Definition von Datenqualität
Datenqualität ist ein Maß dafür, wie genau, vollständig und konsistent Daten über Systeme und Kanäle hinweg sind.
Hochwertige Daten sind zuverlässig genug, um darauf zu handeln: ein Produktdatensatz, der ohne manuelle Überprüfung veröffentlicht werden kann, ein Lagerbestand, dem man ohne physische Nachzählung vertrauen kann, eine Kundenadresse, die keine fehlgeschlagene Lieferung verursacht.
Was macht Daten hochwertig?
Datenqualität wird normalerweise anhand mehrerer Dimensionen bewertet:
- Genauigkeit — die Daten spiegeln die Realität korrekt wider (das angegebene Gewicht entspricht dem tatsächlichen Produktgewicht)
- Vollständigkeit — alle erforderlichen Felder sind ausgefüllt (keine fehlenden Beschreibungen, Bilder oder Kennungen)
- Konsistenz — die gleichen Daten sehen systemübergreifend gleich aus (ein Produktname wird im ERP und im Storefront nicht unterschiedlich geschrieben)
- Aktualität — Daten sind aktuell und spiegeln den aktuellen Zustand des Produkts oder des Lagerbestands wider
Warum ist es für E-Commerce und Integration wichtig?
Schlechte Datenqualität führt zu kumulativen Problemen. Ein fehlendes Attribut führt dazu, dass ein Produkt von einem Marketplace abgelehnt wird. Ein inkonsistenter Produktname bricht einen Suchvergleich zwischen einem PIM und einem ERP. Ein veralteter Lagerbestand führt zu Überverkäufen. Je weiter schlechte Daten systemübergreifend wandern, desto mehr Schaden entstehen und desto schwieriger wird es, die Quelle zurückzuverfolgen.
Wie wird Datenqualität gepflegt?
Durch eine Kombination aus Data-Governance-Regeln, Validierung bei der Dateneingabe, regelmäßigen Audits und Tools, die Vollständigkeitswerte und Fehlerflags automatisch sichtbar machen.