Definition von Datenqualität
Datenqualität ist ein Maßstab dafür, wie genau, vollständig und konsistent Daten über Systeme und Kanäle hinweg vorliegen.
Hochwertige Daten sind zuverlässig genug, um auf ihrer Basis zu handeln: ein Produktdatensatz, der ohne manuelle Überprüfung veröffentlicht werden kann, ein Lagerbestand, dem man ohne physische Inventur vertrauen kann, eine Kundenadresse, die nicht zu fehlgeschlagenen Lieferungen führt.
Was macht Daten hochwertig?
Datenqualität wird üblicherweise anhand mehrerer Dimensionen bewertet:
- Genauigkeit — die Daten reflektieren korrekt die Realität (das angegebene Gewicht entspricht dem tatsächlichen Produktgewicht)
- Vollständigkeit — alle erforderlichen Felder sind ausgefüllt (keine fehlenden Beschreibungen, Bilder oder Identifikatoren)
- Konsistenz — dieselben Daten sehen systemübergreifend gleich aus (ein Produktname wird nicht im ERP und im Storefront unterschiedlich geschrieben)
- Aktualität — Daten sind auf dem neuesten Stand und reflektieren den aktuellen Zustand des Produkts oder des Bestands
Warum ist dies für E-Commerce und Integration wichtig?
Schlechte Datenqualität erzeugt sich verstärkende Probleme. Ein fehlendendes Attribut führt dazu, dass ein Produkt von einem Marketplace abgelehnt wird. Ein inkonsistenter Produktname bricht eine Suchabfrage zwischen einem PIM und einem ERP. Ein veralteter Lagerbestand führt zu Überverkäufen. Je weiter fehlerhafte Daten über Systeme hinweg wandern, desto größer ist der verursachte Schaden und desto schwieriger wird es, sie zur Quelle zurückzuverfolgen.
Wie wird Datenqualität aufrechterhalten?
Durch eine Kombination aus Data-Governance-Regeln, Validierung an der Eingabestelle, regelmäßigen Audits und Tools, die Vollständigkeitswerte und Fehlerflaggen automatisch anzeigen.