Was ist Datenqualität?

Definition von Datenqualität

Datenqualität ist ein Maß dafür, wie genau, vollständig und konsistent Daten über Systeme und Kanäle hinweg sind.

Hochwertige Daten sind zuverlässig genug, um darauf zu handeln: ein Produktdatensatz, der ohne manuelle Überprüfung veröffentlicht werden kann, ein Lagerbestand, dem man ohne physische Nachzählung vertrauen kann, eine Kundenadresse, die keine fehlgeschlagene Lieferung verursacht.

Was macht Daten hochwertig?

Datenqualität wird normalerweise über mehrere Dimensionen bewertet:

  • Genauigkeit — die Daten spiegeln die Realität korrekt wider (das angegebene Gewicht entspricht dem tatsächlichen Produktgewicht)
  • Vollständigkeit — alle erforderlichen Felder sind ausgefüllt (keine fehlenden Beschreibungen, Bilder oder Identifikatoren)
  • Konsistenz — die gleichen Daten sehen über alle Systeme hinweg gleich aus (ein Produktname wird nicht in ERP und Storefront unterschiedlich geschrieben)
  • Aktualität — Daten sind aktuell und spiegeln den aktuellen Zustand des Produkts oder Lagerbestands wider

Warum ist es für E-Commerce und Integration wichtig?

Schlechte Datenqualität führt zu sich verstärkenden Problemen. Ein fehlender Attribut führt dazu, dass ein Produkt von einem Marketplace abgelehnt wird. Ein inkonsistenter Produktname bricht eine Suchübereinstimmung zwischen einem PIM und einem ERP. Ein veralteter Lagerbestand führt zu Überverkäufen. Je weiter fehlerhafte Daten über Systeme wandern, desto mehr Schaden verursachen sie und desto schwieriger wird es, die Quelle nachzuverfolgen.

Wie wird Datenqualität aufrechterhalten?

Durch eine Kombination aus Data-Governance-Regeln, Validierung bei der Dateneingabe, regelmäßigen Audits und Tools, die Vollständigkeitswerte und Fehlerflaggen automatisch anzeigen.