Was ist Datenvollständigkeit?

Definition von Datenvollständigkeit

Datenvollständigkeit ist ein Maß dafür, wie viel der erforderlichen Informationen für einen Produktdatensatz tatsächlich ausgefüllt ist. Sie wird als Prozentsatz der Pflichtfelder und empfohlenen Felder ausgedrückt, die gültige, nutzbare Inhalte enthalten.

Ein Produktdatensatz, der einen Titel und einen Preis hat, aber Abmessungen, Bilder und technische Attribute vermissen lässt, ist unvollständig – auch wenn er technisch gesehen im System vorhanden ist. Datenvollständigkeit misst die Lücke zwischen dem, was ein Produktdatensatz enthält, und dem, was er enthalten sollte.

Was gilt als vollständig?

Das hängt vom Kontext ab. Datenvollständigkeit wird immer gegen eine definierte Anforderung gemessen, und diese Anforderung ändert sich je nachdem, wohin die Daten gehen. Ein Produkt, das auf der Website eines Großhändlers angeboten wird, benötigt möglicherweise einen vollständigen Satz ETIM-Features, mehrere Bilder, eine ausführliche Beschreibung und ein Datenblatt. Das gleiche Produkt in einem internen ERP-System benötigt möglicherweise nur einen Code, einen Namen und eine Maßeinheit.

Die meisten Organisationen definieren Datenvollständigkeit auf zwei Ebenen:

Pflichtfelder — das Minimum, das ein Datensatz benötigt, um überhaupt nutzbar zu sein, wie Produktname, Kennung und Basiseinheit
Empfohlene Felder — Inhalte, die Auffindbarkeit, Conversion oder Datenaustausch verbessern, wie Attribute, Bilder und Marketing-Beschreibungen

Ein Vollständigkeitsscore spiegelt typischerweise wider, wie viele dieser Felder ausgefüllt sind und gewichtet sie nach ihrer Wichtigkeit.

Warum ist das wichtig?

Unvollständige Produktdaten haben direkte operative Konsequenzen. Ein Produkt ohne erforderliche Attribute kann nicht auf einem Kanal angeboten werden, der diese vorschreibt. Ein Produkt ohne Bilder wird in Suchergebnissen und auf Kategorieseiten unterdurchschnittlich abschneiden. Ein Produkt ohne korrekte technische Spezifikationen kann fehlerhaft bestellt werden, was zu Retouren oder Reklamationen führt.

Im Supply-Chain-Kontext bedeuten unvollständige Daten vom Hersteller zusätzliche manuelle Arbeit für jeden Distributor oder Händler, der sie empfängt. Bei einer großen Anzahl von SKUs und Dutzenden von Lieferanten summieren sich diese Kosten schnell auf.

Wie wird Datenvollständigkeit nachverfolgbar gemacht?

In einem Product Information Management (PIM) System wird Datenvollständigkeit normalerweise automatisch berechnet und als Score oder Fortschrittsanzeiger im Produktdatensatz angezeigt. Regeln definieren, welche Felder erforderlich sind, und das System kennzeichnet Datensätze, die unter einem festgelegten Schwellenwert liegen.

Einige Organisationen definieren auch Datenvollständigkeitsprofile pro Kanal oder pro Produktkategorie, sodass das gleiche Produkt für ein Ziel vollständig genug sein kann, für ein anderes aber als unvollständig gekennzeichnet wird.

Was ist der Unterschied zwischen Datenvollständigkeit und Datenqualität?

Datenvollständigkeit zeigt, ob ein Feld ausgefüllt ist. Sie zeigt nicht, ob der Inhalt korrekt, konsistent oder gut geschrieben ist. Eine Produktbeschreibung mit 500 Zeichen Platzhaltertext wird als vollständig registriert, auch wenn sie nutzlos ist.

Datenqualität ist das breitere Maß, das Genauigkeit, Konsistenz und Gebrauchstauglichkeit einschließt. Datenvollständigkeit ist ein Faktor für die Qualität, aber ein hoher Vollständigkeitsscore bedeutet nicht automatisch, dass die Daten gut sind.