Was ist Datenanreicherung?

Definition von Datenanreicherung

Datenanreicherung ist der Prozess der Verbesserung bestehender Produktdatensätze durch Hinzufügen, Korrigieren oder Erweitern von Informationen, um diese vollständiger, genauer und nutzbringender zu gestalten. Während Datenqualität darauf abzielt, fehlerhafte Daten zu korrigieren, konzentriert sich Datenanreicherung auf das Ergänzen fehlender Informationen – aus einem rudimentären Datensatz wird ein publikationsreifer Produkteintrag.

Was umfasst Datenanreicherung?

Datenanreicherung kann je nach fehlenden Informationen eines Produktdatensatzes unterschiedliche Formen annehmen: Vervollständigung technischer Attribute (Abmessungen, Materialien, Gewicht), Verfassen oder Verbesserung von Titeln und Beschreibungen, Hinzufügen von Bildern und Dokumenten, Vergabe korrekter Taxonomie-Klassifizierungen oder Erfassung von Standard-Identifiern wie GTINs. Ein einzelner Datensatz durchläuft oft mehrere dieser Schritte, bevor er als publikationsreif gilt.

Wie unterscheidet sich das von Content-Anreicherung?

Content-Anreicherung bezieht sich in der Regel speziell auf redaktionelle Verbesserungen – ausführlichere Beschreibungen, A+-Content, kanalspezifische Texte. Datenanreicherung ist breiter gefasst: Sie umfasst strukturierte Daten (Attribute, Identifikatoren, Klassifizierungen) ebenso wie Inhalte. In der Praxis verwenden viele Teams die Begriffe synonym.

Warum ist das wichtig?

Ein unvollständiger Produktdatensatz lässt sich nicht effektiv verkaufen. Fehlende Attribute führen dazu, dass das Produkt in gefilterten Suchergebnissen nicht angezeigt wird. Fehlende Bilder erhöhen die Rückgabequoten. Unvollständige Klassifizierungen führen dazu, dass Marketplace-Feeds den Datensatz ganz ablehnen. Teams mit einem klaren, wiederholbaren Anreicherungs-Workflow erreichen eine schnellere Time-to-Market als Teams, die Datenanreicherung ad hoc durchführen.

In einem PIM-System wird in der Regel ein Vollständigkeitsgrad zur Verfolgung des Anreicherungsfortschritts verwendet, sodass auf einen Blick erkennbar ist, welche Datensätze publikationsreif sind und welche noch bearbeitet werden müssen.