Qu'est-ce que la qualité des données ?

Définition de la qualité des données

La qualité des données mesure l'exactitude, l'exhaustivité et la cohérence des données entre les systèmes et les canaux.

Les données de haute qualité sont suffisamment fiables pour agir : un enregistrement produit pouvant être publié sans examen manuel, un niveau de stock auquel on peut se fier sans recomptage physique, une adresse client qui ne cause pas d'échec de livraison.

Qu'est-ce qui fait que les données sont de haute qualité ?

La qualité des données est généralement évaluée selon plusieurs dimensions :

  • Exactitude — les données reflètent correctement le monde réel (le poids indiqué correspond au poids réel du produit)
  • Exhaustivité — tous les champs obligatoires sont remplis (pas de descriptions, d'images ou d'identifiants manquants)
  • Cohérence — les mêmes données se présentent de la même manière dans tous les systèmes (un nom de produit n'est pas orthographié différemment dans l'ERP et sur la vitrine)
  • Actualité — les données sont à jour et reflètent l'état actuel du produit ou de l'inventaire

Pourquoi cela importe-t-il pour l'e-commerce et l'intégration ?

Une mauvaise qualité des données crée des problèmes qui s'aggravent. Un attribut manquant fait rejeter un produit par une marketplace. Un nom de produit incohérent rompt la correspondance de recherche entre un PIM et un ERP. Un niveau de stock obsolète entraîne une surcommande. Plus les mauvaises données se propagent dans les systèmes, plus les dégâts s'accumulent et plus il devient difficile de remonter jusqu'à la source.

Comment maintenir la qualité des données ?

Par une combinaison de règles de gouvernance des données, de validation au point d'entrée, d'audits réguliers et d'outils qui affichent automatiquement les scores d'exhaustivité et les signaux d'erreur.