Conclusiones clave

Diseñe el modelo antes de tocar ninguna configuración de PIM/MDM. La mayoría de los problemas de datos son problemas de modelo, no problemas de datos.

Nunca colapse todo en un único registro. Categoría, Variante, Activo, Canal, Proveedor, Precio y Unidad de medida son entidades distintas. Combinarlas es fácil de hacer y costoso de deshacer.

El alcance de los atributos es la decisión de diseño de mayor impacto. Clasifique cada atributo como global, específico de idioma o específico de canal. Equivocarse rompe la lógica de publicación en los sistemas posteriores.

Tres errores de variantes/bundles que debe evitar:

  • Incorporar variantes de forma retroactiva en una estructura de producto plana
  • Almacenar la composición del bundle en un campo de notas en lugar de como una entidad estructurada
  • Definir ejes de variantes sin vocabularios controlados ("rojo" / "Rojo" / "ROJO" rompe la búsqueda por facetas)

ID interno, SKU, GTIN, EAN y MPN cumplen funciones distintas; nunca los confunda. Utilice una tabla de mapeo entre sistemas. Dos registros que comparten un GTIN indican que uno es un duplicado; aplique esto como una regla de validación estricta.

Los datos principales pertenecen al registro base. Las anulaciones de idioma y canal pertenecen a registros vinculados separados. Defina reglas de completitud por combinación: la ausencia de una descripción en español debe bloquear la publicación en la tienda web en español.

Versione el modelo, asigne responsabilidades y mantenga un documento vivo legible tanto por desarrolladores como por responsables de negocio. Sin gobernanza, los problemas de calidad de datos que resolvió regresarán gradualmente.

¿Qué es un modelo de datos maestros de producto?

La mayoría de los problemas de datos de producto no son problemas de datos. Son problemas de modelo. Los datos suelen estar presentes. Simplemente están almacenados con la forma incorrecta, en el lugar incorrecto y sin las relaciones adecuadas. Para eso está el modelo de datos maestros de producto.

Un modelo de datos maestros de producto es un plano formal. Describe las entidades de su dominio de producto, sus atributos y cómo se relacionan entre sí. Es el plano arquitectónico de toda su información de producto.

El modelo de datos maestros de producto no es lo mismo que un esquema de base de datos. Un esquema es la implementación técnica. El modelo de datos es la capa conceptual que lo precede. Primero se diseña el modelo y luego se implementa el esquema.

Sin un modelo claro, los datos de producto tienden a crecer de forma caótica. Los equipos añaden atributos donde encajan. Los identificadores se duplican. Los datos específicos de canal se mezclan con los registros principales. La ausencia de un modelo explícito era casi siempre la causa raíz de los problemas de calidad de datos. Esto es especialmente cierto para empresas que gestionan decenas de miles de SKUs.

El modelo de datos maestros de producto es la base de cualquier iniciativa de PIM (Product Information Management) o MDM (Master Data Management). Antes de configurar flujos de trabajo, pipelines de importación o reglas de publicación, necesita saber cómo es su estructura de datos.

Entidades principales y sus relaciones

Todo modelo de datos maestros de producto gira en torno a una entidad central: Producto. Todo lo demás se conecta a ella.

Las entidades relacionadas más importantes son:

  • Categoría – define dónde se ubica un producto en la jerarquía del catálogo y qué atributos se le aplican.
  • Variante – una versión específica de un producto que difiere en uno o más ejes, como talla o color.
  • Activo – un archivo digital vinculado a un producto, generalmente una imagen, vídeo o documento.
  • Canal – un punto de venta o distribución, como una tienda web, un marketplace o un catálogo impreso.
  • Proveedor – la entidad que suministra el producto, con sus propios identificadores y datos.
  • Precio – puede modelarse como una entidad independiente cuando hay múltiples listas de precios, divisas o grupos de clientes.
  • Unidad de medida – define cómo se vende, empaqueta o envía el producto.

La siguiente tabla resume cómo se relaciona cada entidad con Producto y la cardinalidad de esa relación.

Entidad Relación con Producto Cardinalidad
Categoría Producto pertenece a Categoría Muchos-a-muchos
Variante Producto tiene Variantes Uno-a-muchos
Activo Producto tiene Activos Uno-a-muchos
Canal Producto se publica en Canal Muchos-a-muchos
Proveedor Producto es suministrado por Proveedor Muchos-a-muchos
Precio Producto tiene Precios Uno-a-muchos
Unidad de medida Producto utiliza Unidad de medida Muchos-a-uno

Un fabricante mediano de sensores industriales ilustra por qué la separación de entidades es importante. Cada sensor pertenece a una categoría, tiene múltiples variantes, está vinculado a una ficha técnica en PDF, se vende a través de tres canales y es suministrado por dos proveedores. Modelar todo esto como campos de texto planos en un único registro de producto hace que los datos sean inmanejables en cuestión de meses.

Arquitectura de atributos

Los atributos son los campos de datos individuales que describen un producto. Diseñar cuidadosamente la arquitectura de atributos es una de las decisiones con mayor impacto en todo el proyecto.

Los tipos de atributo definen qué tipo de valor contiene un campo: texto, número, booleano, fecha, enumeración, multi-enumeración o relación. Elegir el tipo incorrecto genera problemas posteriores. Almacenar un valor de peso como texto en lugar de número hace imposible el filtrado y la conversión de unidades más adelante. Almacenar un país de origen como texto libre en lugar de una enumeración provoca que "España", "ES", "Spain" y "españa" aparezcan como valores separados en los informes.

Los grupos de atributos organizan los campos en paneles lógicos dentro de la interfaz. Los grupos habituales son General, Especificaciones técnicas, Logística y Contenido de marketing. Para un producto con 80 atributos, los grupos bien definidos marcan la diferencia entre una interfaz de edición manejable y una que nadie quiere usar. Un grupo de Especificaciones técnicas para un sensor industrial, por ejemplo, podría contener Temperatura de funcionamiento, Grado de protección IP, Señal de salida y Rango de medición: campos que van juntos y son editados por la misma persona.

Las dimensiones de alcance determinan si el valor de un atributo se comparte globalmente o varía por idioma o canal:

  • Global – un único valor para todos los idiomas y canales. Ejemplos claros son el GTIN, el ID interno y la clasificación de materiales peligrosos. Estos valores son factuales y universales por definición.
  • Específico de idioma – el valor varía según el idioma o la región, como el nombre del producto, la descripción y el texto del aviso legal.
  • Específico de canal – el valor varía según el canal de venta, como un título de 80 caracteres formateado para Amazon frente a un título descriptivo completo para la tienda web.

Esta es la decisión de diseño con mayor impacto en los sistemas posteriores. Equivocarse con el alcance implica duplicar datos innecesariamente o forzar contenido específico de canal en campos globales, lo que rompe la lógica de publicación.

La herencia de atributos permite que los productos asignados a una categoría reciban automáticamente el conjunto de atributos definido para esa categoría. Los atributos se definen una sola vez a nivel de categoría y todos los productos bajo ella los heredan. Cuando se requiere un nuevo atributo "Temperatura de funcionamiento" para todos los productos de la categoría Sensores industriales, un único cambio se propaga instantáneamente a cientos de productos.

Jerarquía y clasificación de productos

La jerarquía de productos es el árbol de categorías que organiza su catálogo tanto para la navegación como para la asignación de atributos.

Una estructura plana con pocos niveles es más fácil de mantener, pero ofrece menos granularidad para la herencia de atributos. Una estructura profunda proporciona mayor precisión, pero requiere más esfuerzo de gobernanza. En la práctica, entre tres y cinco niveles son suficientes para la mayoría de los catálogos B2B y B2C. Una jerarquía como Componentes > Sensores > Sensores de presión > Sensores de presión cerámicos es suficientemente específica para impulsar una herencia de atributos significativa sin volverse inmanejable.

La categorización y la clasificación son dos conceptos distintos que a menudo se confunden. La categorización ubica un producto en un árbol de navegación (p. ej., Electrónica > Cámaras > DSLR). La clasificación asigna un producto a una taxonomía estandarizada como eCl@ss o GS1 GPC, que suele ser necesaria para la integración EDI o de marketplaces. Ambas pueden coexistir en el mismo modelo, almacenadas por separado y sirviendo a propósitos distintos.

Los productos de categoría cruzada son un verdadero desafío. Un producto que pertenece a dos categorías con conjuntos de atributos conflictivos necesita una regla clara. El enfoque más práctico es usar una categoría primaria para la herencia de atributos y las categorías secundarias solo para la navegación. Cómo resuelva esto a nivel de jerarquía determina directamente cómo se definen los ejes de variantes en el siguiente paso.

Modelado de variantes y bundles

El modelado de variantes y bundles es donde muchos modelos de datos maestros de producto se rompen. Vale la pena dedicarle tiempo real durante la fase de diseño.

Los productos simples no tienen variantes: un SKU, un conjunto de atributos.

Los productos configurables tienen un registro padre que define el concepto de producto y registros hijo que representan cada combinación específica de ejes de variantes. Una camiseta en tallas S, M, L, XL y colores Rojo, Azul y Verde es un producto configurable con doce variantes. El padre contiene los datos compartidos: marca, material e instrucciones de cuidado. Cada variante hijo contiene su propia talla, color, SKU y nivel de stock. Esta estructura mantiene el catálogo limpio y hace que el filtrado por talla o color sea fiable.

Los ejes de variantes deben definirse como vocabularios controlados. No se quiere que "rojo", "Rojo" y "ROJO" sean tratados como tres valores distintos. Más allá de la consistencia de los datos, los valores de ejes de variantes no controlados rompen la búsqueda por facetas y la lógica de filtros en el frontend, lo que significa que los clientes no pueden filtrar productos de forma fiable por color, talla o material en su tienda web.

Los bundles son productos compuestos por otros productos. Un "Kit de inicio" formado por un sensor, un soporte de montaje y un cable es un bundle. El modelo necesita una entidad de composición de bundle que registre qué componentes lo forman y en qué cantidades. Si el bundle es virtual (ensamblado en el momento del pedido) o físico (preensamblado y almacenado como unidad) determina cómo funcionan la lógica de precios y de stock.

En proyectos con rangos de productos complejos, siempre recomendamos modelar variantes y bundles de forma explícita antes de comenzar cualquier trabajo de configuración.

Los tres errores más costosos que vemos repetidamente son:

  • Lanzar con una estructura de producto plana e incorporar variantes de forma retroactiva
  • Tratar la composición del bundle como un campo de notas manual en lugar de como una entidad estructurada
  • Definir ejes de variantes sin vocabularios controlados. Cada uno de estos errores es completamente evitable en la fase de diseño del modelo y muy costoso de corregir después del go-live.

Estrategia de identificadores

Los identificadores son la forma en que sus sistemas reconocen y referencian el mismo producto. Una estrategia de identificadores deficiente conduce directamente a registros duplicados y fallos de sincronización.

La siguiente tabla resume los principales tipos de identificadores, quién los asigna, su alcance y su uso principal.

Identificador Asignado por Alcance Uso principal
ID interno Sistema PIM / MDM Interno Integridad del sistema, vinculación de registros
SKU Equipo de negocio / operaciones Interno Almacén, gestión de pedidos
GTIN GS1 (fuente: https://www.gs1.org/standards/get-barcode/gtin) Global Retail, cadena de suministro, EDI
EAN GS1 Global Retail europeo, punto de venta
MPN Fabricante Externo Aprovisionamiento B2B, catálogos técnicos

Cada identificador cumple una función diferente. Confundirlos genera problemas. Un patrón de fallo habitual es usar el número de artículo del ERP como ID interno del PIM. Cuando el sistema ERP se reemplaza o los números de artículo se reestructuran, todas las integraciones se rompen.

La solución práctica es una tabla de mapeo de identificadores entre sistemas. Para cada registro de producto, el PIM almacena su propio ID interno junto con el número de artículo del ERP, el GTIN y el MPN. Los mapeos de importación y exportación referencian esta tabla de forma explícita. Un ejemplo concreto: un producto llega del ERP con el número de artículo "ERP-00447". El PIM lo almacena en un campo dedicado de ID de ERP. La integración con la tienda web mapea el GTIN. El feed EDI del distribuidor mapea el MPN. Cada sistema habla su propio idioma y el PIM traduce entre ellos sin ambigüedad.

Si dos registros comparten el mismo GTIN, uno de ellos es un duplicado. Convertir esto en una regla de validación estricta a nivel de modelo evita que los duplicados entren en el sistema desde el principio. Un modelo de identificadores limpio es también lo que hace fiable la publicación específica por canal: cuando cada producto tiene una identidad inequívoca en todos los sistemas, enviar los datos correctos al canal correcto se convierte en una operación rutinaria en lugar de una tarea de reconciliación manual.

Capa de canal e idioma

El registro principal del producto contiene datos que son válidos independientemente de dónde se venda el producto o en qué idioma. La capa de canal e idioma contiene todo lo que varía.

Los datos específicos de canal incluyen típicamente:

  • Un título de producto reformateado para un marketplace específico
  • Imágenes optimizadas para ese canal
  • Texto promocional relevante solo para un punto de venta

Los datos específicos de idioma incluyen:

  • Nombres y descripciones traducidos
  • Unidades adaptadas al idioma o región
  • Texto legal específico del país

Cada capa reside en su propio lugar: los datos principales en el registro base del producto, las variantes de idioma en registros de traducción vinculados y las anulaciones específicas de canal en registros de asignación de canal. Mantener estas capas limpias es lo que hace manejable la publicación multicanal a escala. AtroPIM gestiona esta separación especialmente bien, permitiendo a los equipos enriquecer y publicar las capas de canal e idioma de forma independiente sin tocar el registro principal del producto.

Las reglas de completitud por combinación de canal/idioma son una función de gobernanza que pertenece al propio modelo: usted define qué atributos son obligatorios antes de que un producto pueda publicarse en un canal específico.

Un producto sin descripción en español no puede publicarse en la tienda web española. Un producto sin un GTIN válido no puede enviarse a un marketplace de retail.

Dependiendo del requisito del canal, estas reglas pueden ser bloqueos estrictos que impiden la publicación por completo, o advertencias suaves que señalan la brecha y permiten la publicación con una anulación consciente. Ambos enfoques tienen su lugar y el modelo debe admitir ambos.

Gobernanza y responsabilidad dentro del modelo

Un modelo de datos maestros de producto no es solo un documento técnico. Es un marco de gobernanza.

Los campos obligatorios deben ser aplicados por el sistema. Las reglas de validación integradas en las definiciones de atributos detectan errores en el momento de la entrada, antes de que se propaguen. Un campo de peso debe rechazar valores negativos. Un campo EAN debe validar el dígito de control. Un campo de URL debe verificar su formato. Un campo de título de producto puede aplicar una longitud máxima de caracteres por canal. Cada una de estas reglas elimina toda una categoría de problemas recurrentes de calidad de datos.

Versionar el modelo es algo que la mayoría de los equipos pasa por alto hasta que lo necesitan. Cuando se añade un nuevo atributo obligatorio o se reestructura una jerarquía de categorías, los registros existentes necesitan migración. Tratar el modelo como un artefacto versionado con un registro de cambios y scripts de migración hace esto manejable. Sin versionado, un cambio estructural en el modelo se convierte en una crisis en lugar de una operación rutinaria.

La responsabilidad significa asignar claramente quién es responsable de cada parte del modelo: quién puede añadir nuevos atributos, quién aprueba cambios en la jerarquía de categorías y quién da el visto bueno a una nueva capa de canal. Sin una responsabilidad definida, el modelo se deteriora. Se añaden nuevos atributos sin gobernanza. Las categorías son reestructuradas por diferentes equipos de forma incompatible. Los problemas de calidad de datos resueltos en la implementación inicial regresan gradualmente.

Igual de importante es mantener un documento de modelo vivo. No se trata de un diagrama de base de datos guardado en un repositorio técnico. Es una referencia legible accesible tanto para desarrolladores como para responsables de negocio, que describe cada entidad, atributo, relación y regla de validación en lenguaje claro. Un buen documento de modelo es lo que permite incorporar nuevos miembros al equipo, respalda auditorías externas y mantiene la alineación entre equipos a medida que el catálogo evoluciona.

Si está comenzando un proyecto de PIM o MDM, el primer paso correcto es una auditoría del modelo de datos: mapee sus entidades actuales, identifique dónde se almacenan los datos de forma inconsistente y defina el modelo objetivo antes de tocar ninguna configuración. La calidad de ese modelo determina la calidad de todo lo que se construye sobre él.


Calificación 0/5 basada en 0 valoraciones