Los recientes informes que indican que Meta suspendió su colaboración con Mercor después de que esta última revelara un incidente de seguridad vinculado al proyecto de código abierto LiteLLM han puesto de relieve una parte de la pila de IA que muchas empresas aún subestiman: la capa de datos y flujo de trabajo que hay detrás del entrenamiento y la evaluación de los modelos.
Para los equipos de IA empresarial, la lección va más allá de una startup o una brecha de seguridad. Es un recordatorio de que la resiliencia de los programas de IA depende de la solidez de los proveedores, las herramientas, los flujos de datos y los controles de gobernanza que los respaldan. Cuando las organizaciones dependen de socios externos para la recopilación, anotación, evaluación o flujos de trabajo de expertos, el riesgo del proveedor se convierte rápidamente en riesgo del modelo. Este enfoque más amplio cobra especial relevancia ahora, ya que Mercor afirmó ser una de las miles de empresas afectadas por un ataque a la cadena de suministro relacionado con LiteLLM y que inició una investigación forense.
Por qué el riesgo del proveedor de IA ahora está más cerca del riesgo del modelo.
La cadena de suministro de IA moderna rara vez es simple. Un solo flujo de trabajo puede involucrar proveedores de datos externos, equipos de anotación, redes de contratistas, API, middleware de código abierto, pipelines de evaluación comparativa y entornos internos de ajuste o evaluación. Si una capa falla, el impacto no se limita al tiempo de actividad. Puede afectar las indicaciones propietarias, los metadatos del flujo de trabajo, la lógica de evaluación comparativa, la información del cliente o los procesos de evaluación internos. El caso de Mercor nos recuerda que la velocidad sin gobernanza puede generar fragilidad oculta.
Las empresas necesitan un modelo de diligencia debida más sólido para los proveedores de IA.
Un proceso de evaluación de proveedores de IA maduro debe ir mucho más allá de un programa piloto exitoso o una promesa de entrega rápida. Debe examinar la procedencia, los controles de acceso, el manejo de datos, la revisión humana, la auditabilidad, la retención, la eliminación y la respuesta a incidentes.
El nivel de exigencia para los proveedores de datos de IA está aumentando. Las empresas ya no evalúan a sus socios únicamente en función de la velocidad o la escala, sino también de su capacidad para respaldar flujos de datos confiables, una calidad medible y operaciones seguras y conformes a la normativa.
La revisión del proveedor debe abarcar más que la capa superior.
Una de las lecciones más importantes del incidente de Mercor es que el riesgo estaba vinculado a una brecha en la cadena de suministro que involucraba a LiteLLM, y no se trataba simplemente de un caso de un proveedor que fue hackeado. En IA, la superficie de riesgo incluye cada vez más capas de orquestación, conectores, herramientas de evaluación y middleware. Un proveedor que aparenta ser seguro aún puede introducir vulnerabilidades en la cadena de suministro si esas dependencias no se gestionan adecuadamente.
La calidad y la gobernanza de los datos son inseparables.
Los fallos de seguridad acaparan los titulares, pero una gobernanza deficiente puede resultar igual de costosa incluso sin una brecha de seguridad. Instrucciones deficientes, etiquetas inconsistentes, un manejo impreciso de casos excepcionales y la falta de documentación sobre el origen de los conjuntos de datos degradan el rendimiento del modelo con el tiempo.
Por eso, los equipos de IA maduros se preocupan cada vez más por cómo se estructura la revisión humana, cómo se mide la calidad y cómo se documentan las decisiones sobre los conjuntos de datos. El contenido público de Shaip enfatiza esta misma dirección a través de flujos de trabajo de calidad con intervención humana, Guía para la recopilación de datos de IAy específicos del dominio Servicios de datos de formación de LLM.
Desarrolla IA con datos confiables.
¿Qué deberían preguntar ahora las empresas a cualquier proveedor de datos de IA?
Un socio sólido en el ámbito de los datos de IA debería poder responder con claridad a preguntas como estas:
¿Cómo se obtienen, licencian, validan y gestionan los datos?
Un proveedor confiable debe poder explicar la procedencia, las prácticas de recolección, los estándares de documentación, los procesos de consentimiento y las normas de retención. La guía pública para compradores de Shaip hace especial hincapié en la procedencia, el control de calidad y las prácticas de recolección que cumplen con la normativa.
¿Qué controles de calidad humanos existen?
Las empresas necesitan más que simplemente decir «contamos con control de calidad». Necesitan una revisión en múltiples niveles, una adjudicación clara, precisión medible y mecanismos de retroalimentación. Los materiales públicos de Shaip hacen hincapié en la revisión por expertos y la evaluación guiada por humanos para los flujos de trabajo de LLM.
¿Qué herramientas de código abierto y de terceros se integran en el flujo de trabajo?
Si un proveedor no puede explicar su pila de dependencias, eso es un problema de gobernanza. El caso de Mercor demuestra por qué.
¿Qué pruebas respaldan el cumplimiento normativo y la preparación para las auditorías?
La postura de seguridad requiere pruebas, no solo palabras de marca. Shaip destaca públicamente las certificaciones ISO 27001:2022, HIPAA y SOC 2 en su página de cumplimiento normativo.
Conclusión final
La pausa entre Meta y Mercor no es solo un titular de prensa. Es una señal de que la adquisición de soluciones de IA está madurando. La cuestión fundamental ya no es solo si un proveedor puede ayudarle a avanzar más rápido, sino si puede hacerlo sin comprometer la gobernanza, la calidad de los datos ni la confianza empresarial.
Shaip ayuda a las empresas a construir sistemas de IA más robustos a través de Datos de entrenamiento de IA, Servicios centrados en el máster en derecho (LLM)y listo para la empresa Seguridad y cumplimiento.
¿Qué es el riesgo que supone un proveedor de datos de IA?
El riesgo asociado a los proveedores de datos de IA es el riesgo operativo, de seguridad, de cumplimiento y de calidad que introducen los proveedores externos involucrados en la recopilación, anotación, evaluación o herramientas de flujo de trabajo de datos de IA.
¿Por qué es importante la seguridad de la cadena de suministro en la IA?
Dado que los flujos de trabajo de IA suelen depender de bibliotecas de código abierto, capas de orquestación y conectores que transfieren datos confidenciales entre sistemas, una debilidad en una de estas dependencias puede afectar a todo el proceso.
¿Qué deben buscar las empresas en un proveedor de datos de IA?
Las empresas deben evaluar la procedencia, el control de calidad humano, los controles de acceso, la auditabilidad, las pruebas de cumplimiento, la transparencia de las dependencias y la preparación para la respuesta ante incidentes. Las guías para compradores y las páginas de cumplimiento de Shaip reflejan estas prioridades.
¿Por qué sigue siendo importante la revisión humana para la IA empresarial?
Porque las tareas ambiguas o que dependen del dominio siguen requiriendo criterio, contexto y responsabilidad. La guía pública HITL de Shaip plantea la revisión humana como un punto de control fundamental en la calidad de los datos.


