Licencias de datos de imágenes y vídeos faciales listos para usar
Conjuntos de datos de reconocimiento facial listos para usar para el entrenamiento de modelos de IA
Aprovechar conjuntos de datos demográficamente diversos y de fuentes éticas para acelerar el entrenamiento de modelos de IA y reducir el sesgo para un conglomerado tecnológico global líder.
Resumen del proyecto
El cliente buscaba acelerar Desarrollo de reconocimiento facial impulsado por IA sin someterse a largos y costosos ciclos de recopilación de datos. Para lograrlo, necesitaban conjuntos de datos listos para usar que no eran solo grande y diverso, sino que también de origen ético y que cumple con las regulaciones globales de privacidad de datos.
Shaip proporcionó conjuntos de datos completos con variaciones controladas de iluminación, poses de la cabeza, oclusiones y emociones, lo que permitió que los modelos del cliente alcanzaran precisión e imparcialidad, a la vez que cumplían con los criterios étnicos y demográficos requeridos. Cada conjunto de datos incluía metadatos detallados, anotaciones de poses y cuadros delimitadores para el reconocimiento de emociones, lo que permitió entrenar y probar los modelos en escenarios reales muy diversos.
Estadísticas clave
Más de 7,000 temas
en el conjunto de datos históricos
con más de 300,000 imágenes
y 2,000 vídeos.
Más de 10,000 temas
en el conjunto de datos de emociones multiángulo.
Imágenes 74,880
en Iluminación
Conjunto de datos de variación.
Imágenes 18,600
cubriendo seis
emociones centrales
Alcance del proyecto
El cliente requería Conjuntos de datos de imágenes y vídeos faciales a gran escala, de origen ético y demográficamente diversos Para apoyar el desarrollo y entrenamiento de modelos de reconocimiento facial. Estos conjuntos de datos fueron esenciales para impulsar los casos de uso en sistemas anti-suplantación de identidad, verificación de identidad, comparación de imágenes y análisis de expresiones, lo que garantiza un rendimiento de IA sólido e imparcial en aplicaciones del mundo real.
El alcance del compromiso incluyó:
- La entrega de conjuntos de datos seleccionados Diseñado para satisfacer casos de uso de reconocimiento facial como anti-suplantación de identidad, verificación de identidad y reconocimiento de expresiones.
- Proporcionar Imágenes y vídeos con anotaciones detalladas para datos demográficos, postura de la cabeza, oclusiones, tipo de iluminación y emociones.
- Garantizar cobertura demográfica equilibrada para reducir el sesgo sistémico en la formación.
- garantizando cumplimiento y consentimiento con estándares globales de protección de datos y privacidad.
Contribuciones al conjunto de datos de muestra:
- Conjunto de datos históricos (~7,000 sujetos): más de 300 000 imágenes y 2,000 vídeos con variaciones de pose y oclusión.
- Conjunto de datos de emociones multiángulo (~10 000 sujetos): 15 a 20 imágenes por sujeto en todos los ángulos y estados emocionales.
- Conjunto de datos de seis emociones (~3,100 sujetos): 18,600 imágenes anotadas que cubren expresiones humanas fundamentales.
- Conjunto de datos de variación de iluminación (~468 sujetos): 74,880 imágenes en nueve condiciones de iluminación.
Desafíos
El proyecto abordó desafíos clave comunes en la construcción de modelos de IA robustos:
Prevenir la sobrerrepresentación de etnias o géneros específicos para garantizar la equidad.
Capturar condiciones de iluminación, ángulos faciales, oclusiones y expresiones naturales.
Proporcionando cientos de miles de imágenes de alta resolución sin comprometer la diversidad.
Cumplir con estrictos requisitos globales de privacidad y protección de datos con el consentimiento total de los participantes.
Solución:
Shaip implementó una enfoque estructurado Para garantizar la calidad y relevancia del conjunto de datos:
- Conjuntos de datos equilibrados seleccionados con amplia representación étnica, de género y de edad.
- capturado Poses de múltiples ángulos y variaciones de iluminación para replicar las condiciones del mundo real.
- Adicional anotaciones detalladas (por ejemplo, postura de la cabeza, oclusiones, emociones) para enriquecer la usabilidad del conjunto de datos.
- Establecido estricto flujos de trabajo de control de calidad y cumplimiento para garantizar el abastecimiento ético y el cumplimiento de la privacidad.
Cartera de conjuntos de datos
| Conjunto de datos | Volumen | Demografía / Diversidad | Estándares/Especificaciones |
|---|---|---|---|
| Conjunto de datos históricos de imágenes y vídeos faciales (aproximadamente 7,000 sujetos) | 7,000 imágenes de inscripción; más de 300 000 imágenes históricas; 2,000 vídeos (1 interior + 1 exterior por cada 1,000 sujetos) | Etnia: Negra (35%), asiática oriental (42%), asiática meridional (13%), blanca (10%); Género: 50% masculino / 50% femenino; Edad: Adultos mayores de 18 años (últimos 10 años) | Duración del vídeo: 1–2 min; Variación de la postura de la cabeza (P1–P7); 5 tipos de oclusión (O0–O4) |
| Conjunto de datos de imágenes faciales (aproximadamente 5,000 sujetos) | 35 imágenes por sujeto; 2,500 indios; 1,000 asiáticos; 1,500 negros | Edad: 18–60 años; Distribución de género equilibrada | Sin embellecimiento; Fondo y ropa variados; Resolución mínima: 960×1280 |
| Conjunto de datos de emociones multiángulo (aproximadamente 10 000 sujetos, chinos) | 15–20 imágenes por sujeto; Poses: Frontal, Izquierda, Derecha (30°–60°); Expresiones: Sonrisa, boca abierta, triste, seria, neutral | Etnia: China; Edad: 18-26; Género: 50/50 | Resolución: 2160×3840 píxeles o superior |
| Conjunto de datos sobre seis emociones humanas (aproximadamente 3,100 sujetos) | 6 imágenes por sujeto (diferentes expresiones); 18,600 imágenes en total | Etnias: Japonesa (9,000), coreana (2,400), china (2,400), del sudeste asiático (2,400), del sur de Asia (2,400); edad: 20-65 años | Anotaciones de cuadro delimitador para emociones; Fondos lisos; Sin sombreros, gafas ni obstrucciones |
| Conjunto de datos de variación de la iluminación (aproximadamente 468 sujetos indios) | 160 imágenes por tema; Total: 74,880 imágenes | Edad: 20–70; 70% Hombres | 9 condiciones de iluminación (interior, exterior, luz lateral, luz de fondo, neón, etc.) |
| Conjunto de datos de imágenes faciales multiétnicas (aproximadamente 600 sujetos) | 3,752 imágenes en total | Etnias: africana, de Oriente Medio, nativa americana, del sur de Asia, del sudeste asiático; edad: 20 a 70 años | - |
Resultado
La colaboración generó un impacto comercial y técnico significativo:
- Precisión del modelo mejorada:Precisión y recuperación mejoradas para modelos de reconocimiento facial en múltiples casos de uso.
- Reducción de sesgo:La representación demográfica equilibrada redujo el sesgo sistémico en los resultados de la IA.
- Cronogramas de desarrollo aceleradoLos conjuntos de datos disponibles en el mercado permitieron la creación rápida de prototipos y el entrenamiento de modelos sin necesidad de una larga recopilación de datos.
- Cumplimiento de la normativa :Todos los conjuntos de datos cumplieron con los estándares globales de privacidad e incluyeron el consentimiento de los participantes.
Los conjuntos de datos diversos y de origen ético de Shaip nos brindaron la velocidad, la calidad y el cumplimiento normativo que necesitábamos. Con datos listos para usar, aceleramos el entrenamiento de modelos de IA y redujimos significativamente el sesgo sistémico.