Conjunto de datos de Gujarati
ગુજરાતી ડેટાસેટ
Conjunto de datos de alta calidad de centros de llamadas, conversaciones generales y podcasts en gujarati para modelos de inteligencia artificial y voz
Descripción general
Título (Idioma)
Conjunto de datos del idioma gujarati
Tipos de conjuntos de datos
Centro de llamadas, conversación general, datos de medios (datos de podcast)
País
India
Descripción
Las conversaciones telefónicas sintéticas y sin guión entre un agente y un cliente están disponibles con una duración de entre 5 y 15 minutos, mientras que los archivos de audio o video de dominio público con licencia, como entrevistas y podcasts con entre 1 y 5 participantes, suelen durar entre 15 y 60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
| Tipo de conjunto de datos | Tasa de muestreo | Oradores | Channel | Horas totales | Número total de oradores |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Oradores | Dual | 54:22:40 | 410 |
| Conversacion general | 8 kHz | 2 Oradores | Dual | 149:15:19 | 308 |
| Datos de medios | 16 kHz | Varios altavoces | Mono | 26:04:30 | 102 |
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.
¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz