Conjunto de datos marathi
मराठी डेटासेट
Conjunto de datos de alta calidad en marathi sobre centros de llamadas, conversaciones generales, monólogos con guion y medios (pódcast) para modelos de IA y voz.
Descripción general
Título (Idioma)
Conjunto de datos del idioma marathi
Tipos de conjuntos de datos
Centro de llamadas, Conversación general, Medios (Podcast), Monólogo con guion
País
India
Descripción
Este conjunto de datos incluye conversaciones telefónicas sintéticas sin guión entre agente y cliente (5 a 15 minutos), conversaciones telefónicas naturales entre humanos (15 a 60 minutos) y audio cantado con transcripciones, lo que proporciona diversos datos de habla para entrenar y evaluar tecnologías de habla y lenguaje.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
| Tipo de conjunto de datos | Tasa de muestreo | Speakers | Channel | Horas totales | Número total de oradores |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Oradores | Dual | 70:28:58 | 634 |
| Conversacion general | 8 kHz | 2 Oradores | Dual | 159:21:13 | 298 |
| Datos de medios | 16 kHz | Altavoces multipal | Mono | 24:09:24 | 94 |
| Monólogo guionado | 24 kHz | Altavoz individual | Mono | 3,900:00:00 | Bajo Demanda |
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.
¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz