Conjunto de datos en swahili
Hifadhidata ya kiswahili
Conjunto de datos de podcast y centro de llamadas en suajili de alta calidad para modelos de inteligencia artificial y voz
Descripción
Título
suajili Conjunto de datos de idioma
Tipo de conjunto de datos
Centro de llamadas
Descripción
Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
230
Frecuencia de muestreo
8 kHz
Canal de audio
Doble
Plataforma de grabación
Ordenador de sobremesa
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
suajili
Idioma
suajili
Género
Mujer 611, Hombre 833, Desconocido 0
Número de altavoces
1,444
Edad
18 - 50
Descripción
Título
suajili Conjunto de datos de idioma
Tipo de conjunto de datos
Podcast
Descripción
Licenciables Archivos de audio/video de dominio público, como entrevistas, podcasts, etc.: de 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
265
Frecuencia de muestreo
16 kHz
Canal de audio
Mono
Plataforma de grabación
Abastecimiento web
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
suajili
Idioma
suajili
Género
Mujer 118, Hombre 493, Desconocido 25
Número de altavoces
636
Edad
18 - 50
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz