Conjunto de datos del sur profundo en inglés
Conjunto de datos de alta calidad de centros de llamadas, conversaciones generales y podcasts del sur profundo en inglés para modelos de inteligencia artificial y voz
Descripción general
Título (Idioma)
Conjunto de datos del idioma inglés del sur profundo
Tipos de conjuntos de datos
Centro de llamadas, conversación general, datos de medios (podcast)
País
El sur de Estados Unidos
Descripción
Las conversaciones telefónicas sintéticas sin guion entre un agente y un cliente están disponibles con una duración de 5 a 15 minutos, mientras que las conversaciones telefónicas sin guion entre dos personas suelen durar entre 15 y 60 minutos. Además, también están disponibles archivos de audio o vídeo de dominio público con licencia, como entrevistas o podcasts con entre 1 y 5 participantes, con una duración de 15 a 60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
| Tipo de conjunto de datos | Tasa de muestreo | Oradores | Channel | Horas totales | Número total de oradores |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Oradores | Dual | 266:44:22 | 634 |
| Conversacion general | 8 kHz | 2 Oradores | Dual | 197:25:07 | 1,490 |
| Datos de medios | 16 kHz | Varios altavoces | Mono | 261:20:58 | 565 |
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.
¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz
Descripción general
Título
Inglés Deep South Conjunto de datos de idioma
Tipo de conjunto de datos
Centro de llamadas
Descripción
Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
151
Frecuencia de muestreo
8 kHz
Canal de audio
Dual
Plataforma de grabación
Escritorio
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Inglés Deep South
Idioma
Inglés Deep South
Género
Mujer 221, Hombre 1004, Desconocido 7
Número de altavoces
1,232
Edad
18 - 50
Descripción general
Título
Inglés Deep South Conjunto de datos de idioma
Tipo de conjunto de datos
Conversacion general
Descripción
Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
56
Frecuencia de muestreo
8 kHz
Canal de audio
Dual
Plataforma de grabación
Escritorio
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Inglés Deep South
Idioma
Inglés Deep South
Género
Mujer 99, Hombre 31, Desconocido 0
Número de altavoces
130
Edad
18 - 50
Descripción general
Título
Inglés Deep South Conjunto de datos de idioma
Tipo de conjunto de datos
Podcast
Descripción
Licenciables Archivos de audio/video de dominio público, como entrevistas, podcasts, etc.: de 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
266
Frecuencia de muestreo
16 kHz
Canal de audio
Mono
Plataforma de grabación
Abastecimiento web
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Inglés Deep South
Idioma
Inglés Deep South
Género
Mujer 204, Hombre 356, Desconocido 21
Número de altavoces
581
Edad
18 - 50