Conjunto de datos en inglés chino
中英文数据集
Conjunto de datos de podcast y centro de llamadas en chino e inglés de alta calidad para modelos de inteligencia artificial y voz
Descripción
Título
Ingles chino Conjunto de datos de idioma
Tipo de conjunto de datos
Centro de llamadas
Descripción
Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
169
Frecuencia de muestreo
8 kHz
Canal de audio
Doble
Plataforma de grabación
Ordenador de sobremesa
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
China
Idioma
Ingles chino
Género
Mujer 1790, Hombre 523, Desconocido 13
Número de altavoces
2,326
Edad
18 - 50
Descripción
Título
Ingles chino Conjunto de datos de idioma
Tipo de conjunto de datos
Podcast
Descripción
Licenciables Archivos de audio/video de dominio público, como entrevistas, podcasts, etc.: de 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
249
Frecuencia de muestreo
16 kHz
Canal de audio
Mono
Plataforma de grabación
Abastecimiento web
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
China
Idioma
Ingles chino
Género
Mujer 126, Hombre 346, Desconocido 6
Número de altavoces
478
Edad
18 - 50
Descripción
Título
Wuhan Conjunto de datos de idioma
Tipo de conjunto de datos
Diálogo espontáneo
Horas totales
500
Frecuencia de muestreo
16 kHz
Chino Conjunto de datos de idioma
TTS
300
16 kHz
hokkienese Conjunto de datos de idioma
Diálogo espontáneo
100
16 kHz
Shanghai Conjunto de datos de idioma
Diálogo espontáneo
500
16 kHz
Sichuan Conjunto de datos de idioma
Diálogo espontáneo
500
16 kHz
Inglés (chino) Conjunto de datos de idioma
Espontáneo con guión
2,000
16 kHz
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz