Conjunto de datos coreano
한국어 데이터셋
Conjunto de datos de alta calidad de centros de llamadas, TTS y podcasts coreanos para modelos de inteligencia artificial y voz
Descripción
Título
Lenguaje Koreano
Conjunto de datos
Tipo de conjunto de datos
Centro de llamadas
Descripción
Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
107
Frecuencia de muestreo
8 kHz
Canal de audio
Doble
Plataforma de grabación
Ordenador de sobremesa
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Coreano
Idioma
Coreano
Género
Mujer 1086, Hombre 210, Desconocido 4
Número de altavoces
1,300
Edad
18 - 50
Descripción
Título
Coreano Conjunto de datos de idioma
Tipo de conjunto de datos
Podcast
Descripción
Licenciables Archivos de audio/video de dominio público, como entrevistas, podcasts, etc.: de 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
204
Frecuencia de muestreo
16 kHz
Canal de audio
Mono
Plataforma de grabación
Abastecimiento web
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Coreano
Idioma
Coreano
Género
Mujer 70, Hombre 303, Desconocido 25
Número de altavoces
398
Edad
18 - 50
Descripción
Título
Coreano Conjunto de datos de idioma
Tipo de conjunto de datos
TTS
Descripción
Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
1,955
Frecuencia de muestreo
48 kHz
Canal de audio
Mono
Plataforma de grabación
Aplicación Movil
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Coreano
Idioma
Coreano
Género
Mujer 1195, Hombre 1134, Desconocido 122
Número de altavoces
2,351
Edad
18 - 50
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz