Conjunto de datos hebreo
ערכת נתונים עברית
Conjunto de datos de podcasts y conversaciones generales en hebreo de alta calidad para modelos de inteligencia artificial y de habla
Noticias
Título (Idioma)
Conjunto de datos del idioma hebreo
Tipos de conjuntos de datos
Conversación general, datos de medios
País
Israel
Descripción
Se encuentran disponibles conversaciones telefónicas sin guión entre dos personas en hebreo de Israel con duraciones de entre 15 y 60 minutos, junto con archivos de audio o video de dominio público con licencia, como entrevistas y podcasts con 1 a 5 participantes, que también duran entre 15 y 60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
| Tipo de conjunto de datos | Tasa de muestreo | Speakers: | Channel | Horas totales | Número total de oradores |
|---|---|---|---|---|---|
| Conversacion general | 8 kHz | 2 Oradores | Dual | 398:47:10 | 814 |
| Datos de medios | 16 kHz | Varios altavoces | Mono | 426:14:16 | 885 |
Clientes destacados
Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.
¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz
Noticias
Título
Hebreo Conjunto de datos de idioma
Tipo de conjunto de datos
Conversacion general
Descripción
Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en Israel.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
399
Frecuencia de muestreo
8 kHz
Canal de audio
Dual
Plataforma de grabación
Escritorio
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Israel
Idioma
Hebreo
Género
Mujer 414, Hombre 399, Desconocido 1
Número de altavoces
814
Edad
18-50
Noticias
Título
Hebreo Conjunto de datos de idioma
Tipo de conjunto de datos
Podcast
Descripción
Licenciables Archivos de audio/video de dominio público, como entrevistas, podcasts, etc.: de 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos.
Caso de uso
ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Detalles del conjunto de datos
Horas totales
427
Frecuencia de muestreo
16 kHz
Canal de audio
Mono
Plataforma de grabación
Abastecimiento web
Formato de audio
. Wav
Formato de transcripción
json
NOSOTROS SOMOS (%)
5
Conjunto de datos demográficos
País
Israel
Idioma
Hebreo
Género
Mujer 361, Hombre 513, Desconocido 13
Número de altavoces
887
Edad
18-50