Conjuntos de datos de audio/habla/voz de alta calidad para entrenar su modelo de IA conversacional 

Conjuntos de datos de voz, voz y audio listos para usar en varios idiomas para poner en marcha sus modelos de reconocimiento automático de voz (ASR)

Conjuntos de datos de voz

Conecte el catálogo de datos de audio que se ha estado perdiendo hoy

DetallesConjunto de datos de idiomaFrecuencia de muestreoTipo de conjunto de datosHoras totales de audioDescripción CortaDescripción del conjunto de datosCanal de audioPlataforma de grabaciónNOSOTROS SOMOS (%)Formato de audioFormato de transcripciónCaso de usoNúmero de altavocesCTA
Hablaes_US_CC_8Vernáculo afroamericanoVernáculo afroamericanoes_ES8 kHzCentro de llamadas211Datos del centro de llamadas vernáculo afroamericanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 612, Hombre: 1242 y Desconocido: 12
Hablaes_US_MA_16Vernáculo afroamericanoVernáculo afroamericanoes_ES16 kHzMedios de audio154Datos de medios vernáculos afroamericanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 151, Hombre: 150 y Desconocido: 10
HablaAfrikáans_GC_8africaansafricaansaf_ZA8 kHzConversacion general368Afrikáans Datos generales de conversaciónConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en ÁfricaDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 502, Hombre: 390 y Desconocido: 2
HablaAfrikáans_MA_16africaansafricaansaf_ZA16 kHzMedios de audio658Archivos multimedia en afrikáansLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 750, Hombre: 1278 y Desconocido: 52
HablaÁrabe_GC_8ÁrabeÁrabear_AE8 kHzConversacion general292Datos de conversación general en árabeConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del GolfoDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 171, Hombre: 534 y Desconocido: 1
HablaÁrabe_SM_48ÁrabeÁrabear-SA48 kHzMonólogo guionado1,947Monólogo con guion árabeGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 838 Masculino 1209 Desconocido 78
HablaAsamés_CC_8AssameseAsamés (en proceso) como enCentro de llamadas60Datos del centro de llamadas asamés (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaAsamés_GCAssameseAsamés (en proceso) como enConversacion general100Asamés (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaAsamés_MAAssameseAsamés (en proceso) como enMedios de audio40Asamés (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_CC_8bengalíbengalí (en proyecto) bn_INCentro de llamadas60Datos del centro de llamadas en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_GCbengalíbengalí (en proyecto) bn_INConversacion general100Datos generales de conversación en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_MAbengalíbengalí (en proyecto) bn_INMedios de audio40Datos de audio multimedia en bengalí (en proceso)Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaBoston_CC_8Inglés de BostonInglés de Bostones_ES8 kHzCentro de llamadas177Datos del centro de llamadas de BostonConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 605, Hombre: 711 y Desconocido: 0
HablaBoston_GC_8Inglés de BostonInglés de Bostones_ES8 kHzConversacion general32Datos de conversación general de BostonConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 53, Hombre: 83 y Desconocido: 0
HablaBoston_MA_16Inglés de BostonInglés de Bostones_ES16 kHzMedios de audio93Datos de audio de Boston MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 43, Hombre: 181 y Desconocido: 2
HablaCanadiense_SM_48francés canadiensefrancés canadiensefr-CA48 kHzMonólogo guionado1,222francés canadienseGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 974 Masculino 631 Desconocido 1
HablaChino_CC_8Ingles chinoIngles chinoes_ES8 kHzCentro de llamadas169Datos del centro de llamadas chinoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 1790, Masculino: 523 y Desconocido: 13
HablaChino_MA_16Ingles chinoIngles chinoes_ES16 kHzMedios de audio249Datos de audio de medios chinosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 126, Masculino: 346 y Desconocido: 6
HablaChino simplificado_SM_48Chino simplificadoChino simplificadozh-CN48 kHzMonólogo guionado2,762Chino simplificadoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1920 Hombre 1535 Desconocido 270
HablaChino tradicional_SM_48Chino TradicionalChino Tradicionalzh-TW48 kHzMonólogo guionado1,028Chino TradicionalGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1069 Masculino 262 Desconocido 3
HablaDanés_GC_8DanésDanésda_DK8 kHzConversacion general372Datos generales de conversación en danésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 311, Hombre: 417, Desconocido: 0
HablaDanés_MA_16DanésDanésda_DK16 kHzMedios de audio664Datos de audio de medios danesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 369, Hombre: 864, Desconocido: 27
HablaDanés_SM_48DanésDanésda-DK48 kHzMonólogo guionado2,579Monólogo con guión danésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de DinamarcaMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1551 Hombre 1233 Desconocido 42
HablaInglés Profundo Sur_CC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzCentro de llamadas151Datos del centro de llamadas del sur profundo en inglésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 221 , Hombre 1004 , Desconocido 7
HablaInglés Profundo Sur_GC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzConversacion general56Datos de conversación general del sur profundo en inglésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 99, Hombre 31, Desconocido 0
HablaInglés Profundo Sur_MA_16Inglés Deep SouthInglés Deep Southes_ES16 kHzMedios de audio266Datos de audio de Deep South Media en inglésLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 204, Hombre 356, Desconocido 21
HablaAlemán_CC_8AlemánAlemánde-De8 kHzCentro de llamadas64Datos del centro de llamadas alemán Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,MonoEscritorio. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 478 Masculino 1440 Desconocido 0
HablaAlemán_IVR_8AlemánAlemánde-De8 kHz IVR200Datos IVR alemanesHumano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontáneaMonoEscritorio. Wav jsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje Femenino 10115 Masculino 8750 Desconocido 0
HablaGujarati_CC_8gujaratiGujarati (en trámite) gu_INCentro de llamadas60Datos del centro de llamadas de Gujarati (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaGujarati_GCgujaratiGujarati (en trámite) gu_INConversacion general100Gujarati (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaGujarati_MAgujaratiGujarati (en trámite) gu_INMedios de audio40Gujarati (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaHebreo_Conversación general_8HebreoHebreoél_IL8 kHzConversacion general399Datos de conversación general en hebreoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en IsraelDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 414 , Hombre 399 , Desconocido 1
HablaHebreo_MA_16HebreoHebreoél_IL16 kHzMedios de audio427Datos de audio de medios hebreosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 361, Hombre 513, Desconocido 13
HablaHindi_MA_16HindiHindihola_IN16 kHzMedios de audio219Datos de audio de Hindi MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 83, Hombre 309, Desconocido 0
HablaHindi_SM_48HindiHindihola-IN48 kHzMonólogo guionado2,867Monólogo guionado en hindiGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1977 Hombre 1864 Desconocido 147
HablaHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCentro de llamadas208ESPAÑOL Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262 , Desconocido 0
HablaHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedios de audio216ESPAÑOL Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 75, Hombre 380, Desconocido 0
HablaHispano_CC_8ingles hispanoingles hispanoes_ES8 kHzCentro de llamadas212Datos del centro de llamadas hispanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262, Desconocido 0
HablaHispano_MA_16ingles hispanoingles hispanoes_ES16 kHzMedios de audio155Audio de los medios de comunicación hispanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 140, Hombre 219, Desconocido 5
Hablaindonesio_GC_8IndonesianIndonesianyo hice8 kHzConversacion general496Datos de conversación general de indonesioConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesioDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 524, Hombre 454, Desconocido 2
HablaIndonesia_MA_16IndonesianIndonesianyo hice16 kHzMedios de audio643Datos de audio de los medios de IndonesiaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 746, Hombre 1507, Desconocido 129
Hablairlandés_GC_8irlandésirlandéses_ES8 kHzConversacion general192Datos de conversación general en irlandésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 213 , Hombre 153 , Desconocido 0
HablaJaponés_SM_48JaponésJaponésja-JP48 kHzMonólogo guionado2,335Monólogo con guion japonésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1460 Hombre 1221 Desconocido 194
HablaCanadá_CC_8kannadaKannada (en tramitación) kn_INCentro de llamadas60Datos del centro de atención telefónica de Kannada (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaKannada_GCkannadaKannada (en tramitación) kn_INConversacion general100Kannada (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaKannada_MAkannadaKannada (en tramitación) kn_INMedios de audio40Kannada (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaCoreano_CC_8CoreanoCoreanoko_KR8 kHzCentro de llamadas107Datos del centro de llamadas de CoreaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1086, Masculino 210 , Desconocido 4
Hablacoreano_MA_16CoreanoCoreanoko_KR16 kHzMedios de audio204Datos de audio de medios coreanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 70 Hombre 303, Desconocido 25
HablaKorean_SM_48CoreanoCoreanoko-KR48 kHzMonólogo guionado1,955Monólogo escrito en coreanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1195 Hombre 1134 Desconocido 122
Hablamalayo_GC_8MalayMalayms_MY8 kHzConversacion general266Datos generales de conversación en malayoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en MalasiaDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 316, Hombre 176 , Desconocido 0
HablaMalayo_MA_16MalayMalayms_MY16 kHzMedios de audio344Datos de audio de Malay MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 236, Hombre 626, Desconocido 47
HablaMalayalam_CC_8malayalamMalayalam (en trámite) ml_INCentro de llamadas60Malayalam (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMalayalam_GCmalayalamMalayalam (en trámite) ml_INConversacion general100Malayalam (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMalayalam_MAmalayalamMalayalam (en trámite) ml_INMedios de audio40Malayalam (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMarathi_CC_8marathiMarathi (en trámite) mr_INCentro de llamadas60Datos del centro de llamadas en marathi (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMarathi_GCmarathiMarathi (en trámite) mr_INConversacion general100Marathi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMarathi_MAmarathiMarathi (en trámite) mr_INMedios de audio40Marathi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMexicana_SM_48Español (mexico)Español (mexico)ES-MX48 kHzMonólogo guionado1,492Monólogo guionado en español mexicanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1016 Masculino 1069 Desconocido 95
HablaHolanda_SM_48DutchDutches-ES48 kHzMonólogo guionado1,205Monólogo guionado holandésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1285 Masculino 531 Desconocido 3
HablaInglés de Nueva York_CC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzCentro de llamadas103Datos del centro de llamadas en inglés de Nueva YorkConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 610, Hombre 532, Desconocido 0
HablaInglés de Nueva York_GC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzConversacion general107Datos de conversación general en inglés de Nueva YorkConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 114, Desconocido 0
HablaInglés de Nueva York_MA_16Inglés de Nueva YorkInglés de Nueva Yorkes_ES16 kHzMedios de audio140Datos de audio de New York English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 66, Hombre 230, Desconocido 11
HablaNueva Zelanda_GC_8Inglés neozelandés Inglés neozelandés es_ES8 kHzConversacion general148Datos generales de conversación en inglés de Nueva ZelandaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 167, hombre 121, Desconocido 4
HablaNueva Zelanda_MA_16Inglés neozelandés Inglés neozelandés es_ES16 kHzMedios de audio400Audio multimedia en inglés de Nueva ZelandaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 367, hombre 678, Desconocido 26
HablaOriya_CC_8OriyaOriya (en trámite) o_ENCentro de llamadas60Datos del centro de llamadas Oriya (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaOriya_GCOriyaOriya (en trámite) o_ENConversacion general100Oriya (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaOriya_MAOriyaOriya (en trámite) o_ENMedios de audio40Oriya (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPolaco_MA_16PolacoPolacopl_PL16 kHzMedios de audio269Audio de medios polacosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 173 Masculino 354 Desconocido 6
HablaPolaco Polonia_SM_48Polaco (Polonia)Polaco (Polonia)es-ES48 kHzMonólogo guionado1,482Polonia polaca - Monólogo con guiónGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1324 Masculino 701 Desconocido 24
HablaPunjabi_CC_8punjabiPunjabi (en tramitación) punjabiCentro de llamadas60Datos del centro de llamadas de Punjabi (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPunjabi_GCpunjabiPunjabi (en tramitación) punjabiConversacion general100Punjabi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPunjabi_MApunjabiPunjabi (en tramitación) punjabi Medios de audio40Punjabi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaRuso_SM_48rusorusoru-RU48 kHzMonólogo guionado2,398Monólogo con guión rusoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1689 Hombre 1937 Desconocido 214
HablaEscocés_GC_8escocés (acento inglés)escocés (acento inglés)es_AB8 kHzConversacion general292Datos de la conversación general escocesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 285, Hombre 260, Desconocido 3
HablaSingapur_CC_8Singapur inglésSingapur ingléses_ES8 kHzCentro de llamadas218Datos del centro de llamadas de SingapurConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 2139, Hombre 884, Desconocido 21
HablaSingapur_MA_16Singapur inglésSingapur ingléses_ES16 kHzMedios de audio247Datos de audio de Singapur MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 160, Hombre 455, Desconocido 37
HablaInglés sudafricano_CC_8Inglés sudafricanoInglés sudafricanoes_ES8 kHzCentro de llamadas261Datos del centro de llamadas en inglés sudafricanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1274 , Hombre 935 , Desconocido 1
HablaInglés sudafricano_MA_16Inglés sudafricanoInglés sudafricanoes_ES16 kHzMedios de audio251Datos de audio de South African English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 235, Hombre 432, Desconocido 36
HablaSuajili_CC_8swahiliswahilisw_KE8 kHzCentro de llamadas230Datos del centro de llamadas en swahiliConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 611, Hombre 833, Desconocido 0
HablaSwahili_MA_16swahiliswahilisw_KE16 kHzMedios de audio265Datos de audio de Swahili MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 493, Desconocido 25
HablaSueco_CC_8SuecoSuecosv_SE8 kHzCentro de llamadas250Datos del centro de llamadas suecoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1581, hombre 727, Desconocido 2
HablaSueco_MA_16SuecoSuecosv_SE16 kHzMedios de audio278Datos de audio de medios suecosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 195, hombre 500, Desconocido 21
HablaTamil_CC_8TamilTamil (en trámite) ta_INCentro de llamadas60Tamil (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTamil_GCTamilTamil (en trámite) ta_INConversacion general100Tamil (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTamil_MATamil Tamil (en trámite) ta_INMedios de audio40Tamil (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_GC_8telugutelugute_IN8 kHzConversacion general553Datos generales de conversación en teluguConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 574, Hombre 564, Desconocido 0
HablaTelugu_MA_16telugutelugute_IN16 kHzMedios de audio648Datos de audio de Telugu MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 207, Hombre 963, Desconocido 2
HablaTelugu_CC_8teluguTelugu (en proceso) te_INCentro de llamadas30Telugu (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_GCteluguTelugu (en proceso) te_INConversacion general50Telugu (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Escritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_MAteluguTelugu (en proceso) te_INMedios de audio20Telugu (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablatailandés_GC_8ThaiThaith_TH8 kHzConversacion general183Conversación general tailandesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigosDobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 338, Hombre 96, Desconocido 8
HablaTailandés_MA_8ThaiThaith_TH16 kHzMedios de audio173Audio de medios tailandesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 143, Hombre 502, Desconocido 26
HablaPavo Turco_SM_48Turquía turcaTurquía turcatr-TR48 kHzMonólogo guionado2,027Turquía turcaGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1561 Masculino 1241 Desconocido 31
Hablavietnamita_GC_8VietnamitaVietnamitavi_VN8 kHzConversacion general295Datos de conversación general en vietnamitaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 400, hombre 380, Desconocidos 2
HablaVietnamita_MA_16VietnamitaVietnamitavi_VN16 kHzMedios de audio257Datos de audio de medios vietnamitasLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 249, hombre 200, Desconocidos 45
HablaGalés_GC_8galés (acento inglés)galés (acento inglés)es_WL8 kHzConversacion general278Datos generales de conversación en galésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleEscritorio5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 270, Hombre 324, Desconocido 0
HablaInglés británico_WW_16Reino Unido InglésReino Unido Ingléses_es16 kHzWake Word200Wake Word Inglés británicocolección de datos de frases clave
  • altavoces 200
  • 4 frases clave únicas por hablante
  • 25-30 grabaciones de frases clave repetidas por frase clave única
  • 25-30 archivos de audio por frase clave única
  • 120 expresiones totales grabadas por hablante
canal 1Aplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSexo: 50% masculino, 50% femenino, +/- 10%.

Ground Truth Audio & Speech Data para acelerar su desarrollo de IA conversacional

Con más de 40 XNUMX horas de conjuntos de datos de audio/voz, Shaip puede ayudarlo a escalar sus modelos de IA conversacionales con conjuntos de datos de voz de alta calidad. Los conjuntos de datos de voz estándar de oro se recopilan en varios idiomas y dialectos, datos demográficos, características del hablante, tipos de diálogo, entornos y escenarios. Si no encuentras lo que buscas? – Shaip puede ayudarlo con cualquier conjunto de datos de voz en cualquier género, edad, idioma o configuración.

Algunos de los conjuntos de datos de idiomas que admitimos: Tenemos conjuntos de datos en todos los principales idiomas y dialectos. Algunos de nuestros idiomas más populares incluyen:

Conjuntos de datos de voz africanos

Conjuntos de datos de voz en árabe

Conjuntos de datos de voz canadienses

Conjuntos de datos de voz chinos

Conjuntos de datos de voz en danés

Conjuntos de datos de voz en inglés

Conjuntos de datos de voz en alemán

Conjuntos de datos de voz en hebreo

Conjuntos de datos de voz de Indonesia

Conjuntos de datos de voz irlandeses

Conjuntos de datos de voz en japonés

Conjuntos de datos de voz en coreano

Conjuntos de datos de voz mexicana

Conjuntos de datos de voz polacos

Conjuntos de datos de voz rusos

Conjuntos de datos de voz escocesa

Conjuntos de datos de voz en español

Conjuntos de datos de voz en sueco

Conjuntos de datos de voz en tailandés

Conjuntos de datos de voz turcos

Conjuntos de datos de voz vietnamita

Descripción del conjunto de datos

Conversaciones de Call Center 8khz: Conversación telefónica sintética sin guion: “agente” y “cliente”

Conversaciones Genéricas 8khz: Conversación telefónica no guionizada entre 2 personas

Medios y podcasts 16khz: Entrevistas de audio/video de dominio público, podcasts, etc. 1-5 personas

Enunciado/Monólogo con guion 16khz: Grabación basada en Prompt 

Comuníquese con nosotros

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos de audio y voz listos para usar en todos los tipos de datos 

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.