Conjuntos de datos de audio/habla/voz de alta calidad para entrenar su modelo de IA conversacional 

Conjuntos de datos de voz, voz y audio listos para usar en varios idiomas para poner en marcha sus modelos de reconocimiento automático de voz (ASR)

Conjuntos de datos de voz

Conecte el catálogo de datos de audio que se ha estado perdiendo hoy

BeneficiosConjunto de datos de idiomaFrecuencia de muestreoTipo de conjunto de datosHoras totales de audioTotal de horas de hablaDescripción del conjunto de datosCanal de audioPlataforma de grabaciónNOSOTROS SOMOS (%)Formato de audioFormato de transcripciónCaso de usoCTA
OratoriaAfro AmericanoVernáculo afroamericano8 kHzCentro de llamadas214211Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaAfro AmericanoVernáculo afroamericano16 kHzMedios de audio159149Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaafricaansafricaans8 kHzConversacion general368404Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en ÁfricaDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaafricaansafricaans16 kHzMedios de audio658615Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaÁrabeÁrabe8 kHzConversacion general293297Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del GolfoDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaBostonBoston8 kHzCentro de llamadas177175Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaBostonBoston8 kHzConversacion general3232Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaBostonBoston16 kHzMedios de audio9393Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaIngles chinoIngles chino8 kHzCentro de llamadas169130Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaIngles chinoIngles chino16 kHzMedios de audio249236Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaDanésDanés8 kHzConversacion general372395Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaDanésDanés16 kHzMedios de audio664603Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglésInglés16 kHzMedios de audio109Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés Deep SouthInglés Deep South8 kHzCentro de llamadas151149Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés Deep SouthInglés Deep South8 kHzConversacion general5656Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés Deep SouthInglés Deep South16 kHzMedios de audio266248Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHebreoHebreo8 kHzConversacion general399397Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en IsraelDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHebreoHebreo16 kHzMedios de audio427400Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHinglishHinglish8 kHzCentro de llamadas208185Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHinglishHinglish16 kHzMedios de audio216219Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaingles hispanoingles hispano8 kHzCentro de llamadas212209Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaingles hispanoingles hispano16 kHzMedios de audio155150Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés indioInglés indio16 kHzMedios de audio13787Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaIndonesianIndonesian8 kHzConversacion general496598Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesioDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaIndonesianIndonesian16 kHzMedios de audio643610Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriairlandésirlandés8 kHzConversacion general192180Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaKoreanKorean8 kHzCentro de llamadas107103Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaKoreanKorean16 kHzMedios de audio204197Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaMalayMalay8 kHzConversacion general266302Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en MalasiaDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaMalayMalay16 kHzMedios de audio344305Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés neozelandés Inglés neozelandés 8 kHzConversacion general148142Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés neozelandés Inglés neozelandés 16 kHzMedios de audio400400Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés de Nueva YorkInglés de Nueva York8 kHzCentro de llamadas103103Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés de Nueva YorkInglés de Nueva York8 kHzConversacion general107106Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés de Nueva YorkInglés de Nueva York16 kHzMedios de audio140140Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriapolacopolaco16 kHzMedios de audio269255Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaescocésescocés8 kHzConversacion general292267Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaSingapur inglésSingapur inglés8 kHzCentro de llamadas218194Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaSingapur inglésSingapur inglés16 kHzMedios de audio247240Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés sudafricanoInglés sudafricano8 kHzCentro de llamadas261204Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés sudafricanoInglés sudafricano16 kHzMedios de audio251245Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaEspañolEspañol16 kHzMedios de audio32Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaswahiliswahili8 kHzCentro de llamadas184165Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaswahiliswahili8 kHzCentro de llamadas4644Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaswahiliswahili16 kHzMedios de audio203191Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriaswahiliswahili16 kHzMedios de audio6258Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaSuecoSueco8 kHzCentro de llamadas250224Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaSuecoSueco16 kHzMedios de audio278255Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriatelugutelugu8 kHzConversacion general553582Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriatelugutelugu16 kHzMedios de audio648599Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaThaiThai8 kHzConversacion general183201Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigosDobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaThaiThai16 kHzMedios de audio173167Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaVietnamitaVietnamita8 kHzConversacion general295293Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaVietnamitaVietnamita16 kHzMedios de audio257248Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriagalésgalés8 kHzConversacion general278299Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés indioInglés indio8 kHzCentro de llamadas200200Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,MonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriatelugu telugu NACentro de llamadas3030Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaTamil Tamil NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriakannada kannada NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamalayalam malayalam NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriabengalí bengalí NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriagujarati gujarati NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamarathi marathi NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaAssamese Assamese NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaOriya Oriya NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriapunjabi punjabi NACentro de llamadas6060Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriatelugu telugu NAConversacion general5050Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaTamil Tamil NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriakannada kannada NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamalayalam malayalam NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriabengalí bengalí NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriagujarati gujarati NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamarathi marathi NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaAssamese Assamese NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaOriya Oriya NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriapunjabi punjabi NAConversacion general100100Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,NADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriatelugu telugu NAMedios de audio2020Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaTamil Tamil NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriakannada kannada NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamalayalam malayalam NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriabengalí bengalí NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriagujarati gujarati NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriamarathi marathi NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaAssamese Assamese NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaOriya Oriya NAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriapunjabipunjabiNAMedios de audio4040Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosNADesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaInglés EE. UU.Inglés EE. UU.48 kHzMonólogo guionado54Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaEspaña españolaEspaña española48 kHzMonólogo guionado108Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaMéxicanoMéxicano48 kHzMonólogo guionado1,4921,228Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Oratoriacanadiensecanadiense48 kHzMonólogo guionado1,2221,049Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaNederlandNederland48 kHzMonólogo guionado1,2051,021Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaPolonia polacaPolonia polaca48 kHzMonólogo guionado1,4821,266Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaTurquía turcaTurquía turca48 kHzMonólogo guionado2,0271,735Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaChino TradicionalChino Tradicional48 kHzMonólogo guionado1,028891Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaÁrabeÁrabe48 kHzMonólogo guionado1,9471,594Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaDanésDanés48 kHzMonólogo guionado2,5792,041Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de DinamarcaMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHindiHindi8 kHzCentro de llamadas122131Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHindiHindi16 kHzAudio multimedia219202Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoDesktop5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaHindiHindi48 kHzMonólogo guionado2,8672,105Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaJaponésJaponés48 kHzMonólogo guionado2,3352,029Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaKoreanKorean48 kHzMonólogo guionado1,9551,548Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaRusoRuso48 kHzMonólogo guionado2,3982,046Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaChino simplificadoChino simplificado48 kHzMonólogo guionado2,7622,181Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoMobile App5. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
OratoriaAlemánAlemán8 kHzCentro de llamadas640Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleDesktop. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Descripción

Conversaciones de Call Center 8khz: Conversación telefónica sintética sin guion: “agente” y “cliente”

Conversaciones Genéricas 8khz: Conversación telefónica no guionizada entre 2 personas

Medios y podcasts 16khz: Entrevistas de audio/video de dominio público, podcasts, etc. 1-5 personas

Enunciado/Monólogo con guion 16khz: Grabación basada en Prompt 

Comuníquese con nosotros

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos de audio y voz listos para usar en todos los tipos de datos 

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Al registrarme, estoy de acuerdo con Shaip Política de Privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.