Los servicios de recopilación de datos de voz más confiables para su IA

Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.

Recolección de datos de audio

Descubra canalizaciones de datos de audio sin cuellos de botella.

Clientes destacados

¿Por qué se necesita un conjunto de datos de entrenamiento del habla para el procesamiento del lenguaje natural?

¿Alguna vez ha notado que su teléfono inteligente VA, es decir, Siri, Bixby o cualquier otra cosa, interactúe? ¡La forma en que responden a todas las preguntas y analizan y presentan resultados según sus requisitos!

Bueno, por mucho que nos intriguen estos AV, estos recursos y programas inteligentes necesitan ser entrenados progresivamente para poder responder, con la mayor precisión. Esta es la razón por la que debe considerar externalizar la recopilación de datos de voz/audio y voz a empresas especializadas en recopilación de datos, con experiencia profesional validada.

Invertir en la recopilación de datos de audio prepara su supuesta PNL para atender a una audiencia multilingüe. No solo eso, la recopilación de datos de voz para NLP, cuando la maneja un experto, incluso tiene en cuenta la recopilación en el campo, el análisis semántico y la transcripción de audio. Con las soluciones profesionales de recopilación de datos de voz, puede:

  • Adquiera conjuntos de datos de audio de alta calidad para mejorar la precisión
  • Configuración de escenarios diversos de destino
  • Recopile datos de entrenamiento de IA multilingües
  • Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales

Servicios profesionales de recopilación de datos de audio / voz para PNL

Cualquier tema. Cualquier escenario.

Los sistemas inteligentes de PNL son todo menos genéricos. Dependiendo de la funcionalidad del programa, es posible que deba centrarse en servicios de datos de audio espaciales y multilingües, que solo pueden ofrecer empresas de recopilación de datos de voz / audio de renombre. Aquí es donde Shaip entra en el esquema de las cosas como un proveedor de servicios de conexión de datos altamente confiable que se enorgullece de hacer el trabajo pesado por sus IA supuestamente inteligentes.

En Shaip, nuestro enfoque principal es alimentar modelos con el mayor volumen posible de muestras de voz personalizadas, en el menor tiempo posible. Con nosotros a bordo, puede esperar:

Colección de discursos
  • Recopilación de datos de audio / voz seleccionados para PNL
  • Programas hechos a medida que responden según casos de uso específicos
  • Preparar la minería de conjuntos de datos de audio
  • Procesamiento de datos automatizado y específico para patrones
  • El nivel más alto posible de especificidad de dominio
  • Tiempo de comercialización más rápido con modelos de inteligencia artificial acelerados

Nuestra Experiencia

Alinee los datos de audio para preparar modelos inteligentes de PNL

Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.

Discurso de monólogo

Colección de discursos monólogos

Maneje los requisitos basados ​​en el habla pertenecientes a un altavoz independiente para sus prototipos de Text-to-Speed ​​y requisitos específicos de transcripciones con alimentación rápida por guión, a través de archivos de un solo canal.

Discurso de diálogo

Discurso de diálogo
Collection

Configure asistentes virtuales inteligentes, chatbots de velocidad específica y modelos de reconocimiento automático de voz con exposición multilingüe a través de archivos de doble canal y recursos transcritos.

Discurso acústico

Datos acústicos
Collection

Podemos grabar de forma profesional datos de audio con calidad de estudio, ya sea en restaurantes, oficinas o hogares o desde varios entornos e idiomas, a través de nuestra red global de colaboradores, al tiempo que cubrimos una gama acústica más amplia.

Expresión de lenguaje natural

Colección de expresiones en lenguaje natural

Entrene configuraciones comerciales inteligentes para identificar frases de clientes pronunciadas de manera diferente con un significado similar, para hacer que las IA sean más autónomas en el tiempo

Asistentes virtuales digitales

Digitales / Virtuales
Asistentes

Concéntrese en crear su próximo Asistente virtual mediante la formación de modelos con salvedades del habla humana, exposición multilingüe, análisis contextual y NLU.

Reconocimiento automático de voz

Reconocimiento automático de voz (ASR)

Mejore la precisión de sus sistemas de reconocimiento automático de voz (ASR) al tener acceso a conjuntos de datos de voz/audio diversificados de última generación, de una amplia gama de datos demográficos.

Expresión de lenguaje natural

Datos de entrenamiento de voz/audio multilingües

Nuestros profesionales de idiomas altamente calificados en todo el mundo ofrecen datos de capacitación de voz/audio multilingüe en varios idiomas y dialectos, incluidos árabe, danés, chino, afrikáans, Singapur, Nueva Zelanda, hebreo, indonesio, irlandés, coreano, malayo, polaco, escocés, sueco , francés, alemán, vietnamita, tailandés, italiano, español y más.

Asistentes virtuales digitales

Texto a voz
(TTS)

Para ofrecer una mejor experiencia de usuario con TTS, es fundamental desarrollar un sistema que suene natural. Cree un modelo multilingüe de texto a voz (TTS) con la ayuda de nuestra fuerza laboral global, que lo ayuda a recopilar datos de voz en más de 150 idiomas y dialectos para mejorar sus modelos de IA desde controles en el automóvil hasta chatbots y soluciones de aprendizaje con alta datos de audio de calidad.

Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz

Nosotros

Nosotros

Equipos dedicados y capacitados:

  • Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
  • Equipo de gestión de proyectos acreditado
  • Equipo de desarrollo de productos experimentado
  • Equipo de contratación y incorporación del grupo de talentos
Proceso

Proceso

La mayor eficiencia del proceso está asegurada con:

  • Proceso robusto Stage-Gate de 6 Sigma
  • Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
  • Bucle de retroalimentación y mejora continua
Plataforma

Plataforma

La plataforma patentada ofrece beneficios:

  • Plataforma de un extremo a otro basada en la web
  • Calidad impecable
  • TAT más rápido
  • Entrega perfecta

Idioma: conjuntos de datos de audio recopilados

Conjuntos de datos de voz/audio listos para usar

DetallesConjunto de datos de idiomaFrecuencia de muestreoTipo de conjunto de datosHoras totales de audioDescripción CortaDescripción del conjunto de datosCanal de audioPlataforma de grabaciónNOSOTROS SOMOS (%)Formato de audioFormato de transcripciónCaso de usoNúmero de altavocesCTA
Hablaes_US_CC_8Vernáculo afroamericanoVernáculo afroamericanoes_ES8 kHzCentro de llamadas211Datos del centro de llamadas vernáculo afroamericanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 612, Hombre: 1242 y Desconocido: 12
Hablaes_US_MA_16Vernáculo afroamericanoVernáculo afroamericanoes_ES16 kHzMedios de audio154Datos de medios vernáculos afroamericanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 151, Hombre: 150 y Desconocido: 10
HablaAfrikáans_GC_8africaansafricaansaf_ZA8 kHzConversacion general368Afrikáans Datos generales de conversaciónConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en ÁfricaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 502, Hombre: 390 y Desconocido: 2
HablaAfrikáans_MA_16africaansafricaansaf_ZA16 kHzMedios de audio658Archivos multimedia en afrikáansLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 750, Hombre: 1278 y Desconocido: 52
HablaÁrabe_GC_8ÁrabeÁrabear_AE8 kHzConversacion general292Datos de conversación general en árabeConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del GolfoDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 171, Hombre: 534 y Desconocido: 1
HablaÁrabe_SM_48ÁrabeÁrabear-SA48 kHzMonólogo guionado1,947Monólogo con guion árabeGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 838 Masculino 1209 Desconocido 78
HablaAsamés_CC_8AssameseAsamés (en proceso) como enCentro de llamadas60Datos del centro de llamadas asamés (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaAsamés_GCAssameseAsamés (en proceso) como enConversacion general100Asamés (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaAsamés_MAAssameseAsamés (en proceso) como enMedios de audio40Asamés (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_CC_8Bengalíbengalí (en proyecto) bn_INCentro de llamadas60Datos del centro de llamadas en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_GCBengalíbengalí (en proyecto) bn_INConversacion general100Datos generales de conversación en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablabengalí_MABengalíbengalí (en proyecto) bn_INMedios de audio40Datos de audio multimedia en bengalí (en proceso)Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaBoston_CC_8Inglés de BostonInglés de Bostones_ES8 kHzCentro de llamadas177Datos del centro de llamadas de BostonConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 605, Hombre: 711 y Desconocido: 0
HablaBoston_GC_8Inglés de BostonInglés de Bostones_ES8 kHzConversacion general32Datos de conversación general de BostonConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 53, Hombre: 83 y Desconocido: 0
HablaBoston_MA_16Inglés de BostonInglés de Bostones_ES16 kHzMedios de audio93Datos de audio de Boston MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 43, Hombre: 181 y Desconocido: 2
HablaCanadiense_SM_48francés canadiensefrancés canadiensefr-CA48 kHzMonólogo guionado1,222francés canadienseGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 974 Masculino 631 Desconocido 1
HablaChino_CC_8Ingles chinoIngles chinoes_ES8 kHzCentro de llamadas169Datos del centro de llamadas chinoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 1790, Masculino: 523 y Desconocido: 13
HablaChino_MA_16Ingles chinoIngles chinoes_ES16 kHzMedios de audio249Datos de audio de medios chinosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 126, Masculino: 346 y Desconocido: 6
HablaChino simplificado_SM_48Chino simplificadoChino simplificadozh-CN48 kHzMonólogo guionado2,762Chino simplificadoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1920 Hombre 1535 Desconocido 270
HablaChino tradicional_SM_48Chino TradicionalChino Tradicionalzh-TW48 kHzMonólogo guionado1,028Chino TradicionalGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1069 Masculino 262 Desconocido 3
HablaDanés_GC_8DanésDanésda_DK8 kHzConversacion general372Datos generales de conversación en danésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 311, Hombre: 417, Desconocido: 0
HablaDanés_MA_16DanésDanésda_DK16 kHzMedios de audio664Datos de audio de medios danesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 369, Hombre: 864, Desconocido: 27
HablaDanés_SM_48DanésDanésda-DK48 kHzMonólogo guionado2,579Monólogo con guión danésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de DinamarcaMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1551 Hombre 1233 Desconocido 42
HablaInglés Profundo Sur_CC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzCentro de llamadas151Datos del centro de llamadas del sur profundo en inglésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 221 , Hombre 1004 , Desconocido 7
HablaInglés Profundo Sur_GC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzConversacion general56Datos de conversación general del sur profundo en inglésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 99, Hombre 31, Desconocido 0
HablaInglés Profundo Sur_MA_16Inglés Deep SouthInglés Deep Southes_ES16 kHzMedios de audio266Datos de audio de Deep South Media en inglésLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 204, Hombre 356, Desconocido 21
HablaAlemán_CC_8AlemánAlemánde-de8 kHzCentro de llamadas64Datos del centro de llamadas alemán Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,MonoOrdenador de sobremesa. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 478 Masculino 1440 Desconocido 0
HablaAlemán_IVR_8AlemánAlemánde-de8 kHz IVR200Datos IVR alemanesHumano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontáneaMonoOrdenador de sobremesa. Wav jsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje Femenino 10115 Masculino 8750 Desconocido 0
HablaGujarati_CC_8GujaratiGujarati (en trámite) gu_INCentro de llamadas60Datos del centro de llamadas de Gujarati (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaGujarati_GCGujaratiGujarati (en trámite) gu_INConversacion general100Gujarati (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaGujarati_MAGujaratiGujarati (en trámite) gu_INMedios de audio40Gujarati (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaHebreo_Conversación general_8HebreoHebreoél_IL8 kHzConversacion general399Datos de conversación general en hebreoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en IsraelDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 414 , Hombre 399 , Desconocido 1
HablaHebreo_MA_16HebreoHebreoél_IL16 kHzMedios de audio427Datos de audio de medios hebreosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 361, Hombre 513, Desconocido 13
HablaHindi_MA_16HindiHindihola_IN16 kHzMedios de audio219Datos de audio de Hindi MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 83, Hombre 309, Desconocido 0
Hablahindi_sm_48HindiHindihola-IN48 kHzMonólogo guionado2,867Monólogo guionado en hindiGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1977 Hombre 1864 Desconocido 147
HablaHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCentro de llamadas208ESPAÑOL Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262 , Desconocido 0
HablaHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedios de audio216ESPAÑOL Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 75, Hombre 380, Desconocido 0
HablaHispano_CC_8ingles hispanoingles hispanoes_ES8 kHzCentro de llamadas212Datos del centro de llamadas hispanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262, Desconocido 0
HablaHispano_MA_16ingles hispanoingles hispanoes_ES16 kHzMedios de audio155Audio de los medios de comunicación hispanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 140, Hombre 219, Desconocido 5
Hablaindonesio_GC_8IndonesioIndonesioyo hice8 kHzConversacion general496Datos de conversación general de indonesioConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesioDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 524, Hombre 454, Desconocido 2
HablaIndonesia_MA_16IndonesioIndonesioyo hice16 kHzMedios de audio643Datos de audio de los medios de IndonesiaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 746, Hombre 1507, Desconocido 129
Hablairlandés_GC_8irlandésirlandéses_ES8 kHzConversacion general192Datos de conversación general en irlandésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 213 , Hombre 153 , Desconocido 0
HablaJaponés_SM_48japonésjaponésja-JP48 kHzMonólogo guionado2,335Monólogo con guion japonésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1460 Hombre 1221 Desconocido 194
HablaCanadá_CC_8kannadaKannada (en tramitación) kn_INCentro de llamadas60Datos del centro de atención telefónica de Kannada (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablakannada_GCkannadaKannada (en tramitación) kn_INConversacion general100Kannada (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaCanadá_MAkannadaKannada (en tramitación) kn_INMedios de audio40Kannada (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaCoreano_CC_8CoreanoCoreanoko_KR8 kHzCentro de llamadas107Datos del centro de llamadas de CoreaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1086, Masculino 210 , Desconocido 4
Hablacoreano_MA_16CoreanoCoreanoko_KR16 kHzMedios de audio204Datos de audio de medios coreanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 70 Hombre 303, Desconocido 25
Hablacoreano_sm_48CoreanoCoreanoko-KR48 kHzMonólogo guionado1,955Monólogo escrito en coreanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1195 Hombre 1134 Desconocido 122
Hablamalayo_GC_8MalayMalayms_MY8 kHzConversacion general266Datos generales de conversación en malayoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en MalasiaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 316, Hombre 176 , Desconocido 0
HablaMalayo_MA_16MalayMalayms_MY16 kHzMedios de audio344Datos de audio de Malay MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 236, Hombre 626, Desconocido 47
HablaMalayalam_CC_8malayalamMalayalam (en trámite) ml_INCentro de llamadas60Malayalam (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMalayalam_GCmalayalamMalayalam (en trámite) ml_INConversacion general100Malayalam (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMalayalam_MAmalayalamMalayalam (en trámite) ml_INMedios de audio40Malayalam (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMaratí_CC_8marathiMarathi (en trámite) señor_INCentro de llamadas60Datos del centro de llamadas en marathi (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablamarathi_GCmarathiMarathi (en trámite) señor_INConversacion general100Marathi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablamarathi_MAmarathiMarathi (en trámite) señor_INMedios de audio40Marathi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaMexicana_SM_48Español (mexico)Español (mexico)ES-MX48 kHzMonólogo guionado1,492Monólogo guionado en español mexicanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1016 Masculino 1069 Desconocido 95
HablaHolanda_SM_48HolandésHolandéses-ES48 kHzMonólogo guionado1,205Monólogo guionado holandésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1285 Masculino 531 Desconocido 3
HablaInglés de Nueva York_CC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzCentro de llamadas103Datos del centro de llamadas en inglés de Nueva YorkConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 610, Hombre 532, Desconocido 0
HablaInglés de Nueva York_GC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzConversacion general107Datos de conversación general en inglés de Nueva YorkConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 114, Desconocido 0
HablaInglés de Nueva York_MA_16Inglés de Nueva YorkInglés de Nueva Yorkes_ES16 kHzMedios de audio140Datos de audio de New York English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 66, Hombre 230, Desconocido 11
HablaNueva Zelanda_GC_8Inglés neozelandés Inglés neozelandés es_ES8 kHzConversacion general148Datos generales de conversación en inglés de Nueva ZelandaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 167, hombre 121, Desconocido 4
HablaNueva Zelanda_MA_16Inglés neozelandés Inglés neozelandés es_ES16 kHzMedios de audio400Audio multimedia en inglés de Nueva ZelandaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 367, hombre 678, Desconocido 26
HablaOriya_CC_8oriyaOriya (en trámite) o_ENCentro de llamadas60Datos del centro de llamadas Oriya (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaOriya_GCoriyaOriya (en trámite) o_ENConversacion general100Oriya (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaOriya_MAoriyaOriya (en trámite) o_ENMedios de audio40Oriya (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPolaco_MA_16polacopolacopl_PL16 kHzMedios de audio269Audio de medios polacosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 173 Masculino 354 Desconocido 6
HablaPolaco Polonia_SM_48Polaco (Polonia)Polaco (Polonia)es-ES48 kHzMonólogo guionado1,482Polonia polaca - Monólogo con guiónGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1324 Masculino 701 Desconocido 24
HablaPunjabi_CC_8punjabiPunjabi (en tramitación) punjabiCentro de llamadas60Datos del centro de llamadas de Punjabi (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPunjabi_GCpunjabiPunjabi (en tramitación) punjabiConversacion general100Punjabi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaPunjabi_MApunjabiPunjabi (en tramitación) punjabi Medios de audio40Punjabi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaRuso_SM_48rusorusoru-RU48 kHzMonólogo guionado2,398Monólogo con guión rusoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1689 Hombre 1937 Desconocido 214
HablaEscocés_GC_8escocés (acento inglés)escocés (acento inglés)es_AB8 kHzConversacion general292Datos de la conversación general escocesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 285, Hombre 260, Desconocido 3
HablaSingapur_CC_8Singapur inglésSingapur ingléses_ES8 kHzCentro de llamadas218Datos del centro de llamadas de SingapurConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 2139, Hombre 884, Desconocido 21
HablaSingapur_MA_16Singapur inglésSingapur ingléses_ES16 kHzMedios de audio247Datos de audio de Singapur MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 160, Hombre 455, Desconocido 37
HablaInglés sudafricano_CC_8Inglés sudafricanoInglés sudafricanoes_ES8 kHzCentro de llamadas261Datos del centro de llamadas en inglés de SudáfricaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1274 , Hombre 935 , Desconocido 1
HablaInglés sudafricano_MA_16Inglés sudafricanoInglés sudafricanoes_ES16 kHzMedios de audio251Datos de audio de South African English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 235, Hombre 432, Desconocido 36
HablaSuajili_CC_8swahiliswahilisw_KE8 kHzCentro de llamadas230Datos del centro de llamadas en swahiliConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 611, Hombre 833, Desconocido 0
HablaSuajili_MA_16swahiliswahilisw_KE16 kHzMedios de audio265Datos de audio de Swahili MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 493, Desconocido 25
HablaSueco_CC_8SuecoSuecosv_SE8 kHzCentro de llamadas250Datos del centro de llamadas suecoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1581, hombre 727, Desconocido 2
HablaSueco_MA_16SuecoSuecosv_SE16 kHzMedios de audio278Datos de audio de medios suecosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 195, hombre 500, Desconocido 21
HablaTamil_CC_8TamilTamil (en trámite) ta_INCentro de llamadas60Tamil (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTamil_GCTamilTamil (en trámite) ta_INConversacion general100Tamil (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTamil_MATamil Tamil (en trámite) ta_INMedios de audio40Tamil (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_GC_8telugutelugute_IN8 kHzConversacion general553Datos generales de conversación en teluguConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 574, Hombre 564, Desconocido 0
HablaTelugu_MA_16telugutelugute_IN16 kHzMedios de audio648Datos de audio de Telugu MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 207, Hombre 963, Desconocido 2
HablaTelugu_CC_8teluguTelugu (en proceso) te_INCentro de llamadas30Telugu (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_GCteluguTelugu (en proceso) te_INConversacion general50Telugu (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
HablaTelugu_MAteluguTelugu (en proceso) te_INMedios de audio20Telugu (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Hablatailandés_GC_8TailandésTailandésth_TH8 kHzConversacion general183Conversación general tailandesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigosDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 338, Hombre 96, Desconocido 8
HablaTailandés_MA_8TailandésTailandésth_TH16 kHzMedios de audio173Audio de medios tailandesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 143, Hombre 502, Desconocido 26
HablaPavo Turco_SM_48Turquía turcaTurquía turcatr-TR48 kHzMonólogo guionado2,027Turquía turcaGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1561 Masculino 1241 Desconocido 31
Hablavietnamita_GC_8VietnamitaVietnamitavi_VN8 kHzConversacion general295Datos de conversación general en vietnamitaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 400, hombre 380, Desconocidos 2
HablaVietnamita_MA_16VietnamitaVietnamitavi_VN16 kHzMedios de audio257Datos de audio de medios vietnamitasLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 249, hombre 200, Desconocidos 45
HablaGalés_GC_8galés (acento inglés)galés (acento inglés)es_WL8 kHzConversacion general278Datos generales de conversación en galésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 270, Hombre 324, Desconocido 0
HablaInglés británico_WW_16Reino Unido InglésReino Unido Ingléses_es16 kHzWake Word200 AltavocesWake Word Inglés británicocolección de datos de frases clave
  • altavoces 200
  • 4 frases clave únicas por hablante
  • 25-30 grabaciones de frases clave repetidas por frase clave única
  • 25-30 archivos de audio por frase clave única
  • 120 expresiones totales grabadas por hablante
canal 1Aplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSexo: 50% masculino, 50% femenino, +/- 10%.

Servicios Ofrecidos

La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:

Recopilación de datos de texto

Recopilación de datos de texto
Servicios

El verdadero valor de los servicios de recopilación de datos cognitivos de Shaip es que les brinda a las organizaciones la clave para desbloquear la información crítica que se encuentra dentro de los datos no estructurados.

Recopilación de datos de imágenes

Servicios de recopilación de datos de imágenes

Asegúrese de que su modelo de visión por computadora identifique cada imagen con precisión, para entrenar sin problemas los modelos de inteligencia artificial de próxima generación del futuro

Recopilación de datos de video

Servicios de recopilación de datos de video

Ahora céntrese en la visión por computadora junto con la PNL para entrenar a sus modelos a identificar objetos, individuos, elementos disuasorios y otros elementos visuales a la perfección.

Comuníquese con nosotros

¿Quiere construir su propio conjunto de datos de audio?

Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades

  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad e Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.

La recopilación de datos de voz para un modelo de aprendizaje automático se refiere al proceso de recopilación de grabaciones de audio del lenguaje hablado. Esta colección ayuda a entrenar y perfeccionar algoritmos de aprendizaje automático, en particular aquellos centrados en la comprensión y el procesamiento de voces humanas.

Cuando intente recopilar datos de audio para el reconocimiento automático de voz (ASR), debe comenzar definiendo las necesidades específicas de su proyecto, incluido el idioma, el acento y el tipo de voz deseados. Después de configurar estos parámetros, asegúrese de obtener todos los permisos necesarios para respetar la privacidad del usuario. Luego, utilice dispositivos o software de grabación adecuados para capturar muestras de audio claras. Cada grabación debe anotarse meticulosamente con su transcripción u otros metadatos pertinentes y almacenarse sistemáticamente para facilitar el acceso.

Un conjunto de datos de voz en el aprendizaje automático es fundamental para entrenar, probar y validar modelos diseñados para reconocer, transcribir o interpretar el lenguaje hablado. Estos conjuntos de datos allanan el camino para innumerables aplicaciones, desde asistentes de voz y servicios de transcripción hasta biometría de voz.

Para recopilar datos precisos de diversos idiomas y acentos, es vital la colaboración con hablantes nativos de los orígenes lingüísticos deseados. Apunte a una muestra variada y representativa para cubrir un amplio espectro de matices demográficos. Emplee equipos de grabación estandarizados en entornos uniformes para garantizar la coherencia del audio. Y, lo que es más importante, anote cada pieza de datos con transcripciones y metadatos detallados, indicando el idioma y el acento específicos.