Los servicios de recopilación de datos de voz más confiables para su IA

Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.

Recopilación de datos de audio

Descubra canalizaciones de datos de audio sin cuellos de botella

Clientes destacados

Servicios profesionales de recopilación de datos de audio/voz

Cualquier tema. Cualquier escenario.

En Shaip, nuestra experiencia radica en la creación de conjuntos de datos de voz de alta calidad diseñados para diversos requisitos de IA/ML. Ofrecemos una amplia gama de idiomas y registramos en diversos entornos, lo que hace que nuestros conjuntos de datos sean completos y adaptables. ohNuestro objetivo es alimentar modelos con el mayor volumen de datos de voz personalizados, en el menor tiempo posible. Con nosotros a bordo, puede esperar: 

Colección de discursos
  • Datos de audio/voz multilingües de alta calidad seleccionados para mejorar la precisión
  • El nivel más alto posible de especificidad de dominio para tescenario diverso Configure
  •  Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales
  • Entornos de grabación: calidad de estudio, con audio nítido con mínimo ruido de fondo, y Ambientes Naturales, donde las grabaciones incorporan sonidos ambientales para imitar situaciones del mundo real.

100+

Países

55K+

Horas de datos de voz

250+

Proyectos

60+

Idiomas (más de 100 dialectos)

8 / 16 / 44 / 48 kHz

Tasa de muestreo

Nuestra Experiencia

Alinee los datos de audio para obtener modelos de PNL más inteligentes

Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.

discurso monólogo

Colección de discursos monólogos

Se centra en procesar el habla de un solo hablante. Utilice indicaciones escritas para alimentar archivos de audio de un solo canal, asegurando la captura de patrones de voz, tonos y matices únicos y específicos de esa persona.

Discurso de diálogo

Discurso de diálogo
Colecciones

Interacción de dos personas, que replica conversaciones y diálogos del mundo real con exposición multilingüe a través de archivos de doble canal y recursos transcritos.

Conversaciones multipartitas

Grupo / Multipartido
Conversaciones

Discusiones entre varias personas, capturando dinámicas de grupo, superposiciones y tonos variados para entrenar con precisión los modelos de habla.

Expresión del lenguaje natural

Colección de expresiones en lenguaje natural

Entrene a las IA para que identifiquen frases o palabras de activación con significados similares utilizando expresiones diversas, ricas y auténticas para el procesamiento y la comprensión avanzados del lenguaje natural.

discurso acústico

Datos acústicos
Colecciones

Podemos grabar profesionalmente datos de audio con calidad de estudio, ya sean restaurantes, oficinas u hogares o de diversos entornos e idiomas, al mismo tiempo que cubrimos un rango acústico más amplio (conjuntos de datos de sonido completos).

Reconocimiento de voz automático

Reconocimiento automático de voz (ASR)

Mejore la precisión de sus sistemas de reconocimiento automático de voz (ASR) al tener acceso a conjuntos de datos de voz/audio diversificados de última generación, de una amplia gama de datos demográficos.

Expresión del lenguaje natural

Datos de entrenamiento de voz/audio multilingües

Nuestros profesionales lingüísticos capacitados, en todo el mundo, ofrecen datos de audio/voz multilingües en varios idiomas y dialectos. Este esfuerzo fomenta la comunicación global y salva las barreras del idioma, contribuyendo a soluciones de IA más inclusivas y efectivas.

asistentes virtuales digitales

Texto a voz
(TTS)

Cree un modelo multilingüe de conversión de texto a voz (TTS) con la ayuda de nuestra fuerza laboral global, que lo ayuda a recopilar datos de voz en más de 150 idiomas y dialectos para mejorar sus modelos de inteligencia artificial, desde controles en el automóvil hasta chatbots y soluciones de aprendizaje con alta tecnología. datos de audio de calidad.

Grabaciones del centro de llamadas

Call Center
Grabaciones

Intercambios genuinos entre agentes y clientes, admitiendo numerosos idiomas como español, alemán, inglés americano, bengalí, japonés, chino e hindi.

Casos de éxito

Conjuntos de datos de IA conversacional con más de 3 horas de datos en 8 idiomas

Con el objetivo de crear una plataforma multilingüe para los idiomas indios, el cliente se asoció con Shaip para recopilar, segmentar y transcribir grandes conjuntos de datos en varios idiomas indios. Esto ayudaría a desarrollar modelos de habla efectivos que podrían impulsar la nueva e innovadora plataforma del cliente.

Problema: Más de 3,000 horas de datos de audio recopilados en 8 idiomas indios, segmentados y transcritos para desarrollar el reconocimiento automático del habla.

Solución: Proporcionamos recopilación, segmentación, transcripción de datos y entregamos archivos JSON con metadatos. Recopilamos 3000 horas de datos de audio en 8 idiomas indios a escala para el proyecto de tecnología del habla del cliente.

Estudio de caso de recopilación de datos del habla

Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz

Personas

Personas

Equipos dedicados y capacitados:

  • Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
  • Equipo de gestión de proyectos acreditado
  • Equipo de desarrollo de productos experimentado
  • Equipo de contratación y incorporación del grupo de talentos
Proceso

Proceso

La mayor eficiencia del proceso está asegurada con:

  • Proceso robusto Stage-Gate de 6 Sigma
  • Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
  • Bucle de retroalimentación y mejora continua
Productos

Productos

La plataforma patentada ofrece beneficios:

  • Plataforma de un extremo a otro basada en la web
  • Calidad impecable
  • TAT más rápido
  • Entrega perfecta

Conjuntos de datos de voz/audio listos para usar

DetallesConjunto de datos de idiomaFrecuencia de muestreoTipo de conjunto de datosHoras totales de audioDescripción CortaDescripción del conjunto de datosCanal de audioPlataforma de grabaciónNOSOTROS SOMOS (%)Formato de audioFormato de transcripciónCaso de usoNúmero de altavocesCTA
Speeches_US_CC_8Vernáculo afroamericanoVernáculo afroamericanoes_ES8 kHzCentro de llamadas211Datos del centro de llamadas vernáculo afroamericanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 612, Hombre: 1242 y Desconocido: 12
Speeches_US_MA_16Vernáculo afroamericanoVernáculo afroamericanoes_ES16 kHzMedios de audio154Datos de medios vernáculos afroamericanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 151, Hombre: 150 y Desconocido: 10
SpeechAfrikáans_GC_8africaansafricaansaf_ZA8 kHzConversacion general368Afrikáans Datos generales de conversaciónConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en ÁfricaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 502, Hombre: 390 y Desconocido: 2
SpeechAfrikáans_MA_16africaansafricaansaf_ZA16 kHzMedios de audio658Archivos multimedia en afrikáansLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 750, Hombre: 1278 y Desconocido: 52
SpeechÁrabe_GC_8ÁrabeÁrabear_AE8 kHzConversacion general292Datos de conversación general en árabeConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del GolfoDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 171, Hombre: 534 y Desconocido: 1
SpeechÁrabe_SM_48ÁrabeÁrabear-SA48 kHzMonólogo guionado1,947Monólogo con guion árabeGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 838 Masculino 1209 Desconocido 78
SpeechAsamés_CC_8AssameseAsamés (en proceso) como enCentro de llamadas60Datos del centro de llamadas asamés (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAsamés_GCAssameseAsamés (en proceso) como enConversacion general100Asamés (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAsamés_MAAssameseAsamés (en proceso) como enMedios de audio40Asamés (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechbengalí_CC_8Bengalíbengalí (en proyecto) bn_INCentro de llamadas60Datos del centro de llamadas en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechbengalí_GCBengalíbengalí (en proyecto) bn_INConversacion general100Datos generales de conversación en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechbengalí_MABengalíbengalí (en proyecto) bn_INMedios de audio40Datos de audio multimedia en bengalí (en proceso)Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechBoston_CC_8Inglés de BostonInglés de Bostones_ES8 kHzCentro de llamadas177Datos del centro de llamadas de BostonConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 605, Hombre: 711 y Desconocido: 0
SpeechBoston_GC_8Inglés de BostonInglés de Bostones_ES8 kHzConversacion general32Datos de conversación general de BostonConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 53, Hombre: 83 y Desconocido: 0
SpeechBoston_MA_16Inglés de BostonInglés de Bostones_ES16 kHzMedios de audio93Datos de audio de Boston MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 43, Hombre: 181 y Desconocido: 2
SpeechCanadiense_SM_48francés canadiensefrancés canadiensefr-CA48 kHzMonólogo guionado1,222francés canadienseGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 974 Masculino 631 Desconocido 1
SpeechChino_CC_8Ingles chinoIngles chinoes_ES8 kHzCentro de llamadas169Datos del centro de llamadas chinoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 1790, Masculino: 523 y Desconocido: 13
SpeechChino_MA_16Ingles chinoIngles chinoes_ES16 kHzMedios de audio249Datos de audio de medios chinosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 126, Masculino: 346 y Desconocido: 6
SpeechChino simplificado_SM_48Chino simplificadoChino simplificadozh-CN48 kHzMonólogo guionado2,762Chino simplificadoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1920 Hombre 1535 Desconocido 270
SpeechChino tradicional_SM_48Chino TradicionalChino Tradicionalzh-TW48 kHzMonólogo guionado1,028Chino TradicionalGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1069 Masculino 262 Desconocido 3
SpeechDanés_GC_8DanésDanésda_DK8 kHzConversacion general372Datos generales de conversación en danésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 311, Hombre: 417, Desconocido: 0
SpeechDanés_MA_16DanésDanésda_DK16 kHzMedios de audio664Datos de audio de medios danesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 369, Hombre: 864, Desconocido: 27
SpeechDanés_SM_48DanésDanésda-DK48 kHzMonólogo guionado2,579Monólogo con guión danésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de DinamarcaMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1551 Hombre 1233 Desconocido 42
SpeechInglés Profundo Sur_CC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzCentro de llamadas151Datos del centro de llamadas del sur profundo en inglésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 221 , Hombre 1004 , Desconocido 7
SpeechInglés Profundo Sur_GC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzConversacion general56Datos de conversación general del sur profundo en inglésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 99, Hombre 31, Desconocido 0
SpeechInglés Profundo Sur_MA_16Inglés Deep SouthInglés Deep Southes_ES16 kHzMedios de audio266Datos de audio de Deep South Media en inglésLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 204, Hombre 356, Desconocido 21
SpeechAlemán_CC_8AlemánAlemánde-de8 kHzCentro de llamadas64Datos del centro de llamadas alemán Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,MonoOrdenador de sobremesa. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 478 Masculino 1440 Desconocido 0
SpeechAlemán_IVR_8AlemánAlemánde-de8 kHz IVR200Datos IVR alemanesHumano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontáneaMonoOrdenador de sobremesa. Wav jsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje Femenino 10115 Masculino 8750 Desconocido 0
SpeechGujarati_CC_8GujaratiGujarati (en trámite) gu_INCentro de llamadas60Datos del centro de llamadas de Gujarati (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechGujarati_GCGujaratiGujarati (en trámite) gu_INConversacion general100Gujarati (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechGujarati_MAGujaratiGujarati (en trámite) gu_INMedios de audio40Gujarati (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechHebreo_Conversación general_8HebreoHebreoél_IL8 kHzConversacion general399Datos de conversación general en hebreoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en IsraelDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 414 , Hombre 399 , Desconocido 1
SpeechHebreo_MA_16HebreoHebreoél_IL16 kHzMedios de audio427Datos de audio de medios hebreosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 361, Hombre 513, Desconocido 13
SpeechHindi_MA_16HindiHindihola_IN16 kHzMedios de audio219Datos de audio de Hindi MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 83, Hombre 309, Desconocido 0
Speechhindi_sm_48HindiHindihola-IN48 kHzMonólogo guionado2,867Monólogo guionado en hindiGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1977 Hombre 1864 Desconocido 147
SpeechHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCentro de llamadas208ESPAÑOL Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262 , Desconocido 0
SpeechHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedios de audio216ESPAÑOL Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 75, Hombre 380, Desconocido 0
SpeechHispano_CC_8ingles hispanoingles hispanoes_ES8 kHzCentro de llamadas212Datos del centro de llamadas hispanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262, Desconocido 0
SpeechHispano_MA_16ingles hispanoingles hispanoes_ES16 kHzMedios de audio155Audio de los medios de comunicación hispanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 140, Hombre 219, Desconocido 5
Speechindonesio_GC_8IndonesioIndonesioyo hice8 kHzConversacion general496Datos de conversación general de indonesioConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesioDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 524, Hombre 454, Desconocido 2
SpeechIndonesia_MA_16IndonesioIndonesioyo hice16 kHzMedios de audio643Datos de audio de los medios de IndonesiaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 746, Hombre 1507, Desconocido 129
Speechirlandés_GC_8irlandésirlandéses_ES8 kHzConversacion general192Datos de conversación general en irlandésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 213 , Hombre 153 , Desconocido 0
SpeechJaponés_SM_48JaponésJaponésja-JP48 kHzMonólogo guionado2,335Monólogo con guion japonésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1460 Hombre 1221 Desconocido 194
SpeechCanadá_CC_8kannadaKannada (en tramitación) kn_INCentro de llamadas60Datos del centro de atención telefónica de Kannada (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechkannada_GCkannadaKannada (en tramitación) kn_INConversacion general100Kannada (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechCanadá_MAkannadaKannada (en tramitación) kn_INMedios de audio40Kannada (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechCoreano_CC_8CoreanoCoreanoko_KR8 kHzCentro de llamadas107Datos del centro de llamadas de CoreaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1086, Masculino 210 , Desconocido 4
Speechcoreano_MA_16CoreanoCoreanoko_KR16 kHzMedios de audio204Datos de audio de medios coreanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 70 Hombre 303, Desconocido 25
Speechcoreano_sm_48CoreanoCoreanoko-KR48 kHzMonólogo guionado1,955Monólogo escrito en coreanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1195 Hombre 1134 Desconocido 122
Speechmalayo_GC_8MalayMalayms_MY8 kHzConversacion general266Datos generales de conversación en malayoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en MalasiaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 316, Hombre 176 , Desconocido 0
SpeechMalayo_MA_16MalayMalayms_MY16 kHzMedios de audio344Datos de audio de Malay MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 236, Hombre 626, Desconocido 47
SpeechMalayalam_CC_8malayalamMalayalam (en trámite) ml_INCentro de llamadas60Malayalam (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayalam_GCmalayalamMalayalam (en trámite) ml_INConversacion general100Malayalam (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayalam_MAmalayalamMalayalam (en trámite) ml_INMedios de audio40Malayalam (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMaratí_CC_8marathiMarathi (en trámite) señor_INCentro de llamadas60Datos del centro de llamadas en marathi (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechmarathi_GCmarathiMarathi (en trámite) señor_INConversacion general100Marathi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechmarathi_MAmarathiMarathi (en trámite) señor_INMedios de audio40Marathi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMexicana_SM_48Español (mexico)Español (mexico)ES-MX48 kHzMonólogo guionado1,492Monólogo guionado en español mexicanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1016 Masculino 1069 Desconocido 95
SpeechHolanda_SM_48HolandésHolandéses-ES48 kHzMonólogo guionado1,205Monólogo guionado holandésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1285 Masculino 531 Desconocido 3
SpeechInglés de Nueva York_CC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzCentro de llamadas103Datos del centro de llamadas en inglés de Nueva YorkConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 610, Hombre 532, Desconocido 0
SpeechInglés de Nueva York_GC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzConversacion general107Datos de conversación general en inglés de Nueva YorkConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 114, Desconocido 0
SpeechInglés de Nueva York_MA_16Inglés de Nueva YorkInglés de Nueva Yorkes_ES16 kHzMedios de audio140Datos de audio de New York English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 66, Hombre 230, Desconocido 11
SpeechNueva Zelanda_GC_8Inglés neozelandés Inglés neozelandés es_ES8 kHzConversacion general148Datos generales de conversación en inglés de Nueva ZelandaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 167, hombre 121, Desconocido 4
SpeechNueva Zelanda_MA_16Inglés neozelandés Inglés neozelandés es_ES16 kHzMedios de audio400Audio multimedia en inglés de Nueva ZelandaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 367, hombre 678, Desconocido 26
SpeechOriya_CC_8oriyaOriya (en trámite) o_ENCentro de llamadas60Datos del centro de llamadas Oriya (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechOriya_GCoriyaOriya (en trámite) o_ENConversacion general100Oriya (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechOriya_MAoriyaOriya (en trámite) o_ENMedios de audio40Oriya (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPolaco_MA_16PolacoPolacopl_PL16 kHzMedios de audio269Audio de medios polacosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 173 Masculino 354 Desconocido 6
SpeechPolaco Polonia_SM_48Polaco (Polonia)Polaco (Polonia)es-ES48 kHzMonólogo guionado1,482Polonia polaca - Monólogo con guiónGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1324 Masculino 701 Desconocido 24
SpeechPunjabi_CC_8punjabiPunjabi (en tramitación) punjabiCentro de llamadas60Datos del centro de llamadas de Punjabi (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPunjabi_GCpunjabiPunjabi (en tramitación) punjabiConversacion general100Punjabi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPunjabi_MApunjabiPunjabi (en tramitación) punjabi Medios de audio40Punjabi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechRuso_SM_48RusoRusoru-RU48 kHzMonólogo guionado2,398Monólogo con guión rusoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1689 Hombre 1937 Desconocido 214
SpeechEscocés_GC_8escocés (acento inglés)escocés (acento inglés)es_AB8 kHzConversacion general292Datos de la conversación general escocesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 285, Hombre 260, Desconocido 3
SpeechSingapur_CC_8Singapur inglésSingapur ingléses_ES8 kHzCentro de llamadas218Datos del centro de llamadas de SingapurConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 2139, Hombre 884, Desconocido 21
SpeechSingapur_MA_16Singapur inglésSingapur ingléses_ES16 kHzMedios de audio247Datos de audio de Singapur MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 160, Hombre 455, Desconocido 37
SpeechInglés sudafricano_CC_8Inglés sudafricanoInglés sudafricanoes_ES8 kHzCentro de llamadas261Datos del centro de llamadas en inglés de SudáfricaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1274 , Hombre 935 , Desconocido 1
SpeechInglés sudafricano_MA_16Inglés sudafricanoInglés sudafricanoes_ES16 kHzMedios de audio251Datos de audio de South African English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 235, Hombre 432, Desconocido 36
SpeechSuajili_CC_8swahiliswahilisw_KE8 kHzCentro de llamadas230Datos del centro de llamadas en swahiliConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 611, Hombre 833, Desconocido 0
SpeechSuajili_MA_16swahiliswahilisw_KE16 kHzMedios de audio265Datos de audio de Swahili MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 493, Desconocido 25
SpeechSueco_CC_8SuecoSuecosv_SE8 kHzCentro de llamadas250Datos del centro de llamadas suecoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1581, hombre 727, Desconocido 2
SpeechSueco_MA_16SuecoSuecosv_SE16 kHzMedios de audio278Datos de audio de medios suecosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 195, hombre 500, Desconocido 21
SpeechTamil_CC_8TamilTamil (en trámite) ta_INCentro de llamadas60Tamil (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTamil_GCTamilTamil (en trámite) ta_INConversacion general100Tamil (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTamil_MATamil Tamil (en trámite) ta_INMedios de audio40Tamil (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_GC_8telugutelugute_IN8 kHzConversacion general553Datos generales de conversación en teluguConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 574, Hombre 564, Desconocido 0
SpeechTelugu_MA_16telugutelugute_IN16 kHzMedios de audio648Datos de audio de Telugu MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 207, Hombre 963, Desconocido 2
SpeechTelugu_CC_8teluguTelugu (en proceso) te_INCentro de llamadas30Telugu (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_GCteluguTelugu (en proceso) te_INConversacion general50Telugu (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_MAteluguTelugu (en proceso) te_INMedios de audio20Telugu (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechtailandés_GC_8TailandésTailandésth_TH8 kHzConversacion general183Conversación general tailandesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigosDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 338, Hombre 96, Desconocido 8
SpeechTailandés_MA_8TailandésTailandésth_TH16 kHzMedios de audio173Audio de medios tailandesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 143, Hombre 502, Desconocido 26
SpeechPavo Turco_SM_48Turquía turcaTurquía turcatr-TR48 kHzMonólogo guionado2,027Turquía turcaGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1561 Masculino 1241 Desconocido 31
Speechvietnamita_GC_8VietnamitaVietnamitavi_VN8 kHzConversacion general295Datos de conversación general en vietnamitaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 400, hombre 380, Desconocidos 2
SpeechVietnamita_MA_16VietnamitaVietnamitavi_VN16 kHzMedios de audio257Datos de audio de medios vietnamitasLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 249, hombre 200, Desconocidos 45
SpeechGalés_GC_8galés (acento inglés)galés (acento inglés)es_WL8 kHzConversacion general278Datos generales de conversación en galésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 270, Hombre 324, Desconocido 0
SpeechInglés británico_WW_16Reino Unido InglésReino Unido Ingléses_es16 kHzWake Word200 AltavocesWake Word Inglés británicocolección de datos de frases clave
  • altavoces 200
  • 4 frases clave únicas por hablante
  • 25-30 grabaciones de frases clave repetidas por frase clave única
  • 25-30 archivos de audio por frase clave única
  • 120 expresiones totales grabadas por hablante
canal 1Aplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSexo: 50% masculino, 50% femenino, +/- 10%.

Servicios Ofrecidos

La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:

Recopilación de datos de texto

Recopilación de datos de texto
Servicios

El verdadero valor de los servicios de recopilación de datos cognitivos de Shaip es que les brinda a las organizaciones la clave para desbloquear la información crítica que se encuentra dentro de los datos no estructurados.

Recopilación de datos de imágenes

Servicios de recopilación de datos de imágenes

Asegúrese de que su modelo de visión por computadora identifique cada imagen con precisión, para entrenar sin problemas los modelos de inteligencia artificial de próxima generación del futuro

Recopilación de datos de vídeo

Servicios de recopilación de datos de video

Ahora céntrese en la visión por computadora junto con la PNL para entrenar a sus modelos a identificar objetos, individuos, elementos disuasorios y otros elementos visuales a la perfección.

Shaip contáctanos

¿Quiere construir su propio conjunto de datos de audio?

Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades

  • Al registrarme, estoy de acuerdo con Shaip Sitio de Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.

La recopilación de datos de voz para un modelo de aprendizaje automático se refiere al proceso de recopilación de grabaciones de audio del lenguaje hablado. Esta colección ayuda a entrenar y perfeccionar algoritmos de aprendizaje automático, en particular aquellos centrados en la comprensión y el procesamiento de voces humanas.

Cuando intente recopilar datos de audio para el reconocimiento automático de voz (ASR), debe comenzar definiendo las necesidades específicas de su proyecto, incluido el idioma, el acento y el tipo de voz deseados. Después de configurar estos parámetros, asegúrese de obtener todos los permisos necesarios para respetar la privacidad del usuario. Luego, utilice dispositivos o software de grabación adecuados para capturar muestras de audio claras. Cada grabación debe anotarse meticulosamente con su transcripción u otros metadatos pertinentes y almacenarse sistemáticamente para facilitar el acceso.

Un conjunto de datos de voz en el aprendizaje automático es fundamental para entrenar, probar y validar modelos diseñados para reconocer, transcribir o interpretar el lenguaje hablado. Estos conjuntos de datos allanan el camino para innumerables aplicaciones, desde asistentes de voz y servicios de transcripción hasta biometría de voz.

Para recopilar datos precisos de diversos idiomas y acentos, es vital la colaboración con hablantes nativos de los orígenes lingüísticos deseados. Apunte a una muestra variada y representativa para cubrir un amplio espectro de matices demográficos. Emplee equipos de grabación estandarizados en entornos uniformes para garantizar la coherencia del audio. Y, lo que es más importante, anote cada pieza de datos con transcripciones y metadatos detallados, indicando el idioma y el acento específicos.