Los servicios de recopilación de datos de voz más confiables para su IA

Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.

Recopilación de datos de audio

Descubra canalizaciones de datos de audio sin cuellos de botella

Clientes destacados

Servicios profesionales de recopilación de datos de audio/voz

Cualquier tema. Cualquier escenario.

En Shaip, nuestra experiencia radica en la creación de conjuntos de datos de voz de alta calidad diseñados para diversos requisitos de IA/ML. Ofrecemos una amplia gama de idiomas y registramos en diversos entornos, lo que hace que nuestros conjuntos de datos sean completos y adaptables. ohNuestro objetivo es alimentar modelos con el mayor volumen de datos de voz personalizados, en el menor tiempo posible. Con nosotros a bordo, puede esperar: 

Colección de discursos
  • Datos de audio/voz multilingües de alta calidad seleccionados para mejorar la precisión
  • El nivel más alto posible de especificidad de dominio para tescenario diverso Configure
  •  Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales
  • Entornos de grabación: calidad de estudio, con audio nítido con mínimo ruido de fondo, y Ambientes Naturales, donde las grabaciones incorporan sonidos ambientales para imitar situaciones del mundo real.

100+

Países

55K+

Horas de datos de voz

250+

Proyectos

60+

Idiomas (más de 100 dialectos)

8 / 16 / 44 / 48 kHz

Tasa de muestreo

Nuestra Experiencia

Alinee los datos de audio para obtener modelos de PNL más inteligentes

Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.

discurso monólogo

Monólogo con guión y discurso espontáneo

Se centra en procesar el habla de un solo hablante. Utilice indicaciones escritas para alimentar archivos de audio de un solo canal, asegurando la captura de patrones de voz, tonos y matices únicos y específicos de esa persona.

Discurso de diálogo

Diálogo con guión y discurso espontáneo

Interacción de dos personas, que replica conversaciones y diálogos del mundo real con exposición multilingüe a través de archivos de doble canal y recursos transcritos.

Conversaciones multipartitas

Grupo / Multipartido
Conversaciones

Discusiones entre varias personas, capturando dinámicas de grupo, superposiciones y tonos variados para entrenar con precisión los modelos de habla.

Colección de expresiones de palabras de activación

Colección de palabras de activación/frases clave/expresiones​

Entrene a las IA para que identifiquen frases clave, palabras de activación o expresiones con significados similares utilizando expresiones diversas, ricas y auténticas para el procesamiento y la comprensión avanzados del lenguaje natural.

discurso acústico

Datos acústicos
Colecciones

Podemos grabar profesionalmente datos de audio con calidad de estudio, ya sean restaurantes, oficinas u hogares o de diversos entornos e idiomas, al mismo tiempo que cubrimos un rango acústico más amplio (conjuntos de datos de sonido completos).

Reconocimiento de voz automático

Reconocimiento automático de voz (ASR)

Mejore la precisión de sus sistemas de reconocimiento automático de voz (ASR) al tener acceso a conjuntos de datos de voz/audio diversificados de última generación, de una amplia gama de datos demográficos.

Expresión del lenguaje natural

Datos de entrenamiento de voz/audio multilingües

Nuestros profesionales lingüísticos capacitados, en todo el mundo, ofrecen datos de audio/voz multilingües en varios idiomas y dialectos. Este esfuerzo fomenta la comunicación global y salva las barreras del idioma, contribuyendo a soluciones de IA más inclusivas y efectivas.

asistentes virtuales digitales

Texto a voz
(TTS)

Cree un modelo multilingüe de conversión de texto a voz (TTS) con la ayuda de nuestra fuerza laboral global, que lo ayuda a recopilar datos de voz en más de 150 idiomas y dialectos para mejorar sus modelos de inteligencia artificial, desde controles en el automóvil hasta chatbots y soluciones de aprendizaje con alta tecnología. datos de audio de calidad.

Grabaciones del centro de llamadas

Call Center
Conversaciones

Intercambios genuinos entre agentes y clientes, admitiendo numerosos idiomas como español, alemán, inglés americano, bengalí, japonés, chino e hindi.

Casos de éxito

Conjuntos de datos de IA conversacional con más de 3 horas de datos en 8 idiomas

Con el objetivo de crear una plataforma multilingüe para los idiomas indios, el cliente se asoció con Shaip para recopilar, segmentar y transcribir grandes conjuntos de datos en varios idiomas indios. Esto ayudaría a desarrollar modelos de habla efectivos que podrían impulsar la nueva e innovadora plataforma del cliente.

Problema: Más de 3,000 horas de datos de audio recopilados en 8 idiomas indios, segmentados y transcritos para desarrollar el reconocimiento automático del habla.

Solución: Proporcionamos recopilación, segmentación, transcripción de datos y entregamos archivos JSON con metadatos. Recopilamos 3000 horas de datos de audio en 8 idiomas indios a escala para el proyecto de tecnología del habla del cliente.

Estudio de caso de recopilación de datos del habla

Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz

Personas

Personas

Equipos dedicados y capacitados:

  • Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
  • Equipo de gestión de proyectos acreditado
  • Equipo de desarrollo de productos experimentado
  • Equipo de contratación y incorporación del grupo de talentos
Procesos

Procesos

La mayor eficiencia del proceso está asegurada con:

  • Proceso robusto Stage-Gate de 6 Sigma
  • Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
  • Bucle de retroalimentación y mejora continua
Productos

Productos

La plataforma patentada ofrece beneficios:

  • Plataforma de un extremo a otro basada en la web
  • Calidad impecable
  • TAT más rápido
  • Entrega perfecta

Conjuntos de datos de voz/audio listos para usar

DetallesConjunto de datos de idiomaFrecuencia de muestreoTipo de conjunto de datosHoras totales de audioDescripción CortaDescripción del conjunto de datosCanal de audioPlataforma de grabaciónNOSOTROS SOMOS (%)Formato de audioFormato de transcripciónCaso de usoNúmero de altavocesCTA
SpeechInglés de Nueva York_GC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzConversacion general107Datos de conversación general en inglés de Nueva YorkConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 114, Desconocido 0
SpeechRuso_SM_48RusoRusoru-RU48 kHzMonólogo guionado2,398Monólogo con guión rusoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1689 Hombre 1937 Desconocido 214
SpeechPunjabi_MApunjabiPunjabi (en tramitación) punjabi Medios de audio40Punjabi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPunjabi_GCpunjabiPunjabi (en tramitación) punjabiConversacion general100Punjabi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPunjabi_CC_8punjabiPunjabi (en tramitación) punjabiCentro de llamadas60Datos del centro de llamadas de Punjabi (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechPolaco Polonia_SM_48Polaco (Polonia)Polaco (Polonia)es-ES48 kHzMonólogo guionado1,482Polonia polaca - Monólogo con guiónGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1324 Masculino 701 Desconocido 24
SpeechPolaco_MA_16PolacoPolacopl_PL16 kHzMedios de audio269Audio de medios polacosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 173 Masculino 354 Desconocido 6
SpeechOriya_MAoriyaOriya (en trámite) o_ENMedios de audio40Oriya (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechOriya_GCoriyaOriya (en trámite) o_ENConversacion general100Oriya (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechOriya_CC_8oriyaOriya (en trámite) o_ENCentro de llamadas60Datos del centro de llamadas Oriya (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechNueva Zelanda_MA_16Inglés neozelandés Inglés neozelandés es_ES16 kHzMedios de audio400Audio multimedia en inglés de Nueva ZelandaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 367, hombre 678, Desconocido 26
SpeechNueva Zelanda_GC_8Inglés neozelandés Inglés neozelandés es_ES8 kHzConversacion general148Datos generales de conversación en inglés de Nueva ZelandaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 167, hombre 121, Desconocido 4
SpeechInglés de Nueva York_MA_16Inglés de Nueva YorkInglés de Nueva Yorkes_ES16 kHzMedios de audio140Datos de audio de New York English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 66, Hombre 230, Desconocido 11
SpeechEscocés_GC_8escocés (acento inglés)escocés (acento inglés)es_AB8 kHzConversacion general292Datos de la conversación general escocesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 285, Hombre 260, Desconocido 3
SpeechInglés de Nueva York_CC_8Inglés de Nueva YorkInglés de Nueva Yorkes_ES8 kHzCentro de llamadas103Datos del centro de llamadas en inglés de Nueva YorkConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 610, Hombre 532, Desconocido 0
SpeechHolanda_SM_48HolandésHolandéses-ES48 kHzMonólogo guionado1,205Monólogo guionado holandésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1285 Masculino 531 Desconocido 3
SpeechMexicana_SM_48Español (mexico)Español (mexico)ES-MX48 kHzMonólogo guionado1,492Monólogo guionado en español mexicanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1016 Masculino 1069 Desconocido 95
Speechmarathi_MAmarathiMarathi (en trámite) señor_INMedios de audio40Marathi (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechmarathi_GCmarathiMarathi (en trámite) señor_INConversacion general100Marathi (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMaratí_CC_8marathiMarathi (en trámite) señor_INCentro de llamadas60Datos del centro de llamadas en marathi (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayalam_MAmalayalamMalayalam (en trámite) ml_INMedios de audio40Malayalam (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayalam_GCmalayalamMalayalam (en trámite) ml_INConversacion general100Malayalam (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayalam_CC_8malayalamMalayalam (en trámite) ml_INCentro de llamadas60Malayalam (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechMalayo_MA_16MalayMalayms_MY16 kHzMedios de audio344Datos de audio de Malay MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 236, Hombre 626, Desconocido 47
Speechmalayo_GC_8MalayMalayms_MY8 kHzConversacion general266Datos generales de conversación en malayoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en MalasiaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 316, Hombre 176 , Desconocido 0
SpeechTelugu_GC_8telugutelugute_IN8 kHzConversacion general553Datos generales de conversación en teluguConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 574, Hombre 564, Desconocido 0
SpeechInglés británico_WW_16Reino Unido InglésReino Unido Ingléses_es16 kHzWake Word200 AltavocesWake Word Inglés británicocolección de datos de frases clave
  • altavoces 200
  • 4 frases clave únicas por hablante
  • 25-30 grabaciones de frases clave repetidas por frase clave única
  • 25-30 archivos de audio por frase clave única
  • 120 expresiones totales grabadas por hablante
canal 1Aplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSexo: 50% masculino, 50% femenino, +/- 10%.
SpeechGalés_GC_8galés (acento inglés)galés (acento inglés)es_WL8 kHzConversacion general278Datos generales de conversación en galésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 270, Hombre 324, Desconocido 0
SpeechVietnamita_MA_16VietnamitaVietnamitavi_VN16 kHzMedios de audio257Datos de audio de medios vietnamitasLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 249, hombre 200, Desconocidos 45
Speechvietnamita_GC_8VietnamitaVietnamitavi_VN8 kHzConversacion general295Datos de conversación general en vietnamitaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 400, hombre 380, Desconocidos 2
SpeechPavo Turco_SM_48Turquía turcaTurquía turcatr-TR48 kHzMonólogo guionado2,027Turquía turcaGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1561 Masculino 1241 Desconocido 31
SpeechTailandés_MA_8TailandésTailandésth_TH16 kHzMedios de audio173Audio de medios tailandesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 143, Hombre 502, Desconocido 26
Speechtailandés_GC_8TailandésTailandésth_TH8 kHzConversacion general183Conversación general tailandesaConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigosDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 338, Hombre 96, Desconocido 8
SpeechTelugu_MAteluguTelugu (en proceso) te_INMedios de audio20Telugu (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_GCteluguTelugu (en proceso) te_INConversacion general50Telugu (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_CC_8teluguTelugu (en proceso) te_INCentro de llamadas30Telugu (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTelugu_MA_16telugutelugute_IN16 kHzMedios de audio648Datos de audio de Telugu MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 207, Hombre 963, Desconocido 2
Speechcoreano_sm_48CoreanoCoreanoko-KR48 kHzMonólogo guionado1,955Monólogo escrito en coreanoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1195 Hombre 1134 Desconocido 122
SpeechTamil_MATamil Tamil (en trámite) ta_INMedios de audio40Tamil (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTamil_GCTamilTamil (en trámite) ta_INConversacion general100Tamil (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechTamil_CC_8TamilTamil (en trámite) ta_INCentro de llamadas60Tamil (In Pipeline) Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechSueco_MA_16SuecoSuecosv_SE16 kHzMedios de audio278Datos de audio de medios suecosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 195, hombre 500, Desconocido 21
SpeechSueco_CC_8SuecoSuecosv_SE8 kHzCentro de llamadas250Datos del centro de llamadas suecoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1581, hombre 727, Desconocido 2
SpeechSuajili_MA_16swahiliswahilisw_KE16 kHzMedios de audio265Datos de audio de Swahili MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 118, Hombre 493, Desconocido 25
SpeechSuajili_CC_8swahiliswahilisw_KE8 kHzCentro de llamadas230Datos del centro de llamadas en swahiliConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 611, Hombre 833, Desconocido 0
SpeechInglés sudafricano_MA_16Inglés sudafricanoInglés sudafricanoes_ES16 kHzMedios de audio251Datos de audio de South African English MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 235, Hombre 432, Desconocido 36
SpeechInglés sudafricano_CC_8Inglés sudafricanoInglés sudafricanoes_ES8 kHzCentro de llamadas261Datos del centro de llamadas en inglés de SudáfricaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1274 , Hombre 935 , Desconocido 1
SpeechSingapur_MA_16Singapur inglésSingapur ingléses_ES16 kHzMedios de audio247Datos de audio de Singapur MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 160, Hombre 455, Desconocido 37
SpeechSingapur_CC_8Singapur inglésSingapur ingléses_ES8 kHzCentro de llamadas218Datos del centro de llamadas de SingapurConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 2139, Hombre 884, Desconocido 21
SpeechBoston_CC_8Inglés de BostonInglés de Bostones_ES8 kHzCentro de llamadas177Datos del centro de llamadas de BostonConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 605, Hombre: 711 y Desconocido: 0
SpeechInglés Profundo Sur_CC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzCentro de llamadas151Datos del centro de llamadas del sur profundo en inglésConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 221 , Hombre 1004 , Desconocido 7
SpeechDanés_SM_48DanésDanésda-DK48 kHzMonólogo guionado2,579Monólogo con guión danésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de DinamarcaMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1551 Hombre 1233 Desconocido 42
SpeechDanés_MA_16DanésDanésda_DK16 kHzMedios de audio664Datos de audio de medios danesesLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 369, Hombre: 864, Desconocido: 27
SpeechDanés_GC_8DanésDanésda_DK8 kHzConversacion general372Datos generales de conversación en danésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 311, Hombre: 417, Desconocido: 0
SpeechChino tradicional_SM_48Chino TradicionalChino Tradicionalzh-TW48 kHzMonólogo guionado1,028Chino TradicionalGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1069 Masculino 262 Desconocido 3
SpeechChino simplificado_SM_48Chino simplificadoChino simplificadozh-CN48 kHzMonólogo guionado2,762Chino simplificadoGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1920 Hombre 1535 Desconocido 270
SpeechChino_MA_16Ingles chinoIngles chinoes_ES16 kHzMedios de audio249Datos de audio de medios chinosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 126, Masculino: 346 y Desconocido: 6
SpeechChino_CC_8Ingles chinoIngles chinoes_ES8 kHzCentro de llamadas169Datos del centro de llamadas chinoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino: 1790, Masculino: 523 y Desconocido: 13
SpeechCanadiense_SM_48francés canadiensefrancés canadiensefr-CA48 kHzMonólogo guionado1,222francés canadienseGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 974 Masculino 631 Desconocido 1
SpeechBoston_MA_16Inglés de BostonInglés de Bostones_ES16 kHzMedios de audio93Datos de audio de Boston MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 43, Hombre: 181 y Desconocido: 2
SpeechBoston_GC_8Inglés de BostonInglés de Bostones_ES8 kHzConversacion general32Datos de conversación general de BostonConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 53, Hombre: 83 y Desconocido: 0
SpeechInglés Profundo Sur_GC_8Inglés Deep SouthInglés Deep Southes_ES8 kHzConversacion general56Datos de conversación general del sur profundo en inglésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 99, Hombre 31, Desconocido 0
Speechbengalí_MABengalíbengalí (en proyecto) bn_INMedios de audio40Datos de audio multimedia en bengalí (en proceso)Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechbengalí_GCBengalíbengalí (en proyecto) bn_INConversacion general100Datos generales de conversación en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechbengalí_CC_8Bengalíbengalí (en proyecto) bn_INCentro de llamadas60Datos del centro de llamadas en bengalí (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAsamés_MAAssameseAsamés (en proceso) como enMedios de audio40Asamés (In Pipeline) Datos de audio de mediosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAsamés_GCAssameseAsamés (en proceso) como enConversacion general100Asamés (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAsamés_CC_8AssameseAsamés (en proceso) como enCentro de llamadas60Datos del centro de llamadas asamés (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechÁrabe_SM_48ÁrabeÁrabear-SA48 kHzMonólogo guionado1,947Monólogo con guion árabeGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 838 Masculino 1209 Desconocido 78
SpeechÁrabe_GC_8ÁrabeÁrabear_AE8 kHzConversacion general292Datos de conversación general en árabeConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del GolfoDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 171, Hombre: 534 y Desconocido: 1
SpeechAfrikáans_MA_16africaansafricaansaf_ZA16 kHzMedios de audio658Archivos multimedia en afrikáansLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 750, Hombre: 1278 y Desconocido: 52
SpeechAfrikáans_GC_8africaansafricaansaf_ZA8 kHzConversacion general368Afrikáans Datos generales de conversaciónConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en ÁfricaDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 502, Hombre: 390 y Desconocido: 2
Speeches_US_MA_16Vernáculo afroamericanoVernáculo afroamericanoes_ES16 kHzMedios de audio154Datos de medios vernáculos afroamericanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 151, Hombre: 150 y Desconocido: 10
SpeechHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedios de audio216ESPAÑOL Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 75, Hombre 380, Desconocido 0
Speechcoreano_MA_16CoreanoCoreanoko_KR16 kHzMedios de audio204Datos de audio de medios coreanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 70 Hombre 303, Desconocido 25
SpeechCoreano_CC_8CoreanoCoreanoko_KR8 kHzCentro de llamadas107Datos del centro de llamadas de CoreaConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 1086, Masculino 210 , Desconocido 4
SpeechCanadá_MAkannadaKannada (en tramitación) kn_INMedios de audio40Kannada (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
Speechkannada_GCkannadaKannada (en tramitación) kn_INConversacion general100Kannada (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechCanadá_CC_8kannadaKannada (en tramitación) kn_INCentro de llamadas60Datos del centro de atención telefónica de Kannada (In Pipeline)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechJaponés_SM_48JaponésJaponésja-JP48 kHzMonólogo guionado2,335Monólogo con guion japonésGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1460 Hombre 1221 Desconocido 194
Speechirlandés_GC_8irlandésirlandéses_ES8 kHzConversacion general192Datos de conversación general en irlandésConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 213 , Hombre 153 , Desconocido 0
SpeechIndonesia_MA_16IndonesioIndonesioyo hice16 kHzMedios de audio643Datos de audio de los medios de IndonesiaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 746, Hombre 1507, Desconocido 129
Speechindonesio_GC_8IndonesioIndonesioyo hice8 kHzConversacion general496Datos de conversación general de indonesioConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesioDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 524, Hombre 454, Desconocido 2
SpeechHispano_MA_16ingles hispanoingles hispanoes_ES16 kHzMedios de audio155Audio de los medios de comunicación hispanosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 140, Hombre 219, Desconocido 5
SpeechHispano_CC_8ingles hispanoingles hispanoes_ES8 kHzCentro de llamadas212Datos del centro de llamadas hispanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262, Desconocido 0
Speeches_US_CC_8Vernáculo afroamericanoVernáculo afroamericanoes_ES8 kHzCentro de llamadas211Datos del centro de llamadas vernáculo afroamericanoConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer: 612, Hombre: 1242 y Desconocido: 12
SpeechHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCentro de llamadas208ESPAÑOL Datos del centro de llamadasConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,DobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 822, Hombre 1262 , Desconocido 0
Speechhindi_sm_48HindiHindihola-IN48 kHzMonólogo guionado2,867Monólogo guionado en hindiGrabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundosMonoAplicación Movil5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 1977 Hombre 1864 Desconocido 147
SpeechHindi_MA_16HindiHindihola_IN16 kHzMedios de audio219Datos de audio de Hindi MediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 83, Hombre 309, Desconocido 0
SpeechHebreo_MA_16HebreoHebreoél_IL16 kHzMedios de audio427Datos de audio de medios hebreosLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 361, Hombre 513, Desconocido 13
SpeechHebreo_Conversación general_8HebreoHebreoél_IL8 kHzConversacion general399Datos de conversación general en hebreoConversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en IsraelDobleOrdenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 414 , Hombre 399 , Desconocido 1
SpeechGujarati_MAGujaratiGujarati (en trámite) gu_INMedios de audio40Gujarati (In Pipeline) Datos de audio multimediaLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechGujarati_GCGujaratiGujarati (en trámite) gu_INConversacion general100Gujarati (In Pipeline) Datos generales de conversaciónConversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechGujarati_CC_8GujaratiGujarati (en trámite) gu_INCentro de llamadas60Datos del centro de llamadas de Gujarati (en proceso)Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,Ordenador de sobremesa5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje
SpeechAlemán_IVR_8AlemánAlemánde-de8 kHz IVR200Datos IVR alemanesHumano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontáneaMonoOrdenador de sobremesa. Wav jsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje Femenino 10115 Masculino 8750 Desconocido 0
SpeechAlemán_CC_8AlemánAlemánde-de8 kHzCentro de llamadas64Datos del centro de llamadas alemán Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,MonoOrdenador de sobremesa. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeFemenino 478 Masculino 1440 Desconocido 0
SpeechInglés Profundo Sur_MA_16Inglés Deep SouthInglés Deep Southes_ES16 kHzMedios de audio266Datos de audio de Deep South Media en inglésLicenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutosMonoAbastecimiento web5.0. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeMujer 204, Hombre 356, Desconocido 21

Servicios Ofrecidos

La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:

Recopilación de datos de texto

Recopilación de datos de texto
Servicios

El verdadero valor de los servicios de recopilación de datos cognitivos de Shaip es que les brinda a las organizaciones la clave para desbloquear la información crítica que se encuentra dentro de los datos no estructurados.

Recopilación de datos de imágenes

Servicios de recopilación de datos de imágenes

Asegúrese de que su modelo de visión por computadora identifique cada imagen con precisión, para entrenar sin problemas los modelos de inteligencia artificial de próxima generación del futuro

Recopilación de datos de vídeo

Servicios de recopilación de datos de video

Ahora céntrese en la visión por computadora junto con la PNL para entrenar a sus modelos a identificar objetos, individuos, elementos disuasorios y otros elementos visuales a la perfección.

Shaip contáctanos

¿Quiere construir su propio conjunto de datos de audio?

Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades

  • Al registrarme, estoy de acuerdo con Shaip Política de Privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.

La recopilación de datos de voz para un modelo de aprendizaje automático se refiere al proceso de recopilación de grabaciones de audio del lenguaje hablado. Esta colección ayuda a entrenar y perfeccionar algoritmos de aprendizaje automático, en particular aquellos centrados en la comprensión y el procesamiento de voces humanas.

Cuando intente recopilar datos de audio para el reconocimiento automático de voz (ASR), debe comenzar definiendo las necesidades específicas de su proyecto, incluido el idioma, el acento y el tipo de voz deseados. Después de configurar estos parámetros, asegúrese de obtener todos los permisos necesarios para respetar la privacidad del usuario. Luego, utilice dispositivos o software de grabación adecuados para capturar muestras de audio claras. Cada grabación debe anotarse meticulosamente con su transcripción u otros metadatos pertinentes y almacenarse sistemáticamente para facilitar el acceso.

Un conjunto de datos de voz en el aprendizaje automático es fundamental para entrenar, probar y validar modelos diseñados para reconocer, transcribir o interpretar el lenguaje hablado. Estos conjuntos de datos allanan el camino para innumerables aplicaciones, desde asistentes de voz y servicios de transcripción hasta biometría de voz.

Para recopilar datos precisos de diversos idiomas y acentos, es vital la colaboración con hablantes nativos de los orígenes lingüísticos deseados. Apunte a una muestra variada y representativa para cubrir un amplio espectro de matices demográficos. Emplee equipos de grabación estandarizados en entornos uniformes para garantizar la coherencia del audio. Y, lo que es más importante, anote cada pieza de datos con transcripciones y metadatos detallados, indicando el idioma y el acento específicos.