Los servicios de recopilación de datos de voz más confiables para su IA

Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.

Descubra canalizaciones de datos de audio sin cuellos de botella

Contáctenos

Clientes destacados

Previo

Cualquier tema. Cualquier escenario.

En Shaip, nuestra experiencia radica en la creación de conjuntos de datos de voz de alta calidad diseñados para diversos requisitos de IA/ML. Ofrecemos una amplia gama de idiomas y registramos en diversos entornos, lo que hace que nuestros conjuntos de datos sean completos y adaptables. ohNuestro objetivo es alimentar modelos con el mayor volumen de datos de voz personalizados, en el menor tiempo posible. Con nosotros a bordo, puede esperar:

Datos de audio/voz multilingües de alta calidad seleccionados para mejorar la precisión
El nivel más alto posible de especificidad de dominio para tescenario diverso Configure

Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales
Entornos de grabación: calidad de estudio, con audio nítido con mínimo ruido de fondo, y Ambientes Naturales, donde las grabaciones incorporan sonidos ambientales para imitar situaciones del mundo real.

100+

Países

55K+

Horas de datos de voz

250+

Proyectos

60+

Idiomas (más de 100 dialectos)

8 / 16 / 44 / 48 kHz

Tasa de muestreo

Nuestra Experiencia

Alinee los datos de audio para obtener modelos de PNL más inteligentes

Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.

Casos de éxito

Conjuntos de datos de IA conversacional con más de 3 horas de datos en 8 idiomas

Con el objetivo de crear una plataforma multilingüe para los idiomas indios, el cliente se asoció con Shaip para recopilar, segmentar y transcribir grandes conjuntos de datos en varios idiomas indios. Esto ayudaría a desarrollar modelos de habla efectivos que podrían impulsar la nueva e innovadora plataforma del cliente.

Problema: Más de 3,000 horas de datos de audio recopilados en 8 idiomas indios, segmentados y transcritos para desarrollar el reconocimiento automático del habla.

Solución: Proporcionamos recopilación, segmentación, transcripción de datos y entregamos archivos JSON con metadatos. Recopilamos 3000 horas de datos de audio en 8 idiomas indios a escala para el proyecto de tecnología del habla del cliente.

Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz

Personas

Equipos dedicados y capacitados:

Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
Equipo de gestión de proyectos acreditado
Equipo de desarrollo de productos experimentado
Equipo de contratación y incorporación del grupo de talentos

Proceso

La mayor eficiencia del proceso está asegurada con:

Proceso robusto Stage-Gate de 6 Sigma
Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
Bucle de retroalimentación y mejora continua

Productos

La plataforma patentada ofrece beneficios:

Plataforma de un extremo a otro basada en la web
Calidad impecable
TAT más rápido
Entrega perfecta

Personas

Equipos dedicados y capacitados:

Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
Equipo de gestión de proyectos acreditado
Equipo de desarrollo de productos experimentado
Equipo de contratación y incorporación del grupo de talentos

Proceso

La mayor eficiencia del proceso está asegurada con:

Proceso robusto Stage-Gate de 6 Sigma
Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
Bucle de retroalimentación y mejora continua

Productos

La plataforma patentada ofrece beneficios:

Plataforma de un extremo a otro basada en la web
Calidad impecable
TAT más rápido
Entrega perfecta

Conjuntos de datos de voz/audio listos para usar

ID de corpus (único)	Palabra clave	Conjunto de datos de idioma	Código de lenguaje	Frecuencia de muestreo	Tipo de conjunto de datos	Horas totales de audio	Descripción Corta	Descripción del conjunto de datos	Canal de audio	Plataforma de grabación	NOSOTROS SOMOS (%)	Formato de audio	Formato de transcripción	Caso de uso	Número de altavoces	CTA
es_US_CC_8	Vernáculo afroamericano	Vernáculo afroamericano	es_ES	8 kHz	Centro de llamadas	211	Datos del centro de llamadas vernáculo afroamericano	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 612, Hombre: 1242 y Desconocido: 12	Contacto
es_US_MA_16	Vernáculo afroamericano	Vernáculo afroamericano	es_ES	16 kHz	Medios de audio	154	Datos de medios vernáculos afroamericanos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 151, Hombre: 150 y Desconocido: 10	Contacto
Afrikáans_GC_8	africaans	africaans	af_ZA	8 kHz	Conversacion general	368	Afrikáans Datos generales de conversación	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en África	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 502, Hombre: 390 y Desconocido: 2	Contacto
Afrikáans_MA_16	africaans	africaans	af_ZA	16 kHz	Medios de audio	658	Archivos multimedia en afrikáans	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 750, Hombre: 1278 y Desconocido: 52	Contacto
Árabe_GC_8	Árabe	Árabe	ar_AE	8 kHz	Conversacion general	292	Datos de conversación general en árabe	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del Golfo	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 171, Hombre: 534 y Desconocido: 1	Contacto
Árabe_SM_48	Árabe	Árabe	ar-SA	48 kHz	Monólogo guionado	1,947	Monólogo con guion árabe	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 838 Masculino 1209 Desconocido 78	Contacto
Asamés_CC_8	Assamese	Asamés (en proceso)	como en		Centro de llamadas	60	Datos del centro de llamadas asamés (en proceso)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Asamés_GC	Assamese	Asamés (en proceso)	como en		Conversacion general	100	Asamés (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Asamés_MA	Assamese	Asamés (en proceso)	como en		Medios de audio	40	Asamés (In Pipeline) Datos de audio de medios	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
bengalí_CC_8	Bengalí	bengalí (en proyecto)	bn_IN		Centro de llamadas	60	Datos del centro de llamadas en bengalí (en proceso)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
bengalí_GC	Bengalí	bengalí (en proyecto)	bn_IN		Conversacion general	100	Datos generales de conversación en bengalí (en proceso)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
bengalí_MA	Bengalí	bengalí (en proyecto)	bn_IN		Medios de audio	40	Datos de audio multimedia en bengalí (en proceso)	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Boston_CC_8	Inglés de Boston	Inglés de Boston	es_ES	8 kHz	Centro de llamadas	177	Datos del centro de llamadas de Boston	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 605, Hombre: 711 y Desconocido: 0	Contacto
Boston_GC_8	Inglés de Boston	Inglés de Boston	es_ES	8 kHz	Conversacion general	32	Datos de conversación general de Boston	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 53, Hombre: 83 y Desconocido: 0	Contacto
Boston_MA_16	Inglés de Boston	Inglés de Boston	es_ES	16 kHz	Medios de audio	93	Datos de audio de Boston Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 43, Hombre: 181 y Desconocido: 2	Contacto
Canadiense_SM_48	francés canadiense	francés canadiense	fr-CA	48 kHz	Monólogo guionado	1,222	francés canadiense	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 974 Masculino 631 Desconocido 1	Contacto
Chino_CC_8	Ingles chino	Ingles chino	es_ES	8 kHz	Centro de llamadas	169	Datos del centro de llamadas chino	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino: 1790, Masculino: 523 y Desconocido: 13	Contacto
Chino_MA_16	Ingles chino	Ingles chino	es_ES	16 kHz	Medios de audio	249	Datos de audio de medios chinos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino: 126, Masculino: 346 y Desconocido: 6	Contacto
Chino simplificado_SM_48	Chino simplificado	Chino simplificado	zh-CN	48 kHz	Monólogo guionado	2,762	Chino simplificado	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1920 Hombre 1535 Desconocido 270	Contacto
Chino tradicional_SM_48	Chino Tradicional	Chino Tradicional	zh-TW	48 kHz	Monólogo guionado	1,028	Chino Tradicional	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1069 Masculino 262 Desconocido 3	Contacto
Danés_GC_8	Danés	Danés	da_DK	8 kHz	Conversacion general	372	Datos generales de conversación en danés	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 311, Hombre: 417, Desconocido: 0	Contacto
Danés_MA_16	Danés	Danés	da_DK	16 kHz	Medios de audio	664	Datos de audio de medios daneses	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer: 369, Hombre: 864, Desconocido: 27	Contacto
Danés_SM_48	Danés	Danés	da-DK	48 kHz	Monólogo guionado	2,579	Monólogo con guión danés	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de Dinamarca	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1551 Hombre 1233 Desconocido 42	Contacto
Inglés Profundo Sur_CC_8	Inglés Deep South	Inglés Deep South	es_ES	8 kHz	Centro de llamadas	151	Datos del centro de llamadas del sur profundo en inglés	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 221 , Hombre 1004 , Desconocido 7	Contacto
Inglés Profundo Sur_GC_8	Inglés Deep South	Inglés Deep South	es_ES	8 kHz	Conversacion general	56	Datos de conversación general del sur profundo en inglés	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 99, Hombre 31, Desconocido 0	Contacto
Inglés Profundo Sur_MA_16	Inglés Deep South	Inglés Deep South	es_ES	16 kHz	Medios de audio	266	Datos de audio de Deep South Media en inglés	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 204, Hombre 356, Desconocido 21	Contacto
Alemán_CC_8	Alemán	Alemán	de-de	8 kHz	Centro de llamadas	64	Datos del centro de llamadas alemán	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Mono	Ordenador de sobremesa		. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 478 Masculino 1440 Desconocido 0	Contacto
Alemán_IVR_8	Alemán	Alemán	de-de	8 kHz	IVR	200	Datos IVR alemanes	Humano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontánea	Mono	Ordenador de sobremesa		. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 10115 Masculino 8750 Desconocido 0	Contacto
Gujarati_CC_8	Gujarati	Gujarati (en trámite)	gu_IN		Centro de llamadas	60	Datos del centro de llamadas de Gujarati (en proceso)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Gujarati_GC	Gujarati	Gujarati (en trámite)	gu_IN		Conversacion general	100	Gujarati (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Gujarati_MA	Gujarati	Gujarati (en trámite)	gu_IN		Medios de audio	40	Gujarati (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Hebreo_Conversación general_8	Hebreo	Hebreo	él_IL	8 kHz	Conversacion general	399	Datos de conversación general en hebreo	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en Israel	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 414 , Hombre 399 , Desconocido 1	Contacto
Hebreo_MA_16	Hebreo	Hebreo	él_IL	16 kHz	Medios de audio	427	Datos de audio de medios hebreos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 361, Hombre 513, Desconocido 13	Contacto
Hindi_MA_16	Hindi	Hindi	hola_IN	16 kHz	Medios de audio	219	Datos de audio de Hindi Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 83, Hombre 309, Desconocido 0	Contacto
hindi_sm_48	Hindi	Hindi	hola-IN	48 kHz	Monólogo guionado	2,867	Monólogo guionado en hindi	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1977 Hombre 1864 Desconocido 147	Contacto
HINGLISH_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Centro de llamadas	208	ESPAÑOL Datos del centro de llamadas	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 822, Hombre 1262 , Desconocido 0	Contacto
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Medios de audio	216	ESPAÑOL Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 75, Hombre 380, Desconocido 0	Contacto
Hispano_CC_8	ingles hispano	ingles hispano	es_ES	8 kHz	Centro de llamadas	212	Datos del centro de llamadas hispano	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 822, Hombre 1262, Desconocido 0	Contacto
Hispano_MA_16	ingles hispano	ingles hispano	es_ES	16 kHz	Medios de audio	155	Audio de los medios de comunicación hispanos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 140, Hombre 219, Desconocido 5	Contacto
indonesio_GC_8	Indonesio	Indonesio	yo hice	8 kHz	Conversacion general	496	Datos de conversación general de indonesio	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesio	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 524, Hombre 454, Desconocido 2	Contacto
Indonesia_MA_16	Indonesio	Indonesio	yo hice	16 kHz	Medios de audio	643	Datos de audio de los medios de Indonesia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 746, Hombre 1507, Desconocido 129	Contacto
irlandés_GC_8	irlandés	irlandés	es_ES	8 kHz	Conversacion general	192	Datos de conversación general en irlandés	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 213 , Hombre 153 , Desconocido 0	Contacto
Japonés_SM_48	Japonés	Japonés	ja-JP	48 kHz	Monólogo guionado	2,335	Monólogo con guion japonés	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1460 Hombre 1221 Desconocido 194	Contacto
Canadá_CC_8	kannada	Kannada (en tramitación)	kn_IN		Centro de llamadas	60	Datos del centro de atención telefónica de Kannada (In Pipeline)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
kannada_GC	kannada	Kannada (en tramitación)	kn_IN		Conversacion general	100	Kannada (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Canadá_MA	kannada	Kannada (en tramitación)	kn_IN		Medios de audio	40	Kannada (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Coreano_CC_8	Coreano	Coreano	ko_KR	8 kHz	Centro de llamadas	107	Datos del centro de llamadas de Corea	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1086, Masculino 210 , Desconocido 4	Contacto
coreano_MA_16	Coreano	Coreano	ko_KR	16 kHz	Medios de audio	204	Datos de audio de medios coreanos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 70 Hombre 303, Desconocido 25	Contacto
coreano_sm_48	Coreano	Coreano	ko-KR	48 kHz	Monólogo guionado	1,955	Monólogo escrito en coreano	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1195 Hombre 1134 Desconocido 122	Contacto
malayo_GC_8	Malay	Malay	ms_MY	8 kHz	Conversacion general	266	Datos generales de conversación en malayo	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en Malasia	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 316, Hombre 176 , Desconocido 0	Contacto
Malayo_MA_16	Malay	Malay	ms_MY	16 kHz	Medios de audio	344	Datos de audio de Malay Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 236, Hombre 626, Desconocido 47	Contacto
Malayalam_CC_8	malayalam	Malayalam (en trámite)	ml_IN		Centro de llamadas	60	Malayalam (In Pipeline) Datos del centro de llamadas	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Malayalam_GC	malayalam	Malayalam (en trámite)	ml_IN		Conversacion general	100	Malayalam (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Malayalam_MA	malayalam	Malayalam (en trámite)	ml_IN		Medios de audio	40	Malayalam (In Pipeline) Datos de audio de medios	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Maratí_CC_8	marathi	Marathi (en trámite)	señor_IN		Centro de llamadas	60	Datos del centro de llamadas en marathi (en proceso)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
marathi_GC	marathi	Marathi (en trámite)	señor_IN		Conversacion general	100	Marathi (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
marathi_MA	marathi	Marathi (en trámite)	señor_IN		Medios de audio	40	Marathi (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Mexicana_SM_48	Español (mexico)	Español (mexico)	ES-MX	48 kHz	Monólogo guionado	1,492	Monólogo guionado en español mexicano	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1016 Masculino 1069 Desconocido 95	Contacto
Holanda_SM_48	Holandés	Holandés	es-ES	48 kHz	Monólogo guionado	1,205	Monólogo guionado holandés	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1285 Masculino 531 Desconocido 3	Contacto
Inglés de Nueva York_CC_8	Inglés de Nueva York	Inglés de Nueva York	es_ES	8 kHz	Centro de llamadas	103	Datos del centro de llamadas en inglés de Nueva York	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 610, Hombre 532, Desconocido 0	Contacto
Inglés de Nueva York_GC_8	Inglés de Nueva York	Inglés de Nueva York	es_ES	8 kHz	Conversacion general	107	Datos de conversación general en inglés de Nueva York	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 118, Hombre 114, Desconocido 0	Contacto
Inglés de Nueva York_MA_16	Inglés de Nueva York	Inglés de Nueva York	es_ES	16 kHz	Medios de audio	140	Datos de audio de New York English Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 66, Hombre 230, Desconocido 11	Contacto
Nueva Zelanda_GC_8	Inglés neozelandés	Inglés neozelandés	es_ES	8 kHz	Conversacion general	148	Datos generales de conversación en inglés de Nueva Zelanda	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 167, hombre 121, Desconocido 4	Contacto
Nueva Zelanda_MA_16	Inglés neozelandés	Inglés neozelandés	es_ES	16 kHz	Medios de audio	400	Audio multimedia en inglés de Nueva Zelanda	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 367, hombre 678, Desconocido 26	Contacto
Oriya_CC_8	oriya	Oriya (en trámite)	o_EN		Centro de llamadas	60	Datos del centro de llamadas Oriya (In Pipeline)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Oriya_GC	oriya	Oriya (en trámite)	o_EN		Conversacion general	100	Oriya (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Oriya_MA	oriya	Oriya (en trámite)	o_EN		Medios de audio	40	Oriya (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Polaco_MA_16	Polaco	Polaco	pl_PL	16 kHz	Medios de audio	269	Audio de medios polacos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 173 Masculino 354 Desconocido 6	Contacto
Polaco Polonia_SM_48	Polaco (Polonia)	Polaco (Polonia)	es-ES	48 kHz	Monólogo guionado	1,482	Polonia polaca - Monólogo con guión	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1324 Masculino 701 Desconocido 24	Contacto
Punjabi_CC_8	punjabi	Punjabi (en tramitación)	punjabi		Centro de llamadas	60	Datos del centro de llamadas de Punjabi (In Pipeline)	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Punjabi_GC	punjabi	Punjabi (en tramitación)	punjabi		Conversacion general	100	Punjabi (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Punjabi_MA	punjabi	Punjabi (en tramitación)	punjabi		Medios de audio	40	Punjabi (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Ruso_SM_48	Ruso	Ruso	ru-RU	48 kHz	Monólogo guionado	2,398	Monólogo con guión ruso	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1689 Hombre 1937 Desconocido 214	Contacto
Escocés_GC_8	escocés (acento inglés)	escocés (acento inglés)	es_AB	8 kHz	Conversacion general	292	Datos de la conversación general escocesa	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 285, Hombre 260, Desconocido 3	Contacto
Singapur_CC_8	Singapur inglés	Singapur inglés	es_ES	8 kHz	Centro de llamadas	218	Datos del centro de llamadas de Singapur	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 2139, Hombre 884, Desconocido 21	Contacto
Singapur_MA_16	Singapur inglés	Singapur inglés	es_ES	16 kHz	Medios de audio	247	Datos de audio de Singapur Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 160, Hombre 455, Desconocido 37	Contacto
Inglés sudafricano_CC_8	Inglés sudafricano	Inglés sudafricano	es_ES	8 kHz	Centro de llamadas	261	Datos del centro de llamadas en inglés de Sudáfrica	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1274 , Hombre 935 , Desconocido 1	Contacto
Inglés sudafricano_MA_16	Inglés sudafricano	Inglés sudafricano	es_ES	16 kHz	Medios de audio	251	Datos de audio de South African English Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 235, Hombre 432, Desconocido 36	Contacto
Suajili_CC_8	swahili	swahili	sw_KE	8 kHz	Centro de llamadas	230	Datos del centro de llamadas en swahili	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 611, Hombre 833, Desconocido 0	Contacto
Suajili_MA_16	swahili	swahili	sw_KE	16 kHz	Medios de audio	265	Datos de audio de Swahili Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 118, Hombre 493, Desconocido 25	Contacto
Sueco_CC_8	Sueco	Sueco	sv_SE	8 kHz	Centro de llamadas	250	Datos del centro de llamadas sueco	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 1581, hombre 727, Desconocido 2	Contacto
Sueco_MA_16	Sueco	Sueco	sv_SE	16 kHz	Medios de audio	278	Datos de audio de medios suecos	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 195, hombre 500, Desconocido 21	Contacto
Tamil_CC_8	Tamil	Tamil (en trámite)	ta_IN		Centro de llamadas	60	Tamil (In Pipeline) Datos del centro de llamadas	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Tamil_GC	Tamil	Tamil (en trámite)	ta_IN		Conversacion general	100	Tamil (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Tamil_MA	Tamil	Tamil (en trámite)	ta_IN		Medios de audio	40	Tamil (In Pipeline) Datos de audio de medios	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Conversacion general	553	Datos generales de conversación en telugu	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 574, Hombre 564, Desconocido 0	Contacto
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Medios de audio	648	Datos de audio de Telugu Media	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 207, Hombre 963, Desconocido 2	Contacto
Telugu_CC_8	telugu	Telugu (en proceso)	te_IN		Centro de llamadas	30	Telugu (In Pipeline) Datos del centro de llamadas	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Telugu_GC	telugu	Telugu (en proceso)	te_IN		Conversacion general	50	Telugu (In Pipeline) Datos generales de conversación	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,		Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
Telugu_MA	telugu	Telugu (en proceso)	te_IN		Medios de audio	20	Telugu (In Pipeline) Datos de audio multimedia	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos		Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje		Contacto
tailandés_GC_8	Tailandés	Tailandés	th_TH	8 kHz	Conversacion general	183	Conversación general tailandesa	Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigos	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 338, Hombre 96, Desconocido 8	Contacto
Tailandés_MA_8	Tailandés	Tailandés	th_TH	16 kHz	Medios de audio	173	Audio de medios tailandeses	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 143, Hombre 502, Desconocido 26	Contacto
Pavo Turco_SM_48	Turquía turca	Turquía turca	tr-TR	48 kHz	Monólogo guionado	2,027	Turquía turca	Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos	Mono	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Femenino 1561 Masculino 1241 Desconocido 31	Contacto
vietnamita_GC_8	Vietnamita	Vietnamita	vi_VN	8 kHz	Conversacion general	295	Datos de conversación general en vietnamita	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh).	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 400, hombre 380, Desconocidos 2	Contacto
Vietnamita_MA_16	Vietnamita	Vietnamita	vi_VN	16 kHz	Medios de audio	257	Datos de audio de medios vietnamitas	Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos	Mono	Abastecimiento web	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 249, hombre 200, Desconocidos 45	Contacto
Galés_GC_8	galés (acento inglés)	galés (acento inglés)	es_WL	8 kHz	Conversacion general	278	Datos generales de conversación en galés	Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos,	Doble	Ordenador de sobremesa	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Mujer 270, Hombre 324, Desconocido 0	Contacto
Inglés británico_WW_16	Reino Unido Inglés	Reino Unido Inglés	es_es	16 kHz	Wake Word	200 Altavoces	Wake Word Inglés británico	colección de datos de frases clave altavoces 200 4 frases clave únicas por hablante 25-30 grabaciones de frases clave repetidas por frase clave única 25-30 archivos de audio por frase clave única 120 expresiones totales grabadas por hablante	canal 1	Aplicación Movil	5.0	. Wav	json	ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje	Sexo: 50% masculino, 50% femenino, +/- 10%.	Contacto

Servicios Ofrecidos

La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:

Recomendaciones

Ofrecimiento

Anotación de audio para IA inteligentes

Los servicios de anotación de audio han sido un fuerte de Shaip desde el principio. Desarrolle, entrene y mejore la inteligencia artificial conversacional, los chatbots y los motores de reconocimiento de voz con nuestros servicios de anotación de audio de última generación.

Guía de compradores

Guía del comprador: Guía completa de IA conversacional

El chatbot con el que conversó se ejecuta en un sistema avanzado de inteligencia artificial conversacional que se entrena, prueba y crea utilizando toneladas de conjuntos de datos de reconocimiento de voz.

Catálogo de datos

Licencias y catálogo de datos de voz listos para usar

Existe una amplia variedad de aplicaciones comunes para datos de voz en proyectos de IA. Le ofrecemos grandes cantidades de datos de alta calidad listos para su reconocimiento de voz.

¿Quiere construir su propio conjunto de datos de audio?

Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades

Nombre *
Apellido*
Correo electrónico*
Teléfono*
Empresa*
País*
País
Comentarios*
Al registrarme, estoy de acuerdo con Shaip Sitio de Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.
CAPTCHA

Preguntas más frecuentes (FAQ)

1. ¿Qué es la recopilación de datos del habla?

La recopilación de datos de voz para un modelo de aprendizaje automático se refiere al proceso de recopilación de grabaciones de audio del lenguaje hablado. Esta colección ayuda a entrenar y perfeccionar algoritmos de aprendizaje automático, en particular aquellos centrados en la comprensión y el procesamiento de voces humanas.

2. ¿Cómo recopilar datos de audio para ASR (reconocimiento automático de voz)?

Cuando intente recopilar datos de audio para el reconocimiento automático de voz (ASR), debe comenzar definiendo las necesidades específicas de su proyecto, incluido el idioma, el acento y el tipo de voz deseados. Después de configurar estos parámetros, asegúrese de obtener todos los permisos necesarios para respetar la privacidad del usuario. Luego, utilice dispositivos o software de grabación adecuados para capturar muestras de audio claras. Cada grabación debe anotarse meticulosamente con su transcripción u otros metadatos pertinentes y almacenarse sistemáticamente para facilitar el acceso.

3. Uso de un conjunto de datos de voz para el aprendizaje automático

Un conjunto de datos de voz en el aprendizaje automático es fundamental para entrenar, probar y validar modelos diseñados para reconocer, transcribir o interpretar el lenguaje hablado. Estos conjuntos de datos allanan el camino para innumerables aplicaciones, desde asistentes de voz y servicios de transcripción hasta biometría de voz.

4. Cómo recopilar datos precisos de múltiples idiomas y acentos

Para recopilar datos precisos de diversos idiomas y acentos, es vital la colaboración con hablantes nativos de los orígenes lingüísticos deseados. Apunte a una muestra variada y representativa para cubrir un amplio espectro de matices demográficos. Emplee equipos de grabación estandarizados en entornos uniformes para garantizar la coherencia del audio. Y, lo que es más importante, anote cada pieza de datos con transcripciones y metadatos detallados, indicando el idioma y el acento específicos.

Los servicios de recopilación de datos de voz más confiables para su IA

Descubra canalizaciones de datos de audio sin cuellos de botella

Clientes destacados

Servicios profesionales de recopilación de datos de audio/voz

Cualquier tema. Cualquier escenario.

100+

55K+

250+

60+

8 / 16 / 44 / 48 kHz

Nuestra Experiencia

Alinee los datos de audio para obtener modelos de PNL más inteligentes

Colección de discursos monólogos

Discurso de diálogo Colecciones

Grupo / Multipartido Conversaciones

Colección de expresiones en lenguaje natural

Datos acústicos Colecciones

Reconocimiento automático de voz (ASR)

Datos de entrenamiento de voz/audio multilingües

Texto a voz (TTS)

Call Center Grabaciones

Casos de éxito

Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz

Personas

Proceso

Productos

Personas

Proceso

Productos

Conjuntos de datos de voz/audio listos para usar

Servicios Ofrecidos

Recopilación de datos de texto Servicios

Servicios de recopilación de datos de imágenes

Servicios de recopilación de datos de video

Recomendaciones

Ofrecimiento

Anotación de audio para IA inteligentes

Guía de compradores

Guía del comprador: Guía completa de IA conversacional

Catálogo de datos

Licencias y catálogo de datos de voz listos para usar

¿Quiere construir su propio conjunto de datos de audio?

Preguntas más frecuentes (FAQ)

Servicios de datos de IA

Especialidad

Industria

Productos

Empresa

Recursos

Contáctenos

Discurso de diálogo
Colecciones

Grupo / Multipartido
Conversaciones

Datos acústicos
Colecciones

Texto a voz
(TTS)

Call Center
Grabaciones

Recopilación de datos de texto
Servicios