Los servicios de recopilación de datos de voz más confiables para su IA
Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.
Descubra canalizaciones de datos de audio sin cuellos de botella
Clientes destacados
Servicios profesionales de recopilación de datos de audio/voz
Cualquier tema. Cualquier escenario.
En Shaip, nuestra experiencia radica en la creación de conjuntos de datos de voz de alta calidad diseñados para diversos requisitos de IA/ML. Ofrecemos una amplia gama de idiomas y registramos en diversos entornos, lo que hace que nuestros conjuntos de datos sean completos y adaptables. ohNuestro objetivo es alimentar modelos con el mayor volumen de datos de voz personalizados, en el menor tiempo posible. Con nosotros a bordo, puede esperar:
- Datos de audio/voz multilingües de alta calidad seleccionados para mejorar la precisión
- El nivel más alto posible de especificidad de dominio para tescenario diverso Configure
- Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales
- Entornos de grabación: calidad de estudio, con audio nítido con mínimo ruido de fondo, y Ambientes Naturales, donde las grabaciones incorporan sonidos ambientales para imitar situaciones del mundo real.
100+
55K+
Horas de datos de voz
250+
Proyectos
60+
Idiomas (más de 100 dialectos)
8 / 16 / 44 / 48 kHz
Tasa de muestreo
Nuestra Experiencia
Alinee los datos de audio para obtener modelos de PNL más inteligentes
Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.
Colección de discursos monólogos
Se centra en procesar el habla de un solo hablante. Utilice indicaciones escritas para alimentar archivos de audio de un solo canal, asegurando la captura de patrones de voz, tonos y matices únicos y específicos de esa persona.
Discurso de diálogo
Colecciones
Interacción de dos personas, que replica conversaciones y diálogos del mundo real con exposición multilingüe a través de archivos de doble canal y recursos transcritos.
Grupo / Multipartido
Conversaciones
Discusiones entre varias personas, capturando dinámicas de grupo, superposiciones y tonos variados para entrenar con precisión los modelos de habla.
Colección de expresiones en lenguaje natural
Entrene a las IA para que identifiquen frases o palabras de activación con significados similares utilizando expresiones diversas, ricas y auténticas para el procesamiento y la comprensión avanzados del lenguaje natural.
Datos acústicos
Colecciones
Podemos grabar profesionalmente datos de audio con calidad de estudio, ya sean restaurantes, oficinas u hogares o de diversos entornos e idiomas, al mismo tiempo que cubrimos un rango acústico más amplio (conjuntos de datos de sonido completos).
Reconocimiento automático de voz (ASR)
Mejore la precisión de sus sistemas de reconocimiento automático de voz (ASR) al tener acceso a conjuntos de datos de voz/audio diversificados de última generación, de una amplia gama de datos demográficos.
Datos de entrenamiento de voz/audio multilingües
Nuestros profesionales lingüísticos capacitados, en todo el mundo, ofrecen datos de audio/voz multilingües en varios idiomas y dialectos. Este esfuerzo fomenta la comunicación global y salva las barreras del idioma, contribuyendo a soluciones de IA más inclusivas y efectivas.
Texto a voz
(TTS)
Cree un modelo multilingüe de conversión de texto a voz (TTS) con la ayuda de nuestra fuerza laboral global, que lo ayuda a recopilar datos de voz en más de 150 idiomas y dialectos para mejorar sus modelos de inteligencia artificial, desde controles en el automóvil hasta chatbots y soluciones de aprendizaje con alta tecnología. datos de audio de calidad.
Call Center
Grabaciones
Intercambios genuinos entre agentes y clientes, admitiendo numerosos idiomas como español, alemán, inglés americano, bengalí, japonés, chino e hindi.
Casos de éxito
Conjuntos de datos de IA conversacional con más de 3 horas de datos en 8 idiomas
Con el objetivo de crear una plataforma multilingüe para los idiomas indios, el cliente se asoció con Shaip para recopilar, segmentar y transcribir grandes conjuntos de datos en varios idiomas indios. Esto ayudaría a desarrollar modelos de habla efectivos que podrían impulsar la nueva e innovadora plataforma del cliente.
Problema: Más de 3,000 horas de datos de audio recopilados en 8 idiomas indios, segmentados y transcritos para desarrollar el reconocimiento automático del habla.
Solución: Proporcionamos recopilación, segmentación, transcripción de datos y entregamos archivos JSON con metadatos. Recopilamos 3000 horas de datos de audio en 8 idiomas indios a escala para el proyecto de tecnología del habla del cliente.
Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz
Personas
Equipos dedicados y capacitados:
- Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
- Equipo de gestión de proyectos acreditado
- Equipo de desarrollo de productos experimentado
- Equipo de contratación y incorporación del grupo de talentos
Proceso
La mayor eficiencia del proceso está asegurada con:
- Proceso robusto Stage-Gate de 6 Sigma
- Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
- Bucle de retroalimentación y mejora continua
Productos
La plataforma patentada ofrece beneficios:
- Plataforma de un extremo a otro basada en la web
- Calidad impecable
- TAT más rápido
- Entrega perfecta
Personas
Equipos dedicados y capacitados:
- Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
- Equipo de gestión de proyectos acreditado
- Equipo de desarrollo de productos experimentado
- Equipo de contratación y incorporación del grupo de talentos
Proceso
La mayor eficiencia del proceso está asegurada con:
- Proceso robusto Stage-Gate de 6 Sigma
- Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
- Bucle de retroalimentación y mejora continua
Productos
La plataforma patentada ofrece beneficios:
- Plataforma de un extremo a otro basada en la web
- Calidad impecable
- TAT más rápido
- Entrega perfecta
Conjuntos de datos de voz/audio listos para usar
Detalles | ID de corpus (único) | Palabra clave | Conjunto de datos de idioma | Código de lenguaje | Frecuencia de muestreo | Tipo de conjunto de datos | Horas totales de audio | Descripción Corta | Descripción del conjunto de datos | Canal de audio | Plataforma de grabación | NOSOTROS SOMOS (%) | Formato de audio | Formato de transcripción | Caso de uso | Número de altavoces | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
es_US_CC_8 | Vernáculo afroamericano | Vernáculo afroamericano | es_ES | 8 kHz | Centro de llamadas | 211 | Datos del centro de llamadas vernáculo afroamericano | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 612, Hombre: 1242 y Desconocido: 12 | Contacto | |
es_US_MA_16 | Vernáculo afroamericano | Vernáculo afroamericano | es_ES | 16 kHz | Medios de audio | 154 | Datos de medios vernáculos afroamericanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 151, Hombre: 150 y Desconocido: 10 | Contacto | |
Afrikáans_GC_8 | africaans | africaans | af_ZA | 8 kHz | Conversacion general | 368 | Afrikáans Datos generales de conversación | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en África | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 502, Hombre: 390 y Desconocido: 2 | Contacto | |
Afrikáans_MA_16 | africaans | africaans | af_ZA | 16 kHz | Medios de audio | 658 | Archivos multimedia en afrikáans | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 750, Hombre: 1278 y Desconocido: 52 | Contacto | |
Árabe_GC_8 | Árabe | Árabe | ar_AE | 8 kHz | Conversacion general | 292 | Datos de conversación general en árabe | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del Golfo | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 171, Hombre: 534 y Desconocido: 1 | Contacto | |
Árabe_SM_48 | Árabe | Árabe | ar-SA | 48 kHz | Monólogo guionado | 1,947 | Monólogo con guion árabe | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 838 Masculino 1209 Desconocido 78 | Contacto | |
Asamés_CC_8 | Assamese | Asamés (en proceso) | como en | Centro de llamadas | 60 | Datos del centro de llamadas asamés (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Asamés_GC | Assamese | Asamés (en proceso) | como en | Conversacion general | 100 | Asamés (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Asamés_MA | Assamese | Asamés (en proceso) | como en | Medios de audio | 40 | Asamés (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_CC_8 | Bengalí | bengalí (en proyecto) | bn_IN | Centro de llamadas | 60 | Datos del centro de llamadas en bengalí (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_GC | Bengalí | bengalí (en proyecto) | bn_IN | Conversacion general | 100 | Datos generales de conversación en bengalí (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_MA | Bengalí | bengalí (en proyecto) | bn_IN | Medios de audio | 40 | Datos de audio multimedia en bengalí (en proceso) | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Boston_CC_8 | Inglés de Boston | Inglés de Boston | es_ES | 8 kHz | Centro de llamadas | 177 | Datos del centro de llamadas de Boston | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 605, Hombre: 711 y Desconocido: 0 | Contacto | |
Boston_GC_8 | Inglés de Boston | Inglés de Boston | es_ES | 8 kHz | Conversacion general | 32 | Datos de conversación general de Boston | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 53, Hombre: 83 y Desconocido: 0 | Contacto | |
Boston_MA_16 | Inglés de Boston | Inglés de Boston | es_ES | 16 kHz | Medios de audio | 93 | Datos de audio de Boston Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 43, Hombre: 181 y Desconocido: 2 | Contacto | |
Canadiense_SM_48 | francés canadiense | francés canadiense | fr-CA | 48 kHz | Monólogo guionado | 1,222 | francés canadiense | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 974 Masculino 631 Desconocido 1 | Contacto | |
Chino_CC_8 | Ingles chino | Ingles chino | es_ES | 8 kHz | Centro de llamadas | 169 | Datos del centro de llamadas chino | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino: 1790, Masculino: 523 y Desconocido: 13 | Contacto | |
Chino_MA_16 | Ingles chino | Ingles chino | es_ES | 16 kHz | Medios de audio | 249 | Datos de audio de medios chinos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino: 126, Masculino: 346 y Desconocido: 6 | Contacto | |
Chino simplificado_SM_48 | Chino simplificado | Chino simplificado | zh-CN | 48 kHz | Monólogo guionado | 2,762 | Chino simplificado | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1920 Hombre 1535 Desconocido 270 | Contacto | |
Chino tradicional_SM_48 | Chino Tradicional | Chino Tradicional | zh-TW | 48 kHz | Monólogo guionado | 1,028 | Chino Tradicional | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1069 Masculino 262 Desconocido 3 | Contacto | |
Danés_GC_8 | Danés | Danés | da_DK | 8 kHz | Conversacion general | 372 | Datos generales de conversación en danés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 311, Hombre: 417, Desconocido: 0 | Contacto | |
Danés_MA_16 | Danés | Danés | da_DK | 16 kHz | Medios de audio | 664 | Datos de audio de medios daneses | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 369, Hombre: 864, Desconocido: 27 | Contacto | |
Danés_SM_48 | Danés | Danés | da-DK | 48 kHz | Monólogo guionado | 2,579 | Monólogo con guión danés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de Dinamarca | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1551 Hombre 1233 Desconocido 42 | Contacto | |
Inglés Profundo Sur_CC_8 | Inglés Deep South | Inglés Deep South | es_ES | 8 kHz | Centro de llamadas | 151 | Datos del centro de llamadas del sur profundo en inglés | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 221 , Hombre 1004 , Desconocido 7 | Contacto | |
Inglés Profundo Sur_GC_8 | Inglés Deep South | Inglés Deep South | es_ES | 8 kHz | Conversacion general | 56 | Datos de conversación general del sur profundo en inglés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 99, Hombre 31, Desconocido 0 | Contacto | |
Inglés Profundo Sur_MA_16 | Inglés Deep South | Inglés Deep South | es_ES | 16 kHz | Medios de audio | 266 | Datos de audio de Deep South Media en inglés | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 204, Hombre 356, Desconocido 21 | Contacto | |
Alemán_CC_8 | Alemán | Alemán | de-de | 8 kHz | Centro de llamadas | 64 | Datos del centro de llamadas alemán | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Mono | Ordenador de sobremesa | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 478 Masculino 1440 Desconocido 0 | Contacto | ||
Alemán_IVR_8 | Alemán | Alemán | de-de | 8 kHz | IVR | 200 | Datos IVR alemanes | Humano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontánea | Mono | Ordenador de sobremesa | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 10115 Masculino 8750 Desconocido 0 | Contacto | ||
Gujarati_CC_8 | Gujarati | Gujarati (en trámite) | gu_IN | Centro de llamadas | 60 | Datos del centro de llamadas de Gujarati (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Gujarati_GC | Gujarati | Gujarati (en trámite) | gu_IN | Conversacion general | 100 | Gujarati (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Gujarati_MA | Gujarati | Gujarati (en trámite) | gu_IN | Medios de audio | 40 | Gujarati (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Hebreo_Conversación general_8 | Hebreo | Hebreo | él_IL | 8 kHz | Conversacion general | 399 | Datos de conversación general en hebreo | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en Israel | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 414 , Hombre 399 , Desconocido 1 | Contacto | |
Hebreo_MA_16 | Hebreo | Hebreo | él_IL | 16 kHz | Medios de audio | 427 | Datos de audio de medios hebreos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 361, Hombre 513, Desconocido 13 | Contacto | |
Hindi_MA_16 | Hindi | Hindi | hola_IN | 16 kHz | Medios de audio | 219 | Datos de audio de Hindi Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 83, Hombre 309, Desconocido 0 | Contacto | |
hindi_sm_48 | Hindi | Hindi | hola-IN | 48 kHz | Monólogo guionado | 2,867 | Monólogo guionado en hindi | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1977 Hombre 1864 Desconocido 147 | Contacto | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Centro de llamadas | 208 | ESPAÑOL Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 822, Hombre 1262 , Desconocido 0 | Contacto | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Medios de audio | 216 | ESPAÑOL Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 75, Hombre 380, Desconocido 0 | Contacto | |
Hispano_CC_8 | ingles hispano | ingles hispano | es_ES | 8 kHz | Centro de llamadas | 212 | Datos del centro de llamadas hispano | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 822, Hombre 1262, Desconocido 0 | Contacto | |
Hispano_MA_16 | ingles hispano | ingles hispano | es_ES | 16 kHz | Medios de audio | 155 | Audio de los medios de comunicación hispanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 140, Hombre 219, Desconocido 5 | Contacto | |
indonesio_GC_8 | Indonesio | Indonesio | yo hice | 8 kHz | Conversacion general | 496 | Datos de conversación general de indonesio | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesio | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 524, Hombre 454, Desconocido 2 | Contacto | |
Indonesia_MA_16 | Indonesio | Indonesio | yo hice | 16 kHz | Medios de audio | 643 | Datos de audio de los medios de Indonesia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 746, Hombre 1507, Desconocido 129 | Contacto | |
irlandés_GC_8 | irlandés | irlandés | es_ES | 8 kHz | Conversacion general | 192 | Datos de conversación general en irlandés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 213 , Hombre 153 , Desconocido 0 | Contacto | |
Japonés_SM_48 | Japonés | Japonés | ja-JP | 48 kHz | Monólogo guionado | 2,335 | Monólogo con guion japonés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1460 Hombre 1221 Desconocido 194 | Contacto | |
Canadá_CC_8 | kannada | Kannada (en tramitación) | kn_IN | Centro de llamadas | 60 | Datos del centro de atención telefónica de Kannada (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
kannada_GC | kannada | Kannada (en tramitación) | kn_IN | Conversacion general | 100 | Kannada (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Canadá_MA | kannada | Kannada (en tramitación) | kn_IN | Medios de audio | 40 | Kannada (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Coreano_CC_8 | Coreano | Coreano | ko_KR | 8 kHz | Centro de llamadas | 107 | Datos del centro de llamadas de Corea | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1086, Masculino 210 , Desconocido 4 | Contacto | |
coreano_MA_16 | Coreano | Coreano | ko_KR | 16 kHz | Medios de audio | 204 | Datos de audio de medios coreanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 70 Hombre 303, Desconocido 25 | Contacto | |
coreano_sm_48 | Coreano | Coreano | ko-KR | 48 kHz | Monólogo guionado | 1,955 | Monólogo escrito en coreano | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1195 Hombre 1134 Desconocido 122 | Contacto | |
malayo_GC_8 | Malay | Malay | ms_MY | 8 kHz | Conversacion general | 266 | Datos generales de conversación en malayo | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en Malasia | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 316, Hombre 176 , Desconocido 0 | Contacto | |
Malayo_MA_16 | Malay | Malay | ms_MY | 16 kHz | Medios de audio | 344 | Datos de audio de Malay Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 236, Hombre 626, Desconocido 47 | Contacto | |
Malayalam_CC_8 | malayalam | Malayalam (en trámite) | ml_IN | Centro de llamadas | 60 | Malayalam (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Malayalam_GC | malayalam | Malayalam (en trámite) | ml_IN | Conversacion general | 100 | Malayalam (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Malayalam_MA | malayalam | Malayalam (en trámite) | ml_IN | Medios de audio | 40 | Malayalam (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Maratí_CC_8 | marathi | Marathi (en trámite) | señor_IN | Centro de llamadas | 60 | Datos del centro de llamadas en marathi (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
marathi_GC | marathi | Marathi (en trámite) | señor_IN | Conversacion general | 100 | Marathi (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
marathi_MA | marathi | Marathi (en trámite) | señor_IN | Medios de audio | 40 | Marathi (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Mexicana_SM_48 | Español (mexico) | Español (mexico) | ES-MX | 48 kHz | Monólogo guionado | 1,492 | Monólogo guionado en español mexicano | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1016 Masculino 1069 Desconocido 95 | Contacto | |
Holanda_SM_48 | Holandés | Holandés | es-ES | 48 kHz | Monólogo guionado | 1,205 | Monólogo guionado holandés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1285 Masculino 531 Desconocido 3 | Contacto | |
Inglés de Nueva York_CC_8 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 8 kHz | Centro de llamadas | 103 | Datos del centro de llamadas en inglés de Nueva York | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 610, Hombre 532, Desconocido 0 | Contacto | |
Inglés de Nueva York_GC_8 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 8 kHz | Conversacion general | 107 | Datos de conversación general en inglés de Nueva York | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 118, Hombre 114, Desconocido 0 | Contacto | |
Inglés de Nueva York_MA_16 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 16 kHz | Medios de audio | 140 | Datos de audio de New York English Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 66, Hombre 230, Desconocido 11 | Contacto | |
Nueva Zelanda_GC_8 | Inglés neozelandés | Inglés neozelandés | es_ES | 8 kHz | Conversacion general | 148 | Datos generales de conversación en inglés de Nueva Zelanda | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 167, hombre 121, Desconocido 4 | Contacto | |
Nueva Zelanda_MA_16 | Inglés neozelandés | Inglés neozelandés | es_ES | 16 kHz | Medios de audio | 400 | Audio multimedia en inglés de Nueva Zelanda | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 367, hombre 678, Desconocido 26 | Contacto | |
Oriya_CC_8 | oriya | Oriya (en trámite) | o_EN | Centro de llamadas | 60 | Datos del centro de llamadas Oriya (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Oriya_GC | oriya | Oriya (en trámite) | o_EN | Conversacion general | 100 | Oriya (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Oriya_MA | oriya | Oriya (en trámite) | o_EN | Medios de audio | 40 | Oriya (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Polaco_MA_16 | Polaco | Polaco | pl_PL | 16 kHz | Medios de audio | 269 | Audio de medios polacos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 173 Masculino 354 Desconocido 6 | Contacto | |
Polaco Polonia_SM_48 | Polaco (Polonia) | Polaco (Polonia) | es-ES | 48 kHz | Monólogo guionado | 1,482 | Polonia polaca - Monólogo con guión | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1324 Masculino 701 Desconocido 24 | Contacto | |
Punjabi_CC_8 | punjabi | Punjabi (en tramitación) | punjabi | Centro de llamadas | 60 | Datos del centro de llamadas de Punjabi (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Punjabi_GC | punjabi | Punjabi (en tramitación) | punjabi | Conversacion general | 100 | Punjabi (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Punjabi_MA | punjabi | Punjabi (en tramitación) | punjabi | Medios de audio | 40 | Punjabi (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Ruso_SM_48 | Ruso | Ruso | ru-RU | 48 kHz | Monólogo guionado | 2,398 | Monólogo con guión ruso | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1689 Hombre 1937 Desconocido 214 | Contacto | |
Escocés_GC_8 | escocés (acento inglés) | escocés (acento inglés) | es_AB | 8 kHz | Conversacion general | 292 | Datos de la conversación general escocesa | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 285, Hombre 260, Desconocido 3 | Contacto | |
Singapur_CC_8 | Singapur inglés | Singapur inglés | es_ES | 8 kHz | Centro de llamadas | 218 | Datos del centro de llamadas de Singapur | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 2139, Hombre 884, Desconocido 21 | Contacto | |
Singapur_MA_16 | Singapur inglés | Singapur inglés | es_ES | 16 kHz | Medios de audio | 247 | Datos de audio de Singapur Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 160, Hombre 455, Desconocido 37 | Contacto | |
Inglés sudafricano_CC_8 | Inglés sudafricano | Inglés sudafricano | es_ES | 8 kHz | Centro de llamadas | 261 | Datos del centro de llamadas en inglés de Sudáfrica | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1274 , Hombre 935 , Desconocido 1 | Contacto | |
Inglés sudafricano_MA_16 | Inglés sudafricano | Inglés sudafricano | es_ES | 16 kHz | Medios de audio | 251 | Datos de audio de South African English Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 235, Hombre 432, Desconocido 36 | Contacto | |
Suajili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Centro de llamadas | 230 | Datos del centro de llamadas en swahili | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 611, Hombre 833, Desconocido 0 | Contacto | |
Suajili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Medios de audio | 265 | Datos de audio de Swahili Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 118, Hombre 493, Desconocido 25 | Contacto | |
Sueco_CC_8 | Sueco | Sueco | sv_SE | 8 kHz | Centro de llamadas | 250 | Datos del centro de llamadas sueco | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1581, hombre 727, Desconocido 2 | Contacto | |
Sueco_MA_16 | Sueco | Sueco | sv_SE | 16 kHz | Medios de audio | 278 | Datos de audio de medios suecos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 195, hombre 500, Desconocido 21 | Contacto | |
Tamil_CC_8 | Tamil | Tamil (en trámite) | ta_IN | Centro de llamadas | 60 | Tamil (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Tamil_GC | Tamil | Tamil (en trámite) | ta_IN | Conversacion general | 100 | Tamil (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Tamil_MA | Tamil | Tamil (en trámite) | ta_IN | Medios de audio | 40 | Tamil (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Conversacion general | 553 | Datos generales de conversación en telugu | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 574, Hombre 564, Desconocido 0 | Contacto | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Medios de audio | 648 | Datos de audio de Telugu Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 207, Hombre 963, Desconocido 2 | Contacto | |
Telugu_CC_8 | telugu | Telugu (en proceso) | te_IN | Centro de llamadas | 30 | Telugu (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_GC | telugu | Telugu (en proceso) | te_IN | Conversacion general | 50 | Telugu (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_MA | telugu | Telugu (en proceso) | te_IN | Medios de audio | 20 | Telugu (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
tailandés_GC_8 | Tailandés | Tailandés | th_TH | 8 kHz | Conversacion general | 183 | Conversación general tailandesa | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigos | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 338, Hombre 96, Desconocido 8 | Contacto | |
Tailandés_MA_8 | Tailandés | Tailandés | th_TH | 16 kHz | Medios de audio | 173 | Audio de medios tailandeses | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 143, Hombre 502, Desconocido 26 | Contacto | |
Pavo Turco_SM_48 | Turquía turca | Turquía turca | tr-TR | 48 kHz | Monólogo guionado | 2,027 | Turquía turca | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1561 Masculino 1241 Desconocido 31 | Contacto | |
vietnamita_GC_8 | Vietnamita | Vietnamita | vi_VN | 8 kHz | Conversacion general | 295 | Datos de conversación general en vietnamita | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh). | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 400, hombre 380, Desconocidos 2 | Contacto | |
Vietnamita_MA_16 | Vietnamita | Vietnamita | vi_VN | 16 kHz | Medios de audio | 257 | Datos de audio de medios vietnamitas | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 249, hombre 200, Desconocidos 45 | Contacto | |
Galés_GC_8 | galés (acento inglés) | galés (acento inglés) | es_WL | 8 kHz | Conversacion general | 278 | Datos generales de conversación en galés | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Ordenador de sobremesa | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 270, Hombre 324, Desconocido 0 | Contacto | |
Inglés británico_WW_16 | Reino Unido Inglés | Reino Unido Inglés | es_es | 16 kHz | Wake Word | 200 Altavoces | Wake Word Inglés británico | colección de datos de frases clave
| canal 1 | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Sexo: 50% masculino, 50% femenino, +/- 10%. | Contacto |
Servicios Ofrecidos
La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:
Recopilación de datos de texto
Servicios
El verdadero valor de los servicios de recopilación de datos cognitivos de Shaip es que les brinda a las organizaciones la clave para desbloquear la información crítica que se encuentra dentro de los datos no estructurados.
Servicios de recopilación de datos de imágenes
Asegúrese de que su modelo de visión por computadora identifique cada imagen con precisión, para entrenar sin problemas los modelos de inteligencia artificial de próxima generación del futuro
Servicios de recopilación de datos de video
Ahora céntrese en la visión por computadora junto con la PNL para entrenar a sus modelos a identificar objetos, individuos, elementos disuasorios y otros elementos visuales a la perfección.
Recomendaciones
Ofrecimiento
Anotación de audio para IA inteligentes
Los servicios de anotación de audio han sido un fuerte de Shaip desde el principio. Desarrolle, entrene y mejore la inteligencia artificial conversacional, los chatbots y los motores de reconocimiento de voz con nuestros servicios de anotación de audio de última generación.
Guía de compradores
Guía del comprador: Guía completa de IA conversacional
El chatbot con el que conversó se ejecuta en un sistema avanzado de inteligencia artificial conversacional que se entrena, prueba y crea utilizando toneladas de conjuntos de datos de reconocimiento de voz.
Catálogo de datos
Licencias y catálogo de datos de voz listos para usar
Existe una amplia variedad de aplicaciones comunes para datos de voz en proyectos de IA. Le ofrecemos grandes cantidades de datos de alta calidad listos para su reconocimiento de voz.
¿Quiere construir su propio conjunto de datos de audio?
Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades
Preguntas más frecuentes (FAQ)
La recopilación de datos de voz para un modelo de aprendizaje automático se refiere al proceso de recopilación de grabaciones de audio del lenguaje hablado. Esta colección ayuda a entrenar y perfeccionar algoritmos de aprendizaje automático, en particular aquellos centrados en la comprensión y el procesamiento de voces humanas.
Cuando intente recopilar datos de audio para el reconocimiento automático de voz (ASR), debe comenzar definiendo las necesidades específicas de su proyecto, incluido el idioma, el acento y el tipo de voz deseados. Después de configurar estos parámetros, asegúrese de obtener todos los permisos necesarios para respetar la privacidad del usuario. Luego, utilice dispositivos o software de grabación adecuados para capturar muestras de audio claras. Cada grabación debe anotarse meticulosamente con su transcripción u otros metadatos pertinentes y almacenarse sistemáticamente para facilitar el acceso.
Un conjunto de datos de voz en el aprendizaje automático es fundamental para entrenar, probar y validar modelos diseñados para reconocer, transcribir o interpretar el lenguaje hablado. Estos conjuntos de datos allanan el camino para innumerables aplicaciones, desde asistentes de voz y servicios de transcripción hasta biometría de voz.
Para recopilar datos precisos de diversos idiomas y acentos, es vital la colaboración con hablantes nativos de los orígenes lingüísticos deseados. Apunte a una muestra variada y representativa para cubrir un amplio espectro de matices demográficos. Emplee equipos de grabación estandarizados en entornos uniformes para garantizar la coherencia del audio. Y, lo que es más importante, anote cada pieza de datos con transcripciones y metadatos detallados, indicando el idioma y el acento específicos.