Los servicios de recopilación de datos de voz más confiables para su IA
Entrene sus modelos de PNL, VA, prototipos de TTS y más con datos de conversación de calidad, con nuestros servicios de recopilación de datos de audio y voz.
Descubra canalizaciones de datos de audio sin cuellos de botella.
Clientes destacados
¿Por qué se necesita un conjunto de datos de entrenamiento del habla para el procesamiento del lenguaje natural?
¿Alguna vez ha notado que su teléfono inteligente VA, es decir, Siri, Bixby o cualquier otra cosa, interactúe? ¡La forma en que responden a todas las preguntas y analizan y presentan resultados según sus requisitos!
Bueno, por mucho que nos intriguen estos AV, estos recursos y programas inteligentes necesitan ser entrenados progresivamente para poder responder, con la mayor precisión. Esta es la razón por la que debe considerar externalizar la recopilación de datos de voz/audio y voz a empresas especializadas en recopilación de datos, con experiencia profesional validada.
Invertir en la recopilación de datos de audio prepara su supuesta PNL para atender a una audiencia multilingüe. No solo eso, la recopilación de datos de voz para NLP, cuando la maneja un experto, incluso tiene en cuenta la recopilación en el campo, el análisis semántico y la transcripción de audio. Con las soluciones profesionales de recopilación de datos de voz, puede:
- Adquiera conjuntos de datos de audio de alta calidad para mejorar la precisión
- Configuración de escenarios diversos de destino
- Recopile datos de entrenamiento de IA multilingües
- Escale su modelo de ML para adaptarse a diversos segmentos demográficos y verticales
Servicios profesionales de recopilación de datos de audio / voz para PNL
Cualquier tema. Cualquier escenario.
Los sistemas inteligentes de PNL son todo menos genéricos. Dependiendo de la funcionalidad del programa, es posible que deba centrarse en servicios de datos de audio espaciales y multilingües, que solo pueden ofrecer empresas de recopilación de datos de voz / audio de renombre. Aquí es donde Shaip entra en el esquema de las cosas como un proveedor de servicios de conexión de datos altamente confiable que se enorgullece de hacer el trabajo pesado por sus IA supuestamente inteligentes.
En Shaip, nuestro enfoque principal es alimentar modelos con el mayor volumen posible de muestras de voz personalizadas, en el menor tiempo posible. Con nosotros a bordo, puede esperar:
- Recopilación de datos de audio / voz seleccionados para PNL
- Programas hechos a medida que responden según casos de uso específicos
- Preparar la minería de conjuntos de datos de audio
- Procesamiento de datos automatizado y específico para patrones
- El nivel más alto posible de especificidad de dominio
- Tiempo de comercialización más rápido con modelos de inteligencia artificial acelerados
Nuestra Experiencia
Alinee los datos de audio para preparar modelos inteligentes de PNL
Shaip ofrece servicios de recopilación de datos de voz / audio de extremo a extremo en más de 100 idiomas para permitir que las tecnologías habilitadas por voz se adapten a un conjunto diverso de audiencias en todo el mundo. Podemos trabajar en proyectos de cualquier alcance y tamaño; desde la concesión de licencias para conjuntos de datos de audio estándar hasta la gestión de la recopilación de datos de audio personalizados, pasando por la transcripción y la anotación de audio. No importa qué tan grande sea su proyecto de recopilación de datos de voz, podemos personalizar los servicios de recopilación de audio para que se adapten a sus necesidades para crear conjuntos de datos de PNL de alta calidad que se dirijan a dialectos, tonos e idiomas. Elija entre nuestra amplia gama de conjuntos de datos de voz y recursos de recopilación de datos de audio, para configuraciones inteligentes que habiliten la voz.
Colección de discursos monólogos
Maneje los requisitos basados en el habla pertenecientes a un altavoz independiente para sus prototipos de Text-to-Speed y requisitos específicos de transcripciones con alimentación rápida por guión, a través de archivos de un solo canal.
Discurso de diálogo
Collection
Configure asistentes virtuales inteligentes, chatbots de velocidad específica y modelos de reconocimiento automático de voz con exposición multilingüe a través de archivos de doble canal y recursos transcritos.
Datos acústicos
Collection
Podemos grabar de forma profesional datos de audio con calidad de estudio, ya sea en restaurantes, oficinas o hogares o desde varios entornos e idiomas, a través de nuestra red global de colaboradores, al tiempo que cubrimos una gama acústica más amplia.
Colección de expresiones en lenguaje natural
Entrene configuraciones comerciales inteligentes para identificar frases de clientes pronunciadas de manera diferente con un significado similar, para hacer que las IA sean más autónomas en el tiempo
Digitales / Virtuales
Asistentes
Concéntrese en crear su próximo Asistente virtual mediante la formación de modelos con salvedades del habla humana, exposición multilingüe, análisis contextual y NLU.
Reconocimiento automático de voz (ASR)
Mejore la precisión de sus sistemas de reconocimiento automático de voz (ASR) al tener acceso a conjuntos de datos de voz/audio diversificados de última generación, de una amplia gama de datos demográficos.
Datos de entrenamiento de voz/audio multilingües
Nuestros profesionales de idiomas altamente calificados en todo el mundo ofrecen datos de capacitación de voz/audio multilingüe en varios idiomas y dialectos, incluidos árabe, danés, chino, afrikáans, Singapur, Nueva Zelanda, hebreo, indonesio, irlandés, coreano, malayo, polaco, escocés, sueco , francés, alemán, vietnamita, tailandés, italiano, español y más.
Texto a voz
(TTS)
Para ofrecer una mejor experiencia de usuario con TTS, es fundamental desarrollar un sistema que suene natural. Cree un modelo multilingüe de texto a voz (TTS) con la ayuda de nuestra fuerza laboral global, que lo ayuda a recopilar datos de voz en más de 150 idiomas y dialectos para mejorar sus modelos de IA desde controles en el automóvil hasta chatbots y soluciones de aprendizaje con alta datos de audio de calidad.
Razones para elegir a Shaip como su socio confiable de recopilación de datos de voz
Personas
Equipos dedicados y capacitados:
- Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
- Equipo de gestión de proyectos acreditado
- Equipo de desarrollo de productos experimentado
- Equipo de contratación y incorporación del grupo de talentos
Proceso
La mayor eficiencia del proceso está asegurada con:
- Proceso robusto Stage-Gate de 6 Sigma
- Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
- Bucle de retroalimentación y mejora continua
Plataforma
La plataforma patentada ofrece beneficios:
- Plataforma de un extremo a otro basada en la web
- Calidad impecable
- TAT más rápido
- Entrega perfecta
Personas
Equipos dedicados y capacitados:
- Más de 30,000 colaboradores para la creación de datos, etiquetado y control de calidad
- Equipo de gestión de proyectos acreditado
- Equipo de desarrollo de productos experimentado
- Equipo de contratación y incorporación del grupo de talentos
Proceso
La mayor eficiencia del proceso está asegurada con:
- Proceso robusto Stage-Gate de 6 Sigma
- Un equipo dedicado de 6 cinturones negros Sigma: propietarios de procesos clave y cumplimiento de calidad
- Bucle de retroalimentación y mejora continua
Plataforma
La plataforma patentada ofrece beneficios:
- Plataforma de un extremo a otro basada en la web
- Calidad impecable
- TAT más rápido
- Entrega perfecta
Idioma: conjuntos de datos de audio recopilados
Conjuntos de datos de voz/audio listos para usar
Detalles | ID de corpus (único) | Palabra clave | Conjunto de datos de idioma | Código de lenguaje | Frecuencia de muestreo | Tipo de conjunto de datos | Horas totales de audio | Descripción Corta | Descripción del conjunto de datos | Canal de audio | Plataforma de grabación | NOSOTROS SOMOS (%) | Formato de audio | Formato de transcripción | Caso de uso | Número de altavoces | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
es_US_CC_8 | Vernáculo afroamericano | Vernáculo afroamericano | es_ES | 8 kHz | Centro de llamadas | 211 | Datos del centro de llamadas vernáculo afroamericano | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 612, Hombre: 1242 y Desconocido: 12 | Contacto | |
es_US_MA_16 | Vernáculo afroamericano | Vernáculo afroamericano | es_ES | 16 kHz | Medios de audio | 154 | Datos de medios vernáculos afroamericanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 151, Hombre: 150 y Desconocido: 10 | Contacto | |
Afrikáans_GC_8 | africaans | africaans | af_ZA | 8 kHz | Conversacion general | 368 | Afrikáans Datos generales de conversación | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, afrikaans hablado en África | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 502, Hombre: 390 y Desconocido: 2 | Contacto | |
Afrikáans_MA_16 | africaans | africaans | af_ZA | 16 kHz | Medios de audio | 658 | Archivos multimedia en afrikáans | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 750, Hombre: 1278 y Desconocido: 52 | Contacto | |
Árabe_GC_8 | arábica | arábica | ar_AE | 8 kHz | Conversacion general | 292 | Datos de conversación general en árabe | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, árabe de los países del Golfo | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 171, Hombre: 534 y Desconocido: 1 | Contacto | |
Árabe_SM_48 | arábica | arábica | ar-SA | 48 kHz | Monólogo guionado | 1,947 | Monólogo con guion árabe | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 838 Masculino 1209 Desconocido 78 | Contacto | |
Asamés_CC_8 | Assamese | Asamés (en proceso) | como en | Centro de llamadas | 60 | Datos del centro de llamadas asamés (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Asamés_GC | Assamese | Asamés (en proceso) | como en | Conversacion general | 100 | Asamés (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Asamés_MA | Assamese | Asamés (en proceso) | como en | Medios de audio | 40 | Asamés (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_CC_8 | bengalí | bengalí (en proyecto) | bn_IN | Centro de llamadas | 60 | Datos del centro de llamadas en bengalí (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_GC | bengalí | bengalí (en proyecto) | bn_IN | Conversacion general | 100 | Datos generales de conversación en bengalí (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
bengalí_MA | bengalí | bengalí (en proyecto) | bn_IN | Medios de audio | 40 | Datos de audio multimedia en bengalí (en proceso) | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Boston_CC_8 | Inglés de Boston | Inglés de Boston | es_ES | 8 kHz | Centro de llamadas | 177 | Datos del centro de llamadas de Boston | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 605, Hombre: 711 y Desconocido: 0 | Contacto | |
Boston_GC_8 | Inglés de Boston | Inglés de Boston | es_ES | 8 kHz | Conversacion general | 32 | Datos de conversación general de Boston | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 53, Hombre: 83 y Desconocido: 0 | Contacto | |
Boston_MA_16 | Inglés de Boston | Inglés de Boston | es_ES | 16 kHz | Medios de audio | 93 | Datos de audio de Boston Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 43, Hombre: 181 y Desconocido: 2 | Contacto | |
Canadiense_SM_48 | francés canadiense | francés canadiense | fr-CA | 48 kHz | Monólogo guionado | 1,222 | francés canadiense | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 974 Masculino 631 Desconocido 1 | Contacto | |
Chino_CC_8 | Ingles chino | Ingles chino | es_ES | 8 kHz | Centro de llamadas | 169 | Datos del centro de llamadas chino | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino: 1790, Masculino: 523 y Desconocido: 13 | Contacto | |
Chino_MA_16 | Ingles chino | Ingles chino | es_ES | 16 kHz | Medios de audio | 249 | Datos de audio de medios chinos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino: 126, Masculino: 346 y Desconocido: 6 | Contacto | |
Chino simplificado_SM_48 | Chino simplificado | Chino simplificado | zh-CN | 48 kHz | Monólogo guionado | 2,762 | Chino simplificado | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1920 Hombre 1535 Desconocido 270 | Contacto | |
Chino tradicional_SM_48 | Chino Tradicional | Chino Tradicional | zh-TW | 48 kHz | Monólogo guionado | 1,028 | Chino Tradicional | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1069 Masculino 262 Desconocido 3 | Contacto | |
Danés_GC_8 | Danés | Danés | da_DK | 8 kHz | Conversacion general | 372 | Datos generales de conversación en danés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 311, Hombre: 417, Desconocido: 0 | Contacto | |
Danés_MA_16 | Danés | Danés | da_DK | 16 kHz | Medios de audio | 664 | Datos de audio de medios daneses | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer: 369, Hombre: 864, Desconocido: 27 | Contacto | |
Danés_SM_48 | Danés | Danés | da-DK | 48 kHz | Monólogo guionado | 2,579 | Monólogo con guión danés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos, danés de Dinamarca | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1551 Hombre 1233 Desconocido 42 | Contacto | |
Inglés Profundo Sur_CC_8 | Inglés Deep South | Inglés Deep South | es_ES | 8 kHz | Centro de llamadas | 151 | Datos del centro de llamadas del sur profundo en inglés | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 221 , Hombre 1004 , Desconocido 7 | Contacto | |
Inglés Profundo Sur_GC_8 | Inglés Deep South | Inglés Deep South | es_ES | 8 kHz | Conversacion general | 56 | Datos de conversación general del sur profundo en inglés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 99, Hombre 31, Desconocido 0 | Contacto | |
Inglés Profundo Sur_MA_16 | Inglés Deep South | Inglés Deep South | es_ES | 16 kHz | Medios de audio | 266 | Datos de audio de Deep South Media en inglés | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 204, Hombre 356, Desconocido 21 | Contacto | |
Alemán_CC_8 | alemán | alemán | de-De | 8 kHz | Centro de llamadas | 64 | Datos del centro de llamadas alemán | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Mono | Escritorio | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 478 Masculino 1440 Desconocido 0 | Contacto | ||
Alemán_IVR_8 | alemán | alemán | de-De | 8 kHz | IVR | 200 | Datos IVR alemanes | Humano a Máquina. Un tipo de flujo de IVR en el que hay un mensaje TTS (p. ej., "¿Cómo puedo ayudarlo?") seguido de una respuesta humana espontánea | Mono | Escritorio | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 10115 Masculino 8750 Desconocido 0 | Contacto | ||
Gujarati_CC_8 | gujarati | Gujarati (en trámite) | gu_IN | Centro de llamadas | 60 | Datos del centro de llamadas de Gujarati (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Gujarati_GC | gujarati | Gujarati (en trámite) | gu_IN | Conversacion general | 100 | Gujarati (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Gujarati_MA | gujarati | Gujarati (en trámite) | gu_IN | Medios de audio | 40 | Gujarati (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Hebreo_Conversación general_8 | Hebreo | Hebreo | él_IL | 8 kHz | Conversacion general | 399 | Datos de conversación general en hebreo | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, hebreo en Israel | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 414 , Hombre 399 , Desconocido 1 | Contacto | |
Hebreo_MA_16 | Hebreo | Hebreo | él_IL | 16 kHz | Medios de audio | 427 | Datos de audio de medios hebreos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 361, Hombre 513, Desconocido 13 | Contacto | |
Hindi_MA_16 | Hindi | Hindi | hola_IN | 16 kHz | Medios de audio | 219 | Datos de audio de Hindi Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 83, Hombre 309, Desconocido 0 | Contacto | |
Hindi_SM_48 | Hindi | Hindi | hola-IN | 48 kHz | Monólogo guionado | 2,867 | Monólogo guionado en hindi | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1977 Hombre 1864 Desconocido 147 | Contacto | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Centro de llamadas | 208 | ESPAÑOL Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 822, Hombre 1262 , Desconocido 0 | Contacto | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Medios de audio | 216 | ESPAÑOL Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 75, Hombre 380, Desconocido 0 | Contacto | |
Hispano_CC_8 | ingles hispano | ingles hispano | es_ES | 8 kHz | Centro de llamadas | 212 | Datos del centro de llamadas hispano | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 822, Hombre 1262, Desconocido 0 | Contacto | |
Hispano_MA_16 | ingles hispano | ingles hispano | es_ES | 16 kHz | Medios de audio | 155 | Audio de los medios de comunicación hispanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 140, Hombre 219, Desconocido 5 | Contacto | |
indonesio_GC_8 | Indonesian | Indonesian | yo hice | 8 kHz | Conversacion general | 496 | Datos de conversación general de indonesio | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, bahasa indonesio | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 524, Hombre 454, Desconocido 2 | Contacto | |
Indonesia_MA_16 | Indonesian | Indonesian | yo hice | 16 kHz | Medios de audio | 643 | Datos de audio de los medios de Indonesia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 746, Hombre 1507, Desconocido 129 | Contacto | |
irlandés_GC_8 | irlandés | irlandés | es_ES | 8 kHz | Conversacion general | 192 | Datos de conversación general en irlandés | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 213 , Hombre 153 , Desconocido 0 | Contacto | |
Japonés_SM_48 | japonés | japonés | ja-JP | 48 kHz | Monólogo guionado | 2,335 | Monólogo con guion japonés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1460 Hombre 1221 Desconocido 194 | Contacto | |
Canadá_CC_8 | kannada | Kannada (en tramitación) | kn_IN | Centro de llamadas | 60 | Datos del centro de atención telefónica de Kannada (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Kannada_GC | kannada | Kannada (en tramitación) | kn_IN | Conversacion general | 100 | Kannada (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Canadá_MA | kannada | Kannada (en tramitación) | kn_IN | Medios de audio | 40 | Kannada (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Coreano_CC_8 | Coreano | Coreano | ko_KR | 8 kHz | Centro de llamadas | 107 | Datos del centro de llamadas de Corea | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1086, Masculino 210 , Desconocido 4 | Contacto | |
coreano_MA_16 | Coreano | Coreano | ko_KR | 16 kHz | Medios de audio | 204 | Datos de audio de medios coreanos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 70 Hombre 303, Desconocido 25 | Contacto | |
Korean_SM_48 | Coreano | Coreano | ko-KR | 48 kHz | Monólogo guionado | 1,955 | Monólogo escrito en coreano | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1195 Hombre 1134 Desconocido 122 | Contacto | |
malayo_GC_8 | Malay | Malay | ms_MY | 8 kHz | Conversacion general | 266 | Datos generales de conversación en malayo | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, malayo en Malasia | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 316, Hombre 176 , Desconocido 0 | Contacto | |
Malayo_MA_16 | Malay | Malay | ms_MY | 16 kHz | Medios de audio | 344 | Datos de audio de Malay Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 236, Hombre 626, Desconocido 47 | Contacto | |
Malayalam_CC_8 | malayalam | Malayalam (en trámite) | ml_IN | Centro de llamadas | 60 | Malayalam (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Malayalam_GC | malayalam | Malayalam (en trámite) | ml_IN | Conversacion general | 100 | Malayalam (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Malayalam_MA | malayalam | Malayalam (en trámite) | ml_IN | Medios de audio | 40 | Malayalam (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Marathi_CC_8 | marathi | Marathi (en trámite) | mr_IN | Centro de llamadas | 60 | Datos del centro de llamadas en marathi (en proceso) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Marathi_GC | marathi | Marathi (en trámite) | mr_IN | Conversacion general | 100 | Marathi (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Marathi_MA | marathi | Marathi (en trámite) | mr_IN | Medios de audio | 40 | Marathi (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Mexicana_SM_48 | Español (mexico) | Español (mexico) | ES-MX | 48 kHz | Monólogo guionado | 1,492 | Monólogo guionado en español mexicano | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1016 Masculino 1069 Desconocido 95 | Contacto | |
Holanda_SM_48 | holandés | holandés | es-ES | 48 kHz | Monólogo guionado | 1,205 | Monólogo guionado holandés | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1285 Masculino 531 Desconocido 3 | Contacto | |
Inglés de Nueva York_CC_8 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 8 kHz | Centro de llamadas | 103 | Datos del centro de llamadas en inglés de Nueva York | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 610, Hombre 532, Desconocido 0 | Contacto | |
Inglés de Nueva York_GC_8 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 8 kHz | Conversacion general | 107 | Datos de conversación general en inglés de Nueva York | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 118, Hombre 114, Desconocido 0 | Contacto | |
Inglés de Nueva York_MA_16 | Inglés de Nueva York | Inglés de Nueva York | es_ES | 16 kHz | Medios de audio | 140 | Datos de audio de New York English Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 66, Hombre 230, Desconocido 11 | Contacto | |
Nueva Zelanda_GC_8 | Inglés neozelandés | Inglés neozelandés | es_ES | 8 kHz | Conversacion general | 148 | Datos generales de conversación en inglés de Nueva Zelanda | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 167, hombre 121, Desconocido 4 | Contacto | |
Nueva Zelanda_MA_16 | Inglés neozelandés | Inglés neozelandés | es_ES | 16 kHz | Medios de audio | 400 | Audio multimedia en inglés de Nueva Zelanda | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 367, hombre 678, Desconocido 26 | Contacto | |
Oriya_CC_8 | oriya | Oriya (en trámite) | o_EN | Centro de llamadas | 60 | Datos del centro de llamadas Oriya (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Oriya_GC | oriya | Oriya (en trámite) | o_EN | Conversacion general | 100 | Oriya (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Oriya_MA | oriya | Oriya (en trámite) | o_EN | Medios de audio | 40 | Oriya (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Polaco_MA_16 | polaco | polaco | pl_PL | 16 kHz | Medios de audio | 269 | Audio de medios polacos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 173 Masculino 354 Desconocido 6 | Contacto | |
Polaco Polonia_SM_48 | Polaco (Polonia) | Polaco (Polonia) | es-ES | 48 kHz | Monólogo guionado | 1,482 | Polonia polaca - Monólogo con guión | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1324 Masculino 701 Desconocido 24 | Contacto | |
Punjabi_CC_8 | punjabi | Punjabi (en tramitación) | punjabi | Centro de llamadas | 60 | Datos del centro de llamadas de Punjabi (In Pipeline) | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Punjabi_GC | punjabi | Punjabi (en tramitación) | punjabi | Conversacion general | 100 | Punjabi (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Punjabi_MA | punjabi | Punjabi (en tramitación) | punjabi | Medios de audio | 40 | Punjabi (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Ruso_SM_48 | ruso | ruso | ru-RU | 48 kHz | Monólogo guionado | 2,398 | Monólogo con guión ruso | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1689 Hombre 1937 Desconocido 214 | Contacto | |
Escocés_GC_8 | escocés (acento inglés) | escocés (acento inglés) | es_AB | 8 kHz | Conversacion general | 292 | Datos de la conversación general escocesa | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 285, Hombre 260, Desconocido 3 | Contacto | |
Singapur_CC_8 | Singapur inglés | Singapur inglés | es_ES | 8 kHz | Centro de llamadas | 218 | Datos del centro de llamadas de Singapur | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 2139, Hombre 884, Desconocido 21 | Contacto | |
Singapur_MA_16 | Singapur inglés | Singapur inglés | es_ES | 16 kHz | Medios de audio | 247 | Datos de audio de Singapur Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 160, Hombre 455, Desconocido 37 | Contacto | |
Inglés sudafricano_CC_8 | Inglés sudafricano | Inglés sudafricano | es_ES | 8 kHz | Centro de llamadas | 261 | Datos del centro de llamadas en inglés de Sudáfrica | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1274 , Hombre 935 , Desconocido 1 | Contacto | |
Inglés sudafricano_MA_16 | Inglés sudafricano | Inglés sudafricano | es_ES | 16 kHz | Medios de audio | 251 | Datos de audio de South African English Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 235, Hombre 432, Desconocido 36 | Contacto | |
Suajili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Centro de llamadas | 230 | Datos del centro de llamadas en swahili | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 611, Hombre 833, Desconocido 0 | Contacto | |
Suajili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Medios de audio | 265 | Datos de audio de Swahili Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 118, Hombre 493, Desconocido 25 | Contacto | |
Sueco_CC_8 | Sueco | Sueco | sv_SE | 8 kHz | Centro de llamadas | 250 | Datos del centro de llamadas sueco | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 1581, hombre 727, Desconocido 2 | Contacto | |
Sueco_MA_16 | Sueco | Sueco | sv_SE | 16 kHz | Medios de audio | 278 | Datos de audio de medios suecos | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 195, hombre 500, Desconocido 21 | Contacto | |
Tamil_CC_8 | Tamil | Tamil (en trámite) | ta_IN | Centro de llamadas | 60 | Tamil (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Tamil_GC | Tamil | Tamil (en trámite) | ta_IN | Conversacion general | 100 | Tamil (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Tamil_MA | Tamil | Tamil (en trámite) | ta_IN | Medios de audio | 40 | Tamil (In Pipeline) Datos de audio de medios | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Conversacion general | 553 | Datos generales de conversación en telugu | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (Rango) - 15-60 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 574, Hombre 564, Desconocido 0 | Contacto | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Medios de audio | 648 | Datos de audio de Telugu Media | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 207, Hombre 963, Desconocido 2 | Contacto | |
Telugu_CC_8 | telugu | Telugu (en proceso) | te_IN | Centro de llamadas | 30 | Telugu (In Pipeline) Datos del centro de llamadas | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_GC | telugu | Telugu (en proceso) | te_IN | Conversacion general | 50 | Telugu (In Pipeline) Datos generales de conversación | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
Telugu_MA | telugu | Telugu (en proceso) | te_IN | Medios de audio | 20 | Telugu (In Pipeline) Datos de audio multimedia | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Contacto | ||||
tailandés_GC_8 | Thai | Thai | th_TH | 8 kHz | Conversacion general | 183 | Conversación general tailandesa | Conversación telefónica sin guión entre dos personas. Aprox. Duración del audio (rango): 15 a 60 minutos, un registro informal que se usa entre amigos | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 338, Hombre 96, Desconocido 8 | Contacto | |
Tailandés_MA_8 | Thai | Thai | th_TH | 16 kHz | Medios de audio | 173 | Audio de medios tailandeses | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 143, Hombre 502, Desconocido 26 | Contacto | |
Pavo Turco_SM_48 | Turquía turca | Turquía turca | tr-TR | 48 kHz | Monólogo guionado | 2,027 | Turquía turca | Grabaciones de un solo enunciado, que tienden a caer en el rango de 5 a 30 segundos | Mono | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Femenino 1561 Masculino 1241 Desconocido 31 | Contacto | |
vietnamita_GC_8 | Vietnamita | Vietnamita | vi_VN | 8 kHz | Conversacion general | 295 | Datos de conversación general en vietnamita | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, norte (p. ej., Hanoi), centro y sur (p. ej., ciudad de Ho Chi Minh). | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 400, hombre 380, Desconocidos 2 | Contacto | |
Vietnamita_MA_16 | Vietnamita | Vietnamita | vi_VN | 16 kHz | Medios de audio | 257 | Datos de audio de medios vietnamitas | Licenciables Archivos de audio/video de dominio público como entrevistas, podcasts, etc. - 1 a 5 personas. Aprox. Duración del audio (rango) 15-60 minutos | Mono | Abastecimiento web | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 249, hombre 200, Desconocidos 45 | Contacto | |
Galés_GC_8 | galés (acento inglés) | galés (acento inglés) | es_WL | 8 kHz | Conversacion general | 278 | Datos generales de conversación en galés | Conversación telefónica sintética sin guión entre "agente" y "cliente", aprox. Duración del audio (rango) 5-15 minutos, | Doble | Escritorio | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Mujer 270, Hombre 324, Desconocido 0 | Contacto | |
Inglés británico_WW_16 | Reino Unido Inglés | Reino Unido Inglés | es_es | 16 kHz | Wake Word | 200 Altavoces | Wake Word Inglés británico | colección de datos de frases clave
| canal 1 | Aplicación Movil | 5.0 | . Wav | json | ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje | Sexo: 50% masculino, 50% femenino, +/- 10%. | Contacto |
Servicios Ofrecidos
La recopilación de datos de audio de expertos no es todo manos a la obra para configuraciones integrales de IA. En Shaip, incluso puede considerar los siguientes servicios para hacer que los modelos estén más extendidos de lo habitual:
Recopilación de datos de texto
Servicios
El verdadero valor de los servicios de recopilación de datos cognitivos de Shaip es que les brinda a las organizaciones la clave para desbloquear la información crítica que se encuentra dentro de los datos no estructurados.
Servicios de recopilación de datos de imágenes
Asegúrese de que su modelo de visión por computadora identifique cada imagen con precisión, para entrenar sin problemas los modelos de inteligencia artificial de próxima generación del futuro
Servicios de recopilación de datos de video
Ahora céntrese en la visión por computadora junto con la PNL para entrenar a sus modelos a identificar objetos, individuos, elementos disuasorios y otros elementos visuales a la perfección.
Recomendaciones
Ofrecimiento
Anotación de audio para IA inteligentes
Los servicios de anotación de audio han sido un fuerte de Shaip desde el principio. Desarrolle, entrene y mejore la inteligencia artificial conversacional, los chatbots y los motores de reconocimiento de voz con nuestros servicios de anotación de audio de última generación.
Guía de compradores
Guía del comprador: Guía completa de IA conversacional
El chatbot con el que conversó se ejecuta en un sistema avanzado de inteligencia artificial conversacional que se entrena, prueba y crea utilizando toneladas de conjuntos de datos de reconocimiento de voz.
Catálogo de datos
Licencias y catálogo de datos de voz listos para usar
Existe una amplia variedad de aplicaciones comunes para datos de voz en proyectos de IA. Le ofrecemos grandes cantidades de datos de alta calidad listos para su reconocimiento de voz.
¿Quiere construir su propio conjunto de datos de audio?
Conéctese con nuestro experto interno en recopilación de datos de voz para configurar un depósito de audio que mejor se adapte a sus necesidades