Ahora consigue 50% DE DESCUENTO* sobre conjuntos de datos listos para usar de IA conversacional

Conjunto de datos de voz y audio para chatbots, asistentes de voz, dispositivos habilitados para voz.

* Oferta de período limitado

  • Al registrarme, estoy de acuerdo con Shaip Sitio de Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.

Con la confianza de los líderes de la industria

DetallesConjunto de datos de idiomas listos para usarConversaciones del centro de llamadas 8khz*Conversaciones genéricas 8khz*Medios y podcasts 16khz*Enunciado/Monólogo con guion 16khz*Volumen total en horasDialectos cubiertosFormato de audioFormato de transcripción de textoCaso de usoFuenteCTA
SpeechafricaansConjunto de datos de audio afrikáans6009001500Afrikáans hablado en África. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechÁrabeConjunto de datos de audio árabe80015002300Árabe de los países del Golfo. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechChinoConjunto de datos de audio chino20002000chino de china. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechDanésConjunto de datos de audio danés40060020003000Danés de Dinamarca. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechHolandésConjunto de datos de audio holandés20002000Holandés de Holanda. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - Acento AAVEInglés - Conjunto de datos de audio AAVE (inglés vernáculo afroamericano)5005001000La variedad vernácula (a veces conocida como AAVE, hablada típicamente por la gran mayoría de los afroamericanos de clase media y trabajadora) y la variedad más estándar (típicamente hablada por los afroamericanos de clase media en situaciones formales y públicas) pero con un mayor énfasis sobre la lengua vernácula.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento de Boston/Nueva YorkInglés - Conjunto de datos de audio de Boston/Nueva York225225350800Esta es una colección de varios acentos regionales que se hablan en las ciudades de Boston, Nueva York y Filadelfia y sus alrededores. Estos acentos pueden sonar similares a los de los no locales, pero distintos de otros acentos estadounidenses. A pesar de que el vocabulario local es diferente al de otras partes del mundo de habla inglesa, estos acentos son mutuamente inteligibles con el inglés que se habla en otros lugares.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - Acento chinoInglés - Conjunto de datos de audio con acento chino150300450Hablantes que hablan chino como primer idioma y que se mudaron o emigraron a los Estados Unidos cuando eran adolescentes o adultos y aprendieron inglés como segundo idioma.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento del sur profundoInglés - Conjunto de datos de audio del sur profundo2752754501000Oradores de (i) Texas; (ii) Carolina del Norte, Carolina del Sur, Georgia; (iii) Nueva Orleans; (iv) península de Florida; (v) Tennessee, Arkansas, Míchigan.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - Acento HispanoInglés - Conjunto de datos de audio con acento hispano400400800El inglés hispano se refiere a las variedades de inglés estadounidense habladas por hispanoamericanos de diversa herencia nacional. El enfoque principal estuvo en los mexicoamericanos, hablantes de diferentes orígenes nacionales (p. ej., México, Puerto Rico, República Dominicana, Ecuador, Cuba, etc.) y también de diferentes regiones (p. ej., California, Nueva York, Florida). Se incluyeron hablantes que hablan español como primera lengua, así como hablantes de origen hispano que hablan español como lengua de herencia.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - Acento de Nueva ZelandaInglés - Conjunto de datos de audio de Nueva Zelanda2507501000Hablantes en ambas islas, incluida una mezcla de hablantes más jóvenes (<40 años) y hablantes mayores (>40 años) en proporciones iguales.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - Acento de SingapurInglés - Conjunto de datos de audio de Singapur4006001000Tanto el inglés estándar de Singapur como el inglés coloquial de Singapur. Singapurenses de diferentes orígenes étnicos (por ejemplo, chino, malayo, indio, etc.) y de diferentes niveles educativos.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento sudafricanoInglés - Conjunto de datos de audio de Sudáfrica4006001000Representantes de diversas clases socioeconómicas y antecedentes etnológicos (por ejemplo, sudafricanos de origen europeo, africano, indio o mixto).. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento irlandésInglés - Conjunto de datos de audio irlandés500500Inglés hablado en Irlanda. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento escocésConjunto de datos de audio inglés - escocés800800Inglés hablado por escoceses. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglés - acento galésConjunto de datos de audio inglés - galés800800inglés galés. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechFranco canadienseConjunto de datos de audio canadiense francés10001000francés canadiense. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechHebreoConjunto de datos de audio en hebreo7507501500hebreo en israel. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechIndonesioConjunto de datos de audio de Indonesia100010002000Indonesio bahasa. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechJaponésConjunto de datos de audio japonés20002000Japonés de Japón. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechCoreanoConjunto de datos de audio coreano10020015001800Los oradores se repartieron por toda Corea del Sur.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechMalayConjunto de datos de audio en malayo5005001000Malayo en Malasia. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechEspañol mexicanoConjunto de datos de audio en español mexicano12501250Mexicano de México. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechPolacoConjunto de datos de audio polaco25020002250Polaco de Polonia. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechRusoConjunto de datos de audio ruso20002000Ruso de Rusia. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechswahiliConjunto de datos de audio swahili3506501000Swahili sudafricano y keniano. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechSuecoConjunto de datos de audio sueco3506501000Sueco en Suecia. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechChino de TaiwánConjunto de datos de audio chino de Taiwán10001000chino de Taiwán. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechTailandésConjunto de datos de audio tailandés350450800Un registro informal usado entre amigos,. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechTurcoConjunto de datos de audio turco20002000Turco de Turquía. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechVietnamitaConjunto de datos de audio vietnamita6004001000Norte (p. ej., Hanoi), Centro y Sur (p. ej., Ciudad Ho Chi Minh).. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechHindiConjunto de datos de audio hindi80020002800Hindi en India específicamente en las regiones norte, este y oeste. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechHinglishConjunto de datos de audio en inglés indio300500800Recopilado de ciudades indias urbanas que son centros financieros del país debido a las crecientes oportunidades económicas. Dichos lugares pueden ser Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, etc.. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechInglésConjunto de datos de audio en inglés700700. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechkannadaConjunto de datos de audio de Kannada6010040200Kannada de Karnataka, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechmalayalamConjunto de datos de audio en malayalam6010040200Malayalam de Kerala, Lakshadweep y Puducherry. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechoriyaConjunto de datos de audio de Oriya6010040200Oriya de partes de Odisha, Bengala Occidental, Jharkhand y Chhattisgarh. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechpunjabiConjunto de datos de audio punjabi6010040200Punjabi de Punjab, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechTamilConjunto de datos de audio tamil60100240400Tamil de Tamil Nadu, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechteluguConjunto de datos de audio telugu1009509502000Telugu de Andhra Pradesh, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechBengalíConjunto de datos de audio bengalí6010040200Bengalí de Bengala Occidental, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechGujaratiConjunto de datos de audio de Gujarati6010040200Gujarati de Gujarat, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechmarathiConjunto de datos de audio marathi6010040200Marathi de Maharashtra, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip
SpeechAssameseConjunto de datos de audio en asamés6010040200Asamés de Assam, India. WavjsonASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguajeSaip

Gran experiencia en IA conversacional

La inteligencia artificial conversacional o los chatbots o los asistentes virtuales/digitales son tan inteligentes como la tecnología y los datos detrás de ellos. En Shaip, le ofrecemos un amplio conjunto de datos de audio diversificados para procesamiento de lenguaje natural (NLP) que imitan conversaciones con personas reales que le permiten dar vida a su IA. Con nuestro profundo conocimiento, lo ayudamos a crear y localizar modelos de voz habilitados para IA, con la máxima precisión con conjuntos de datos ricos y estructurados en varios idiomas de todo el mundo. Ofrecemos servicios de recopilación de audio multilingüe, transcripción de audio y anotación de audio en función de sus requisitos, mientras personalizamos por completo la intención deseada, las expresiones y la distribución demográfica.

Colección de discursos con guión

Colección de habla espontánea

Transcripción de datos de audio

Etiquetado y anotación de datos

Shaip le permite entrenar con precisión su plataforma de IA conversacional para que pueda:

  • Hable, envíe mensajes de texto y chatee sin problemas a través de múltiples canales.
  • Aprenda de las interacciones existentes en forma de chat, transcripciones de voz, transacciones, etc. y sugiera y converse, en función de estos aprendizajes.
  • Comprenda la intención detrás del habla humana y elimine la ambigüedad en la comprensión del lenguaje humano.
  • Interactuar con usted de forma individual y puede ser capacitado para identificar a los usuarios y recordar conversaciones pasadas.

Líder mundial en datos de entrenamiento de IA conversacional

Horas de datos de audio en más de 100 idiomas: con origen, transcripción y anotación

Licencias de datos de voz

Más de 20 horas de datos de voz en más de 40 idiomas y dialectos que cubren una gama de más de 55 temas de diferentes dominios, es decir, centro de llamadas, debates, conversaciones generales, discursos, podcasts, etc.

Recopilación de datos de voz

Recopile datos de audio y voz (monólogo, conversación de 2 personas, chat de robot humano) en más de 100 idiomas de todo el mundo, personalizados según sus requisitos de inteligencia artificial.

Transcripción de datos de voz

Transcripción de audio rentable o anotación de audio a través de una fuerza laboral sólida de 30,000 colaboradores con TAT, precisión y ahorros garantizados

Acelere el desarrollo de su aplicación de IA conversacional con los servicios de recopilación de audio y anotación de audio

La ventaja de Shaip

escala

Podemos obtener, escalar y entregar datos de audio de todo el mundo en varios idiomas y dialectos según sus requisitos.

conocimiento

Contamos con la experiencia adecuada en lo que respecta a la recopilación, transcripción y anotación estándar de datos precisos e imparciales.

Nuestra red

Una red de más de 30,000 colaboradores calificados, a los que se les pueden asignar rápidamente tareas de recopilación de datos para crear un modelo de entrenamiento de IA y servicios de ampliación.

Tecnología

Tenemos una plataforma totalmente basada en inteligencia artificial con herramientas y procesos patentados para aprovechar la gestión del flujo de trabajo las 24 horas del día, los 7 días de la semana.

Agilidad

Nos adaptamos muy rápido a los cambios en los requisitos del cliente y ayudamos a acelerar el desarrollo de la inteligencia artificial con datos de voz de calidad 5-10 veces más rápido que la competencia.

Seguridad

Damos la máxima importancia a la seguridad y privacidad de los datos y también estamos certificados para manejar datos sensibles altamente regulados.

Lo que hacemos mejor

Datos de muestra

Obtenga datos etiquetados de la más alta calidad en una fracción del tiempo. Es el estándar de oro, confiable y está listo para entrenar sus modelos de IA y ML para lograr los niveles más altos de rendimiento.

Más Información

Recopilación, etiquetado y anotación de datos

Con Shaip, obtiene más de 15 años de experiencia comprobada en la recopilación, transcripción y anotación de datos de calidad. Con nuestra fuerza laboral global, podemos recopilar datos de todo el mundo y luego proporcionar servicios de etiquetado y anotación con la cantidad perfecta de nivel de habilidad y experiencia requerida para sus datos.

Más Información

Catálogos de datos y licencias

Con nuestro vasto inventario de millones de conjuntos de datos, puede recopilar y organizar según sea necesario. Luego, podemos licenciar esos datos de calidad para sus requisitos específicos de uso de AI y ML. Además, estos datos están disponibles a una fracción del costo si los creara usted mismo.

Más Información

¿Quiere construir su propio conjunto de datos?

Contáctenos ahora para saber cómo podemos recopilar un conjunto de datos personalizado para su solución de IA única.