Conjunto de datos tamiles

தமிழ் தரவுத்தொகுப்பு

Desbloquea el poder de los conjuntos de datos de voz tamil para ASR, TTS e IA conversacional. Shaip ofrece conjuntos de datos de audio tamil premium para entrenar modelos lingüísticos más inteligentes.

Noticias

Título (Idioma)

Conjunto de datos del idioma tamil

Tipos de conjuntos de datos

Centro de llamadas, conversación general, datos de medios, monólogo con guion

País

India

Descripción

Este conjunto de datos incluye conversaciones sintéticas sin guión entre agente y cliente (5 a 15 minutos), conversaciones telefónicas naturales entre humanos (15 a 60 minutos) y datos multimedia con transcripciones, que ofrecen diversos datos de habla para entrenar y evaluar tecnologías de habla y lenguaje.

Caso de uso

ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Detalles del conjunto de datos

Tipo de conjunto de datos Tasa de muestreo Speakers: Channel Horas totales Número total de oradores
Call Center 8 kHz 2 Oradores Dual 124:23:52 484
Call Center 16 kHz 2 Oradores Mono 199:44:21 1,986
Conversacion general 8 kHz 2 Oradores Dual 101:42:05 440
Conversacion general 48 kHz 2 Oradores Mono 80:21:16 141
Datos de medios 16 kHz Varios altavoces Mono 43:07:01 32
Monólogo guionado 24 kHz Altavoz individual Mono 500:00:00 Bajo Demanda

Clientes destacados

Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

Amazon
Google
Microsoft
Shaip contáctanos

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Este campo es para fines de validación y debe dejarse sin cambios.
  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.