Conjunto de datos malayo

Establecer datos Melayu

Conjunto de datos de alta calidad de centros de llamadas, conversaciones generales y podcasts en malayo para modelos de IA y voz.

Resumen

Título (Idioma)

Conjunto de datos del idioma malayo

Tipos de conjuntos de datos

Centro de llamadas, conversación general, datos de medios (datos de podcast)

País

Malasia, Indonesia, Brunei y Singapur

Descripción

Se encuentran disponibles conversaciones telefónicas sin guión entre dos personas en malayo de Malasia con duraciones de entre 15 y 60 minutos, junto con archivos de audio o video de dominio público con licencia, como entrevistas y podcasts con 1 a 5 participantes, que también duran entre 15 y 60 minutos.

Caso de uso

ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Detalles del conjunto de datos

Tipo de conjunto de datos Tasa de muestreo Speakers: Channel Horas totales Número total de oradores
Conversacion general 8 kHz 2 Oradores Dual 239:49:43 432
Conversacion general 48 kHz 2 Oradores Mono 90:19:23 140
Datos de medios 16 kHz Altavoces multipal Mono 343:57:16 907
Call Center 8 kHz 2 Oradores Mono 2,000:00:00 Bajo Demanda

Clientes destacados

Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

Amazon
Google
Microsoft
Shaip contáctanos

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Este campo es para fines de validación y debe dejarse sin cambios.
  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.