Conjunto de datos del sur profundo en inglés

Conjunto de datos de alta calidad de centros de llamadas, conversaciones generales y podcasts del sur profundo en inglés para modelos de inteligencia artificial y voz

Descripción general

Título (Idioma)

Conjunto de datos del idioma inglés del sur profundo

Tipos de conjuntos de datos

Centro de llamadas, conversación general, datos de medios (podcast)

País

El sur de Estados Unidos

Descripción

Las conversaciones telefónicas sintéticas sin guion entre un agente y un cliente están disponibles con una duración de 5 a 15 minutos, mientras que las conversaciones telefónicas sin guion entre dos personas suelen durar entre 15 y 60 minutos. Además, también están disponibles archivos de audio o vídeo de dominio público con licencia, como entrevistas o podcasts con entre 1 y 5 participantes, con una duración de 15 a 60 minutos.

Caso de uso

ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Detalles del conjunto de datos

Tipo de conjunto de datos Tasa de muestreo Oradores Channel Horas totales Número total de oradores
Call Center 8 kHz 2 Oradores Dual 266:44:22 634
Conversacion general 8 kHz 2 Oradores Dual 197:25:07 1,490
Datos de medios 16 kHz Varios altavoces Mono 261:20:58 565

Clientes destacados

Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

Amazon
Google
Microsoft
Shaip contáctanos

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Este campo es para fines de validación y debe dejarse sin cambios.
  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.