Conjunto de datos en inglés de EE. UU.

Conjunto de datos de inglés estadounidense de alta calidad para modelos de IA y voz

Vista General

Título (Idioma)

Conjunto de datos en inglés de EE. UU.

Tipos de conjuntos de datos

Centro de llamadas, Medios (Podcast), Médico

País

Estados Unidos

Descripción

Este conjunto de datos incluye conversaciones sintéticas sin guión entre agente y cliente (5 a 15 minutos), archivos de audio o video de dominio público con licencia, como entrevistas y podcasts con 1 a 5 participantes (15 a 60 minutos), junto con tipos de conjuntos de datos médicos y de medios para una investigación integral del habla y el lenguaje.

Caso de uso

ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Detalles del conjunto de datos

Tipo de conjunto de datos Tasa de muestreo Speakers: Channel Horas totales Número total de oradores
Call Center 8 kHz 2 Oradores Mono 10,196:00:00 1,052
Call Center 8 kHz 2 Oradores Dual 597:26:43 Bajo Demanda
Datos de medios 16 kHz Varios altavoces Mono 620:23:43 5,466
Médical Scientific 8 kHz 2 Oradores Mono 1,480:30:33 697

Clientes destacados

Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

Shaip contáctanos

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Este campo es para fines de validación y debe dejarse sin cambios.
  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.