Conjunto de datos polaco

Conjunto de datos polaco

Datos de medios polacos de alta calidad y monólogo con guion para modelos de IA y voz

Noticias

Título (Idioma)

Conjunto de datos en idioma polaco

Tipos de conjuntos de datos

Medios (Podcast), Monólogo con guión

País

Polonia

Descripción

Este conjunto de datos incluye archivos de audio o video de dominio público licenciables, como entrevistas y podcasts con 1 a 5 participantes (15 a 60 minutos), junto con monólogos con guión donde un solo orador ofrece contenido predefinido para entrenar y evaluar modelos de habla y lenguaje.

Caso de uso

ASR, asistente virtual, chatbot, IA conversacional, análisis de voz, TTS, modelado de lenguaje

Detalles del conjunto de datos

Tipo de conjunto de datos Tasa de muestreo Speakers: Channel Horas totales Número total de oradores
Datos de medios 16 kHz Altavoces multipal Mono 268:56:51 532
Monólogo guionado 48 kHz Altavoz individual Mono 2,348:00:00 2,699

Clientes destacados

Capacitar a los equipos para crear productos de inteligencia artificial líderes en el mundo.

Amazon
Google
Microsoft
Shaip contáctanos

¿No encuentras lo que estás buscando?

Se recopilan nuevos conjuntos de datos listos para usar en todos los tipos de datos

Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de entrenamiento de audio/voz

  • Este campo es para fines de validación y debe dejarse sin cambios.
  • Al registrarme, estoy de acuerdo con Shaip Política de privacidad y Términos de Servicio y dar mi consentimiento para recibir comunicaciones de marketing B2B de Shaip.