Conversaciones sintéticas sobre atención médica para ASR

Permitir el desarrollo de tecnología ambiental a través de conversaciones sintéticas sobre atención médica

Tecnología ambiental

Más de 2000 horas de datos de audio recopilados y transcritos en un entorno clínico

En el dominio de rápida evolución de la IA conversacional, una de las aplicaciones notables es el sector de la salud, donde se utiliza la tecnología para optimizar las interacciones entre proveedor y paciente. Nuestro cliente, un nombre líder en tecnología sanitaria, se acercó a Shaip con el requisito de mejorar su modelo de reconocimiento automático de voz (ASR) para comprender y transcribir mejor conversaciones de varios hablantes en entornos clínicos. Debido a las regulaciones de privacidad, adquirir diálogos del mundo real fue un desafío; por lo tanto, la idea era crear y transcribir interacciones sintéticas pero realistas entre los proveedores de atención médica y los pacientes.

Volumen

2,000 horas, o aproximadamente 12,000 a 24,000 interacciones sintéticas individuales de 10 duración media de los minutos.

Objetivo

Nuestro objetivo principal era generar alrededor de 2,000 horas de grabaciones de audio, lo que se traducía en entre 12,000 24,000 y XNUMX XNUMX interacciones sintéticas meticulosamente elaboradas, que incorporaban una diversidad de género, edad, acentos y roles médicos. Este conjunto de datos completo y auténtico, diseñado para imitar diálogos clínicos del mundo real, se creó respetando estrictamente las normas de privacidad como HIPAA. Las interacciones sintéticas sirvieron como un rico conjunto de datos, fundamental para entrenar y perfeccionar el modelo ASR de nuestro cliente, mejorando significativamente su competencia en el manejo de conversaciones del mundo real dentro de entornos clínicos.

 

Objetivos

Desafios

Cumplimiento Regulatorio

Garantizar el cumplimiento de las leyes de privacidad como HIPAA y al mismo tiempo crear interacciones de atención médica realistas pero sintéticas puede ser un desafío.

Cumplimiento regulatorio

Autenticidad y diversidad de datos

Crear interacciones sintéticas que imiten con precisión los diálogos clínicos del mundo real y al mismo tiempo abarquen una amplia gama de escenarios, acentos, edades y roles médicos exige un enfoque meticuloso y un conocimiento profundo del dominio.

Autenticidad y diversidad de datos

Garantía de Calidad

Lograr un alto nivel de precisión en la transcripción, como la tasa de precisión de palabras (WER) del 95 % y la tasa de precisión de etiquetas (TER) del 90 %, requiere procesos rigurosos de control de calidad.

Habilidades técnicas

Garantizar que la infraestructura técnica, incluidas las plataformas de grabación y transcripción, pueda manejar el volumen de datos y mantener la calidad es un desafío importante.

Reclutamiento y capacitación de recursos

Reclutar personas con experiencia médica para el juego de roles y garantizar que se ajusten a escenarios realistas mientras se mantiene un flujo de conversación natural puede ser todo un desafío. Además, capacitar a los transcriptores para que cumplan con estrictas pautas de calidad requiere un esfuerzo y experiencia sustanciales.

Enfoque/Solución

Colección y transcripción de audio

  • Creación de escenarios: Se desarrollaron escenarios realistas que reflejan afecciones comunes no urgentes que se encuentran en las prácticas de medicina familiar para adultos, como la hipertensión, la diabetes y el manejo del dolor.
  • Juego de roles: Se reclutaron personas con experiencia médica para desempeñar roles como proveedores de atención médica y pacientes, adhiriéndose a los escenarios proporcionados y simulando conversaciones clínicas del mundo real.
  • Grabación: Se utilizó la aplicación móvil Shaip Work para capturar audio, asegurando una representación diversa en términos de género, edad, acentos y antecedentes profesionales entre los participantes.

Validación y Transcripción

  • Ejecuté scripts de validación para garantizar la precisión y calidad de los archivos de audio.
  • Las transcripciones se llevaron a cabo en la plataforma Bhasha, siguiendo pautas específicas proporcionadas y garantizando la transcripción textual del texto con una diarioización precisa.
  • Metadatos anotados que incluyen identificación del hablante, edad, género, idioma nativo y capacitación/experiencia médica, que fueron fundamentales para los propósitos de capacitación del modelo del cliente.

Garantía de Calidad

  • Los controles de calidad exhaustivos realizados por CQA y PMO garantizaron un objetivo de calidad de transcripción del 95 % de tasa de precisión de palabras (WER) y del 90 % de tasa de precisión de etiquetas (TER).

Entrega de datos

  • Estructuré los datos de manera clara y organizada y los entregué en lotes, junto con notas de lote detalladas y directorios culturales.
  • Me aseguré de que todos los datos, incluidos archivos de audio, transcripciones y metadatos, estuvieran etiquetados y formateados con precisión según las especificaciones del cliente.

Comentarios e iteración

Establecí un sólido circuito de retroalimentación con el cliente para identificar cualquier deficiencia, garantizando que se hicieran correcciones y se entregara un conjunto de datos completo y preciso.

Logros clave

  • Recopilación y transcripción exitosa de 2000 horas de interacciones médicas sintéticas.
  • Transcripción rápida y precisa con un índice de precisión notable, lo que contribuye significativamente al objetivo del cliente de mejorar su modelo ASR.
  • Demostró la capacidad de Shaip para manejar proyectos complejos a gran escala con un enfoque meticuloso hacia la calidad y la precisión.

Resultado

El proyecto meticulosamente ejecutado y facilitado por Shaip dio como resultado un rico conjunto de datos que contribuyó significativamente a la mejora del modelo ASR del cliente. Las interacciones sintéticas crearon una representación realista de los diálogos clínicos, ayudando al cliente a lograr un servicio de voz más sólido y confiable para entornos de atención médica. A través de un enfoque estructurado y bien coordinado, Shaip aseguró la entrega exitosa de un proyecto complejo dentro del plazo estipulado, solidificando su experiencia en la gestión de proyectos de IA conversacional a gran escala en el ámbito de la atención médica.

Nuestra colaboración con Shaip avanzó significativamente en nuestro proyecto de tecnología ambiental e IA conversacional en el ámbito de la atención sanitaria. Su experiencia en la creación y transcripción de diálogos sintéticos sobre atención médica proporcionó una base sólida, mostrando el potencial de los datos sintéticos para superar los desafíos regulatorios. Con Shaip, superamos estos obstáculos y ahora estamos un paso más cerca de hacer realidad nuestra visión de soluciones de atención médica intuitivas.

Oro-5 estrellas

Acelere su IA sanitaria
desarrollo de aplicaciones al 100%