Precisión de datos de oncología: concesión de licencias, desidentificación y anotaciones para la innovación del modelo de PNL
Revolucionando el tratamiento del cáncer con tecnologías de PNL de vanguardia.
Descripción general del proyecto
El cliente, un actor importante en la industria de la salud, necesitaba una solución avanzada de PNL para procesar un volumen sustancial de registros médicos oncológicos. Como parte de una iniciativa fundamental para perfeccionar la investigación oncológica, la necesidad de equilibrar el análisis de datos detallado con estándares estrictos de privacidad es primordial. Este estudio de caso describe nuestras contribuciones para mejorar los esfuerzos de investigación del cliente a través de anotaciones de datos de alta fidelidad, prácticas rigurosas de desidentificación y la aplicación de técnicas de procesamiento del lenguaje natural (NLP), todo dentro del marco regulatorio proporcionado por HIPAA.

Estadísticas clave
Licencia de datos
+ Datos desidentificados
10,000 páginas
No Oncología
Dominio
10,000 páginas
Oncología
Dominio
10,000 páginas
Oncología
Relaciones
4500 páginas
la Negación
9000 páginas
NER + Relación
Mapeo
1223 páginas
Desafíos
El proyecto requirió una comprensión detallada de la documentación clínica, una identificación precisa de las entidades médicas y la capacidad de aplicar etiquetas de negación con precisión, todo dentro de un marco seguro que proteja la privacidad del paciente de acuerdo con las regulaciones HIPAA. El esfuerzo exigió no sólo experiencia técnica en el manejo de grandes volúmenes de datos complejos, sino también un enfoque estratégico para incorporar comentarios y mantener la calidad en todas las etapas del proceso de anotación.
Descripción detallada de los servicios:
- Cobertura integral de datos clínicos: Abarcando varios tipos de notas, entornos de atención y subespecialidades oncológicas, lo que garantiza un conjunto de datos sólido que refleje diversos escenarios clínicos.
- Desidentificación rigurosa: Garantizar que todos los registros etiquetados no estén identificados de conformidad con el método Safe Harbor de HIPAA, garantizando la confianza del cliente en la privacidad y seguridad de los datos.
- Directrices de anotación: Creación e implementación de pautas estándar de anotación de datos para la preparación de registros etiquetados de acuerdo con los estándares HIPAA.
- Técnicas avanzadas de anotación: Aplicación de PNL a 10,000 páginas de registros relacionados con la oncología, lo que implica un etiquetado complejo de estados de negación y otros detalles relevantes según las pautas establecidas previamente.
- Garantía de calidad rigurosa: Alcanzar el estándar de calidad especificado en la directriz.
Solución
Nuestro enfoque implicó las siguientes estrategias clave:
Cobertura integral de datos clínicos
Para adaptar el conjunto de datos a las necesidades específicas del cliente, se extrajo meticulosamente una selección específica de datos del amplio repositorio de Shaip de más de 5 millones de registros médicos electrónicos. Este conjunto de datos seleccionado abarcó una variedad de tipos de notas y configuraciones de atención, lo que proporcionó una amplia y diversa información.
espectro de escenarios clínicos. Esto garantiza un conjunto de datos que no solo es completo sino también altamente representativo de los datos médicos del mundo real.
Desidentificación rigurosa
El proceso se adhirió estrictamente al método Safe Harbor de desidentificación de HIPAA, que garantiza la confianza del cliente en la privacidad y seguridad de los datos. Esto implica eliminar toda la información médica protegida (PHI) y reemplazarla con marcadores de posición etiquetados, manteniendo así la utilidad de los datos y al mismo tiempo protegiendo la confidencialidad del paciente.
Variables de desidentificación
Categoría: | Subcategoría |
---|---|
Nombre | Nombre del paciente, Nombre del médico, Nombre del enfermero practicante, Nombre del familiar, Nombre del centro médico, Nombre de la clínica, Nombre del asilo de ancianos, Nombre de la empresa, Nombre de la universidad |
Edad | |
Fecha | Patrón de fecha, Patrón de mes y año, Patrón de día y mes, Patrón de día y año, Día, Mes, Año, Temporada |
Ubicación | País, Estado, Ciudad, Calle, Código postal, Número de habitación, Número de suite, Número de piso |
ID | Número de seguro social, Número de registro médico, Número de beneficiario del plan de salud, Número de cuenta, Número de certificado/licencia, Identificación biométrica, Identificación de registro, Número de acceso, Número de identificación del vehículo, Número de matrícula Identificadores del dispositivo y número de serie |
Contacto | Número de teléfono, Número de fax, Dirección de correo electrónico, URL web, Dirección IP |
Ejemplo:
El 25 de septiembre de 2106, a las 11:00 am, el Sr. Harry Pace, de 90 años de edad, ingresó al Forrest General Hospital para una cirugía de cadera programada, previamente consultado por su médico de atención primaria, el Dr. José Martín, y atendido por Kendra Reith, MARYLAND. Durante su estadía, estuvo bajo el cuidado de Mary Hu, NP, y Suzan Ray, RN, y también se consultó a R. Charles Melancon, PA. Su operación, realizada el mismo día de su ingreso, fue exitosa y no se reportaron complicaciones. Después de la cirugía, el Sr. Pace fue trasladado a la habitación 202, piso 2, para su recuperación. Su esposa, Emma Pace, estuvo presente en todo momento y recibió todas las actualizaciones necesarias. Durante su breve estadía, sus registros médicos, incluido el MRN MR99062619 y la cuenta KV000014764, fueron manejados de acuerdo con los protocolos estándar del Gracewood Nursing Home, su residencia anterior. Fue dado de alta ese mismo día y llevado a la Clínica Ambulatoria de Oakland para su posterior recuperación. Durante todo el proceso, todos los procedimientos fueron documentados y asegurados respetando los estándares de confidencialidad.
Ejemplo: anonimizado
On [Patrón de fecha], a las 11:00 horas, el Sr. [Nombre del paciente], Envejecido [Envejecer], fue admitido en [Nombre del centro médico] para una cirugía de cadera programada, consultada previamente por su médico de atención primaria el Dr. [Nombre del médico], y asistió [Nombre del médico] MARYLAND. Durante su estancia estuvo bajo el cuidado de [Enfermera practicante], NP, y [Enfermera practicante], RN, con [Nombre del médico], PA, también fue consultado. Su operación, realizada el mismo día de su ingreso, fue exitosa y no se reportaron complicaciones. Después de la cirugía, el Sr. [Nombre del paciente] fue trasladado a la Habitación no. [Número de habitación], Piso núm. [Número de piso], para recuperarse. Su esposa, [Nombre del miembro de la familia], estuvo presente en todo momento y se le proporcionaron todas las actualizaciones necesarias. Durante su breve estadía, sus registros médicos, incluido el MRN [Numero de historia CLINICA] y cuenta [Número de cuenta], fueron manejados de acuerdo con los protocolos estándar de [Nombre del hogar de ancianos], su residencia anterior. Fue dado de alta más tarde el mismo día y puesto al cuidado de [Nombre de la clínica] para una mayor recuperación. Durante todo el proceso, todos los procedimientos fueron documentados y asegurados respetando los estándares de confidencialidad.
Directrices de anotación y técnicas avanzadas de anotación
Shaip fue fundamental en el establecimiento y la implementación de pautas de anotación de datos estándar, lo que garantizó que todos los registros etiquetados se prepararan de manera uniforme y en cumplimiento con los estándares HIPAA. Además, se anotaron meticulosamente 10,000 XNUMX páginas de varios registros médicos, con
Se hizo hincapié en el etiquetado detallado de los estados de negación y otras entidades clínicamente relevantes, incluidas varias subespecialidades oncológicas. La anotación fue realizada por un equipo de anotadores expertos con conocimientos especializados en oncología y normativas de privacidad de datos.
Anotación compleja
Categoría: | Subcategoría |
---|---|
Fecha Anotación (Oncología) | Fecha de diagnóstico, Fecha de la etapa, Inicio, Fecha del procedimiento, Fecha de inicio de la medicación, Fecha de finalización de la medicación, Fecha de inicio de la radiación, Fecha de finalización de la radiación |
Enfermedades (Oncología) | Problema de cáncer, histología, estado clínico, sitio del cuerpo, comportamiento, grado, estadio del cáncer, estadio TNM, prueba de marcador tumoral, dimensiones, código |
Perdida de Peso (Oncología) | Medicina contra el cáncer, dosis del fármaco, frecuencia, cirugía contra el cáncer, resultado de la cirugía, modalidad de radiación, dosis de radiación |
Genómica | Código de variación, gen estudiado, método, muestra |
la Negación | Negativo, Posible Negativo, Incierto, Posible Positivo |
NER clínico Relaciones | Problema de cáncer: sitio del cuerpo, histología: sitio del cuerpo, comportamiento: sitio del cuerpo, cirugía de cáncer: sitio del cuerpo, modalidad de radiación: sitio del cuerpo, histología: grado, problema de cáncer: dimensión |
Ejemplo:
Declaración de nota clínica de oncología
“A la paciente Jane Doe se le diagnosticó cáncer de pulmón de células no pequeñas (NSCLC) en estadio IIIB, específicamente adenocarcinoma, el 03/05/2023. El cáncer se encuentra en el lóbulo inferior derecho del pulmón. Se clasifica como T3N2M0 según el sistema de estadificación TNM, con un tamaño tumoral de 5 cm x 3 cm. Se identificó una deleción del exón 19 de EGFR mediante análisis por PCR de la muestra de biopsia del tumor. La quimioterapia con carboplatino AUC 5 y pemetrexed 500 mg/m² se inició el 03/20/2023 y se administrará cada 3 semanas. La radioterapia de haz externo (RHE) a una dosis de 60 Gy en 30 fracciones comenzó el 04/01/2023. El tratamiento del paciente está en curso y no hay evidencia de metástasis cerebrales en la resonancia magnética reciente. La posibilidad de invasión linfovascular aún no se ha determinado y la tolerancia del paciente al régimen de quimioterapia completo sigue siendo incierta.
Declaración de nota clínica de oncología:
Garantía de calidad rigurosa
Implementó un marco de gestión de proyectos flexible que facilitó la integración eficaz de los comentarios de los clientes y, al mismo tiempo, mantuvo estrictos estándares de calidad. Se aplicó un protocolo integral de garantía de calidad, que se alineaba con las pautas para alcanzar los parámetros de calidad requeridos. Este protocolo incluyó rondas sucesivas de revisión y verificación, lo que aseguró la precisión y confiabilidad de los datos anotados. Esta supervisión meticulosa de la calidad es crucial para crear una solución de procesamiento del lenguaje natural confiable, vital para la toma de decisiones clínicas informadas y la excelencia en la investigación.
El Resultado
Se entregaron con éxito 10,000 XNUMX registros etiquetados y desidentificados de alta calidad, lo que proporcionó un conjunto de datos seguro y valioso para el desarrollo del modelo de procesamiento del lenguaje natural del cliente. La aplicación meticulosa del procesamiento del lenguaje natural y el cumplimiento de los estándares de desidentificación de la HIPAA dieron como resultado un conjunto de datos altamente refinado que respaldará los esfuerzos de investigación oncológica actuales y futuros del cliente, con el objetivo final de mejorar los resultados de los pacientes oncológicos y la eficiencia de la prestación de atención.
El éxito del proyecto ilustra nuestra capacidad para manejar datos médicos complejos con precisión, contribuyendo al objetivo del cliente de mejorar los resultados de la atención al paciente y acelerar el ritmo de la innovación en la atención médica.
Nuestra asociación con Shaip ha sido fundamental para mejorar nuestras capacidades de PNL dentro del dominio de la oncología. El manejo profesional de 10,000 registros médicos, anotados con negaciones detalladas y otras entidades clínicas, demostró su compromiso con la excelencia y el cumplimiento. Además, su compromiso con los estándares de privacidad como HIPAA nos ha proporcionado recursos invaluables para impulsar nuestras iniciativas de IA para desarrollar tratamientos y diagnósticos oncológicos de vanguardia.