Mejora de la investigación de PNL en oncología

Precisión de datos de oncología: concesión de licencias, desidentificación y anotaciones para la innovación del modelo de PNL

PNL oncología

Revolucionando la atención del cáncer con tecnologías de PNL de vanguardia

El cliente, un actor importante en la industria de la salud, necesitaba una solución avanzada de PNL para procesar un volumen sustancial de registros médicos oncológicos. Como parte de una iniciativa fundamental para perfeccionar la investigación oncológica, la necesidad de equilibrar el análisis de datos detallado con estándares estrictos de privacidad es primordial. Este estudio de caso describe nuestras contribuciones para mejorar los esfuerzos de investigación del cliente a través de anotaciones de datos de alta fidelidad, prácticas rigurosas de desidentificación y la aplicación de técnicas de procesamiento del lenguaje natural (NLP), todo dentro del marco regulatorio proporcionado por HIPAA.

Volumen

Licencia de datos + De-id de datos
10 Páginas
Relaciones Oncológicas
10 Páginas
Dominio no oncológico
10 Páginas
la Negación
10 Páginas
Dominio de Oncología
10 Páginas
NER + Mapeo de relaciones
10 Páginas

Desafios

El proyecto requirió una comprensión detallada de la documentación clínica, una identificación precisa de las entidades médicas y la capacidad de aplicar etiquetas de negación con precisión, todo dentro de un marco seguro que proteja la privacidad del paciente de acuerdo con las regulaciones HIPAA. El esfuerzo exigió no sólo experiencia técnica en el manejo de grandes volúmenes de datos complejos, sino también un enfoque estratégico para incorporar comentarios y mantener la calidad en todas las etapas del proceso de anotación.

Objetivos

Descripción detallada de los servicios

CategoríaDescripción
Cobertura integral de datos clínicosAbarca varios tipos de notas, entornos de atención y subespecialidades oncológicas, lo que garantiza un conjunto de datos sólido que refleje diversos escenarios clínicos.
Desidentificación rigurosaGarantizar que todos los registros etiquetados no estén identificados de conformidad con el método Safe Harbor de HIPAA, garantizando la confianza del cliente en la privacidad y seguridad de los datos.
Directrices de anotaciónCreación e implementación de pautas estándar de anotación de datos para la preparación de registros etiquetados de acuerdo con los estándares HIPAA.
Estrategias de anotación avanzadasSe llevó a cabo una anotación manual de 10,000 páginas de registros relacionados con la oncología con un enfoque detallado en la identificación de estados de negación y otra información pertinente de acuerdo con las pautas establecidas.
Garantía de calidad rigurosaAlcanzar el estándar de calidad especificado descrito en la guía.

Solución

Nuestro enfoque implicó las siguientes estrategias clave:

Compilación personalizada de conjuntos de datos de oncología

De un vasto archivo de más de 5 MN EHR, se extrajo un subconjunto de datos cuidadosamente elegido, con el objetivo de abordar los requisitos especializados del cliente en cuanto a datos oncológicos con un enfoque en entidades genómicas. El proceso de recopilación implicó la creación de una lista exhaustiva de marcadores tumorales, genes, variantes y estadios TNM, empleando búsquedas de palabras clave para identificar documentos que abundan en estos datos. Se utilizaron expresiones regulares para identificar una variedad de variaciones genéticas y etapas del cáncer. Este enfoque, combinado con una amplia cobertura de datos que abarca varios tipos de documentos, especialidades, entornos de atención y datos de múltiples médicos, garantizó un conjunto de datos oncológicos completo y relevante.

Compilación de conjuntos de datos de oncología.

Desidentificación rigurosa

El proceso se adhirió estrictamente al método Safe Harbor de desidentificación de HIPAA, que garantiza la confianza del cliente en la privacidad y seguridad de los datos. Esto implica eliminar toda la información médica protegida (PHI) y reemplazarla con marcadores de posición etiquetados, manteniendo así la utilidad de los datos y al mismo tiempo protegiendo la confidencialidad del paciente.

Variables de desidentificación

CategoríaSubcategoría
NombreNombre del paciente, Nombre del médico, Nombre del enfermero practicante, Nombre del familiar, Nombre del centro médico, Nombre de la clínica, Nombre del asilo de ancianos, Nombre de la empresa, Nombre de la universidad
Edad 
FechaPatrón de fecha, Patrón de mes y año, Patrón de día y mes, Patrón de día y año, Día, Mes, Año, Temporada
DestinoPaís, Estado, Ciudad, Calle, Código postal, Número de habitación, Número de suite, Número de piso
IDNúmero de seguro social, número de registro médico, número de beneficiario del plan de salud, número de cuenta, número de certificado/licencia, identificación biométrica, identificación de registro, número de acceso, número de identificación del vehículo, número de placa, identificadores de dispositivo y número de serie.
ContactoNúmero de teléfono, Número de fax, Dirección de correo electrónico, URL web, Dirección IP

Ejemplo:

El 25 de septiembre de 2106, a las 11:00 am, el Sr. Harry Pace, de 90 años de edad, ingresó al Forrest General Hospital para una cirugía de cadera programada, previamente consultado por su médico de atención primaria, el Dr. José Martín, y atendido por Kendra Reith, MARYLAND. Durante su estadía, estuvo bajo el cuidado de Mary Hu, NP, y Suzan Ray, RN, y también se consultó a R. Charles Melancon, PA. Su operación, realizada el mismo día de su ingreso, fue exitosa y no se reportaron complicaciones. Después de la cirugía, el Sr. Pace fue trasladado a la habitación 202, piso 2, para su recuperación. Su esposa, Emma Pace, estuvo presente en todo momento y recibió todas las actualizaciones necesarias. Durante su breve estadía, sus registros médicos, incluido el MRN MR99062619 y la cuenta KV000014764, fueron manejados de acuerdo con los protocolos estándar del Gracewood Nursing Home, su residencia anterior. Fue dado de alta ese mismo día y llevado a la Clínica Ambulatoria de Oakland para su posterior recuperación. Durante todo el proceso, todos los procedimientos fueron documentados y asegurados respetando los estándares de confidencialidad.

Ejemplo: anonimizado

On [Patrón de fecha], a las 11:00 horas, el Sr. [Nombre del paciente], años de edad [Envejecer], fue admitido en [Nombre del centro médico] para una cirugía de cadera programada, consultada previamente por su médico de atención primaria el Dr. [Nombre del médico], y atendido por [Nombre del médico] MARYLAND. Durante su estancia estuvo bajo el cuidado de [Practicante de enfermería], NP y [Practicante de enfermería], enfermera registrada, con [Nombre del médico], PA, también siendo consultado. Su operación, realizada el mismo día de su ingreso, fue exitosa y no se reportaron complicaciones. Después de la cirugía, el Sr. [Nombre del paciente] fue trasladado a la Habitación no. [Número de habitación], Piso nº. [Numero de piso], para recuperar. Su esposa, [Nombre del familiar], estuvo presente en todo momento y recibió todas las actualizaciones necesarias. Durante su breve estancia, sus registros médicos, incluido el MRN [Numero de historia CLINICA] y cuenta [Número de cuenta], fueron manipulados según los protocolos estándar de [Nombre del hogar de ancianos], su residencia anterior. Fue dado de alta ese mismo día al cuidado de [Nombre de la clínica] para una mayor recuperación. Durante todo el proceso, todos los procedimientos fueron documentados y asegurados respetando los estándares de confidencialidad.

Directrices de anotación y técnicas avanzadas de anotación

Shaip jugó un papel decisivo en el establecimiento y la implementación de pautas estándar de anotación de datos que garantizaron que todos los registros etiquetados se prepararan de manera consistente y de conformidad con los estándares HIPAA. Además, se anotaron meticulosamente 10,000 páginas de diversos registros médicos, centrándose en el etiquetado detallado de los estados de negación y otras entidades clínicamente relevantes, incluidas varias subespecialidades de oncología. La anotación fue realizada por un equipo de anotadores expertos con conocimientos especializados en oncología y normativa de privacidad de datos.

Criterios de anotación complejos

CategoríaSubcategoría
Anotación de fecha (oncología)Fecha de diagnóstico, Fecha de etapa, Inicio, Fecha del procedimiento, Fecha de inicio del medicamento, Fecha de finalización del medicamento, Fecha de inicio de la radiación, Fecha de finalización de la radiación
Enfermedad (Oncología)Problema de cáncer, histología, estado clínico, sitio del cuerpo, comportamiento, grado, estadio del cáncer, estadio TNM, prueba de marcador tumoral, dimensiones, código
Tratamiento (Oncología)Medicina contra el cáncer, dosis del fármaco, frecuencia, cirugía contra el cáncer, resultado de la cirugía, modalidad de radiación, dosis de radiación
GenómicaCódigo de variación, gen estudiado, método, muestra
la NegaciónNegativo, Posible Negativo, Incierto, Posible Positivo
NER clínicoProblema de cáncer – Sitio del cuerpo, Histología – Sitio del cuerpo, Comportamiento – Sitio del cuerpo, Cirugía del cáncer – Relaciones Sitio del cuerpo, Modalidad de radiación – Sitio del cuerpo, Histología – Grado, Problema de cáncer – Dimensión

Ejemplo:

Declaración de nota clínica de oncología

Declaración de nota clínica de oncología

“A la paciente Jane Doe se le diagnosticó cáncer de pulmón de células no pequeñas (NSCLC) en estadio IIIB, específicamente adenocarcinoma, el 03/05/2023. El cáncer se encuentra en el lóbulo inferior derecho del pulmón. Se clasifica como T3N2M0 según el sistema de estadificación TNM, con un tamaño tumoral de 5 cm x 3 cm. Se identificó una deleción del exón 19 de EGFR mediante análisis por PCR de la muestra de biopsia del tumor. La quimioterapia con carboplatino AUC 5 y pemetrexed 500 mg/m² se inició el 03/20/2023 y se administrará cada 3 semanas. La radioterapia de haz externo (RHE) a una dosis de 60 Gy en 30 fracciones comenzó el 04/01/2023. El tratamiento del paciente está en curso y no hay evidencia de metástasis cerebrales en la resonancia magnética reciente. La posibilidad de invasión linfovascular aún no se ha determinado y la tolerancia del paciente al régimen de quimioterapia completo sigue siendo incierta.

Declaración de nota clínica de oncología

Declaración de nota clínica de oncología

Garantía de calidad rigurosa

Implementé un marco de gestión de proyectos flexible que facilitó la integración efectiva de los comentarios de los clientes y al mismo tiempo mantuvo estrictos estándares de calidad. Se aplicó un protocolo integral de garantía de calidad, alineado con las pautas para alcanzar los puntos de referencia de calidad requeridos. Este protocolo incluyó rondas sucesivas de revisión y verificación, asegurando la precisión y confiabilidad de los datos anotados. Esta meticulosa supervisión de la calidad es crucial para crear una solución de PNL confiable, vital para la toma de decisiones clínicas informadas y la excelencia en la investigación.

Resultado

Se entregaron con éxito 10,000 XNUMX registros etiquetados no identificados de alta calidad, lo que proporcionó un conjunto de datos seguro y valioso para el desarrollo del modelo de PNL del cliente. La aplicación meticulosa de la PNL y el cumplimiento de los estándares de desidentificación de HIPAA dieron como resultado un conjunto de datos altamente refinado que respaldará los esfuerzos de investigación oncológica actuales y futuros del cliente, con el objetivo en última instancia de mejorar los resultados de los pacientes oncológicos y la eficiencia en la prestación de atención.

El éxito del proyecto ilustra nuestra capacidad para manejar datos médicos complejos con precisión, contribuyendo al objetivo del cliente de mejorar los resultados de la atención al paciente y acelerar el ritmo de la innovación en la atención médica.

Nuestra asociación con Shaip ha sido fundamental para mejorar nuestras capacidades de PNL dentro del dominio de la oncología. El manejo profesional de 10,000 registros médicos, anotados con negaciones detalladas y otras entidades clínicas, demostró su compromiso con la excelencia y el cumplimiento. Además, su compromiso con los estándares de privacidad como HIPAA nos ha proporcionado recursos invaluables para impulsar nuestras iniciativas de IA para desarrollar tratamientos y diagnósticos oncológicos de vanguardia.

Oro-5 estrellas

Acelere su IA sanitaria
desarrollo de aplicaciones al 100%