Licencia de datos médicos/sanitarios de alta calidad para modelos de IA y ML
Conjuntos de datos médicos/sanitarios listos para usar para impulsar su proyecto de IA para el cuidado de la salud
Ingrese los datos médicos que se ha estado perdiendo hoy
Conjuntos de datos médicos y sanitarios para el aprendizaje automático
Datos de audio del dictado médico
Nuestro conjunto de datos anonimizados para el cuidado de la salud incluye 31 archivos de audio de diferentes especialidades dictados por médicos que describen la condición clínica de los pacientes y el plan de atención según los encuentros médico-paciente en el hospital / entorno clínico.
Archivos de audio de dictados médicos listos para usar:
- 257,977 31 horas de datos de voz dictados por médicos del mundo real de XNUMX especialidades para entrenar modelos de voz de atención médica
- Audio de dictado capturado desde varios dispositivos como Dictado telefónico (54.3 %), Grabadora digital (24.9 %), Micrófono de voz (5.4 %), Teléfono inteligente (2.7 %) y Desconocido (12.7 %)
- Audio y transcripciones redactados de PII que se adhieren a las pautas de puerto seguro de conformidad con HIPAA
Expedientes médicos transcritos
Los registros médicos transcritos se refieren a la transcripción de la conversación entre el médico y el paciente, la transcripción de los informes médicos y la evaluación médica. Ayuda a mapear el historial médico del paciente para futuras visitas y también actúa como punto de referencia para los médicos. Ayuda al médico a evaluar el estado actual del paciente y sugerir un tratamiento adecuado.
Expedientes médicos transcritos listos para usar:
- Transcripción de 257,977 31 horas de dictado médico del mundo real de XNUMX especialidades para entrenar modelos de habla de atención médica
- Registros médicos transcritos de varios tipos de trabajo, como informe operativo, resumen de alta, nota de consulta, nota de admisión, nota ED, nota clínica, informe de radiología, etc.
- Audio y transcripciones redactados de PII que se adhieren a las pautas de puerto seguro de conformidad con HIPAA
Registros electrónicos de salud (EHR)
Los registros médicos electrónicos o EHR son registros médicos que contienen el historial médico del paciente, diagnósticos, recetas, planes de tratamiento, fechas de vacunación o inmunización, alergias, imágenes de radiología (tomografía computarizada, resonancia magnética, rayos X) y pruebas de laboratorio y más.
Expedientes médicos electrónicos (EHR) listos para usar:
- Más de 5.1 millones de registros y archivos de audio de médicos en 31 especialidades
- Registros médicos estándar de oro del mundo real para entrenar NLP clínico y otros modelos de Document AI
- Información de metadatos como MRN (anonimizado), fecha de ingreso, fecha de alta, días de estadía, género, clase de paciente, pagador, clase financiera, estado, disposición de alta, edad, DRG, descripción de DRG, reembolso de $, AMLOS, GMLOS, riesgo de mortalidad, gravedad de la enfermedad, mero, código postal del hospital, etc.
- Registros médicos de varios estados y regiones de EE. UU.: noreste (46 %), sur (9 %), medio oeste (3 %), oeste (28 %), otros (14 %)
- Expedientes médicos pertenecientes a todas las clases de pacientes cubiertas: pacientes hospitalizados, pacientes ambulatorios (clínicos, de rehabilitación, recurrentes, de día quirúrgicos), de emergencia.
- Registros médicos pertenecientes a todos los grupos de edad de pacientes <10 años (7.9 %), 11-20 años (5.7 %), 21-30 años (10.9 %), 31-40 años (11.7 %), 41-50 años (10.4 %) ), 51-60 años (13.8 %), 61-70 años (16.1 %), 71-80 años (13.3 %), 81-90 años (7.8 %), 90+ años (2.4 %)
- Proporción de género del paciente de 46% (hombre) y 54% (mujer)
- Documentos redactados de PII que se adhieren a las pautas de puerto seguro de conformidad con HIPAA
- Registros médicos pertenecientes a todos los grupos de edad de pacientes <10 años (7.9 %), 11-20 años (5.7 %), 21-30 años (10.9 %), 31-40 años (11.7 %), 41-50 años (10.4 %) ), 51-60 años (13.8 %), 61-70 años (16.1 %), 71-80 años (13.3 %), 81-90 años (7.8 %), 90+ años (2.4 %)
- Proporción de género del paciente de 46% (hombre) y 54% (mujer)
- Documentos redactados de PII que se adhieren a las pautas de puerto seguro de conformidad con HIPAA
Conjunto de datos de imagen de tomografía computarizada
Los médicos usan la imagen de la tomografía computarizada para diagnosticar y detectar condiciones anormales o normales en el cuerpo de un paciente (es decir, para identificar enfermedades o lesiones en varias partes del cuerpo). En el diagnóstico de procesamiento de imágenes computarizado, una imagen de tomografía computarizada pasa por fases sofisticadas, a saber, adquisición, mejora de imagen, extracción de características importantes, identificación de región de interés (ROI), interpretación de resultados, etc.
Shaip proporciona conjuntos de datos de imágenes de tomografía computarizada de alta calidad esenciales para la investigación y el diagnóstico médico. Nuestros conjuntos de datos incluyen miles de imágenes de alta resolución recopiladas de pacientes reales y procesadas con técnicas de vanguardia. Estos conjuntos de datos están diseñados para ayudar a los profesionales médicos e investigadores a mejorar su conocimiento y comprensión de diversas afecciones médicas, incluido el cáncer, los trastornos neurológicos y las enfermedades cardiovasculares. Con Shaip, puede acceder a datos médicos fiables y precisos para mejorar su investigación y mejorar los resultados de los pacientes.
Conjunto de datos de imágenes de resonancia magnética
Los modelos de visión por computadora están diseñados para derivar información significativa de imágenes y videos digitales, según IBM. Permite un uso extensivo de datos de imágenes de atención médica para proporcionar un mejor diagnóstico, tratamiento y predicción de enfermedades. Puede utilizar el contexto de la secuencia de imágenes, la textura, la forma y la información de contorno, así como el conocimiento previo, para producir información en 3D y 4D que ayude a mejorar la comprensión humana. Al igual que las tomografías computarizadas, las resonancias magnéticas también se utilizan para diagnosticar y detectar condiciones anormales o normales en el cuerpo de un paciente (es decir, para identificar enfermedades o lesiones en varias partes del cuerpo).
Shaip proporciona conjuntos de datos de imágenes de resonancia magnética de alta calidad esenciales para la investigación y el diagnóstico médico. Nuestros conjuntos de datos incluyen miles de imágenes de alta resolución recopiladas de pacientes reales y procesadas con técnicas de vanguardia.
Conjunto de datos de imágenes de rayos X
Las pruebas de rayos X se utilizan para verificar la estructura interna y la integridad del objeto. Se pueden generar imágenes de rayos X de un objeto de prueba en diferentes posiciones y diferentes niveles de energía para diagnosticar y detectar condiciones anormales en el cuerpo de un paciente.
Shaip proporciona conjuntos de datos de imágenes de rayos X de alta calidad esenciales para la investigación y el diagnóstico médico. Nuestros conjuntos de datos incluyen miles de imágenes de alta resolución recopiladas de pacientes reales y procesadas con técnicas de vanguardia. Con Shaip, puede acceder a datos médicos fiables y precisos para mejorar su investigación y mejorar los resultados de los pacientes.
¿No encuentras lo que estás buscando?
Se recopilan nuevos conjuntos de datos médicos listos para usar en todos los tipos de datos
Contáctenos ahora para dejar de lado sus preocupaciones sobre la recopilación de datos de capacitación en atención médica
Preguntas más frecuentes (FAQ)
Un conjunto de datos sanitarios es una colección de datos relacionados con la salud, a menudo estructurados y recopilados para análisis, investigación y toma de decisiones en los ámbitos médico y sanitario.
Los ejemplos incluyen registros médicos electrónicos (EHR), bases de datos de imágenes médicas, secuencias genómicas, datos demográficos de pacientes y conjuntos de datos de dispositivos de salud portátiles.
Los conjuntos de datos sanitarios respaldan la investigación médica al proporcionar información sobre los patrones de enfermedades, los resultados del tratamiento, el comportamiento del paciente, la eficacia de los medicamentos y más, contribuyendo así a los avances médicos y la formulación de políticas.
Los formatos comunes incluyen CSV, Excel, DICOM (para imágenes médicas) y HL7 (para registros de salud).
Las preocupaciones sobre la privacidad surgen del posible uso indebido de datos confidenciales de los pacientes, lo que lleva al robo de identidad, la discriminación o la exposición no deseada a información de salud personal.
La información del paciente está protegida mediante desidentificación (eliminación de información de identificación personal), cifrado, controles de acceso estrictos y cumplimiento de regulaciones como HIPAA (en los EE. UU.).
Para garantizar la calidad, valide y limpie periódicamente el conjunto de datos, utilice métodos estandarizados de recopilación de datos, haga referencias cruzadas con fuentes confiables e involucre a expertos en el dominio para la verificación.