Desarrollo de un modelo basado en aprendizaje profundo para predecir eventos pediátricos críticos en salas generales
En un estudio reciente publicado en Informes científicosLos investigadores utilizaron el aprendizaje profundo para desarrollar un modelo que predice eventos críticos en niños ingresados en una sala general utilizando variables simples.
Estancia: Desarrollo de un modelo de aprendizaje profundo que predice eventos críticos para pacientes pediátricos ingresados en una sala generals. Crédito de la imagen: PopTika/Shutterstock.com
fondo
El diagnóstico temprano de personas en deterioro es vital para un tratamiento rápido antes de eventos críticos como la reanimación cardiopulmonar (RCP). Es más probable que los niños reciban tratamiento antes de un paro cardíaco. Las herramientas existentes requieren mucho tiempo y son complejas, lo que las hace inviables.
La puntuación de alerta temprana pediátrica (PEWS) tiene un poder predictivo escaso. El aprendizaje profundo se utiliza para desarrollar modelos de predicción de crisis médicas; Sin embargo, la mayoría de las investigaciones se han centrado en los adultos.
Un estudio utilizó 29 criterios para determinar la probabilidad de transmisión en la UCI, lo que puede no ser realista. Otro creó un modelo LSTM que necesitaba más de 20 mediciones de biomarcadores.
Sobre el estudio
En el actual estudio observacional transversal retrospectivo, los investigadores desarrollaron un modelo de aprendizaje automático para predecir eventos críticos en pacientes pediátricos ingresados en salas generales en función de características como signos vitales, edad, sexo e intervalo de medición.
El equipo realizó el estudio desde enero de 2020 hasta diciembre de 2022, incluyendo pacientes menores de 18 años que fueron hospitalizados en la sala general del Hospital Terciario de Niños.
Describieron eventos críticos como reanimación cardiopulmonar en salas generales, traslado inesperado a unidades de cuidados intensivos (UCI) o muerte.
Entrenaron un modelo para predecir eventos críticos utilizando los signos vitales recopilados durante la hospitalización, utilizando los intervalos de medición, la edad y el sexo de los participantes para estandarizar la variación en el rango normal por edad.
Los investigadores separaron el conjunto de datos preprocesados en conjuntos de datos de entrenamiento (80%) y de prueba (20%), y el aprendizaje profundo se realizó utilizando redes neuronales artificiales (ANN) simples. Examinaron biomarcadores combinando códigos de identificación seudonimizados e historiales de hospitalización para crear códigos de identificación de hospitalización únicos (IHID).
Clasificaron los intervalos de medición de los signos vitales en orden ascendente y estimaron el intervalo entre las mediciones de los signos vitales dentro del IHID.
Los investigadores definieron los registros críticos como datos recopilados seis horas antes de que ocurra un evento, como el traslado a una unidad de cuidados intensivos o la muerte, y seis horas antes de que ocurra la RCP, como las muertes después de la RCP.
Dividieron los registros en categorías críticas y no críticas, eliminando categorías no críticas que contienen eventos importantes y realizando un aprendizaje profundo en los últimos registros IHID documentados en los grupos no críticos.
Los investigadores midieron la capacidad predictiva del modelo utilizando dos métricas básicas: el área bajo la curva característica operativa del receptor (AUROC) y el área bajo la curva de recuperación de precisión (AUPRC).
Los criterios de valoración secundarios incluyeron reanimación cardiopulmonar, traslado inesperado a la unidad de cuidados intensivos y muerte. Además, el estudio examinó la idoneidad del proceso de estimación para todas las características utilizadas y la correlación entre ellas.
resultados
El estudio incluyó a 13.787 personas con 22.184 hospitalizaciones y 1.039.070 puntos de datos de signos vitales. La edad promedio de los participantes hospitalizados fue de 69 meses y el 43% de los pacientes eran mujeres.
La hospitalización duró 3,0 días. Tras el filtrado de datos quedaron 14.227 registros relevantes, de los cuales 74 meses y el 43% eran femeninos.
La categoría crítica representó el 4,40% de los pacientes, con 261 casos que requirieron reanimación cardiopulmonar, 238 casos con traslado no programado a la unidad de cuidados intensivos y 141 muertes. El valor de imputación promedio de los datos faltantes para el período de medición inicial fue 276.
El rendimiento predictivo del modelo generado fue sobresaliente, con un AUROC de 0,99 y un AUPRC de 0,90.
El equipo creó un modelo de aprendizaje profundo con un poder predictivo excepcional que utiliza factores simples para predecir con precisión eventos críticos y al mismo tiempo reducir la carga de trabajo del personal médico. Sin embargo, el estudio fue un ensayo de un solo centro, lo que justifica más investigaciones para validar externamente el modelo.
Los predictores más importantes del resultado fueron el intervalo de medición, la SpO2 y la puntuación z RR. La producción del modelo aumenta a medida que disminuye el intervalo de tiempo, mientras que el efecto disminuye a medida que aumenta el intervalo de tiempo. SpO2 mostró una tendencia similar.
Una frecuencia respiratoria y una frecuencia cardíaca más altas tuvieron un mayor efecto en los resultados, mientras que los valores más bajos de puntuaciones z tuvieron un efecto menor.
El examen de la correlación entre las propiedades de caracterización del modelo reveló que intervalos de medición más estrechos dieron como resultado valores SHAP más altos, pero la puntuación HR z no fue significativa.
La correlación entre los valores de saturación de oxígeno (SpO2) y las lecturas de SHAP fue consistentemente inversa, y la tendencia se volvió más pronunciada a medida que disminuyeron los intervalos de medición.
Conclusión
En general, los resultados del estudio destacan un modelo basado en el aprendizaje profundo que utiliza datos simples como signos vitales, sexo, períodos de medición y edad para predecir la intervención en pacientes pediátricos con fallas.
Este método reduce la carga del personal médico al depender de una pequeña cantidad de variables en lugar de agregar mediciones. El modelo tenía valores AUROC y AUPRC de 0,99 y 0,90, respectivamente, lo que es mucho mejor que investigaciones anteriores.
El modelo superó consistentemente 0,96 en todos los eventos críticos, pero su AUPRC disminuyó debido a la falta de capacitación especializada. El modelo produjo mejores resultados en todos los períodos, posiblemente debido al desequilibrio entre los subgrupos críticos y no críticos y a la uniformidad de los datos.