Identificador persistente para citar o vincular este elemento:
http://hdl.handle.net/10553/117462
Título: | Diseño de un método de monitorización de pacientes con sepsis en Unidades de Cuidados Intensivos mediante técnicas de Machine Learning | Autores/as: | Ríos Bolaños, Caterina | Director/a : | Navarro Mesa, Juan Luis Suarez Diaz, Francisco Jose Gimeno Nieves, Encarnacion |
Clasificación UNESCO: | 3325 Tecnología de las telecomunicaciones | Fecha de publicación: | 2022 | Resumen: | La sepsis es una afección que se produce como consecuencia de una respuesta extrema del cuerpo frente a una infección que daña sus propios órganos y tejidos, causando secuelas irreversibles e incluso la muerte. En la actualidad, representa una crisis sanitaria a nivel mundial que afecta a millones de personas. Los métodos de evaluación tradicionales no permiten el diagnóstico precoz de la afección, que ha demostrado ser unos de los principales factores a la hora de reducir la mortalidad de los pacientes. Estudios recientes demuestran que la combinación de datos clínicos con técnicas de Machine Learning permite predecir la sepsis con precisión varias horas antes de que los síntomas físicos se manifiesten.
En la línea de los descrito anteriormente, el objetivo principal de este proyecto es el diseño de un método de detección temprana de la sepsis que sirva como apoyo a los médicos en las Unidades de Cuidados Intensivos. Para lograrlo, se ha hecho un diseño que integra clasificadores convencionales obtenidos a partir de las variables clínicas (es lo que se ha denominado “clasificadores base”), estrategias de combinación de clasificadores, y un elemento de pos-procesado basado en probabilidades acumuladas en ventanas temporales deslizantes. El desarrollo es de tipo constructivo en el que cada nuevo elemento añade una mejora en términos de detección de sepsis. Los clasificadores base que se han usado son Bayesiano, SVM, y regresión lineal y logística. Las estrategias de combinación han sido promedio, producto y majority voting.
A partir del diseño anterior, se han diseñado dos módulos: uno de identificación temprana de pacientes sépticos y otro de detección temprana de eventos de sepsis. El primero permite identificar en las primeras 8 horas de ingreso en la UCI qué pacientes podrían llegar a desarrollar una sepsis. Por otro lado, el segundo permite distinguir cuándo un paciente pasa de no tener sepsis a tenerla, con especial énfasis en las 6 horas anteriores al comienzo.
Para probar las bondades del diseño se ha llevado a cabo una experimentación intensiva sobre la base de datos aportada en el “Physionet Challenge: Early Prediction of Sepsis from Clinical Data. The PhysioNet Computing in Cardiology Challenge, 2019”. En él se aportan 40.300 pacientes provenientes de dos hospitales, divididos en los conjuntos A (20.300) y B (20.000). En cada conjunto hay pacientes con y sin sepsis, y de ellos hay datos clínicos que permiten abordar el problema de detección temprana. Así mismo, en el reto se introduce una “función de utilidad” que expresa la expectativa que los médicos tienen acerca de los resultados de un método de monitorización, y permite cuantificar la bondad de los métodos desarrollados.
De todos los clasificadores base aplicados, el Bayesiano ha resultado ser el mejor. A su vez, las estrategias de combinación de tipo producto y majority voting han resultado las mejores. La ventana deslizante que mejores resultados ha dado para las probabilidades acumuladas es de 8 horas.
Como síntesis del resultado de todo el diseño, se puede resaltar que los valores de utilidad son 0,675 para el conjunto de datos A, 0,641 para el conjunto de datos B y 0,621 para la combinación de ambos conjuntos. Estos resultados, y otros que se muestran en la memoria, permiten asegurar que el sistema propuesto es altamente competitivo en el marco científico de referencia en el que se ubica. Sepsis is a condition that occurs when the body has an extreme response to an infection which damages its own organs and tissues, leading to irreversible sequels and even death. As of now, it is a world-wide health crisis that affects millions of people every year. Traditional evaluation methods do not allow the early diagnosis of sepsis, which has been proved to be a key factor to reduce mortality in patients. Studies show that combining medical data with Machine Learning techniques allows to accurately predict sepsis several hours before the physical symptoms manifest themselves. In line with the above, the main goal of this study is the development of a sepsis early detection system capable of providing support for healthcare professionals in the ICUs. To achieve this, a design has been made that integrates conventional classifiers derived from clinical variables (referred to as "base classifiers"), classifier combination strategies, and a post-processing element based on cumulative probabilities in sliding time windows. The development is constructive in that each new element adds an improvement in terms of sepsis detection. The base classifiers that have been used are Bayesian, SVM, and linear and logistic regression. The combination strategies used have been average, product and majority voting. Based on the above design, two modules have been designed: one for early identification of septic patients and the other for early detection of sepsis events. The first one allows to identify within the first 8 hours of admission to the ICU which patients could develop sepsis. On the other hand, the second allows to distinguish when a patient goes from not having sepsis to having sepsis, with special emphasis on the 6 hours prior to the onset of sepsis. To test the design, intensive experimentation has been carried out on the database provided in the "Physionet Challenge: Early Prediction of Sepsis from Clinical Data. The PhysioNet Computing in Cardiology Challenge, 2019". It provides 40,300 patients from two hospitals, divided into sets A (20,300) and B (20,000). In each set there are patients with and without sepsis, and from them there are clinical data to address the problem of early detection. The challenge also introduces a "utility function" that expresses the expectation that physicians have about the results of a monitoring method and allows quantifying the goodness of the developed methods. Of all the base classifiers applied, the Bayesian classifier proved to be the best. In turn, the product and majority voting combination strategies were the best. The sliding window that has given the best results for the cumulative probabilities is 8 hours. As a conclusion of the result of the whole design, it can be highlighted that the utility values are 0.675 for data set A, 0.641 for data set B and 0.621 for the combination of both sets. These results, and others shown in the report, allow us to ensure that the proposed system is highly competitive in the scientific reference framework in which it is located. |
Departamento: | Departamento de Señales y Comunicaciones | Facultad: | Escuela de Ingeniería de Telecomunicación y Electrónica | Titulación: | Máster Universitario en Ingeniería de Telecomunicación | URI: | http://hdl.handle.net/10553/117462 |
Colección: | Trabajo final de máster |
En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.
Vista completaLos elementos en ULPGC accedaCRIS están protegidos por derechos de autor con todos los derechos reservados, a menos que se indique lo contrario.