Análisis y mejora del comportamiento de un modelo de aprendizaje profundo usado en el descubrimiento de nuevos fármacos.

Segura López, Pablo

Título:	Análisis y mejora del comportamiento de un modelo de aprendizaje profundo usado en el descubrimiento de nuevos fármacos.
Autores/as:	Segura López, Pablo
Director/a :	Castrillón Santana, Modesto Fernando Sosa Marco, Adriel
Clasificación UNESCO:	120317 Informática
Fecha de publicación:	2025
Resumen:	El proceso de descubrimiento de nuevos f´armacos es sumamente costoso y conlleva a˜nos de investigaci´on. El uso de herramientas de inteligencia artificial puede acelerar dicho proceso en gran medida y ayudar a refinar las estructuras moleculares ahorrando meses e incluso a˜nos el proceso global. En fases tempranas, el desarrollo de un f´armaco est´a vinculado con su potencial de inhibici´on del comportamiento aberrante de prote´ınas que desencadenan procesos patol ´ogicos, como c´ancer o enfermedades neurodegenerativas. Es por ello por lo que cuantificar la magnitud de la interacci´on del complejo f´armaco-prote´ına, tambi´en conocida como su afinidad, es uno de los criterios m´as relevantes en esta fase. La aplicaci´on de modelos de aprendizaje profundo para esta tarea ha cobrado un gran inter´es con el fin de aliviar la carga computacional de los modelos f´ısicos cl´asicos, as´ı como de superar las limitaciones de sus niveles de teor´ıa apoy´andose sobre la evidencia experimental. Sin embargo, una de las principales dificultades en el desarrollo de modelos de aprendizaje profundo para realizar esta estimaci´on tiene que ver con demostrar una capacidad de generalizaci´on suficiente. Esto se realiza en un contexto en que la informaci ´on experimental accesible representa una fracci´on muy peque˜na de todo el espacio qu´ımico. En este trabajo se partir´a de un modelo del estado del arte basado en Redes Neuronales de Grafos (GNN), con el que se obtiene una codificaci´on de la interacci´on intermolecular f´armaco-prote´ına aprovechando la estructura de los datos moleculares de entrada. Si bien, el modelo considerado ha mostrado un desempe˜no superior a otros del estado del arte, se ha identificado un aspecto fundamental no resuelto: la confiabilidad de las estimaciones del modelo para casos donde la interacci´on intermolecular es baja o nula, no ha sido contrastada. Esta limitaci´on est´a fundamentada principalmente en el conjunto de datos de entrenamiento, as´ı como en la propia arquitectura del modelo. La meta de este trabajo ser´a analizar a fondo el problema descrito y estudiar el modelo, proponiendo modificaciones para mejorar su comportamiento. The process of discovering new drugs is extremely costly and involves years of research. The use of artificial intelligence tools can greatly accelerate this process and help refine molecular structures, saving months or even years in the overall timeline. In early stages, drug development is linked to its potential to inhibit aberrant protein behavior that triggers pathological processes (e.g., cancer or neurodegenerative diseases). This is why quantifying the strength of the drug–protein complex interaction (also known as its affinity) is one of the most relevant criteria at this stage. The application of deep learning models to this task has gained significant interest in order to alleviate the computational burden of traditional physical models, as well as to overcome the limitations of their theoretical levels by relying on experimental evidence. However, one of the main challenges in developing deep learning models for this estimation lies in demonstrating sufficient generalization capability. This is done in a context where available experimental information represents only a very small fraction of the entire chemical space. This work will be based on a state-of-the-art model using Graph Neural Networks (GNNs), which provides a representation of the drug–protein intermolecular interaction by leveraging the structure of the input molecular data. Although the considered model has shown superior performance compared to other state-of-the-art models, a fundamental unresolved issue has been identified: the reliability of the model’s estimations in cases where the intermolecular interaction—and thus the affinity—is low has not been assessed. This limitation is mainly due to the training dataset, as well as the architecture of the model itself. The goal of this work will be to analyse the described problem as well as study the model in depth and propose modifications to improve its performance.
Departamento:	Departamento de Informática y Sistemas
Facultad:	Escuela de Ingeniería Informática
Titulación:	Grado en Ingeniería Informática
URI:	https://accedacris.ulpgc.es/handle/10553/143128
Colección:	Trabajo final de grado

En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.

Vista completa

Visitas

Google Scholar^TM

Comparte

Exporta metadatos

Dirección

Contacto

Legal

De interés

Visitas

Google ScholarTM

Comparte

Exporta metadatos

Dirección

Google Scholar^TM