Identificador persistente para citar o vincular este elemento:
https://accedacris.ulpgc.es/jspui/handle/10553/143128
| Título: | Análisis y mejora del comportamiento de un modelo de aprendizaje profundo usado en el descubrimiento de nuevos fármacos. | Autores/as: | Segura López, Pablo | Director/a : | Castrillón Santana, Modesto Fernando Sosa Marco, Adriel |
Clasificación UNESCO: | 120317 Informática | Fecha de publicación: | 2025 | Resumen: | El proceso de descubrimiento de nuevos f´armacos es sumamente costoso y
conlleva a˜nos de investigaci´on. El uso de herramientas de inteligencia artificial
puede acelerar dicho proceso en gran medida y ayudar a refinar las estructuras
moleculares ahorrando meses e incluso a˜nos el proceso global. En fases tempranas,
el desarrollo de un f´armaco est´a vinculado con su potencial de inhibici´on
del comportamiento aberrante de prote´ınas que desencadenan procesos patol
´ogicos, como c´ancer o enfermedades neurodegenerativas. Es por ello por lo
que cuantificar la magnitud de la interacci´on del complejo f´armaco-prote´ına,
tambi´en conocida como su afinidad, es uno de los criterios m´as relevantes en
esta fase. La aplicaci´on de modelos de aprendizaje profundo para esta tarea
ha cobrado un gran inter´es con el fin de aliviar la carga computacional de los
modelos f´ısicos cl´asicos, as´ı como de superar las limitaciones de sus niveles de
teor´ıa apoy´andose sobre la evidencia experimental. Sin embargo, una de las
principales dificultades en el desarrollo de modelos de aprendizaje profundo
para realizar esta estimaci´on tiene que ver con demostrar una capacidad de
generalizaci´on suficiente. Esto se realiza en un contexto en que la informaci
´on experimental accesible representa una fracci´on muy peque˜na de todo el
espacio qu´ımico.
En este trabajo se partir´a de un modelo del estado del arte basado en
Redes Neuronales de Grafos (GNN), con el que se obtiene una codificaci´on
de la interacci´on intermolecular f´armaco-prote´ına aprovechando la estructura
de los datos moleculares de entrada.
Si bien, el modelo considerado ha mostrado un desempe˜no superior a otros
del estado del arte, se ha identificado un aspecto fundamental no resuelto: la
confiabilidad de las estimaciones del modelo para casos donde la interacci´on
intermolecular es baja o nula, no ha sido contrastada. Esta limitaci´on est´a
fundamentada principalmente en el conjunto de datos de entrenamiento, as´ı
como en la propia arquitectura del modelo.
La meta de este trabajo ser´a analizar a fondo el problema descrito y estudiar
el modelo, proponiendo modificaciones para mejorar su comportamiento. The process of discovering new drugs is extremely costly and involves years of research. The use of artificial intelligence tools can greatly accelerate this process and help refine molecular structures, saving months or even years in the overall timeline. In early stages, drug development is linked to its potential to inhibit aberrant protein behavior that triggers pathological processes (e.g., cancer or neurodegenerative diseases). This is why quantifying the strength of the drug–protein complex interaction (also known as its affinity) is one of the most relevant criteria at this stage. The application of deep learning models to this task has gained significant interest in order to alleviate the computational burden of traditional physical models, as well as to overcome the limitations of their theoretical levels by relying on experimental evidence. However, one of the main challenges in developing deep learning models for this estimation lies in demonstrating sufficient generalization capability. This is done in a context where available experimental information represents only a very small fraction of the entire chemical space. This work will be based on a state-of-the-art model using Graph Neural Networks (GNNs), which provides a representation of the drug–protein intermolecular interaction by leveraging the structure of the input molecular data. Although the considered model has shown superior performance compared to other state-of-the-art models, a fundamental unresolved issue has been identified: the reliability of the model’s estimations in cases where the intermolecular interaction—and thus the affinity—is low has not been assessed. This limitation is mainly due to the training dataset, as well as the architecture of the model itself. The goal of this work will be to analyse the described problem as well as study the model in depth and propose modifications to improve its performance. |
Departamento: | Departamento de Informática y Sistemas | Facultad: | Escuela de Ingeniería Informática | Titulación: | Grado en Ingeniería Informática | URI: | https://accedacris.ulpgc.es/handle/10553/143128 |
| Colección: | Trabajo final de grado |
En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.
Vista completaLos elementos en ULPGC accedaCRIS están protegidos por derechos de autor con todos los derechos reservados, a menos que se indique lo contrario.