Dissertação de Mestrado #726 – Miguel Felipe de Abreu Rocha e Senra – 19/08/2024
Predição da Energia de Ligação de Pósitron com Moléculas: Uma Análise Exploratória Utilizando Algoritmos de Machine Learning
Autor: Miguel Felipe de Abreu Rocha e Senra
Banca Examinadora
Prof. José Rachid Mohallem (Orientador)
DF/UFMG
Dr. Paulo Henrique Ribeiro Amaral (Coorientador)
posdoc DF/UFMG
Prof. Maurício Veloso Brant Pinheiro
DF/UFMG
Prof. Omar Paranaíba Vilela Neto
DCC/UFMG
Prof. Juan Carlos González Pérez (Suplente)
DF/UFMG
Orientação
Prof. José Rachid Mohallem (Orientador)
DF/UFMG
Dr. Paulo Henrique Ribeiro Amaral (Coorientador)
posdoc DF/UFMG
Resumo do Trabalho
O objetivo desta dissertação é empregar técnicas de aprendizado de máquina para investigar a importância de propriedades moleculares específicas na determinação da energia de ligação do pósitron com moléculas. Foram utilizados dados experimentais de energias de ligação de pósitrons (PBEs) e propriedades moleculares como polarizabilidade, momento de dipolo e número de ligações π. Cinco algoritmos de aprendizado de máquina foram explorados: máquinas de vetores de suporte para regressão (SVR), regressão polinomial com regularização ridge, XGBoost, perceptron de multicamadas (RNA) e um modelo ensemble. Os dados foram divididos em três grupos: moléculas apolares, polares e uma mistura dos dois tipos. Diferentes conjuntos de propriedades moleculares foram testados para cada grupo. A avaliação e ajuste dos algoritmos foram realizados utilizando validação cruzada aninhada e otimização bayesiana respectivamente, com a métrica de referência sendo o erro percentual absoluto médio. Além disso foi utilizado a abordagem SHAP para interpretabilidade dos modelos utilizados. Os resultados sugerem que a polarizabilidade anisotrópica é um descritor importante para moléculas polares, bem como as ligações π para as moléculas apolares, refletindo a influência da estrutura e distribuição espacial da nuvem eletrônica no cálculo energia de ligação do pósitron. Para as moléculas polares, observou-se também a melhoria do desempenho dos algoritmos quando utiliza-se o potencial de ionização como atributo. Este estudo demonstra que técnicas de aprendizado de máquina podem fornecer pistas valiosas sobre os mecanismos físicos envolvidos na ligação do pósitron com moléculas, complementando abordagens teóricas e experimentais. No entanto, limitações como a escassez de dados experimentais precisam ser superadas em pesquisas futuras. Trabalhos futuros devem focar na aquisição de mais dados, exploração de outros modelos específicos para poucas amostras e técnicas avançadas de interpretabilidade de modelos.
Tópico: Defesa de Dissertação – Miguel Senra
Horário: 19 ago. 2024 02:00 da tarde São Paulo
Entrar Zoom Reunião
https://zoom.us/j/97169205299?pwd=df5OSTE1FdbpbPRCZ2ugUR8bcNoF8G.1
ID da reunião: 971 6920 5299
Senha: 878648