[Abstract]
“Classificação de alto nível baseada em redes: novos modelos e aplicações“
Aprendizado de máquina é uma aplicação da inteligência artificial com foco no desenvolvimento de programas de computador que podem acessar dados e usá-los para aprender por conta própria. Classificação de dados de alto nivel é uma técnica baseada na formação de padrão nos dados, ao invés de somente nas suas características físicas. Redes complexas têm se mostrado bastante úteis para caracterizar relacionamentos entre amostras de dados e, conseqüentemente, são um poderoso mecanismo de captura de padrões de dados. Neste trabalho, são investigadas novas maneiras de se usar a abordagem baseada em rede no desenvolvimento de técnicas de classificação de alto nível.
Inicialmente, duas técnicas de classificação são introduzidas, e seus desempenhos são avaliados aplicando-as a conjuntos de dados de referência na área, tanto artificiais quanto reais, bem como comparando seus resultados com aqueles obtidos por modelos de classificação tradicionais, nos mesmos dados. Posteriormente, são exploradas as vantagens inerentes a este tipo de abordagem, tais como a sua versatilidade e interpretabilidade, para se desenvolver novas técnicas baseadas em rede especificamente projetadas para serem aplicadas em dados de problemas reais e relevantes em campos muito diversos, desde o mercado financeiro à corrupção de políticos e cuidados de saúde. Embora estes tipos de aplicação certamente requerem um esforço maior por parte dos pesquisadores, em termos do desafio e pré-processamento dos dados, acredita-se que elas são importantes para aproximar a pesquisa acadêmica da realidade.
Entre os resultados obtidos neste trabalho, está a detecção de uma relação não esperada entre dados de votação de projetos de lei e condenações por corrupção e outros crimes financeiros entre deputados brasileiros. Também é demonstrado como é possível adaptar um modelo, que originalmente foi aplicado na detecção de periodicidade em dados meteorológicos, para identificar tendências de alta e de baixa no mercado de ações, acionando automaticamente uma ordem de compra ou de venda para o ativo, de acordo com a situação. Em outra investigação, é apresentada uma técnica para auxiliar os profissionais de saúde na tarefa de monitorar pacientes com COVID-19, por meio da detecção de sinais prévios de insuficiência hepática, renal ou respiratória, apenas com base nos resultados do exame de hemograma completo. Em resumo, acredita-se que este trabalho faz uma importante contribuição para o avanço do estudo de dados públicos em larga escala usando redes complexas.
Palavras-chave: redes complexas, classificação de dados de alto nível, aprendizado de máquina, partidos políticos, votações legislativas, predição de corrupção, mercado de ações, automação de investimentos, COVID-19, detecção de insuficiência, hemograma.
Ano de Publicação: 2021
Aluno: Tiago Santos Colliri
Orientador: Prof. Dr. Rogério Henrique de Araújo Júnior
Programa: Doutoramento em Ciências de Computação e Matemática Computacional (PPG-CCMC)
Universidade: Instituto de Ciências Matemáticas e de Computação – Universidade de São Paulo (Brasil)
Mais informação: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-26032021-102400/pt-br.php