Software gratuito pode auxiliar economistas na análise de dados

Novos modelos estatísticos ajudam economistas, ambientalistas e pesquisadores da área da saúde a trabalharem com dados mais flexíveis

Plataforma pode ser utilizada por economistas para traçar perfis de consumo e renda Foto:Pixels Bay

Desde a década de 1990, o mundo vive cada vez mais imerso na era dos dados. O avanço da internet e do big data trouxe o armazenamento de uma infinidade de informações, permite complexas análises de perfil de usuários, cruzar variáveis e tentar estabelecer relações entre elas. As novas possibilidades fizeram crescer a demanda por novos modelos matemáticos capazes de seguir a flexibilidade dos dados e gerar resultados mais confiáveis. Luis Hernando Vanegas Penagos, doutor pelo Instituto de Matemática e Estatística da USP, utilizou modelos já existentes para desenvolver um software de código livre que pode ser hoje utilizado por diversos campos da ciência.

O ponto inicial do projeto foi um modelo estatístico já conhecido e muito utilizado por profissionais da medicina, meio-ambiente, mineração e economia. Com ele é possível analisar dados como o horário da infecção vs aparecimento dos primeiros sintomas ou o número de partículas, químicos e organismos de um bioma. A partir disso, o pesquisador propôs a generalização da classe dos Modelos de Regressão Normal Linear.

Os modelos de regressão têm como principal característica explicar a relação entre variáveis e auxiliar pesquisadores na hora de estabelecer relações e traçar perfis. A nova classe, chamada de log-simétrica, apresenta características mais flexíveis, como a análise de dados positivos e com comportamento assimétrico, ao contrário do modelo anterior que apresentava limitações. “No trabalho desenvolvido com o professor Gilberto Paula, busquei fornecer metodologias alternativas quando as suposições iniciais de simetria e variância constante na distribuição dos dados não eram satisfeitas”, explica Luis Vanegas.

Embora não tivesse sido pensada para cumprir um papel prático no primeiro momento, o estudo deu origem a uma biblioteca de softwares de código livre, onde qualquer pessoa pode ter acesso às ferramentas necessárias para a análise de dados com o uso do novo modelo. Responsável pela programação da plataforma, Vanegas agora trabalha na sua constante atualização e aperfeiçoamento. A ferramenta está hospedada em uma plataforma de código aberto, onde qualquer usuário pode consultar e se beneficiar. Até novembro de 2018, o arquivo já havia sido baixado mais de 12 mil vezes. 

Aplicação na área de Econometria

Para o professor Gilberto de Paula, professor do Instituto de Matemática e Estatística da USP e orientador do estudo, os economistas estão entre os profissionais que mais se beneficiariam do uso da plataforma, mais precisamente a área de econometria, que busca entender as variáveis econômicas com ajuda de ferramentas estatísticas. “Os economistas já costumam trabalhar com o modelo de log-normal para traçar perfis de consumo da população. Consumo, renda e gastos de uma forma geral. Uma maioria consome pouco e uma minoria consome muito. São dados que funcionam muito bem dentro do novo modelo e da ferramenta que propomos ”, completa.

Mesmo de volta em seu país natal, a Colômbia, Vanegas continua dedicado a melhorar as características da nova classe. Para 2019, o estudo será revisitado e deve chegar às prateleiras em forma de livro. A tese de doutorado Log-symmetric regression models under the presence of uncensored, left- or right-censored observations : a semi-parametric approach, que deu origem ao programa e foi defendida em 2015, chegou a ser finalista do prêmio CAPES e no concurso de teses de doutorado do Simpósio Nacional de Probabilidade e Estatística (SINAPE) realizado em Porto Alegre. A publicação ficou com a quarta posição na premiação

Seja o primeiro a comentar

Faça um comentário

Seu e-mail não será divulgado.


*