Tornar um modelo mais complicado para incorporar fatores de análise adicionais e mais dados é uma má prática bastante frequente. Mas o que devem os cientistas fazer para decidir que dados o seu modelo deve usar? É melhor fazer um modelo mais geral que se aplique a mais casos? Ou deve concentrar-se no que é o foco e onde há mais garantias de se serem fatores mais conhecidos e relevantes?
Este é um problema frequente da ciências e até noutras áreas, como por exemplo nos modelos aplicados na gestão e no apoio à decisão que tendem também a incorporar cada vez mais variáveis e dados.
Um novo artigo que acaba de ser publicado na revista Science Advances propõe uma nova forma de avaliar os modelos, utilizando aquilo a que chamam a “dimensão eficaz” de um modelo. De forma bastante sintética, esta é uma forma de quantificar a complexidade do modelo e os autores mostram que aumentar essa complexidade tende a aumentar a incerteza dos resultados, ao invés de a baixar como se poderia pensar, porque muitos dos parâmetros não são independentes e influenciam-se mutuamente.
A gravidade da situação decorre de modelos complexos darem a ilusão de serem mais rigorosos e precisos. Discutem-se neste momento vários exemplos de modelos que têm este problema de excesso de variáveis e dados, nomeadamente nas áreas climáticas e pandémicas. Com base nesta análise, os cientistas responsáveis pelo estudo propõem que se avalie, a cada passo do desenvolvimento do modelo, a independência dos fatores utilizados e a qualidade dos dados disponíveis.
Sublinham que, apesar de usarem a complexidade como argumento, a sua mensagem não é que modelos simples são necessariamente melhores, mas que um modelo deve ser adequado a cada situação e aos dados disponíveis, não devendo tornar-se mais abrangente ou incorporar variáveis com dados de menor qualidade ou muito relacionados.
Crédito da imagem e da metáfora: Picasso e Martin Scorsese