A Inteligência Artificial é um tema muito recorrente nos Media. Pelas suas conquistas, pela sua projeção, pelo temor, pela especulação, pelas potencialidades extraordinárias. Mas, quase sempre, no meio das notícias frequentes, torna-se difícil distinguir entre aquilo que é apenas o espetáculo mediático de alguma concretização pontual, do que verdadeiramente pode fazer a diferença no mundo real.
Depois, há também o fator complexidade. É certamente mais fácil para o cidadão comum impressionar-se com o carro autónomo, a linguagem natural, a deteção de comportamentos nas redes sociais, ou até a ação em processos industriais, do que, por exemplo, avaliar a conquista recente do Alpha Fold, um software de Inteligência Artificial, que permite reproduzir a estrutura das proteínas.
E porque é que isso é tão importante? Tão simplesmente porque as proteínas são “os blocos” que permitem a Vida no planeta. Todas as formas de vida são suportadas por processos envolvendo proteínas, que funcionam como se fossem um género de nano-máquinas capazes de concretizar muitas das funções biológicas inerentes à Vida.
Nesta área, uma das questões mais importantes por resolver no conhecimento humano foi enunciada em 1971, por Christian Anfinsen, vencedor do Nobel da Química desse ano, e que passa pela capacidade de determinar a estrutura tridimensional das proteínas a partir das sequências lineares dos aminoácidos. Ou seja ser capaz de entender “como se chega dos elementos mais simples da biologia até às estruturas complexas correspondentes aos vários tipos de proteínas?”
A resposta a esta questão tem-se revelado mais difícil do que se pensava, precisamente porque a nossa capacidade de representação geométrica e matemática não foi capaz de gerar as equações que se materializem no entendimento dos processos que levam à formação das proteínas.
Devido a estas dificuldades, a abordagem através da inteligência artificial é considerada, desde há muito tempo, como bastante promissora e talvez até a melhor maneira de se poder avançar na resolução deste problema. No entanto essa abordagem também se tem revelado difícil. Desde a década de 90 que lançou esse desafio e, depois de algum progresso inicial, durante muito anos pouco mais se progrediu.
Para se entender melhor a evolução convém introduzir o fator de reprodução geométrica, normalmente típico da área do design industrial – o GDT (Geometric Dimensioning and Tolerencing) – através do qual se podem comparar os modelos das proteínas gerados pelos algoritmos de inteligência artificial, com os modelos reais das proteínas. Para que possa haver um bom alinhamento, a percentagem deve ser o mais alta possível e nunca abaixo de 90%.
Durante muitos anos só se conseguiu um GDT à volta dos 60%. Nos últimos anos houve uma subida promissora acima dos 70% e recentemente, com todo o esforço dedicado a entender algumas das proteínas da Covid 19, conseguiram-se finalmente níveis de GDT bem acima dos 90%, em alguns casos mesmo, muito perto dos 100%.
Esta capacidade de modelação da estrutura das proteínas é um progresso absolutamente notável, que pode permitir extraordinários avanços no entendimento da evolução das doenças ou no desenvolvimento de medicamentos ou até na compreensão de base, dos processos da Vida em geral.
Que destaque foi dado a isto no Media? Certamente, muito menos do que o merecido!
E já agora, destacamos também o vídeo da Deepmind, que conta bem esta história e mostra a persistência necessária, no processo fantástico que é a ciência, assim como o regozijo dos cientistas, quando se progride no conhecimento da humanidade.
Crédito da foto: Alpha-Fold