L'IA AlphaFold de Google prédit la structure de la quasi-totalité des protéines connues

La base de donnée d'AlphaFold est disponible en libre accès (KEYSTONE/Ti-Press/Gabriele Putzu)

La base de données AlphaFold inventorie à présent la quasi-totalité des structures de protéines connues à ce jour. Grâce à l’ajout, annoncé le 28 juillet 2022, de nouvelles prédictions, elle jouit d’un fastueux contenu de plus de 200 millions de structures protéiques, relate le New York Times. Développé en 2018 par DeepMind, une entreprise de Google spécialisée dans l'intelligence artificielle, AlphaFold prédit les structures possibles des protéines à partir de leur séquence en acide aminées.

Pourquoi c’est révolutionnaire. Modéliser la structure tridimensionnelle des protéines, d’où découle pour bonne part leur fonction biologique, est un élément clé dans la compréhension des voies moléculaires et la mise au point de nouveaux médicaments. Même si le logiciel reste perfectible, l’IA d’AlphaFold a bouleversé le domaine.

Les réseaux neuronaux à apprentissage profond surpassent les anciennes méthodes expérimentales, coûteuses et chronophages. L’existence en libre accès, depuis l’été passé, d’une base de données si vaste insuffle un vent nouveau dans la recherche biomédicale. Pour la revue Nature, il y a un avant et un après AlphaFold, voire une véritable «AlphaFold mania».

Cette manne de données ouvre aussi la possibilité d’explorer le vivant selon de nouvelles perspectives, en comparant non plus les génomes mais les protéines qui en sont issues — c’est l’objet de la métaprotéomique, en plein essor. Interrogé par le New York Times, Demis Hassabis, directeur en chef de Deepmind, commente:

«Les scientifiques peuvent désormais explorer l'ensemble de cette base de données et rechercher des récurrences — des corrélations entre les espèces et des schéma évolutifs qui n'étaient peut-être pas évidents jusque-là.»

A lire dans le New York Times (EN)