David Baker admire l'oeuvre de 150 000 ordinateurs.

T. S. WARREN/AP

Une tentative de modélisation utilise le calcul partagé avec l'espoir de réaliser une percée scientifique

Par Ellen Callaway

En exploitant les millions d'heures de calcul offertes par 150.000 volontaires, les scientifiques ont réussi à prédire la structure d'une protéine à partir de sa seule séquence d'acides aminés. Le projet constitue une avancée significative dans un domaine qui a été exploré sitôt que des résultats tangibles sont apparus, déclare l'expert.

Déterminer la forme d'une protéine est habituellement effectué par irradiation de faisceaux de rayons X sur la forme cristalline de la protéine puis par une mesure de la diffraction, et les chimistes des protéines sont depuis longtemps sceptiques sur les tentatives de remplacement des tests par la modélisation et la théorie. "Actuellement, la modélisation a mauvaise presse dans ce domaine" explique Michael Levitt, un bio-informaticien de l'Université de Standford. Mais dans un article publié le 14 octobre dans le journal Nature, David Baker, un biochimiste de l'Université de Washington à Seattle, et ses collègues présentent des résultats qui pourraient faire encore mieux que dissiper ce scepticisme (B. Qian et al. Nature doi : 10.1038 / nature06249 ; 2007).

La forme d'une protéine - et donc son activité - est déterminée de manière précise par la façon dont se replient ses chaines d'acides aminés. "Imaginez vous la chose comme un serpent totalement flexible, il existe des milliers de degrés de liberté pour chacun des points situés sur ce serpent" illustre Eleanor Dodson, spécialiste en biologie structurale à l'Université de York (Royaume-Uni). La forme finale dépend des interactions moléculaires de chaque acide aminé avec ses voisines, avec les molécules d'eau environnantes et avec les acides animés qui sont situées à une grande distance à l'intérieure de la séquence, mais qui deviennent proche lors du repliement. C'est un problème abominable à modéliser.

"Imaginez vous la chose comme un serpent totalement flexible, il existe des milliers de degrés de liberté pour chacun des points situés sur ce serpent"

Plutôt que d'utiliser les techniques habituelles pour résoudre le problème, la technique de Baker combine l'ensemble des informations connues sur la structure des protéines avec l'immense puissance de calcul rendue disponible par l'intermédiaire de l'infrastructure ouverte de Berkeley pour le calcul en reseau (Berkeley Open Infrastructure for Network Computing). Ce logiciel, développé à l'Université de Californie (Berkeley), permet au grand public de contribuer en partageant la puissance de calcul non utilisée de leur(s) ordinateur(s) pour des projets scientifiques (le plus célèbre étant la recherche d'une intelligence extraterrestre avec SETI@home), 150 000 volontaires l'utilisent en téléchargeant une copie du programme Rosetta@home développé par le laboratoire Baker. 

Rosetta casse la séquence d'une protéine en petits morceaux qui peuvent être mis en concordance avec des morceaux identiques provenant de protéines dont les structures sont connues. Ces différentes formes offrent de nombreuses possibilités d'assembler les morceaux de la protéine à l'étude, et le programme choisit celles qui minimisent l'énergie libre de la structure (une mesure de sa stabilité). Les chercheurs tendent à toujours plus affiner le modèle des protéines en faisant fonctionner encore et encore le programme sur des milliers d'ordinateurs. 

Lorsque la séquence de T0283, une protéine d'une bactérie constituée de 112 acides animés, a été testée, le réseau a recraché plusieurs millions de structures après un million d'heures de calcul cumulé. Ces millions ont été réduits à cinq structures après des analyses répétées, et une seule de ces structures a été mise en évidence, par corrélation avec la structure déterminée par son cristal.
Bien que la précision des modèles ait été encore assez éloigné des modèles de cristaux haute résolution, elle était assez bonne pour que les chercheurs pensent que cette technique pourrait à l'avenir simplifier le processus traditionnel d'obtention des structures par rayons-X. Pour convertir les schémas aux rayons-X en structures, les chercheurs doivent produire des modèles à partir de cristaux qui ont été enrichis avec des métaux lourds "marqueurs", ou alors utiliser des modèles possèdant des indications sur ce à quoi ressemblera la structure finale, par exemple à partir de la forme de la protéine en question. La structure de T0283 issue de Rosetta était suffisamment bonne pour valider cette dernière technique. Le programme devrait maintenant être capable de fournir des points de référence pour les protéines pour lesquelles il y a déjà des données par rayons-X, mais qui manquent de liens utiles avec d'autres protéines qui végètent dans un coin. "On sera alors en mesure de résoudre toute une série de structures bien plus rapidement" déclare Adrian Roitberg, un modeleur de protéines à l'Université de Floride à Gainesville. Il y a encore de la place pour des améliorations, indique Rhiju Das, un post-doctorant travaillant sur le projet Rosetta@Home et un des co-auteurs de l'article avec Baker. Chaque ordinateur personnel travaille en autonomie, explique-t-il. Si le programme pouvait être réécrit pour être exécuté sur les multiples processeurs parallèlisés à l'intérieur d'un supercalculateur, Rosetta pourrait être considérablement plus puissant. La rançon du succès d'une meilleure prédiction des structures serait la perspective de protéines faites "sur mesure", explique Baker, qui utilise Rosetta pour trouver des séquences qui correspondent aux structures désirées. Son laboratoire et celui du biochimiste Bill Schief de l'Université de Washington coopèrent sur la re-modélisation de la protéine GP120 du SIDA pour concevoir un vaccin qui pourrait stimuler le système immunitaire d'une façon différente de ce qui se produit avec le virus naturel. La protéine remodelée devrait engendrer des anticorps capablent d'attaquer le virus plus efficacement que les anticorps créés naturellement après l'infection. Le jour où les modeleurs de protéines rendront les méthodes par cristallisation obsolètes est encore loin, ajoute Baker. Néanmoins, la fusion des deux techniques pourrait offrir l'occasion aux biologistes de mieux comprendre les protéines - et plus rapidement. "Si vous vous souciez réellement de la structure de vos protéines, vous devriez combiner l'expérimentation aux modélisations" conclus t-il.