Interview du Dr. David Baker du projet Rosetta@home de l'Université de Washington

28 Avril 2006 - Interview n°4

Rosetta (détails)

Source : Team Picard

 

Team Picard: Quel est le but de Rosetta@Home?
DaveBaker: C'est de prédire les structures des protéines naturelles, et de créer de toute pièce de nouvelles protéines ayant des principes actifs nouveaux et utiles

TP: Le projet et le programme sont baptisés du nom de la pierre de Rosette? Pourquoi avez-vous choisi Rosetta comme nom?
DB: C'est Kim Simons, un étudiant agrégé qui a écrit la première version de Rosetta (il y a bien longtemps), c'est lui qui a choisi le nom basé sur la pierre de Rosette. Le programme visait à déchiffrer la "signification" du code génétique des acides aminés d'une protéine.

TP: L'application que le projet exécute par l'intermédiaire du programme BOINC s'appelle également Rosetta et est libre pour l'usage scolaire. Qui l'emploie autrement?
DB: Il y a des centaines d'étudiants dans le domaine des protéines à travers le monde qui utilisent Rosetta .

TP: Est-il vrai que plus vous faites tourner cette simulation pour une protéine , plus vous  vous rapprochez au maximum de la forme la plus précise de l'identité de la protéine naturelle? Pourquoi?
DB: Oui. Car il est plus probable que nous trouvions la plus basse structure d'énergie. Le projet nécessite de simuler le pliage d'une protéine un nombre important de fois afin de trouver la séquence d'acide aminé ayant une structure nécessitant le minimum d'énergie. Puisque la structure réelle est la séquence ayant la plus basse structure d'énergie, elle devrait être une représentation très précise de la forme de la protéine. Celle-ci détermine la manière dont elle agit en interaction avec les autres protéines, ou encore qu'elle est sa fonction réelle .

TP: J'ai lu qu'il est possible de découvrir la forme exacte des protéines. En fait vous les avez comparées à vos résultats trouvés grâce à la simulation pour vous assurer que vos modèles sont précis. Pourquoi pas simplement déterminer des formes de protéine expérimentalement?
DB: Bonne question. Cela coûte plus de 100.000 dollars (85.000 euros) pour résoudre la structure d'une protéine, et souvent beaucoup d'années de travail.
TP: D'accords, laissons de coté la science pendant une minute, parlez nous du projet. Il y a actuellement deux projets qui tournent sur BOINC? Pourquoi avez-vous lancé Ralph?
DB: Ceci est dû au fait que nous essayons continuellement d'améliorer de manière scientifique Rosetta, ainsi que pour mettre en application les souhaits émis par les utilisateurs. de ce fait le programme évolue très souvent, et nous avons eu besoin d'un projet spécifique pour examiner de nouvelles versions du programme sur une petite échelle avec les utilisateurs qui ne s'occupent pas des erreurs que celà peut occasionner.

TP: De combien de membre est composé votre équipe ? DB: Nous sommes actuellement cinq pour dévellopper rosetta@home.

TP: Vous cherchez activement de nouveaux utilisateurs pour participer au projet. Je suppose que c'est parce que vos résultats sont meilleurs avec une utilisation plus intensive. Si chaque nouveau volontaire avait un nouvel ordinateur allumé 24 heures sur 24, sept jours sur sept, de combien de nouveaux utilisateurs auriez-vous besoin? Si on pouvait exaucer ici et maintenant tous vos souhaits que demanderiez vous?
DB: Oui, il nous faudrait beaucoup plus d'utilisateurs, parce que le calcul des structures de grandes protéines exige beaucoup plus de puissance que vous nous accordez actuellement (rappel Rosetta est actuellement proche des 30 teraflops). Nous nous sommes fixés un objectif de 150 teraflops, qui serait 5 à 10 fois plus important que la puissance du projet actuel ceci pourrait être réalisé par 100.000 nouveaux utilisateurs à temps plein. Mais en réalité, pour un objectif plus ambitieux en ce qui concerne la biologie structurale, qui aurait un impact énorme sur le monde, même ce nombre ne serait pas suffisant. Mais le projet continuera pendant un certain nombre années, je prévois, ainsi ce n'est pas trop grave si quelques problèmes ne peuvent pas être résolus maintenant !

TP: Votre page internet attire l'attention. Vous avez beaucoup d'informations mis à disposition des nouveaux utilisateurs pour les tenir au courant de ce que vous faites et même quelques descriptions très techniques sur ce qui va être fait. Pourquoi avez-vous décidé de mettre à disposition plus de documentations que les autres projets de calcul partagé?
DB: Nous avons voulu mettre à dispostion des gens le maximum de documentation au sujet de ce que nous faisons et dans quel but.

TP: Dites-moi au sujet de votre page des "meilleures prédictions". Qu'est-ce que c'est, pourquoi existe t'elle?
DB: C'est une partie très importante du site car elle montre les résultats que nous obtenons et comment les gens contribuent aux résultats. Je renvoie à cette page du site d'autres scientifiques qui veulent se renseigner sur l'état actuel de la prévision de structure des protéines.

TP: Comment en êtes vous arrivé à choisir le calcul partagé?

DB: Au vu des résultats de notre groupe l'année dernière nous nous sommes dit que nous pourrions accomplir des progrès signficatifs dans le domaine des prévisions de structure des protéines, si nous disposions d'une quantité beaucoup plus grande en terme de puissance de calcul. Mais il n'y avait tout simplement aucune manière de mesurer notre puissance de calcul individuel de manière significative. J'avais entendu parler du calcul partagé  par les professeurs Charlie Brooks (Predictor) et Vijay Pande (Folding@home) que je vois de temps à autre.

TP: Comment BOINC a-t-il mis en place votre projet? Auriez-vous lancé un projet de calcul partagé sans lui?

DB: BOINC a été d'une aide inestimable!! Je ne sais pas si nous aurions pu en  arriver là sans eux. Je pense que David Anderson et l'équipe de développement de Boinc ont apporté une contribution énorme à notre projet .

TP: Avez-vous rencontré des problèmes en utilisant la plateforme BOINC?
DB: Non, aucun.

TP: Je trouve que c'est important d'aider les jeunes à s'intéresser aux maths et à la Science. Si vous étiez un professeur et que vous vouliez faire tourner ce projet dans la salle informatique de votre lycée en tant que complément aux cours de biologie, comment présenteriez-vous votre projet dans un cours de base de biologie? Les concepts peuvent être assez durs à comprendre pour un jeune.
DB: J'en conviens. Je pense que le projet pourrait être présenté dans un cours de biologie au lycée ou dans des salles informatiques. L'image du plus bas point d'altitude sur un paysage compliqué est je pense le meilleur moyen d'expliquer nos recherches à une large assistance (j'ai d'ailleurs essayé de faire comprendre ceci sur la page Web de rosetta@home).

TP:  De quelles études avez-vous eu besoin pour arriver au niveau que vous avez atteinds aujourd'hui?
DB: J'ai obtenu une thèse et j'ai fait quelques années de travail postdoctoral avant de devenir un professeur à l'Université de Washington il y a environ 13 ans.

TP: Qu'est-ce que peut faire la communauté du calcul partagé (des projets,les utilisateurs et les équipes qui participent aux projets) pour rendre accessible ce passe-temps à tous les utilisateurs moyens en informatique?
DB: Excellente question -- j'aimerais bien connaitre la réponse!

TP: Que faites-vous quand vous n'êtes pas au travail?
DB: J'ai deux gosses et je passe l'essentiel de mon temps libre avec ma famille. Nous essayons d'aller en montagne nous ballader et skier aussi souvent que possible.

TP: Vous essayez de poster fréquemmentsur le message board de votre forum. Qu'est-ce qui vous incite à le faire ?
DB: Beaucoup d'utilisateurs demandent plus de rétroactivité sur la façon dont le projet évolue et c'est le minimum que je puisse faire pour remercier les gens de la magnifique contribution qu'ils apportent au projet!!

TP: Cette interview est une première, mais dans les prochaines semaines d'autres membres seront ici pour parler avec nous, nous satisferons ainsi les questions que vous souhaiteriez que je leur pose, et elles seront présentes dans la prochaine interview. Pour celà vous pouvez utiliser cette forme de contact qui n'exige pas de s'enregistrer sur le forum. Pour finir, nous voudrions remercier tout spécialement le Dr. David Baker d'avoir pris le temps sur son programme chargé de répondre à nos quelques questions.