29 Juin 2006

Aujourd'hui j'ai rencontré les personnes qui conçoivent les programmes de sciences des lycées et collèges publics pour discuter de la possibilité d'incorporer rosetta@home dans les cours de science. Je pense que participer à un vrai projet de recherche pourrait être plus inspirant que de juste apprendre de la théorie ; Je n'ais moi même presque jamais trouvé  les cours de science très amusant ou intéressant -- ce qui est passionnant c'est de découvrir les nouvelles choses davantage que d'apprendre des choses découvertes  il y a bien longtemps. Quoi qu'il en soit, ils étaient très intéressés et nous devrions avoir quelques projets pilotes dans ces écoles.

Ce message board a été ce qui m'a donné l'idée pour monter un tel projet -- il m'a été vraiment amusant et gratifiant d'essayer d'expliquer notre recherche et de répondre à toutes vos questions. En vue de rendre le projet plus éducatif, nous travaillons, avec l'aide d'un expert de Microsoft en la matière , pour accroitre la réotractivité avec vous les participants en ce qui concerne les résultats que vos propres ordinateurs calculent. Si tout va bien vous le découvrirez dans peu de temps.

 

28 Juin 2006

Les cibles du CASP (Critical Assessment of techniques for protein Structure Prediction - concours international des meilleurs programmes de prédiction de repliement des protéines) continuent à nous être renvoyés et nous sommes pleinement occupés à analyser les résultats. Nous avons moins d'un jour pour chaque cible. En comparant ceci avec le temps nécessaire pour résoudre ce type de structure à l'aide de la cristallographie aux rayon X ou de la R.M.N. (Résonnance Magnétique Nucléaire) :  il aurait fallu une bonne année, et souvent grâce à l'aide considérable de l'intuition humaine. Peut-être que les prédictions de structures expérimentalement déterminées seraient légérement meilleure en qualité mais c'est sans commune mesure avec le temps qu'il faudrait passer pour arriver à un résultat finalement très proche.


Deux questions pertinantes ont été soulevée sur le crunching boards :

Etant donné que de nouvelles méthodologies sont en développement, il y aurait-t-il un moyen pour améliorer le mécanisme utilisé qui consiste en quelque sorte à chercher une aiguille dans une botte de foin et de plutot commencer par exemple à se concentrer autour de la structure réelle des proteines ?

Réponse : les bons modèles seront toujours une fraction infime des structures générés juste parce qu'il y a énormément de conformations (arrangements) alternatifs pour une chaîne de protéine. Mais pour avoir confiance en les prédictions obtenues, il doit y avoir une convergence entre les plus basses énergies obtenues sur une structure simple. Comme nos méthodes s'améliorent et que la puissance de calcul augmente, trouver les bons modèles équivaudra toujours à trouver une « aiguille dans une botte de foin » dans la totalité de la population globale, mais dominera de plus en plus dans cette population les modèles ayant les plus basses structures énergétiques


Et est-ce que ce le but  (d'après ce que je comprends) du projet se déplace vers une phase de conception/d'assemblage moléculaire?

Réponse : Non, alors ça c'est la solution au problème de prévision de structure, ce n'est pas nécessaire pour la réussite de la conception et de l'assemblage moléculaire (certainement, bien que, des méthodes plus précises de prévision effectuent les deux domaines). Nous avons déjà eu des succès considérables avec la conception et la modélisation moléculaire. Après le CASP nous mettrons en place la phase d'assemblage moléculaire et nous concevrons des calculs sur l'application rosetta@home, tout comme nous continurons à améliorer nos méthodes de prévision de structure.

 

21 juin 2006

Les cibles de CASP continuent à entrer, et nous avons plus à faire que jamais--notre « salle de commande du CASP » avec Rhiju, Bin et d'autres personnes qui passent rageusement à travers les cibles, des morceaux de papier avec diverses informations sur chacune des cibles dispersé un peu partout dans la pièce, etc. vous pouvez imaginer la scène !

Les structures de quelques unes des cibles ont maintenant été publié , mais ils sont tous dans la catégorie « comparative modeling » (modélisation comparative)  c'est à cet endroit que la copie d'une structure connue donne déjà une bonne solution (nous essayons d'affiner ces modèles commençants en utilisant la partie du protocole de Rosetta fonctionnant en haute résolution). Nous n'avons pas employé Rosetta pour calculer ces protéines car ils prennent moins du temps. Nos résultats sont bons comparés à ceux des serveurs automatiques, mais nous ne saurons pas de quelle façon ils s'assemblent comparé aux résultats des autres participants et ceci jusqu'à la réunion de novembre.

Nous avons obtenu plusieurs nouvelles passionnantes hier d'une expérience analogue de prévision appelé CAPRI sur un assemblage protéine-protéine. Pour ce problème, qui consiste à trouver la plus basse énergie pour un arrangement couplé de deux structures de protéine et qui donne les coordonnées des protéines prisent isolement, notre approche est très semblable à ce qui fonctionne sous rosetta@home--il y a une première recherche en basse résolution suivie de l'affinage au niveau atomique. Chu Wang, un étudiant agrégé du groupe, a fait une prévision pour la série la plus récente de CAPRI, et elle s'est s'averée être mieux faite que toutes les autres prévisions fait par le groupe :

http://capri.ebi.ac.uk/round10/R10_T26/ (déroulez jusqu'en bas « medium predictions »( « prévisions moyennes ») ; nous en sommes au groupe 80).


En conclusion, pour répondre à une question posée sur le forum de discussion, beaucoup de protéines se composent d'une multitude de « domaines » indépendamment pliés. Dans la plupart des cas, il est possible d'identifier l'ordre de l'acide aminé à l'endroit même où sont situés les frontières entre les domaines, et dans ces cas nous effectuons des calculs de repliement séparément pour chaque domaine. Ceci à fin de produire des modèles pour différentes parties d'un ordre d'acide aminé, et nous devons alors assembler ces derniers dans une structure cohérente. Pour celà nous employons un protocole encore très semblable à celui que vous faites fonctionner, sauf que la seule variation permise est dans l'éditeur de liens entre les domaines, en général autour 10 résidus, alors que la structure à l'intérieur du domaine est maintenue fixe (c'est tout à fait analogue au problème d'assemblage moléculaire que j'ai mentionné ci-dessus).