hcmd

Etudier les interactions entre plus de 2200 protéines dont les structures sont connues (particulièrement celles qui ont un rôle dans les maladies neuromusculaires).


Nom anglais du projet : Help Cure Muscular Dystrophy

INSCRIPTION win

Télécharger BOINC

URL du projet : http://www.worldcommunitygrid.org/

Début de la seconde phase du projet : le 12 Mai 2009

Configuration minimale : 64 Mo de Mémoire Vive et 50 Mo d'espace disque disponible.

Liens du Projet
L'Alliance Francophone
Statistiques

 

 

  • Les résultats : Domaine public

Le World Community Grid met sa technologie à disposition des seules organisations publiques ou à but non lucratif pour qu'elles l'utilisent dans des recherches humanitaires qui, autrement, risqueraient de ne pas aboutir en raison du coup élevé de l'infrastructure informatique nécessaire en l'absence d'infrastructure publique. Dans le cadre de notre engagement à faire progresser le bien-être de l'homme, tous les résultats seront versés au domaine public et transmis à la communauté scientifique mondiale.



Sommaire :

- Les participants aux recherches
- Le projet en quelques mots
- Comment rejoindre l'Alliance Francophone
- Comment sélectionner
le projet de lutte contre la dystrophie musculaire une fois inscrit
- La gestion de son compte
- La FAQ du projet
- L'écran de veille du projet
- À propos du projet

 


Les participants aux recherches

Le projet Lutte contre la dystrophie musculaire, dirigé par le docteur Alessandra Carbone de l'université Pierre et Marie Curie à Paris, s'est associé à des équipes spécialisées en informatique distribuée (Jean-Marie Chesnaux du CNRS), modélisation moléculaire (Richard Lavery du CNRS) et analyse génétique des myopathies (Pascale Guicheney de l'INSERM).



Bio-informatique :

Informatique distribuée : Analyses des Myopathies : Modelisation Moléculaire :

 


Le projet en quelques mots :


Le World Community Grid et les chercheurs parrainés par Décrypthon, un partenariat entre l'AFM, le CNRS, l'Universite Pierre et Marie Curie et IBM, étudient les interactions entre plus de 2200 protéines dont les structures sont connues, avec un accent mis sur les protéines qui ont un rôle dans les maladies neuromusculaires. La base de données contenant les informations produites aidera les chercheurs à élaborer des molécules pour inhiber ou améliorer l'association de certaines macromolécules, ce qui pourrait améliorer les traitements des myopathies et des autres maladies neuromusculaires.

Que sont les maladies neuromusculaires et la myopathie de Duchenne ?

Le terme générique « maladie neuromusculaire » désigne un groupe de maladies (plus de 200 au total) qui affectent le fonctionnement des muscles, soit en touchant directement le muscle (dystrophie musculaire), soit indirectement en touchant le nerf moteur ou la jonction entre le nerf et le muscle. La plupart de ces maladies sont rares (moins d'une personne sur 2 000 est affectée), elles sont d'origine génétique (80% des cas) et affectent aussi bien les enfants que les adultes. Ces maladies chroniques conduisent à une diminution de la force musculaire et occasionnent un handicap sévère de la fonction motrice (mouvements, respiration, etc.). Les manifestations de ces maladies sont variables. Certaines sont progressives alors que d'autres peuvent rester stables durant plusieurs années. De plus, la même pathologie peut produire des symptômes différents d'une personne à l'autre.


Malgré les avancées des approches thérapeutiques, il n'existe à ce jour aucun traitement curatif disponible de ces maladies.

 

 

  • Comment rejoindre l'Alliance Francophone

Cliquez ici, puis appuyez sur le bouton vert "rejoindre cette équipe".

 

  • Comment sélectionner le projet de lutte contre la dystrophie musculaire une fois inscrit

Mes Projets (sélectionner Help Cure Muscular Dystrophy - Phase 2, éventuellement cocher l'option pour recevoir des unités d'autres projets lorsque aucune unité du projet choisi n'est disponible), valider en appuyant sur enregistrer (en bas à droite)

 

 

 

La gestion de son compte

Se rendre sur la page d'accueil du site WCG : www.worldcommunitygrid.org/
Choisir Mes Calculs dans le menu en haut.

Vous pouvez aussi y accéder directement en appuyant sur ce lien
Rentrer son nom de membre ainsi que son mot de passe.
Vous avez la possibilité de gérer les préférences vous concernant.
Notamment de changer votre nom de membre, d'avoir une vue d'ensemble des unités calculées, ou de changer les préférences du projet dans les options avancées.
Il est aussi possible de choisir dans Mes projets si voulez participer à un ou plusieurs projets en particulier, ou de demander à participer au bêta test de nouveaux projets.

Lorsqu'un nouveau projet arrive sur WCG, il est automatiquement coché sur tous les comptes. C'est à l'utilisateur de faire la démarche si il ne souhaite pas participer à ce nouveau projet.

 

 

 

La FAQ du projet

 

Qu'est-ce que le programme Décrypthon ?

Le programme Décrypthon, lancé en mai 2004, est né d'un partenariat entre l'AFM (Association française de dystrophie musculaire), le CNRS (Centre national français de la recherche scientifique) et IBM (www.decrypthon.fr). Le programme inclut la mise à disposition d'une plate-forme technologique de pointe reposant sur les technologies de grille (Grid Computing). Il fournit des moyens technologiques, financiers et humains et s'appuie sur la participation d'universités partenaires ainsi que sur le réseau à très haut débit RENATER (Réseau National de Télécommunications pour l'Enseignement et la Recherche) et d'utilisateurs individuels de l'Internet.

L'objectif de ce programme est de fournir aux groupes de recherche des moyens de calcul très importants via la technologie de grille, ainsi que des moyens techniques de calcul partagé, afin de faciliter et accélérer le développement de programmes de recherche dans les domaines de la biologie et en particulier des maladies neuromusculaires. Il fournit également aux chercheurs l'expertise et le support nécessaires à la validation et au portage et à la diffusion de leurs applications scientifiques sur la grille (IBM et CNRS), ainsi qu'un financement (AFM) de leur projet.

 

Quelles sont les fonctions des protéines ?

Les protéines sont à la base des mécanismes biologiques :

  • ce sont des éléments biologiques qui catalysent toutes les réactions biochimiques dans le fonctionnement cellulaire (ce sont les enzymes).
  • ce sont les éléments structuraux de base qui constituent les os, les muscles, les vaisseaux sanguins, etc.
Dans la mesure où les protéines jouent un rôle fondamental en biologie, les scientifiques ont séquencé le génome humain, qui constitue la « matrice » pour ces protéines. Il contient le code génétique qui spécifie la séquence en acides aminés, briques élémentaires qui constituent les protéines.

L'un des objectifs de la biologie moderne est de comprendre le rôle des protéines et comment elles interagissent dans la cellule.

 

Quelle est la structure d'une protéine ?

Les protéines sont de grosses molécules constituées par l'assemblage d'unités de base : les acides aminés. Les protéines ne restent pas à l'état de simples chaînes d'acides aminés, mais se replient en une forme compacte particulière (structure tridimensionnelle) qui donne la spécificité de sa fonction à la protéine.

Ainsi, la seule connaissance de la séquence en acides aminés ne suffit pas à nous indiquer le rôle de la protéine dans la cellule. Pour pouvoir assurer sa fonction, une protéine doit avoir une conformation particulière nommée « repliement tridimensionnel ». Pour jouer leur rôle, les protéines se replient par elles-mêmes. Ce processus de repliement des protéines qui est une étape fondamentale en biologie, reste un mystère.

Le nombre de conformations que peut prendre une protéine est en théorie très grand. Cependant, une seule structure correspond au repliement correct de la protéine trouvée dans l'organisme. Les cellules ont développé des mécanismes permettant d'aider les protéines à se replier correctement pour jouer leur rôle spécifique dans l'organisme.

Par ailleurs, quand les protéines ne se replient pas correctement, elles peuvent conduire à des développements pathologiques tels que la maladie d'Alzheimer, Huntington, Parkinson ou différents cancers.

Les informations obtenues sur la structure des protéines sont importantes. Elles permettent non seulement d'identifier les protéines partenaires, mais également de déterminer la manière dont ces interactions pourraient être perturbées par des mutations naturelles ou créées artificiellement dans l'une des protéines partenaires, ou encore par des molécules médicaments.

 

Qu'est-ce que la modélisation moléculaire ?

La modélisation moléculaire fait appel à des méthodes théoriques et à des moyens informatiques pour modéliser le comportement des molécules. Les méthodes de modélisation sont utilisées pour étudier la structure de systèmes biologiques comme le repliement des protéines, ou les interactions moléculaires entre une protéine et un ligand allant de systèmes biologiques simples (petites molécules) à des systèmes plus complexes (complexes de protéines).

Toutes les techniques de modélisation moléculaire décrivent les systèmes modélisés au niveau atomique. Le plus petit niveau d'information est l'atome ou un groupe d'atome.

Les interactions entre les atomes voisins (les atomes sont les plus petites unités élémentaires de la matière) peuvent être représentées par des interactions élastiques (ressort qui représente les liaisons chimiques). Un modèle mathématique complexe qui prend en compte la somme des énergies potentielles (force) décrit ces interactions entre les atomes.

Ainsi, pour des structures complexes comme les protéines (composées de centaines d'atomes pour les plus petites), la modélisation tridimensionnelle nécessite des moyens de calcul important.

 

Qu'est-ce que le docking entre une protéine et un ligand ?

Le rôle biologique de la plupart des protéines connues à ce jour n'est pas complètement élucidé. Les protéines qui participent à des processus biologiques bien décrits peuvent avoir des interactions avec d'autres protéines ou avoir d'autres fonctions qui sont sans rapport avec le processus dans lequel elles ont été identifiées initialement.

De la même manière, un grand nombre de protéines « hypothétiques » ont été décrites lors du programme de séquençage du génome humain. Pour ces protéines, la séquence en acides aminés est la seule information disponible.

Aussi, pour chaque protéine, les chercheurs tentent-ils de trouver : le(s) protéine(s) partenaire(s) in-vivo, la structure tridimensionnelle de la protéine et de ses complexes ainsi que le type d'interaction (forte ou faible) entre les partenaires.

Le docking d'une protéine et de son ligand est une technique de modélisation moléculaire qui tente de prédire la position et l'orientation (la structure tridimensionnelle) d'une protéine en relation avec un ligand (une autre protéine, de l'ADN, un médicament, etc.).

Les méthodes de docking sont fondées sur des principes purement physiques. Même les protéines de fonction inconnue (ou qui ont été très peu étudiées) peuvent être « dockées ». La seule condition préalable est que leur structure tridimensionnelle ait été déterminée expérimentalement, ou qu'elle puisse être estimée par une approche théorique (modélisation).

Les techniques de docking peuvent être utilisées pour différentes approches, principalement dans le screening (filtrage) virtuel de banques de molécules chimiques pour sélectionner des médicaments potentiels.

 

 

L'écran de veille


 

 

Economiseur d'écran/Graphiques: Quand je regarde les images de l'économiseur d'écran, sur quoi est en train de travailler mon ordinateur?

Votre ordinateur est en train de travailler sur une interaction spécifique entre protéines parmi les nombreuses dont les structures sont connues, avec l'accent mis sur les protéines qui ont un rôle dans les maladies neuromusculaires. La base de données contenant les informations produites aidera les chercheurs à élaborer des molécules pour inhiber ou améliorer l'association de certaines macromolécules, ce qui pourrait améliorer les traitements des myopathies et des autres maladies neuromusculaires.


Economiseur d'écran/Graphiques: Pourquoi y a-t-il deux molécules colorées?

Cette disctinction est faite pour représenter les deux protéines partenaires dont l'interaction est en train d'être calculée. Leurs positions respectives représentent la configuration spatiale qui est calculée par l'unité de calcul.


Economiseur d'écran/Graphiques: Que représente la barre d'avancement?

La barre d'avancement représente la progression de votre ordinateur sur l'unité en cours de calcul.

Que représentent Erelec et Etmin dans le cercle en haut à gauche de la fenêtre du graphique ?

Le but du programme de docking entre deux protéines est de trouver la configuration spatiale qui favorise au mieux le complexe entre ces deux protéines et de voir si elles ont une chance d'interagir, si elles étaient confrontées dans le monde réel, c'est-à-dire dans un système biologique. La qualité de cette interaction entre deux protéines est évaluée par une énergie d'interaction Etmin (exprimée en kcal/mol). Le terme Erelec représente la contribution électrostatique dans l'énergie d'interaction. Cette énergie dépend directement des charges électriques dans toute la protéine. Plus l'énergie d'interaction (Etmin) est négative, plus l'interaction protéine-protéine est forte.

Pour plus de détails sur le calcul de l'énergie d'interaction entre deux protéines, reportez-vous à la publication scientifique suivante : M. Zacharias, Protein-protein docking with a reduced protein model accounting for side-chain flexibility, Protein Science 12,1271 (2003) http://protsci.highwire.org/cgi/content/abstract/12/6/1271


Economiseur d'écran/Graphiques: Que représentent les deux noms dans le cercle en bas à gauche?

Il s'agit des noms des deux molécules qui tournent dans le grand cercle de l'économiseur d'écran. Ces deux molécules sont ce sur quoi votre machine est en train de calculer.


Economiseur d'écran/Graphiques: Qu'est ce que l'UPMC?

UPMC est l'acronyme de Université Pierre et Marie Curie (http://www.upmc.fr). Pour plus d'information sur la participation de l'UPMC à ce projet, cliquez ici.

Economiseur d'écran/Graphiques: Que représente le chiffre 2 derrère le nom "Help Cure Musculare Dystrophy"?

Celà indique que c'est la phase 2 du projet "Help Cure Muscular Dystrophy" qui est active. Pour plus d'information à propos de la phase 2, cliquez ici.

Economiseur d'écran/Graphiques: Qui sont les personnes représentées dans le diaporama ?

De gauche à droite :

 

Quelle est la différence entre la première phase et la seconde phase du Projet de Lutte contre la Dystrophie Musculaire?

La première phase du projet de Lutte contre la Dystrophie Musclaire" s'est terminée en Juin 2007. Les chercheurs ont analysé les résultats pour élaborer la phase 2. Leur rapport est disponible à cette adresse: http://www.ihes.fr/%7Ecarbone/HCMDproject.htm.

 

A propos du projet :

 

Du gène à la pathologie

En 1986, le premier gène impliqué dans une myopathie a été identifié : le gène de la dystrophine pour la dystrophie de Duchenne de Boulogne. Depuis, les progrès réalisés dans le domaine de l'analyse génétique ont permis d'identifier plus de 200 gènes à l'origine de maladies neuromusculaires. Cependant, la fonction et les interactions des protéines correspondantes sont généralement inconnues. Le nombre de gènes identifiés a augmenté mais les connaissances sur ces pathologies ont révélé la complexité de l'expression de ces maladies.

Toutes les cellules d'un organisme comprennent la même information génétique contenue dans l'ADN. L'expression des gènes (plus de 25 000 ont été identifiés chez l'homme et forment le génome) permet la production de protéines (plus de 45 000 ont été décrites, chaque gène codant en moyenne pour 1,6 protéines). Ces protéines assurent le fonctionnement des cellules, avec des spécificités d'expression variables selon l'organe comme les muscles. Certaines d'entre elles sont des enzymes, d'autres sont des molécules impliquées dans des voies de signalisation. D'autres encore sont des récepteurs qui se lient à d'autres protéines appelées ligands avec une affinité et une spécificité très grandes (comme celles que l'on observe entre une clé et une serrure). Enfin, certaines peuvent être des protéines structurales. La structure tridimensionnelle de la protéine (structure 3D) détermine ses interactions avec les autres constituants de la cellule, et donc sa fonction.

Le fonctionnement des muscles est dépendant d'un grand nombre de protéines. Ces dernières sont localisées et agissent à différents niveaux de la cellule musculaire, du corps cellulaire ou de l'axone du motoneurone qui stimule le muscle. Elles peuvent également se trouver à la jonction neuromusculaire entre le nerf et le muscle.

La plupart des maladies neuromusculaires sont dues à des mutations génétiques, c'est-à-dire des mutations dans certains gènes qui provoquent des anomalies dans les protéines correspondantes. Ces mutations entraînent la formation de protéines non fonctionnelles, voire partiellement fonctionnelles, ou peuvent même conduire à l'absence totale de synthèse de la protéine. Les pathologies neuromusculaires sont différentes selon la protéine impliquée et sa localisation.

Pour que les chercheurs puissent comprendre les maladies neuromusculaires, ou comment les protéines cessent d'assurer leur rôle fonctionnel dans le muscle ou le nerf, ils ont besoin de connaître en détail la fonction et les interactions des protéines impliquées dans ces pathologies.

La connaissance de la fonction et des interactions des protéines est également nécessaire pour aider les chercheurs à concevoir des stratégies thérapeutiques. En l'absence de ces connaissances vitales, ils ne pourront pas développer de thérapies innovantes pour la grande majorité des maladies neuromusculaires.

 

Le World Community Grid et le projet Décrypthon d'assemblage moléculaire

Le projet de Lutte contre la Dystrophie Musculaire utilisera la puissance du World Community Grid pour déterminer les interactions protéine-protéine pour plus de 2.200 structures protéiques connues et non redondantes. Ces protéines sont archivées dans la Banque de Données des Protéines. Parmis les protéines analysées, vous trouverez une bonne part de protéines jouant un rôle dans les mutations génétiques observées dans les cas de pathologie neuromusculaire.

Ce projet permettra la création d'une base de données contenant des informations sur les sites d'interactions potentielles des protéines qui auront été analysées. Des travaux complémentaires permettront d'étudier les interactions de ligands avec l'ADN (tels que des médicaments). L'intérêt thérapeutique est important, car s'il est possible de modéliser une petite molécule pour inhiber ou augmenter l'interaction d'une molécule avec un partenaire, il est beaucoup plus difficile de comprendre comment cette même molécule peut influencer directement ou indirectement d'autres interactions existantes.

L'approche proposée dans ce projet combine l'utilisation d'informations évolutionnistes (comment l'évolution a modifié les protéines pour améliorer leurs fonctions) et la modélisation moléculaire (détermination par calculs informatiques de la position relative de deux partenaires qui interagissent entre eux) pour identifier des interactions potentielles entre deux protéines.

La modélisation moléculaire fait appel à des méthodes théoriques et à des moyens informatiques pour modéliser le comportement des molécules. Ces méthodes et techniques servent à étudier la structure des systèmes biologiques comme le repliement des protéines, ou l'identification de liaisons entre une protéine et un ligand allant de l'analyse de petites molécules à des systèmes plus complexes (interactions entre plusieurs protéines).

L'assemblage entre une protéine et son ligand (docking) est une technique de modélisation pour prédire la position et l'orientation (structure tridimensionnelle) d'une protéine en relation avec son ligand (une autre protéine, l'ADN, un médicament, etc.). Les méthodes de docking sont fondées sur des principes purement physiques. Même les protéines de fonction inconnue (ou qui ont été très peu étudiées) peuvent être « dockées ». La seule condition préalable est que leur structure tridimensionnelle ait été déterminée expérimentalement, ou qu'elle puisse être estimée par une approche théorique (modélisation).

L'approche par docking moléculaire commence généralement par l'interrogation d'une base de données de molécules de structure tridimensionnelle connue, en essayant de trouver des paires de molécules qui ont une affinité à se lier entre elles. Cette affinité est évaluée à l'aide d'une fonction calculant pour chaque interaction un score. Au final, un classement des paires de molécules présentant les meilleures caractéristiques de liaison pour une protéine ciblée est établi. La qualité de l'interaction est caractérisée par une composante géométrique et une composante chimique. La composante géométrique détermine la manière dont les surfaces (structure tridimensionnelle) des molécules interagissent entre elles, à la manière d'une main dans un gant. La composante chimique décrit la qualité des interactions atomiques entre les deux molécules partenaires (les interactions moléculaires sont-elles fortes ou faibles ?).

Pour les structures complexes telles que les protéines (les plus petites structures sont composées de milliers d'atomes), il faudrait un temps de calcul considérable pour déterminer les protéines qui ont une affinité à se lier entre elles. Grâce à World Community Grid, les calculs nécessaires pour calculer ces docking prendra énormément moins de temps. Pour les 168 premières protéines sélectionnées lors de la première phase, la durée de calcul processeur était de 8.000 années. Avec 2.246 protéines pour la seconde phase, la durée de calcul estimée est de  11,46 x 8000 = 91.680 années de calcul World Community Grid (World Community Grid a une puissance de calcul d'environ 300 années de calcul processeur par jour)

Une solution pour franchir cette barrière du temps de calcul est d'utiliser les informations liées à l'évolution des protéines pour prédire les sites potentiels d'interactions. Un docking moléculaire peut ainsi être réalisé pour les surfaces des protéines qui ont le plus de chance d'interagir entre elles. Cette analyse préliminaire fondée sur l'évolution des protéines permet de réduire considérablement le temps de calcul par un facteur 100, et ainsi d'étendre l'analyse à un plus grand nombre de protéines en sollicitant l'aide essentielle du World Community Grid. Sans l'aide du World Community Grid, les temps de calcul nécessaires pour mener ce projet avec un grand nombre de protéines seraient prohibitifs.

Les volontaires qui mettent leur PC à la disposition du World Community Grid participeront à ce programme de recherche des meilleurs partenaires protéine-protéine. Leur participation permettra de mener à bien d'autres projets conduits par l'AFM, le CNRS, l'INSERM et d'autres acteurs scientifiques. Ils contribueront ainsi à l'élaboration d'outils qui amélioreront les connaissances scientifiques indispensables au développement de thérapies nouvelles pour les maladies rares.