riz2
WCG
riz1
Nutritious Rice for the World (du riz pour l'Humanité)

Améliorer le rendement, la qualité nutritionnelle du riz par l'utilisation de la technique dite d'hybridation intelligente ou de sélection assistée par marqueurs

INSCRIPTION

Télécharger BOINC (tutoriel)

URL du projet : http://www.worldcommunitygrid.org/

Lancement du projet : le 12 Mai 2008

Configuration minimale : 128 Mo de Mémoire Vive et 200 Mo d'espace disque disponible.

Articles connexes : Toute l'Actualité des projets WCG

Liens du Projet
L'Alliance Francophone
Statistiques

 

Vidéo de présentation du projet par le Dr Ram Samudrala (sous-titrage en français)

 

 

 

Introduction
 

Statut et résultat du projet :

 Les progrès et les découvertes de cette recherche sont présentés sur le site internet du groupe de recherche en bio-informatique de l'Université de Washington. Pour discuter de ce projet, vous pouvez consulter le forum du projet Nutritious Rice for the World (en anglais)

Pour vous permettre de visualiser le travail effectué au niveau protéique, chaque protéine est représentée sur l'image ci-dessous par un point de couleur dans une grille de 200x200. Les couleurs indiquent le statut de chacune des protéines (environ 40.000 protéines sont étudiées par le projet, 100.000 structures en trois dimensions seront générées pour chaque protéine).

statut
Calculé
En cours de calcul
Non encore traité

Cette image sera régulièrement mise à jours

riz1Mission

Ce projet a pour ambition de prédire la structure des protéines qui composent les principales variétés de riz. L'objectif serait d'aider les agriculteurs à cultiver de nouvelles variétés de riz plus productives, plus résistantes aux maladies et aux déprédateurs, mais également de proposer un large choix de nutriments bio-disponibles pour l'ensemble de la population mondiale (et spécialement dans les régions durement touchées par la malnutrition)

Il est extrêmement difficile et couteux de déterminer la structure des protéines. Cependant, avec l'informatique, il est possible de prédire la structure d'une protéine à partir de sa séquence ADN. Pour mener à bien ce travail, le groupe de recherche en bio-informatique de l'université de Washington a développé une application à la pointe de la technologie. Des milliers de protéines différentes peuvent entrer dans la composition d'un grain de riz. La recherche menée représente donc un challenge informatique qu'un unique ordinateur ne pourrait pas résoudre dans un délais raisonnable. C'est pour cette raison que les volontaires du programme World Community Grid sont invités à apporter leur aide pour mener à bien ce travail colossal.  L'espoir serait d'améliorer les rendements et la qualité du riz en collaboration avec des agronomes et des cultivateurs.

L'importance de cette recherche

La faim et la malnutrition restent le risque principal pour la santé dans le monde. Près de 30% de la population mondiale souffre de malnutrition. [1]. Chaque année, 10 millions de personnes meurent de faim ou de maladies liés à la malnutrition. La réalité des chiffres montre qu'il y a chaque année plus de mort de la faim ou de malnutrition que de morts du SIDA, de la malaria et de la tuberculose réunis [2].
Le riz est l'aliment de base pour plus de la moitié de la population mondiale. 20% des apports énergétiques de tout les hommes, de toutes les femmes et de tout les enfant de notre planète proviennent de la consommation du riz. En Asie, plus de 2 milliards de citoyens tirent 70% de leur apport énergétique journalier de la consommation du riz ou de ses dérivés [3].
De nouvelles variétés de riz plus productives, plus résistantes et d'une meilleure qualité nutritionnelle pourrait impactées positivement la vie de milliards de personnes.

L'approche du projet

Traditionnellement, de nouvelles variétés de riz sont obtenues en croisant différentes variétés existantes pour produire des hybrides présentant des caractéristiques supérieures. Cependant, cette technique se limite à croiser des variétés qui ont des caractéristiques facilement observables.
Les caractéristiques complexes (un meilleur rendement,  la résistance aux maladies ou la qualité nutritionnelle) sont le résultat d'intéractions bio chimiques complexes entre les protéines composant le grain de riz. Identifier ces protéines et en apprendre davantage sur leurs propriétés et leurs interactions offrira la possibilité aux agriculteurs de choisir les meilleures candidats pour l'hybridation. La prédiction de la structure de ces protéines pourra aider à comprendre quel est le rôle biochimique de ces protéines dans la détermination des caractéristiques du riz

1. Chiffres de l'Organisation des Nations Unies pour l'alimentation et l'agriculture (voir ce document .pdf intitulé "le spectre de la malnutrition").
2. Chiffres du Programme Alimentaire Mondial (vous pouvez consulter le discours intitulé "Horizon of Hope" prononcé par John M. Powell, directeur exécutif adjoint chargé des affaires extérieures et de la mobilisation des ressources au Programme alimentaire mondial)
3. Selon l'Organisation des Nations Unies pour l'alimentation et l'agriculture (vous pouvez consulter le communiqué de presse "Le riz, c’est la vie: Réunion de la Commission internationale du riz")

 

SOMMAIRE :

 

  • Comment rejoindre l'Alliance Francophone

Cliquez ici, puis appuyez sur le bouton vert "rejoindre cette équipe".

 

  • Comment sélectionner le projet Nutritious Rice for the World une fois inscrit

Mes Projets (sélectionner Nutritious Rice for the World, éventuellement cocher l'option pour recevoir des unités d'autres projets lorsque aucune unité du projet choisi n'est disponible), valider en appuyant sur enregistrer (en bas à droite)

 

  • Les résultats : Domaine public

Le World Community Grid met sa technologie à disposition des seules organisations publiques ou à but non lucratif pour qu'elles l'utilisent dans des recherches humanitaires qui, autrement, risqueraient de ne pas aboutir en raison du coup élevé de l'infrastructure informatique nécessaire en l'absence d'infrastructure publique. Dans le cadre de notre engagement à faire progresser le bien-être de l'homme, tous les résultats seront versés au domaine public et transmis à la communauté scientifique mondiale.

 

 


La gestion de son compte
Se rendre sur la page d'accueil du site WCG : www.worldcommunitygrid.org/
Choisir Mes Calculs dans le menu en haut.

Vous pouvez aussi y accéder directement en appuyant sur ce lien
Rentrer son nom de membre ainsi que son mot de passe.
Vous avez la possibilité de gérer les préférences sur le projet World Community Grid
Notamment de changer votre nom de membre, d'avoir une vue d'ensemble des unités calculées, ou de changer les préférences du projet dans les options avancées.
Il est aussi possible de choisir dans "Mes projets" si voulez participer à un ou plusieurs projets en particulier, ou de demander à participer au bêta test de nouveaux projets.

Lorsqu'un nouveau projet arrive sur WCG, il est automatiquement coché sur tous les comptes. C'est à l'utilisateur de faire la démarche si il ne souhaite pas participer à ce nouveau projet.


A propos du projet

L'hybridation intelligente ou sélection assistée par marqueurs (Marker assisted breeding)

Les méthodes traditionnellement utilisées pour obtenir des variétés hybrides de riz consistent à mélanger différentes variétés ayant des caractéristiques favorables. Une des limites de ce processus est que ces caractéristiques (également connu sous le nom de phénotype) doivent être clairement observables. Les différentes versions des gènes n'ont pas toujours un phénotype évident et il est possible de passer à coté de nombreuses mélanges qui pourraient se révéler favorables.
 
Pour contourner ce problème, l'hybridation intelligente utilise des séquences ADN du riz qui ont été récemment révelées. Dès lors que la séquence ADN du gène qui nous intéresse est connu, les cultivateurs pourront identifier les caractéristiques  de telle ou telle souche de riz même si le phénotype est imperceptible ou caché.

Le Génome du Riz
 
Alors que le séquençage du génome du riz est maintenant terminé, toutes les questions se déplacent vers l'identification des gènes qui participent à l'amélioration du rendement, de la résistance aux maladies et de l'apport nutritionnel d'un grain de riz. Cette recherche est extrêmement complexe, car très peu de plants de céréales ont été séquencés et, par conséquent, bon nombre des gènes du riz ne ressemble à aucun autres gènes aux fonctions connues.

Prévision de la Structure d'une Protéine
 
Les gènes dictent la construction des protéines qu'ils codent. Les protéines sont des molécules qui se plient sous une forme ou une structure atomique spécifique. Cette structure donne souvent une idée de sa fonction. Il est extrêmement laborieux de déterminer expérimentalement la structure d'une protéine - cela peut prendre des années pour une protéine simple. Heureusement, des prévisions précises des structures protéiques peuvent être réalisées à partir de l'ADN des gènes en utilisant des simulations sur ordinateur. Le groupe de recherche en bio informatique à l'université de Washington a développé Protinfo, qui peut produire des structures de protéine à un coût et dans un lapse de temps réduit.

rix2Protinfo & World Community Grid
 
Pour effectuer des modélisations tridimensionnels pour des dizaines de milliers de protéines du riz, le projet utilise Protinfo. Ces modèles 3D sont alors utilisés pour prévoir la fonction de chacune de ces protéines et pour comprendre le rôle du gène qui les code. Les modèles, et toutes les analyses permettant de les étudier, seront hébergés dans la base de données et sur le serveur Bioverse, un cadriciel qui permet de relier des molécules telles que les protéines et l'ADN aux mécanismes d'apparition et au système d'un organisme.
 
rizLes ordinateurs des volontaires sur WCG utiliseront le logiciel Protinfo pour créer des modélisations de toutes les protéines codées par le génome du riz dont la structure peut être prévue avec certitude. Ces modèles seront analysés pour au final ne garder que les meilleurs. À partir des structures résultantes, des outils de prévision seront utilisés pour déterminer la fonction de chaque protéine et le rôle du gène qui la code. En utilisant la puissance de Protinfo, WCG examinera pour commencer plus de 10.000 gènes, et produira 100.000 modèles par gène. Générer ce milliard de modèles sur les 320 processeurs du groupe de recherche en bio-informatique prendrait environ 30 ans. Avec WCG, ce travail sera effectué en une année.

Ces connaissances aboutiront si tout va bien au développement de variétés de riz hybrides améliorés avec un plus grand rendement, une plus grande résistance aux maladies et aux parasites, et un large choix d'éléments nutritifs biodisponibles. Ces connaissances pourront également être élargies à d'autres cultures vivrières telles que le blé et le maïs.



Les participants aux recherches
 
Groupe de recherche en bio-informatique
Unité de Microbiologie
Université de Washington, Seattle
 http://compbio.washington.edu/

La recherche scientifique effectuée sur ce projet est le fruit d'une collaboration entre tous les membres (présents et passés) du groupe de recherche en bio informatique, avec l'ensemble de la communauté scientifique. Les membres de ce groupe de recherche sont cités pour avoir rendu ce projet une réalité par l'implémentation d'un programme dédié à la prédiction de la structure des protéines, la construction d'une base de donnée et l'analyse des résultats

- Dr. Ram Samudrala, directeur de recherche.
- Dr. Ling-Hong Hung, programmeur et chercheur.
- Michal Guerquin, directeur de projet

 

 

 

 FAQ du projet


  • Pourquoi le riz? 
  • Qu'est-ce qu'une protéine?
  • Que font les protéines?
  • Que nous dit la structure d'une protéine?
  • A quoi ressemblent les protéines?
  • Pourquoi avons-nous besoin de prédire la structure d'une protéine?
  • En quoi Protinfo est-il différent des autres approches?
  • Pourquoi la prédiction de la structure d'une protéine est-elle si difficile?
  • Économiseur d'écran/Graphiques: que représente la forme qui tourne sur elle même au centre de l'image?
  • Économiseur d'écran/Graphiques: que représente le graphe rouge intitulé RAPDF?
  • Économiseur d'écran/Graphiques: que représente l'arrière-plan?
  • Économiseur d'écran/Graphiques: puis-je regarder l'information d'une autre façon?
  •  Quels sont les pré requis pour participer au projet Nutritious Rice for the World?
  •    
     
    Pourquoi le riz?
    Le riz, le maïs et le blé sont les trois principales céréales dans le monde, fournissant 43% des calories alimentaires consommées dans le monde.  
    Le riz est la seule céréale qui a vu son génome séquencé. Même si son génome est différent du génome humain ou de celui d'autres mammifères, le riz est néanmoins un bon modèle pour les autres céréales.  Les leçons apprises sur la façon dont les fonctions et les interactions des gènes du riz interagissent devraient être utiles pour comprendre la génétique et la biologie des plus importantes cultures céréalières.
     
     
    Qu'est-ce qu'une protéine?
    Les protéines sont de grandes biomolécules constituées d'une ou de plusieurs chaînes d'acides aminés. La disposition des différents types d'acides aminés qui constituent la chaîne détermine la structure et les propriétés des protéines. Une protéine est synthétisée par la transcription et la traduction de la séquence ADN du gène qui lui correspond. Ainsi, alors que l'ADN peut être considéré comme le grand plan moléculaire de la vie, les protéines portent les instructions contenues dans ce plan.
     
     
    Que font les protéines?
    Que ne font-elles pas? Certaines protéines sont structurantes comme le collagène et la kératine qui constituent le système pileux, la peau et les ongles. Certaines sont des enzymes qui catalysent les réactions chimiques nécessaires à toutes les activités du métabolisme. D'autres ont des fonctions importantes de signalisation et de retour d'information qui assurent que les cellules font ce qu'elles sont censées faire et ne croissent pas de façon désordonnée.
     
     
    Que nous dit la structure d'une protéine?
    Les protéines sont régies par les mêmes règles que n'importe quelle autre molécule. La structure d'une protéine, ou comment elle se replie, détermine sa fonction. Par exemple, l'arrangement précis des groupes chimiques actifs de différents acides aminés de la chaîne d'une protéine sur le site actif d'un enzyme détermine son activité catalytique. Un autre exemple est l'emplacement des groupes chargés positivement sur la surface pour permettre aux protéines d'ADN de s'attacher au squelette de l'ADN chargé négativement. De plus on peut souvent identifier le rôle d'une protéine de fonction inconnue en comparant sa structure aux structures de protéines connues.
     
     
    A quoi ressemblent les protéines?
    Les protéines sont trop petites pour être visibles au microscope traditionnel. Il est possible de voir les plus grosses protéines et les assemblages de protéines au microscope électronique ou au microscope à force atomique. Les structure de protéines que vous avez l'habitude de "voir" sont des représentations haute résolution déterminées par la cristallographie aux rayons X ou par Résonance Magnétique Nucléaire (RMN).
     
     
    Pourquoi avons-nous besoin de prédire la structure d'une protéine?
    La prédiction est la seule alternative viable aux techniques expérimentales qui peuvent être extrêmement laborieuses et demander des mois ou des années d'efforts.
     
     
    En quoi Protinfo est-il différent des autres approches?
    La prédiction de structure de protéine est une branche active de la recherche, et aucune méthode ou méthodologie n'est la meilleure pour toutes les situations. Le succès auprès du public de projets comme Folding@Home, POEM@Home, Human Proteome Folding et Rosetta@Home est une preuve de l'intérêt soulevé pour résoudre ces problèmes exigeants en calculs. Nous voulons offrir une autre approche qui diffère de façon subtile mais significative et qui peut fournir des résultats complémentaires et compétitifs.
     
    Certaines approches (comme Folding@Home et POEM@Home) simulent le repliement de la protéine comme on croit qu'il a lieu en réalité, en minimisant les énergies physiques. Protinfo (comme Human Proteome Folding et Rosetta@Home) utilise une minimisation des "énergies statistiques" pour identifier des structures de protéines semblables, mais avec une approche différente. Plutôt que de se baser sur une seule fonction complexe d'énergie, Protinfo utilise une fonction simple, facilement calculable, et choisit les meilleures structures en poursuivant par un ensemble de fonctions plus sophistiquées. Une autre différence est que Protinfo utilise une nouvelle  méthodologie d'échantillonnage continu qui nous permet d'explorer les bonnes structures d'une manière plus détaillée. La méthodologie d'échantillonnage continu demande peu de mémoire et l'exécution de notre fonction d'énergie compacte est très rapide. Ceci permet à Protinfo de tourner sur presque n'importe quel ordinateur.
     
    Depuis 1994, la prédiction de structures effectuée par Protinfo a été reconnue comme faisant partie des méthodes les plus efficientes lors de la compétition Critical Assessment of Structure Prediction (CASP). Vous pouvez trouver plus d'information sur Protinfo dans les pages "Recherche" de ce projet.
     
     
    Pourquoi la prédiction de la structure d'une protéine est-elle si difficile?
    Deux facteurs rendent la prédiction de la structure d'une protéine difficile : la nature des fonctions d'énergie et le champ d'action de la recherche.
     
    L'environnement d'une protéine est peuplé de beaucoup d'autres atomes et molécules. Si le programme simulait un processus se déroulant dans le vide ou même dans un solvant non polarisé (au lieu de l'environnement aqueux qu'est le cytoplasme) ce serait beaucoup plus facile. La présence de molécules polarisées et polarisables présentes dans le solvant complexifie énormément le calcul précis des forces électrostatiques. De plus, la "force" principale lors du repliement d'une protéine est l'effet hydrophobique. Cette force résulte des interactions entre les atomes de la protéine, de leurs interactions avec les atomes du solvant et des interactions entre les atomes du solvant. Dans les simulations telles que Protinfo, Human Proteome Folding, et Rosetta@Home, l'effet de ces interactions dépendantes du solvant est estimé par le calcul d'énergies statistiques. Le développement de meilleurs modèles et simulations du solvant est une autre branche active de la recherche pour finalement venir à bout de ces problèmes.
     
    Le second facteur limitatif est le nombre de structures (ou conformations) possibles qui doivent être échantillonnées pour une protéine. Même avec une fonction d'énergie extrêmement précise, il est toujours nécessaire d'échantillonner les conformations possibles suffisamment finement pour trouver la bonne. Non seulement le nombre de conformations possibles est énorme (voir le paradoxe de Levinthal), mais il est rendu encore plus difficile par le paysage énergétique extrêmement compliqué. La plupart des techniques courantes d'optimisation globale qui pourraient être utilisées avec une fonction se comportant correctement vont échouer quand on les applique au repliement des protéines. Heureusement, de ces deux problèmes celui-ci est certainement le moindre. Avec la puissance accrue des processeurs et les techniques d'échantillonnage améliorées, des structures exactes sont couramment générées - mais en l'absence d'une fonction d'énergie parfaitement exacte nous ne sommes pas toujours capable de les identifier. 



    L'écran de veille

    riz

     

     
    Économiseur d'écran/Graphiques: Que représente la forme qui tourne sur elle même au centre de l'image?
    C'est une représentation de la dernière structure prédite par votre ordinateur.
     
     
    Économiseur d'écran/Graphiques: Que représente le graphe rouge intitulé RAPDF?
    C'est le score de la meilleure structure du moment. Le score provient de la fonction Residue-specific All-atom conditional Probability Discriminatory Function (RAPDF où Fonction des Résidus Spécifiques de la Discrimination de la Probabilité s'appliquant à l'Ensemble des Atomes) qui calcule les similarités entre la structure de la protéine prédite et la structure réelle. Les meilleurs structures ont un score bas. Vous pouvez trouver davantage d'information dans les pages Recherche de ce projet.  
     
     
    Économiseur d'écran/Graphiques: Que représente l'arrière-plan?
    L'arrière-plan représente une rizière en Asie.
     
     
    Économiseur d'écran/Graphiques: Puis-je regarder l'information d'une autre façon?
    Lorsque vous regardez les graphiques, vous pouvez également utiliser les commandes-clavier qui vous permettront de modifier la façon dont l'information est affichée.
    Ces touches ne fonctionnent que dans la version affichage à la demande des graphiques, elles seront sans effet en mode économiseur d'écran (en fait elles feront sortir du mode économiseur comme toute autre touche).
     
    Unité de travail:
    M montre ou cache les informations relatives au participant
    I agrandit ou réduit la taille du graphe RAPDF
     
    Visualisation de la protéine:
    B montre ou cache le squelette de la protéine
    S montre ou cache les atomes de la structure
    Lorsque les atomes sont montrés par la commande précédente
      C montre ou cache les atomes de carbone C et Calpha
      A montre ou cache les atomes de carbone Calpha
      N montre ou cache les atomes d'azote
      O montre ou cache les atomes d'oxygène
     
     
    Quels sont les prérequis pour participer au projet Nutritious Rice for the World?
     
    Les pré requis pour Windows sont:
    - au moins 128 Mo de mémoire RAM (avec la mémoire virtuelle activée)
    - 200 Mo sur le disque dur avec au moins 50 Mo disponibles  
    - la capacité d'afficher des graphiques 8-bits avec une résolution de 640x480
    - une connexion Internet avec un débit minimum de 28 kbps
    - Systèmes d'exploitation supportés: Windows 98, ME, 2000, XP ou Vista
     
     
    Les pré requis pour Linux sont:
    - au moins 128 Mo de mémoire RAM (avec la mémoire virtuelle activée)
    - 200 Mo sur le disque dur avec au moins 50 Mo disponibles  
    - la capacité d'afficher des graphiques 8-bits avec une résolution de 640x480
    - une connexion Internet avec un débit minimum de 28 kbps
    - Système d'exploitation supporté: Linux
       
    Les pré requis pour Mac sont:
    - un processeur Intel ou PowerPC
    - au moins 128 Mo de mémoire RAM (avec la mémoire virtuelle activée)
    - 200 Mo sur le disque dur avec au moins 50 Mo disponibles  
    - la capacité d'afficher des graphiques 8-bits avec une résolution de 640x480
    - une connexion Internet avec un débit minimum de 28 kbps
    - Système d'exploitation supporté: OS/X