Les chercheurs du projet Nutritious Rice for the World (NRW) ont développé un processus de post-traitement des résultats calculés par les volontaires du World Community Grid (WCG) 260 fois plus rapide. Ils ont publié un papier décrivant comment cela a été réalisé en utilisant les Unités de Traitement Graphiques (GPU) des ordinateurs.
Résumé pour personne averti
Le post-traitement des informations calculées par les volontaires WCG de 62 000 protéines de riz exige un processus intensif, appelé clustering. Ce processus détermine la structure la plus probable pour une protéine donnée. 100 000 prédictions de structure ont été calculées pour chaque protéine.
L'algorithme détermine ensuite la structure la plus probable pour la protéine en sélectionnant les formes finales qui se ressemblent le plus. Pour accélérer radicalement ce pas de post-traitement, les chercheurs ont développé une façon de profiter des GPU. Les scientifiques ont ainsi été en mesure d'augmenter la vitesse de ce post-traitement par un facteur 260, ce qui les aidera à accélérer les pas suivants de leur recherche.
Résumé technique
Le calcul de la racine signifie que la déviation carrée (RMSD) entre l'ensemble atomique de deux structures superposées de façon optimale est une composante fondamentale de techniques de comparaison structurelles. Nous décrivons la méthode du quaternion, GPU-Q-J, qui est stable avec les calculs de simple précision et convenable pour les unités GPU. L'application a été exécutée sur une carte graphique ATI 4770 en C/C++ et en Brook+ dans Linux. NRW sur WCG a prédit les structures de plus de 62 000 petites protéines et de domaines de protéine produisant un total de 10 milliards de structures potentielles.
Les ensembles de clustering de structures sur cette échelle exigent le calcul de grande similarité de matrices se composant de RMSD entre chaque paire de structures dans le lot. Comme une épreuve en grandeur réelle, nous avons calculé les matrices pour 6 différents ensembles de NRW. La méthode GPU était 260 fois plus rapide que l'unité centrale existante la plus rapide basée sur cette méthode et plus de 500 fois plus rapide que la méthode qui avait été utilisée précédemment. GPU-Q-J est une avance significative par rapport aux méthodes d'unité centrale précédentes. Il soulage un embouteillage important dans le clustering de grands nombres de structures pour NRW. Il a aussi des applications dans les méthodes de comparaison de structure qui impliquent la superposition multiple et les pas de détermination RMSD, particulièrement quand de telles méthodes sont appliquées sur un protéome et un génome à large échelle.
Accès à la publication (en anglais).