Un article relatif sur SIMAP a été publié dans le Laborjournal, le 7 Août 2006
Voire l'article original en Allemand
SIMAP : la base de données sur les similitudes entre protéines
Tous par rapport à tous
Les protéines sont les éléments les plus importants de la vie, et il y a beaucoup à faire pour les connaitre de plus près- beaucoup trop par rapport à ce qui pourrait être trouvé dans un laboratoire. C'est ici, que la bio-informatique entre en jeu. Lorsqu'un chercheur trouve une nouvelle protéine, la première étape est la comparaison de sa séquence avec d'autres, les séquences des protéines dejà connues. Des similitudes de séquence donnent des indications sur les liens de parenté entre les protéines. Comme certaines protéines utilisées ont souvent les même fonctions à l'intérieur de l'organisme, il est possible de transposer les liens de parenté d'une protéine grâce aux connaissances expérimentales.
Pour enfin pouvoir comparer toutes les séquences de protéine, des scientifiques du GSF-Forschungszentrum für Gesundheit und Umwelt (Centre de recherche pour la santé et l'environnement) du Neuherberg à Munich et de l'Université Technique de Munich (Similarity matrice of protéine) ont développé le projet SIMAP (http://boinc.bio.wzw.tum.de/boincsimap/). Thomas Rattei qui occupe la chaire de Bio-informatique génomique à l'Université Technique de Munich en est le coordinateur . Dans SIMAP, les similitudes sont calculées entre toutes les protéines connues, environ quatre millions de séquences de protéine sont actuellement présentes dans la base de donnée. Les similitudes de protéine ne sont pas tous recalculées à chaque fois, seules les nouvelles séquences qui arrivent dans la base sont intégrées à la matrice - c'est ce qu'on appelle les Updates (Mises à jours)
A partir de là, le calcul incrémental des 16000 milliards (4 millions multiplié par 4 millions) de comparaisons prendrait beaucoup trop de temps sur un ordinateur individuel (environ quatre-vingts ans), les Munichois ont recruté dans le monde entier des volontaires qui ont décidé de mettre les capacités de calcul inutilisés de leurs ordinateurs à la disposition des chercheurs. À l'aide des Communautés autour des technologies de Grid Computing (calcul partagé) se forme un super-calculateur par la mise en commun de 10.000 ordinateurs de volontaires qui offrent une capacité de calcul momentanée de plus de deux Teraflops (ou 2x1012 FLOPS), le FLOPS ( opérations à virgule flottante par seconde ) est une unité qui sert à mesurer de façon scientifique la puissance des systèmes informatiques utilisés.