Traduction du Message de Nathan Edwards sur le forum du projet Lattice

Qualitativement, nous pensons que ces applications sont à peu près similaires et qu'elles calculent à peu près la même chose. Nous sommes actuellement en discussion avec l'équipe du projet SIMAP pour voir comment nous pourrions utiliser leurs résultats pour éviter de calculer les séquences Pfam (Pfam est une grande collection de séquences d'alignement et de modèles de Markov cachés couvrant de nombreuses familles de protéines communes) correspondant aux séquences connues de protéines bactériennes issues des bases de données publiques. Nous nous intéressons aussi à leur application, pour voir ce que nous pouvons tirer de leur expérience, et peut-être tirer avantage de leurs efforts de développement d'une application BOINC native pour ces calculs (voir plus bas).

Les différences entre les 2 projets, telles que je les vois et d'après nos connaissances actuelles :


* SIMAP hmmer est une véritable application BOINC, avec des points de reprise des calculs, un pourcentage de progression des calculs et un certain nombre de modifications du code pour améliorer les performances d'entrée/sortie.

* Lattice HMMPfam est une application BOINC enveloppante, avec pratiquement aucun changement au code hmmpfam.  

* SIMAP hmmer est utilisé pour calculer des séquences Pfam pour toutes les séquences de protéines disponibles dans les bases de données de séquences de protéines.

* Lattice HMMPfam est utilisé pour calculer les séquences Pfam pour toutes les séquences protéiniques des bactéries issues des bases de données publiques de séquences de protéines, ainsi qu'une série de prédictions issues de Glimmer3 pour le génome bactérien. [ C'est la source de la série d'unités qu'il faut traiter actuellement]. Si vous le désirez, je serai enchanté de vous expliquer pourquoi l'ajout des prédictions de Glimmer3 est utile.

* Les 2 projets utilisent des paramètres légèrement différents vis à vis de l'application hmmpfam sous-jacente. Nous ne savons pas si ces légères différences seront significatives ou non.

* Le projet SIMAP semble très orienté vers ses 2 applications. Le but de Lattice (d'après ce que j'en sais, voir Mike et Adam pour la ligne de conduite officielle :-) semble plus être d'assister de nombreuses applications différentes se centrant sur la bioinformatique. HMMPfam est la première application de données lourdes pour Lattice, et en tant que telle, ne calcule pas seulement des choses utiles pour moi :-), mais aussi pour aider le projet Lattice à améliorer son infrastructure générale à supporter ces types d'applications bioinformatiques.