WCG - Africa Rainfall Project : Mise à jour de juillet
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Si vous donnez actuellement de la puissance de calcul à ce projet, vous pouvez apporter une simple modification à vos paramètres pour accélérer la progression.
- Affichages : 1051
Lire la suite : WCG - Africa Rainfall Project : Mise à jour de juillet
WCG - Microbiome Immunity Project : Mise à jour de juillet
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Comme nous l'avons annoncé le mois dernier, le temps du Microbiome Immunity Project sur le World Community Grid se termine, mais l'analyse des données bat son plein. Ce sera la dernière mise à jour mensuelle de ce projet.
- Affichages : 927
Lire la suite : WCG - Microbiome Immunity Project : Mise à jour de juillet
Environ 300 millions de petites molécules travaillent pour OpenPandemics - COVID-19 dans le cadre du test du système
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Le récent test de résistance sur World Community Grid a permis aux chercheurs d'exécuter rapidement des simulations pour 300 millions de petites molécules.
Contexte
OpenPandemics - COVID-19 a été créé pour aider à accélérer la recherche de traitements COVID-19 potentiels. Le projet vise également à créer une boîte à outils open source à réponse rapide qui peut aider tous les scientifiques à rechercher rapidement des traitements en cas de futures pandémies.
Fin 2020, nous avons annoncé la sélection de 70 composés (sur un groupe original d'environ 20 000) qui pourraient être prometteurs pour être étudiés en tant qu'inhibiteurs potentiels du virus qui cause le COVID-19. Des tests en laboratoire sont actuellement en cours pour certains de ces composés (voir la fin de ce rapport pour plus de détails).
Fin avril et début mai, nous avons fourni à World Community Grid environ 30 000 lots d'unités de travail GPU. Cela faisait partie d'un test de résistance de l'infrastructure du World Community Grid et du flux de travail d'analyse, et a rapidement généré une très grande quantité de données pour nous.
Qu'avons-nous appris du récent test de résistance (stress test) ?
Le test de résistance a été un excellent exercice pour découvrir les goulots d'étranglement dans notre flux de travail. En raison de l'ampleur presque incroyable des résultats renvoyés - l'équivalent d'environ 3/4 du nombre de résultats du processeur pendant un an en une semaine - il nous est devenu évident que le principal goulot d'étranglement était ce que nous appelons en interne « réhydratation/analyse ». C'est l'étape où nous convertissons le soi-disant "génome" décrivant l'emplacement, la rotation et l'état de torsion d'un résultat d'amarrage donné en coordonnées atomiques xyz et effectuons l'analyse.
Le stress test nous a motivé à développer des optimisations considérables dans notre code pour la version GPU. Ces optimisations ont accéléré la réhydratation/l'analyse de plus de dix fois, ce qui a conduit à une accélération globale de 5 fois de notre flux de travail. Ces optimisations sont prêtes à être incorporées dans notre source de code grand public sur la page AutoDock-GPU GitHub et seront disponibles pour l'ensemble de la communauté, profitant à tous les chercheurs qui utilisent notre code pour leurs simulations.
Cibles en cours d'exécution sur World Community Grid
Actuellement, tous les calculs se concentrent sur la protéine de pointe du virus SARS-CoV2. Les premières unités de travail ciblant le pic étaient le "test de résistance", qui a amarré environ 300 millions de petites molécules contre l'un des nombreux sites de liaison possibles. Par la suite, nous avons ciblé plusieurs poches de liaison possibles avec des molécules réactives et non réactives.
Les molécules réactives contiennent un groupe chimique capable de réagir sélectivement avec les acides aminés tyrosine ou lysine (qui sont des éléments constitutifs courants des protéines) en utilisant un type particulier de chimie du soufre (échange de fluorure de sulfonyle, SuFEx). Si l'une de ces molécules se lie réellement à la protéine de pointe, elle pourrait interférer avec l'entrée du virus dans les cellules humaines et, à son tour, ralentir la réplication du virus.
Tests de composés en cours
Dans notre analyse, nous avons filtré les résultats d'amarrage bruts pour identifier les composés les plus prometteurs à synthétiser et à tester dans des tests biologiques. Au cours de ce processus, le nombre de résultats a été réduit de centaines de millions de molécules à quelques dizaines qui ont montré les modèles d'interaction les plus intéressants avec les enzymes virales.
Avec nos collaborateurs d'Enamine, nous avons identifié celles plus accessibles grâce à la chimie de synthèse, en sélectionnant in fine des molécules qui pourraient cibler deux des principales protéases du virus SARS-CoV2 : 28 pour la protéase Plpro, et 47 pour la protéase Mpro. Enamine a rapidement synthétisé, purifié et expédié les molécules à nos laboratoires de collaborateurs expérimentaux à Scripps Florida (laboratoires Griffin et Kojetin) et à l'Université Emory (laboratoire Sarafianos). Dès que les résultats biologiques seront disponibles, nous les partagerons avec la communauté.
Merci à tous ceux qui soutiennent ce projet !
8 juillet 2021
traduction de l'article WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=715
- Affichages : 1077
Rencontrez le nouveau membre de l'équipe de recherche Help Stop TB
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Les chercheurs ont récemment accueilli un nouveau membre de l'équipe qui concevra des approches d'apprentissage automatique.
Contexte
En octobre, l'Organisation mondiale de la santé a publié les statistiques mondiales les plus récentes sur la tuberculose, notamment les suivantes :
- En 2019, environ 10 millions de personnes ont contracté la tuberculose.
- 1,4 million de personnes sont décédées de la tuberculose en 2019.
- La tuberculose reste l'une des 10 principales causes de décès dans le monde et la principale cause d'un seul agent infectieux (au-dessus du VIH / SIDA).
Le projet Help Stop TB a été créé pour étudier la gaine de Mycobacterium tuberculosis, la bactérie responsable de la tuberculose. En savoir plus sur cette gaine pourrait aider les scientifiques à mieux comprendre comment la bactérie se protège, ce qui pourrait à son tour aider à la recherche continue de meilleurs traitements.
Bienvenue, Connor !
Nous sommes ravis d'accueillir Connor McGee en tant que nouveau membre de l'équipe de recherche Help Stop TB.
Connor est doctorant dans le cadre du programme de formation doctorale BBSRC à l'Université de Nottingham. Dans le cadre du programme, il a effectué deux stages de recherche distincts de 8 semaines avant de choisir un projet final. Dans son diplôme précédent, Connor s'est spécialisé dans le domaine des neurosciences computationnelles, combinant divers outils des mathématiques et des neurosciences pour aider à résoudre le casse-tête des cellules gliales dans le cerveau.
Lors de la sélection de ses différents projet, Connor s'est vu offrir l'opportunité de s'éloigner de son expertise immédiate, dans le monde de la chimie computationnelle dans le cadre du projet Help Stop TB. Il était un peu nerveux au début, mais s'est rapidement passionné pour l'étude de la façon dont les molécules se replient et s'assemblent en des structures plus complexes. Lorsque le moment est venu de faire une sélection finale de projet, Connor était prêt à se lancer dans les travaux du groupe Croft sur la structure moléculaire et à résoudre de nouvelles énigmes chimiques passionnantes.
S'appuyant sur son expérience antérieure dans le développement de statistiques et de méthodologies, Connor concevra des approches d'apprentissage automatique qui peuvent être utilisées pour aider à étudier les données générées tout au long du projet Help Stop TB. En intégrant l'apprentissage automatique à des boîtes à outils multidisciplinaires innovantes, Connor espère aider à comprendre les facteurs régissant le repliement de l'acide mycolique tout en garantissant l'explicabilité, l'interprétabilité et la transparence.
Merci à tous ceux qui soutiennent ce projet !
1er juillet 2021
traduction de l'article WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=714
- Affichages : 985
MLC@Home : mise à jour de juillet
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Notes pour le 1er juillet 2021
Un résumé mensuel des nouvelles et des notes pour MLC@Home
Résumé
Joyeux premier anniversaire à MLC@Home ! Ce projet a été mis en ligne le 1er juillet 2020 et a fait son chemin assez rapidement dans la communauté BOINC. Nous sommes restés concentrés sur notre objectif, qui est d'ouvrir la boîte noire des réseaux de neurones pour expliquer pourquoi ils font les choix qu'ils font. C'est tellement important que l'apprentissage automatique imprègne de plus en plus notre vie quotidienne ; des voitures autonomes aux décisions bancaires et aux diagnostics médicaux. Nous avons besoin de recherches pour comprendre comment éviter les biais de ces systèmes.
Nous sommes également le premier, et à ce jour le seul, projet public BOINC axé sur l'apprentissage automatique. Cela signifie que bien que nous puissions tirer parti du cadre BOINC pour la gestion des tâches, nous devons créer la plupart de l'infrastructure client ML à partir de zéro. Cela n'a pas toujours été facile, mais nous avons accompli tant de choses au cours de la dernière année malgré tout.
Au cours de la dernière année, nous avons :
- Contributions reçues de plus de 2500+ bénévoles et de 9200+ hôtes
- Traitement de plus de 3,4 millions d' unités de travail BOINC
- Formation de plus de 1,1 million de réseaux de neurones pour l'analyse de 3 ensembles de données différents, les plus grands ensembles de données de leur genre
- Généré plus de 4,3 To de données pour l'analyse
- Publication d'un article académique (d'autres à venir..)
- Présenté au Workshop BOINC 2021
- Publication de 47 versions client ciblant 3 architectures CPU différentes, 2 architectures GPU et plusieurs versions de Windows et Linux.
- Dépassé le serveur initial au cours des premiers mois !
Je suis submergé par notre communauté et ce que nous avons accompli ensemble. Nous avons déjà montré que les réseaux entraînés avec les mêmes données se regroupent dans l'espace de poids, malgré le caractère aléatoire associé à l'entraînement des réseaux de neurones. Nous avons également montré que nous pouvons utiliser ce clustering pour détecter les réseaux formés avec des données empoisonnées par rapport à des données propres, une découverte importante sur le terrain.
Mais il y a encore tellement à faire ! Alors que nous voulons reconnaître et célébrer ce que nous avons accompli ensemble jusqu'à présent, regardons également vers l'avenir et fixons-nous quelques objectifs lâches pour la prochaine année de MLC@Home :
- MLDS continuera à court terme !
DS4 est (presque) prêt et étend l'ensemble de données pour inclure les types de réseau CNN ainsi que les RNN utilisés dans DS1-3. DS5 variera probablement légèrement la forme et la taille de chaque réseau pour voir si le clustering se produit toujours lorsque la forme varie. Le futur travail MLDS au-delà de DS5 est à déterminer, mais nous nous attendons à ce qu'il y ait beaucoup de WU DS4/DS5 pendant de nombreux mois à venir. Nous prévoyons de mettre à jour le document avec les dernières séries au cours du mois prochain.
- Nous aimerions nous développer au-delà du MLDS !
Nous sommes le premier projet à faire du ML à l'échelle de BOINC. Nous aimerions nous étendre pour soutenir d'autres domaines de recherche et nous engager à mettre en ligne au moins un autre projet de ML au cours de la prochaine année. Veuillez nous contacter si vous êtes un chercheur intéressé à travailler avec la plateforme !
- Nous devons améliorer l'aspect technique du projet
Du client prenant en charge les GPU AMD et OSX à l'optimisation de l'utilisation des cartes graphiques à un meilleur processus de validation pour les WU, il existe une longue liste de problèmes techniques que nous aimerions résoudre, et que nous n'avons pas fait si efficacement au cours des trois derniers mois. Nous arrivons également à des cas particuliers de la pile logicielle BOINC qui sont difficiles à contourner. Si vous êtes un développeur et que vous souhaitez aider, nous serions heureux de recevoir votre assistance.
- Nous aimerions améliorer la sensibilisation
Pour impliquer davantage de personnes, nous aimerions produire quelques courtes vidéos sur le projet, ce que nous avons trouvé et comment les autres peuvent aider. Ceux-ci doivent être courts, facilement accessibles et faciles à partager. Nous aimerions en produire au moins un dans les 6 prochains mois.
Ce sont des objectifs lâches mais qui devraient vous donner une idée de ce sur quoi nous concentrons nos efforts pour l'année prochaine. Si vous avez d'autres idées, veuillez les partager ci-dessous ou sur Discord.
Merci encore pour votre soutien à MLC@Home, et voici encore de nombreuses années de recherche fructueuse et importante dans un domaine important.
Autres nouvelles
- DS3 est presque complet (juste quelques 130+ derniers ruissellements !). Je considère DS3 comme l'ensemble de données le plus important et j'ai hâte d'effectuer notre analyse sur l'ensemble !
- À partir de maintenant, nous allons exploser les WU DS1 (puis DS2) dans les files d'attente GPU et CPU jusqu'à ce que cela se termine et/ou jusqu'à ce que DS4 soit prêt. Nous essaierons de les faire franchir le pas dès que possible.
- Quelques nouvelles amusantes! Tankbuster, utilisateur de MLC Discord, a mis à jour le graphique de notre bannière ! Voir la bannière mise à jour sur les pages du projet et d'accueil !
- Encore plus excitant, Tankbuster a créé un prototype d'application graphique pour MLC@Home ! Vous pouvez voir des maquettes et des vidéos et suivre la discussion sur le serveur MLC Discord (lien en bas).
Aperçu de l'état du projet
(notez que ces chiffres sont approximatifs)
Merci encore à tous nos bénévoles !
Les mises-à-jour mensuelles précédentes (auparavant hebdomadaires) sont, habituellement, traduites sur le forum, ici.
- La page d'accueil des administrateurs MLC@Home : https://www.mlcathome.org/
Discord invite : https://discord.gg/BdE4PGpX2y
Twitter: @MLCHome2
traduction de l'article MLC@Home : https://www.mlcathome.org/mlcathome/forum_thread.php?id=212
- Affichages : 1108
WCG - OpenPandemics - COVID-19 : Mise à jour de juin
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Les chercheurs commencent à analyser l'énorme quantité de données générées lors du test de résistance du mois dernier, lorsque 30 000 lots de travail ont été exécutés en huit jours.
Contexte
Le projet OpenPandemics - COVID-19 a été créé pour aider à accélérer la recherche de traitements potentiels contre la COVID-19. Le projet vise également à créer une boîte à outils open source à réponse rapide qui aidera tous les scientifiques à rechercher rapidement des traitements en cas de futures pandémies.
Fin 2020, les chercheurs ont annoncé avoir sélectionné 70 composés (parmi un groupe initial d'environ 20.000) qui pourraient être prometteurs en tant qu'inhibiteurs potentiels du virus responsable de la COVID-19. Des tests en laboratoire sont actuellement en cours pour 25 de ces composés.
Analyser une quantité de données sans précédent
Le mois dernier, l'équipe de recherche a fourni à World Community Grid environ 30 000 lots d'unités de travail GPU. Cela faisait partie d'un test de résistance de l'infrastructure du World Community Grid et a rapidement généré une très grande quantité de données qui sont analysées par les chercheurs.
L'équipe technique du World Community Grid a publié sur notre forum les découvertes qu'elle a faites concernant les capacités techniques actuelles du programme. L'équipe de recherche travaille actuellement sur une mise à jour sur ce qu'elle a découvert jusqu'à présent à partir de l'énorme quantité de données, mais en attendant, elle a également tweeté quelques statistiques et jalons du projet .
Merci à tous ceux qui ont participé au stress test, et qui continuent à apporter leur puissance de calcul au projet !
État actuel des unités de travail
CPU
- Disponible pour téléchargement : 6 063 lots
- En cours : 2 199 lots
- Terminé : 51 189 lots
6 770 lots au cours des 30 derniers jours
Moyenne de 225,7 lots par jour
- Reste à faire (équipe de recherche) : 26,9 jours
GPU
- Disponible pour téléchargement : 16 283 lots
- En cours : 4 174 lots
- Terminé : 52 292 lots
15 366 lots au cours des 30 derniers jours
Moyenne de 512,2 par jour
- Reste à faire (équipe de recherche) : 31,8 jours
24 juin 2021
traduction de l'article WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=713
- Affichages : 1015
- WCG - Mapping Cancer Markers : Mise à jour de juin
- WCG - Help Stop TB : Mise à jour de juin
- WCG - Africa Rainfall Project : Mise à jour de juin
- WCG - Microbiome Immunity Project : Mise à jour de juin
- WCG - OpenPandemics - COVID-19 : Mise à jour de mai
- WCG - Mapping Cancer Markers : Mise à jour de mai
Page 8 sur 35