WCG

Discussion sur les erreurs actuelles de notre plateforme BOINC et de ce qui est en train d'être corrigé.

Publié le 13/07/2022

Chers volontaires,

Au cours de la semaine dernière, nous sommes entrés dans une nouvelle étape de notre phase de test. Nous avons donné quelques unités de travail à nos volontaires pour qu'ils les crunchent. L'objectif était de voir si des erreurs imprévues se produisaient, ce que nous avons pu trouver grâce aux commentaires de nos volontaires. Si vous avez des questions spécifiques sur les unités de travail limitées, consultez ce fil de discussion sur nos forums.

Voici une mise à jour rapide de notre équipe technique :

Nous avons travaillé pour évaluer la façon dont le système répond à la charge et si la configuration est correcte. Comme beaucoup l'ont remarqué sur les forums, il y a quelques problèmes avec la configuration du backend BOINC. Les utilisateurs auront remarqué des notifications anormales dans le gestionnaire BOINC à propos d'URLs de projet incorrectes et de double rattachement au même projet. Nous avons résolu le problème sous-jacent et nous nous excusons pour la gêne occasionnée.

En outre, nous travaillons à résoudre le manque de synchronisation entre la page de profil du site Web et le gestionnaire BOINC. Nous travaillons également à la résolution d'un problème de blocage avec les unités de travail GPU pour Open Pandemics. Une fois ce problème résolu, nous devrions être en mesure d'augmenter la quantité d'unités de travail que nous pouvons envoyer aux volontaires.

Notre arriéré de problèmes non bloquants a continué de croître au fur et à mesure que nous observons la charge du système, mais dans l'ensemble, nous nous approchons d'un état stable et nous sommes impatients de mettre à jour les utilisateurs avec des statistiques et plus de détails au fur et à mesure que nous continuons le déploiement de notre système de production.

Merci de votre compréhension et de votre soutien continu.

Sincèrement,

L'équipe de World Community Grid

Source : https://www.worldcommunitygrid.org/about_us/article.s?articleId=773

Redémarrage du site et du forum !

Publié le : 21 juin 2022

Chers bénévoles, nous sommes ravis de vous annoncer que la reconstruction et les tests de notre site Web et de nos forums sont terminés et qu'ils sont désormais accessibles au public.

Le site web et les forums sont de retour avec toutes leurs fonctionnalités. L'onglet "Liens", qui fournit des liens vers nos pages d'aide et nos comptes de médias sociaux, a été ajouté à la présentation du site Web. À la demande générale, un lien vers le forum est disponible sous l'onglet Communauté pour un accès plus facile. Les nouveaux venus sur le World Community Grid sont encouragés à s'inscrire, à lire la section "À propos" pour en savoir plus sur le fonctionnement interne du logiciel et la section "Projets actuels" pour décider des projets qu'ils souhaitent soutenir.

Le forum du World Community Grid est à nouveau en ligne pour les discussions sur les projets de recherche, les commentaires constructifs et les nouvelles. Nous vous rappelons les directives de la communauté, qui peuvent être lues ici. Les nouveaux volontaires sont encouragés à lire les directives et à examiner les conversations existantes sur le forum pour comprendre l'étiquette du forum avant de poster. Comme toujours, nous demandons à tous les utilisateurs de faire preuve de civilité envers les autres utilisateurs et les administrateurs, ainsi que de s'abstenir de discuter de sujets non pertinents pour la recherche et la grille de la Communauté mondiale.

Merci d'avoir lu, merci d'avoir attendu, et restez à l'écoute pour des nouvelles très intéressantes à venir !

L'équipe de World Community Grid - Ensemble, nous pouvons faire plus.

Nous travaillons actuellement sur la correction de bugs sur notre site Web et expérimentons des moyens améliorés de fournir des mises à jour à notre communauté.

Publié le : 3 juin 2022

Chers bénévoles, nous avons travaillé dur pour permettre le redémarrage des WCG. Comme tous ceux qui ont vécu ce voyage avec nous le savent, la route a été longue et semée d'embûches. Malheureusement, nos tests ont révélé des bogues imprévus et nous ont empêchés de discuter avec vous d'une grande partie de notre travail quotidien. Dans cette mise à jour, nous souhaitons donner un aperçu de certaines des difficultés techniques et des nouvelles méthodes de communication sur lesquelles nous avons travaillé.

Pour le moment, notre priorité absolue est de corriger les bogues sur le site Web de production, actuellement opérationnel dans notre environnement de cloud privé. Les problèmes que nous devons résoudre avant de fournir l'accès au site Web impliquent principalement des contrôles de sécurité, des mises à jour de notre base de données principale, des certificats, la surveillance des performances et de nombreux problèmes techniques mineurs.

Pour clarifier, alors que les utilisateurs existants verraient toutes leurs contributions et statistiques passées, les forums et le contenu Web, nous rencontrons des problèmes avec le processus d'enregistrement de compte pour les nouveaux bénévoles. Selon notre meilleure estimation, ce problème et d'autres liés à l'expérience utilisateur sur le site Web WCG devraient être résolus d'ici le début de la semaine prochaine.

Nous résolvons également certains problèmes de certificat avec SendGrid, le service que nous utilisons pour envoyer des e-mails à tous nos bénévoles actifs. Les avantages incluent la réception d'articles Web (comme celui-ci) sous forme d'e-mails directement dans votre boîte de réception et la possibilité d'activer ou de désactiver des mises à jour spécifiques.

Sur le thème de la communication, nous sommes heureux d'annoncer que notre équipe s'est agrandie - et nous avons un stagiaire en communication pour les 16 prochains mois. Nous préparons une nouvelle plate-forme de communication - Instagram, et avons commencé à planifier du nouveau matériel audiovisuel pour notre chaîne YouTube. Le processus de création vidéo a dû passer au second plan pendant le processus de migration, mais nous nous préparons à changer cela, une fois que toutes nos difficultés techniques auront été résolues.

Nous tenons à vous remercier d'avoir été patient avec le temps qu'il a fallu pour préparer entièrement le système pour le redémarrage de WCG. Nous travaillons dur pour que le résultat en vaille la peine.

L'ÉQUIPE du World Community Grid - Ensemble, tout le monde accomplit plus

 

Le WCG est presque prêt à redémarrer.

Publié le : 22 mai 2022

Les tests d'assurance qualité se sont enfin terminés avec succès et tous les bogues ont été résolus. L'environnement de production est testé en ce moment même. Compte tenu des problèmes inattendus que nous avons rencontrés avec le système d'assurance qualité, nous préférons le tester quelques jours de plus. Le site web et le forum sont prêts à être relancés, l'environnement de production interroge BOINC localement avec succès et nous allons redémarrer BOINC lentement dans les prochains jours. Nous fournirons plus de détails en début de semaine prochaine.

 

Merci à l'équipe technique du WCG

L'équipe technique du WCG

La date révisée pour le lancement sera le 24 mai 2022, après la journée de Victoria.

Publié le : 12 mai 2022

Nous avons pu résoudre une boucle de redirection qui rendait une grande partie du site inutilisable en raison de règles de réécriture incorrectes dans Apache et de leur interaction avec le DNS hébergé par nos soins. Nous avons ensuite résolu d'autres problèmes résultant des modifications nécessaires apportées à la configuration de HAProxy, aux certificats des serveurs internes et donc aux domaines, ainsi qu'à IBM WebSphere.

Nous sommes maintenant en train de mettre à jour le contenu du site Web de production pour inclure les mises à jour qui ont été publiées pendant le temps d'arrêt, de porter la broche de dépendance React à la version 17 du site Web actuel hébergé à www.worldcommunitygrid.org vers le site Web de production complet qui a également été touché. Nous devons ensuite nous assurer manuellement de la fonctionnalité sur tous les principaux navigateurs. Une fois terminé, le site web et les forums seront prêts à fonctionner.

Enfin, nous avons pu tester les connexions des clients BOINC à nos serveurs à partir de comptes nouvellement créés/enregistrés. Bien que nous ayons pu contacter le planificateur BOINC et vérifier les unités de travail disponibles, nous sommes en train de diagnostiquer un échec de validation de la clé de projet qui s'est produit dans certains cas.

Du côté du serveur, nous avons pu vérifier le flux de données de nos partenaires de recherche dans la couche de gestion des unités de travail de notre pile. Ainsi, cette partie est entièrement validée et se déroulera sans problème lors du redémarrage. Nous continuons à évaluer l'état de préparation de la pile de gestion des unités de travail en vue de son lancement avec le site Web.

Nous vous remercions

L'équipe technique du WCG

 

Les problèmes ont été résolus, nous pouvons continuer les tests.

Publié le : 10 mai 2022

Nous avons effectué des recherches supplémentaires sur les problèmes que nous avons rencontrés avec notre courtier de messages et IBM WebSphere. Nous avons pu résoudre le problème de la configuration périmée de JAAS dans IBM WebSphere, qui faisait que les connexions JMS nécessitant des informations d'identification mises à jour n'étaient pas réinitialisées tant qu'une information d'identification de l'alias correct existait déjà dans la configuration de WebSphere. Par conséquent, l'identifiant obsolète survivait simplement à la reconfiguration scriptée de WebSphere pour polluer à nouveau toutes les connexions de file d'attente et de sujet au redémarrage. Bien que notre équipe ait utilisé les outils de diagnostic habituels pour IBM MQ, nous n'en avons tiré aucune information supplémentaire et nous avons pris beaucoup de retard dans la découverte du bogue dans notre script de déploiement. Ce n'est que ce matin que nous avons découvert le problème en passant en revue tous les scripts de configuration et en vérifiant manuellement chaque objet référencé dans la console de ligne de commande WAS.

Comme nous sommes maintenant en mesure de continuer à tester le système, nous prévoyons de réévaluer la date de redémarrage du WCG la plus proche à laquelle nous pouvons nous engager d'ici jeudi soir (12 mai 2022). Nous publierons un calendrier actualisé dans les médias sociaux et sur le site Web le 12 mai.

Nous vous remercions

Équipe technique du WCG

 

Nous effectuons des tests supplémentaires pour confirmer que le système est prêt.

Publié le : 8 mai 2022

Malheureusement, nous devons maintenant effectuer des tests supplémentaires à partir de demain pour confirmer que le système est prêt. Bien que nous ayons pu résoudre des problèmes avec l'équilibreur de charge HAProxy et résoudre partiellement un deuxième problème empêchant les clients d'accéder à certaines files d'attente publiées par notre courtier de messages en interne, des tests supplémentaires pour confirmer qu'il n'y aura pas d'effets inattendus résultant de ces changements sont maintenant nécessaires en raison des implications de sécurité. Nous continuons à travailler sur ce point ce soir et nous espérons vous informer demain [9 mai 2022] de la nouvelle date de démarrage du WCG, à moins que nous ne rencontrions des difficultés inattendues.

En prévision du redémarrage imminent des WCG, le projet OPN a préparé un stock important de paquets sur le serveur OPN pour OPN1 et OPNG. Les paquets les plus récents sont non réactifs et arriment la bibliothèque ZINC à PLPro, en ciblant le site de liaison du ligand dans l'entrée PDB 7LOS.
Ce site de liaison a été choisi parce que certaines des molécules ayant une activité dans les expériences de laboratoire s'y arriment bien. L'équipe OPN prévoit d'effectuer un docking réactif sur ce même site de liaison.

Nous vous remercions

L'équipe technique du WCG

https://www.worldcommunitygrid.org/news/0508

 

Nous continuons à travailler dur pour redémarrer le WCG dès que possible.

Publié le : 7 mai 2022

Alors que nous continuons à travailler dur pour redémarrer le WCG dès que possible, nous souhaitons faire le point sur l'état actuel. Nous sommes actuellement confrontés à des problèmes inattendus avec l'équilibreur de charge - un composant petit mais essentiel qui garantit que les serveurs scientifiques feront face à des charges de travail accrues. Si nous ne résolvons pas ce problème à temps, cela nous empêchera de redémarrer le 9 mai. Nous ferons le point sur le résultat de nos efforts pour résoudre ce problème dimanche soir.

Une brève mise à jour sur la science

Le temps d'arrêt du WCG a permis aux équipes de rattraper leur retard en matière d'analyses et de validations. Le projet ARP continue d'analyser les données et a commencé à préparer le portail en ligne pour aider à diffuser les résultats à une plus large communauté scientifique. OPN1 est occupé à valider les résultats du premier cycle de calcul (la validation a été retardée en raison de problèmes en Europe). MCM est partiellement en pause jusqu'à ce que nous redémarrions complètement (car l'équipe MCM est maintenant l'équipe WCG). Le SCC termine également la validation préclinique des médicaments précédents et prépare de nouvelles cibles pour le calcul sur le WCG. Nous avons préparé des unités de travail pour le redémarrage des projets OPN1 et MCM.

Nous apprécions vraiment tous les messages de soutien que nous avons reçus lors de la dernière mise à jour, votre patience et votre soutien continu au WCG et à ses projets.

Nous vous remercions

L'équipe technique du WCG

 

Source : https://www.worldcommunitygrid.org/news/0507