Rosetta : Mise-à-jour des résultats de la recherche contre la Covid-19
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Voici une courte vidéo de David Baker décrivant certains résultats passionnants de la méthode "De novo design" ciblant le SRAS-Cov-2 (virus de la COVID-19)
Traduction de la vidéo : Mise-à-jour - coronavirus Rosetta@Home - Septembre 2020
Dans cette vidéo, le professeur David Baker décrit les progrès récemment réalisés dans la lutte contre le coronavirus. Avec l'aide de volontaires Rosetta@Home, des scientifiques de l'Institut pour la conception de protéines de l'Université de Washington ont réussi à créer des protéines antivirales candidates qui bloquent l'infection à coronavirus en laboratoire. Cette percée avance vers des essais cliniques.
"Merci à tous d'avoir contribué à Rosetta@Home : vous avez vraiment formé la colonne vertébrale de nos efforts informatiques de groupe. Je voulais partager avec vous, aujourd'hui, des résultats très intéressants sur la lutte contre le coronavirus avec la conception de protéines. L'une des choses que nous avons faite sur Rosetta@Home est de concevoir des séquences qui se replient en de nouvelles structures de forme complémentaire au virus et nous avons conçu des millions de ces structures et c'est pourquoi cela prend beaucoup de temps de calcul puis, après avoir trouvé notre forme complémentaire, nous concevons leurs surfaces afin qu'elles puissent se lier étroitement au virus. Nous avons fabriqué ces protéines en laboratoire et nous avons trouvé celles qui se lient très étroitement à la protéine virale, de façon plus fine que les protéines précédentes. Nous avons constaté, en outre, que ces protéines protègent les cellules du coronavirus vivant et nous sommes donc très excités à ce sujet comme thérapeutique potentielle et nous essayons de savoir comment nous pourrions avancer sa sortie mondiale. Rien de tout cela ne pourrait être vraiment fait sans vos contrubutions et je voulais vous remercier pour ça. Si vous souhaitez en savoir plus sur une partie de ce travail, nous avons publié un article scientifique, la semaine dernière que vous pouvez trouver sur notre site web (traduction ci-dessous). Il y a aussi eu une bonne quantité de choses dans les médias à ce sujet mais, de toute façon, je voulais vous remercier beaucoup pour vos contributions et nous allons de l'avant pour avoir une affinité de liants encore meilleure. Nous nous appuyons beaucoup sur Rosetta@Home alors j'espère que vous resterez impliqués sur ce projet."
David Baker, Ph.D.
Directeur de Rosetta@Home Professeur de Médecine (Institut pour la conception de protéines - Université de Washington)
Pour plus d'informations, veuillez consulter la publication : De novo design of picomolar SARS-CoV-2 mini protein inhibitors
(traduction ci-dessous)
Méthode "De novo design" des inhibiteurs de la miniprotéine picomolaire SARS-CoV-2
Extrait
Cibler l'interaction entre la protéine Spike du SRAS-CoV-2 et le récepteur ACE2 humain est une stratégie thérapeutique prometteuse. Nous avons conçu des inhibiteurs en utilisant deux approches de conception "de novo". Les échafaudages générés par ordinateur ont été construits autour d'une hélice ACE2 qui interagit avec le domaine de liaison au récepteur Spike (RBD), ou ancrés contre le RBD pour identifier de nouveaux modes de liaison et leurs séquences d'acides aminés conçues pour optimiser la liaison, le repliement et la stabilité de la cible. Dix conceptions ont lié le RBD avec des affinités allant de 100 pM à 10 nM, et ont bloqué l'infection ARS-CoV-2 des cellules Vero E6 avec des valeurs d'IC 50 entre 24 pM et 35 nM; Les plus puissants, avec de nouveaux modes de liaison, sont les protéines de 56 et 64 résidus (IC 50 ~ 0,16 ng / ml). Les structures de microscopie cryoélectronique de ces minibindres en complexe avec le trimère d'ectodomaine de pointe SARS-CoV-2 avec les trois RBD liés sont presque identiques aux modèles de calcul. Ces minibinders hyperstables fournissent des points de départ pour les thérapies contre le SRAS-CoV-2.
L'infection par le SRAS-CoV-2 débute généralement dans la cavité nasale, le virus s'y répliquant pendant plusieurs jours avant de se propager aux voies respiratoires inférieures. L'administration d'une concentration élevée d'un inhibiteur viral dans le nez et dans le système respiratoire pourrait donc généralement fournir une protection prophylactique et / ou un bénéfice thérapeutique pour le traitement d'une infection précoce, et pourrait être particulièrement utile pour les travailleurs de la santé et d'autres personnes entrant en contact fréquent avec des personnes infectées. Un certain nombre d'anticorps monoclonaux sont en cours de développement en tant que traitements systémiques du COVID-19, mais ces protéines ne sont pas idéales pour l'administration intranasale car les anticorps sont des molécules volumineuses et souvent pas extrêmement stables et la densité des sites de liaison est faible (deux pour 150 KDa d'anticorps); L'amélioration de la maladie dépendante des anticorps est également un problème potentiel. Les liants de protéines Spike de haute affinité qui bloquent l'interaction avec l'enzyme 2 (ACE2) de conversion de l'angiotensine du récepteur cellulaire humain avec une stabilité améliorée et des tailles plus petites pour maximiser la densité des domaines inhibiteurs pourraient avoir des avantages par rapport aux anticorps pour une administration directe dans le système respiratoire par administration intranasale, nébulisation ou aérosol de poudre sèche. Nous avons découvert précédemment que l'administration intranasale de petites protéines conçues pour se lier étroitement à l'hémagglutinine de la grippe peut fournir une protection à la fois prophylactique et thérapeutique dans des modèles de d'infection grippale mortelle.
Stratégie de conception
Nous avons entrepris de concevoir des minibinders de protéines de haute affinité pour le SARS-CoV-2 Spike RBD qui entrent en compétition avec la liaison ACE2. Nous avons exploré deux stratégies: d'abord, nous avons incorporé l'hélice alpha de ACE2 qui fait la majorité des interactions avec le RBD dans de petites protéines conçues qui font des interactions supplémentaires avec le RBD pour atteindre une affinité plus élevée ( Fig. 1A ). Deuxièmement, nous avons conçu des liants complètement à partir de zéro sans nous fier aux interactions de liaison RBD connues ( Fig.1B). Un avantage de la deuxième approche est que la gamme des possibilités de conception est beaucoup plus large, et donc potentiellement une plus grande diversité de modes de liaison à haute affinité peut être identifiée. Pour la première approche, nous avons utilisé le constructeur de plans Rosetta pour générer des miniprotéines qui incorporent l'hélice ACE2 (résidus ACE2 humains 23 à 46). Pour la deuxième approche, nous avons utilisé l'amarrage RIF ( 12 ) et la conception à l'aide de grandes bibliothèques de miniprotéines pour générer des liants vers des régions distinctes de la surface RBD entourant le site de liaison ACE2 ( Fig. 1 et Fig. S1).
Fig. 1 Vue d'ensemble des approches de conception informatique.
( A ) Conception de protéines hélicoïdales incorporant l'hélice ACE2.
( B ) Conception de novo à grande échelle de petits échafaudages hélicoïdaux (en haut) suivi d'un amarrage de champ d'interaction rotamère (RIF) pour identifier la forme et les modes de liaison chimiquement complémentaires.
Caractérisation expérimentale et optimisation
De grands pools de minibinders conçus (voir Méthodes) réalisés en utilisant les première et seconde approches, ont été codés dans de longs oligonucléotides et criblés pour la liaison à RBD marqué par fluorescence affiché sur la surface des cellules de levure. Le séquençage en profondeur a identifié trois conceptions d'échafaudage en hélice ACE2 ( approche 1 ) et 105 conceptions d'interface de novo ( approche 2 ) qui ont été enrichies après le tri cellulaire activé par fluorescence (FACS) pour la liaison RBD. Les trois modèles d'échafaudage ACE2 et douze des modèles de novo ont été exprimés en E. coliet purifié. L'une des conceptions à échafaudage ACE2 et onze des douze conceptions de novo étaient RBD soluble et lié avec des affinités allant de 100 nM à 2 uM dans des expériences d'interférométrie biocouche (BLI) (figures S2, A, C et E et S3). La maturation d'affinité de la conception à échafaudage ACE2 par mutagenèse par PCR a conduit à un variant, AHB1, qui a lié RBD avec une affinité de ~ 1 nM (fig. modèle de conception, mais avait une faible thermostabilité (fig. S4C). Nous avons généré dix conceptions supplémentaires incorporant l'épingle à cheveux hélicoïdale de liaison de AHB1, et avons constaté que l'une liait le RBD et était thermostable (fig. S2, B, D et F).
Pour 50 des minibinders fabriqués à l'aide de l'approche 2 et de la conception à échafaudage en hélice ACE2 de deuxième génération, nous avons généré des bibliothèques de mutagenèse à saturation de site (SSM) dans lesquelles chaque résidu de chaque conception a été remplacé par chacun des 20 acides aminés un à la fois. Un séquençage en profondeur avant et après le tri FACS pour la liaison RBD a révélé que les résidus à l'interface de liaison et au noyau de la protéine étaient largement conservés pour 40 des 50 minibinders Approach 2 et pour la conception à échafaudage hélice ACE2 ( Fig.2et figues. S6 et S7). Pour la plupart de ces minibinders, un petit nombre de substitutions a été enrichi dans le tri FACS; Des bibliothèques combinatoires incorporant ces substitutions ont été construites pour la conception basée sur ACE2 et les huit conceptions d'Approche 2 à affinité la plus élevée et à nouveau criblées pour la liaison à la RBD à des concentrations allant jusqu'à 20 pM. Chaque bibliothèque a convergé sur un petit nombre de séquences étroitement liées; l'un de ceux-ci a été sélectionné pour chaque conception AHB2 ou LCB1-LCB8 et s'est avéré se lier au RBD avec une affinité élevée sur la surface de la levure d'une manière concurrencée par ACE2 ( Fig. 3 et Fig. S8).
Fig. 2 Cartographie de séquence haute résolution de AHB2, LCB1 et LCB3 avant l'optimisation de la séquence.
( A , C et E ) Les protéines de liaison conçues sont colorées par l'entropie de position de Shannon de la mutagenèse de saturation du site avec des positions bleues indiquant une faible entropie (conservées) et en rouge celles de haute entropie (non conservées). ( B , D et F) Cartes thermiques représentant les valeurs d'enrichissement de liaison RBD pour des mutations uniques dans le noyau du modèle de conception (à gauche) et l'interface conçue (à droite). Les substitutions qui sont fortement épuisées sont indiquées en bleu et les mutations bénéfiques en rouge. L'épuisement de la plupart des substitutions à la fois dans le site de liaison et le noyau suggère que les modèles de conception sont largement corrects, tandis que les substitutions enrichies suggèrent des voies pour améliorer l'affinité. Les cartes SSM complètes sur toutes les positions pour AHB2 et les huit conceptions de novo sont fournies dans les fig. S6 et S7.
Fig. 3 Les conceptions optimisées se lient avec une forte affinité à la RBD, sont en concurrence avec ACE2 et sont thermostables.
( A ) ACE2 est en concurrence avec les conceptions pour la liaison à la RBD. Les cellules de levure présentant la conception indiquée ont été incubées avec 200 pM de RBD en présence ou en l'absence de 1 uM d'ACE2, et la liaison de RBD aux cellules (axe Y) a été surveillée par cytométrie en flux. ( B ) Liaison des miniprotéines purifiées à la RBD surveillée par interférométrie biocouche. Pour les LCB1 et LCB3, les K d n’ont pas pu être estimés avec précision en raison du manque de sensibilité de l’instrument et des longs temps d’équilibrage inférieurs à 200 pM. ( C ) Spectres de dichroïsme circulaire à différentes températures, et ( D ) signal CD à une longueur d'onde de 222 nm en fonction de la température. Les conceptions entièrement de novo LCB1 et LCB3 sont plus stables que la conception à hélice échafaudée ACE2 AHB2.
AHB2 et LCB1 – LCB8 ont été exprimés, purifiés à partir d' E. Coli et la liaison à la RBD évaluée par BLI. Pour sept des plans, les valeurs K D allaient de 1 à 20 nM ( Fig.3 , fig. S8 et tableau S2), et pour deux (LCB1 et LCB3), les valeurs K D étaient inférieures à 1 nM, ce qui est trop forte pour mesurer de manière fiable avec cette technique ( Fig. 3 ). A la surface des cellules de levure, LCB1 et LCB3 ont montré des signaux de liaison à 5 pM de RBD après un traitement par protéase (trypsine et chymotrypsine) (fig. S9). Les spectres de dichroïsme circulaire des minibindres purifiés étaient conformes aux modèles de conception, et les températures de fusion pour la plupart étaient supérieures à 90 ° C ( Fig.3et fig. S8). Les dessins ont conservé une activité de liaison complète après 14 jours à température ambiante (fi g.S10). AHB1 / 2 et LCB3 se sont également liés au SRAS-CoV RBD (en plus du SARS-CoV-2 RBD), mais avec une affinité plus faible (fig. S11); nous prévoyons que les affinités de liaison obtenues pour le SRAS-CoV-2 pourraient être facilement obtenues pour d'autres protéines de pointe de coronavirus si celles-ci étaient directement ciblées pour la conception.
Détermination de la structure CryoEM
Nous avons caractérisé les structures de LCB1 et LCB3 en complexe avec le trimère d'ectodomaine de pointe SARS-CoV-2 à une résolution de 2,7 Å et 3,1 Å, respectivement, et avons constaté que les minibinders se lient de manière stoechiométrique aux trois RBD dans le trimère de pointe ( Fig.4, A et E , et figures S12 et S13). Bien que le pic abritait principalement deux RBD ouverts pour les deux complexes, nous avons identifié un sous-ensemble de particules avec trois RBD ouverts pour le complexe LCB3 ( Fig. 4, A et E , et figures S12 et S13). Nous avons amélioré la résolvabilité des densités RBD / LCB1 et RBD / LCB3 en utilisant une classification ciblée et un raffinement local donnant des cartes à une résolution de 3,1 et 3,5 Å permettant la visualisation des interactions formées par chaque minibinder avec le RBD ( Fig.4, B et F , et figures S12 et S13).
Fig.4 Caractérisation CryoEM des minibindres LCB1 et LCB3 en complexe avec SARS-CoV-2 S.
( A ) Représentation de surface moléculaire de LCB1 lié au trimère de l'ectodomaine SARS-CoV-2 S vu le long de deux orientations orthogonales.
( B ) Superposition du modèle conçu (gris argent) et de la structure cryoEM raffinée (magenta) de LCB1 (en utilisant la carte obtenue par raffinement local) lié au RBD (cyan).
( C et D ) Vues agrandies du modèle de calcul (gris argent) du complexe LCB1 / RBD superposé sur la structure CryoEM (cyan pour RBD et rose pour LCB1) montrant des chaînes latérales en interaction sélectionnées.
( E ) Représentation de surface moléculaire de LCB3 lié au trimère de l'ectodomaine SARS-CoV-2 S vu le long de deux orientations orthogonales.
( F) Superposition du modèle conçu (gris argent) et de la structure cryoEM raffinée (saumon) de LCB3 (en utilisant la carte obtenue par raffinement local) lié au RBD (cyan).
( G et H ) Zoom sur les interactions entre LCB3 (saumon) et le SRAS-CoV-2 RBD (cyan) montrant des chaînes latérales d'interaction sélectionnées.
En (A) et (E), chaque protomère S est coloré distinctement (cyan, rose et or).
Pour (B) et (F), les RBD ont été superposés pour évaluer les écarts de pose de liaison entre les modèles conçus et la structure raffinée de chaque minibinder.
LCB1 et LCB3 accostent avec des orientations opposées dans la crevasse formée par le motif de liaison au récepteur RBD grâce à des interfaces complémentaires de forme étendue avec de nombreuses interactions électrostatiques médiées par deux des trois hélices three minibinder ( Fig.4, B à D et F à H ). Semblable à ACE2, les sites de liaison LCB1 et LCB3 sont enterrés dans l'état conformationnel S fermé et nécessitent l'ouverture d'au moins deux RBD pour permettre la reconnaissance simultanée des trois sites de liaison ( Fig. 4, A et E ). LCB1 et LCB3 forment des liaisons hydrogène multiples et des ponts salins avec le RBD avec des surfaces enterrées de ~ 1000Å ^ 2 et ~ 800Å ^ 2, respectivement ( Fig.4, C, D, G et H), compatible avec les affinités sous-nanomolaires de ces inhibiteurs. Tel que conçu, les sites de liaison pour LCB1 et LCB3 chevauchent celui de ACE2 (fig. S14 et tableau S1), et devraient donc entrer en compétition pour la liaison à la RBD et inhiber l'attachement viral à la surface de la cellule hôte.
La superposition des modèles LCB1 / RBD ou LCB3 / RBD aux structures cryoEM correspondantes, en utilisant le RBD comme référence, montre que les poses de liaison correspondent étroitement à la conception avec le squelette Cɑ rmsd de 1,27 Å et 1,9Å pour LCB1 et LCB3, respectivement ( Fig. 4, B et F ) et la plupart des interactions polaires dans les modèles de conception correspondent étroitement à la structure CryoEM ( Fig. 4, C, D, G et H ). Ces données montrent que la méthode de conception informatique peut avoir une précision assez élevée. Les comparaisons de structure sur la figure 4, C, D, G et H , concernent les modèles de conception d'origine; les substitutions qui augmentent l'affinité de liaison sont assez subtiles et ont très peu d'effet sur la géométrie du squelette.
Neutralisation virale
Nous avons étudié la capacité de AHB1, AHB2 et LCB1-5 à prévenir l'infection des cellules par le SRAS-CoV-2 de bonne foi . Des concentrations variables de minibinders ont été incubées avec 100 unités de formation de focalisation (FFU) de SARS-CoV-2, puis ajoutées à des monocouches Vero E6. AHB1 et AHB2 fortement neutralisés SRAS-CoV-2 (IC 50 de 35 nM et 15,5 nM , respectivement), tandis qu'un minibinder de la grippe de contrôle n'a montré aucune activité de neutralisation ( Fig. 5A ). Ensuite, nous avons testé les minibinders LCB1-5 conçus par Approach 2. Nous avons observé une neutralisation encore plus puissante du SARS-CoV-2 par LCB1 et LCB3 avec des valeurs IC 50 de 23,54 pM et 48,1 pM, respectivement ( Fig.5B; à des volumes d'incubation accrus, des CI50 aussi faibles que 11 pM ont été obtenues). Sur une base molaire, ces valeurs sont environ 3 fois inférieures à celles de l'anticorps monoclonal anti-SARS-CoV-2 le plus puissant décrit à ce jour ; sur une base de masse, en raison de leur très petite taille, les dessins sont encore plus puissants que les anticorps.
Fig. 5 Neutralisation du virus vivant par des inhibiteurs de miniprotéines conçus.
L'activité de neutralisation de ( A ) AHB1 et AHB2 ou ( B ) LCB1-5 a été mesurée par FRNT. Les concentrations indiquées de minibinders ont été incubées avec 100 FFU de SRAS-CoV-2 authentique et ensuite transférées sur des monocouches Vero E6. AHB1, AHB2, LCB1 et LCB3 neutralisent efficacement le SARS-CoV-2, avec des valeurs EC 50 <50nM (AHB1 et AHB2) ou <50pM (LCB1 et LCB3). Les données sont représentatives de deux expériences indépendantes, chacune réalisée en double technique.
Conclusions
Les minibinders conçus dans ce travail présentent des avantages potentiels par rapport aux anticorps en tant que thérapeutiques potentielles. Ensemble, ils couvrent une gamme de modes de liaison, et en combinaison, une fuite mutationnelle virale serait tout à fait improbable (figures S1 et S14 et tableau S1). Le maintien de l'activité après une période prolongée à des températures élevées suggère qu'ils ne nécessiteraient pas une chaîne d'approvisionnement à température contrôlée. Les conceptions sont 20 fois plus petites qu'une molécule d'anticorps complète et, par conséquent, à masse égale, ont 20 fois plus de sites de neutralisation potentiels, augmentant l'efficacité potentielle d'un médicament administré localement. Le coût des produits et la capacité de passer à une production très élevée devraient être inférieurs pour les miniprotéines beaucoup plus simples, qui, contrairement aux anticorps, ne nécessitent pas d'expression dans les cellules de mammifères pour un repliement correct. La petite taille et la stabilité élevée devraient également les rendre aptes à être formulés dans un gel pour application nasale et à être administrés directement dans le système respiratoire par nébulisation ou sous forme de poudre sèche. Nous explorerons d'autres voies de livraison dans les mois à venir alors que nous cherchons à traduire les protéines neutralisantes de haute puissance en traitements et prophylactiques contre le SRAS-Cov2. L'immunogénicité est un problème potentiel avec toute molécule étrangère, mais pour les petites protéines conçues de novo précédemment caractérisées, peu ou pas de réponse immunitaire a été observée ( Nous explorerons d'autres voies de livraison dans les mois à venir alors que nous cherchons à traduire les protéines neutralisantes de haute puissance en traitements et prophylactiques contre le SRAS-Cov2. L'immunogénicité est un problème potentiel avec toute molécule étrangère, mais pour les petites protéines conçues de novo précédemment caractérisées, peu ou pas de réponse immunitaire a été observée ( Nous explorerons d'autres voies de livraison dans les mois à venir alors que nous cherchons à traduire les protéines neutralisantes de haute puissance en traitements et prophylactiques contre le SRAS-Cov2. L'immunogénicité est un problème potentiel avec toute molécule étrangère, mais pour les petites protéines conçues de novo précédemment caractérisées, peu ou pas de réponse immunitaire a été observée (11 , 14 ), peut-être parce que la solubilité et la stabilité élevées associées à la petite taille rendent la présentation sur des cellules dendritiques moins probable.
Le moment choisi est essentiel en cas d'épidémie de pandémie: des traitements efficaces sont nécessaires dans les plus brefs délais. Nous avons commencé à concevoir minibinders en Janvier 2020 grâce à la Rosetta sur un modèle de la structure de Spike SRAS-CoV-2 et passe au structures cristallines une fois qu'ils sont devenus disponibles ( 4 , 15 - 17). À la fin du mois de mai 2020, nous avions identifié des neutralisants très puissants du virus infectieux; pendant ce même temps, un certain nombre d'anticorps monoclonaux neutralisants ont été identifiés. Nous pensons qu'avec un développement continu, l'approche de conception informatique peut devenir beaucoup plus rapide. Premièrement, à mesure que les méthodes de prédiction de la structure continuent de gagner en précision, des modèles cibles adaptés à la conception pourraient être générés dans la journée suivant la détermination de la séquence du génome d'un nouveau pathogène. Deuxièmement, avec l'amélioration continue des méthodes de conception informatique, il devrait être possible de rationaliser le flux de travail décrit ici, qui nécessitait le criblage de grands ensembles de conceptions informatiques, suivi d'une optimisation expérimentale, pour identifier les liants à très haute affinité. L'accord très étroit des structures cryoEM de LCB1 et LCB3 avec les modèles de conception informatique suggère que les principaux défis à surmonter ne sont pas dans la conception de novo de protéines avec une forme et une complémentarité chimique à la surface cible, mais dans la reconnaissance des meilleurs candidats et identifier un petit nombre de substitutions augmentant l'affinité. La grande quantité de données collectées dans les expériences de conception d'interface de protéines telles que celles décrites ici devrait informer l'amélioration des modèles atomiques détaillés au cœur des calculs de conception de Rosetta, ainsi que des approches d'apprentissage automatique complémentaires, pour permettre la reconnaissance et l'amélioration de la conception de séquence du meilleurs candidats; cela permettrait une conception in silico encore plus rapide des inhibiteurs de pM comme LCB1 et LCB3. Avec le développement continu des méthodes, nous pensons qu'il deviendra possible de générer des modèles neutralisant les pathogènes à ultra haute affinité dans les semaines suivant l'obtention de la séquence du génome. Il est difficile de se préparer à de futures pandémies inconnues et une telle capacité pourrait être un élément important d’une stratégie d’intervention générale.
traduction :
- forum Rosetta : https://boinc.bakerlab.org/rosetta/forum_thread.php?id=14226
- article Science Mag : https://science.sciencemag.org/content/early/2020/09/08/science.abd9909
- Affichages : 1047
Raid d'Automne 2020
- Détails
- Écrit par : Christian
- Catégorie parente: Actualités
Enfin venu le temps du Raid!
Il se déroulera sur le projet CPU NFS@home du 25 septembre (20h00) au 11 octobre 2020 (20h00).
Url pour s'y attacher : http://escatter11.fullerton.edu/nfs/
Afin de palier au risque de manque d'unités, World Community Grid sera le projet de secours.
Et pour ne pas laisser inactif nos GPU's, il vous est proposé de les faire cruncher sur le projet Einstein@home.
Url du projet : https://einsteinathome.org/
En espérant vous voir nombreuses et nombreux à nous rejoindre pour cet événement, nous vous invitons à la discussion
sur le forum AF: https://forum.boinc-af.org/index.php/topic,8357.0.html
- Affichages : 1117
WCG : OpenPandemics - COVID-19 : Mise à jour de septembre
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Les chercheurs et l'équipe technique du World Community Grid poursuivent leurs travaux pour faire travailler le projet sur GPU.
Contexte
OpenPandemics - COVID-19 a été créé pour aider à accélérer la recherche de traitements de la COVID-19.
Vous pouvez en savoir plus sur les détails des travaux sur le site Web de l'équipe de recherche.
Version GPU d'OpenPandemics
L'équipe de recherche et l'équipe technique de World Community Grid continuent de progresser dans le portage du logiciel qui alimente OpenPandemics sur GPU.
Les chercheurs travaillent sur l'amélioration des performances d'une version OpenCL. Pendant ce temps, World Community Grid a soumis le code pour l'examen Open Source d'IBM et un examen de sécurité. Nous ne savons actuellement pas exactement quand les relectures IBM seront effectuées.
AutoDock Suite a 30 ans
L'équipe de recherche a récemment publié un article sur l'histoire d'AutoDock, le logiciel qui alimente OpenPandemics, FightAIDS@Home et d'autres projets qui ont recherché des traitements potentiels contre diverses maladies.
Vous pouvez lire l'article ici (sur le portail).
État actuel des unités de travail
- Disponible pour téléchargement: 3 452 lots
- En cours: 2259 lots (18949527 unités de travail)
- Terminé: 9479 lots
2991 lots au cours des 30 derniers jours
Moyenne de 99,7 lots par jour
- Reste-à-faire estimé: 34,6 jours
17 sept. 2020
traduction de l'article de WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=648&messageId=175292.1002.1600783533184
- Affichages : 995
WCG : Help Stop TB - Mise à jour de septembre
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Les chercheurs de Help Stop TB auront bientôt un membre supplémentaire pour aider à l'analyse des données pendant quelques mois.
Que sont les acides mycoliques et pourquoi leur étude est-elle importante pour lutter contre la tuberculose?
Les réponses à ces deux questions sont dans la vidéo ci-dessus (en anglais).
Contexte
Le projet Help Stop TB a été créé pour étudier la gaine de la bactérie responsable de la tuberculose, afin d'aider les scientifiques à rechercher de meilleurs traitements.
En 2018, environ 10 millions de personnes ont contracté la tuberculose et 1,5 million de personnes sont décédées. Et dans une publication récente, l'Organisation mondiale de la santé a déclaré : «Entre 2020 et 2025, 1,4 million de décès supplémentaires par tuberculose pourraient être enregistrés comme conséquence directe de la pandémie de COVID-19».
Alternance des étudiants
En plus du nouveau membre de l'équipe qui a été présenté lors de la dernière mise à jour du projet, les chercheurs auront un étudiant supplémentaire pour aider à l'analyse des données pendant quelques mois, à partir d'octobre.
État actuel des unités de travail
- En cours: 41 lots (4100 unités de travail)
- Terminé: 23 574 lots
34 lots au cours des 30 derniers jours
Moyenne de 1,1 lots par jour
Remarque : pour ce projet particulier, les chercheurs doivent souvent analyser les lots que nous leur renvoyons avant de pouvoir construire d'autres unités de travail. Cela peut parfois conduire à une alimentation intermittente des unités de travail.
16 sept. 2020
traduction de l'article du WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=647&messageId=175292.1002.1600783533184
- Affichages : 985
iThena : Réseau informatique mondial avant et après la pandémie
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Dans le magazine "Forum Akademickie" ( https://forumakademickie.pl ) n ° 5/2020, un article "Globalna sieć komputerowa przed i po pandemii" (traduction du titre: "Réseau informatique mondial avant et après la pandémie") a été publié par MSc. Łukasz Świerczewski :
Réseau informatique mondial avant et après la pandémie
Avec un bon concept de fonctionnement et des données avec la bonne résolution, il est possible de trouver la plus petite aiguille dans la plus grande botte de foin, ce qui est l'un des principaux objectifs du projet iThena.
La pandémie COVID-19 a été le sujet dominant dans pratiquement tous les sites d'actualités et de réseaux sociaux ces derniers mois. Le monde n'anticipait pas l'apparition d'un ennemi aussi inattendu, silencieux et rusé. Nous n'étions pas préparés à l'image visible de la réalité qui nous est présentée par les médias. La COVID-19 a considérablement affecté de nombreux domaines de notre entreprise. La nouvelle menace a obligé les écoles, les universités et les entreprises à se tourner dans une très large mesure vers des activités menées derrière les bureaux de nos maisons.
Je ne suis ni biologiste ni une personne ayant une formation médicale. Jusqu'à présent, les virus dans mon travail d'ingénierie ont toujours attaqué les ordinateurs, pas les gens directement. Cependant, le changement dynamique de la situation mondiale et la nécessité d'adapter des sociétés entières à de nouvelles conditions affectent également les domaines technologiques. En passant nos journées à la maison, surfer sur le Web, faire des achats en ligne et regarder des films, nous sommes plus immergés que d'habitude dans la réalité virtuelle. Nous communiquons, les données circulent grâce aux ondes radio, aux impulsions électriques au milieu de certains supports de transmission, ou de plus en plus souvent grâce aux photons dans le cœur de la fibre. Même le meilleur réseau informatique peut être submergé par trop de trafic, ce que nous pouvons parfois observer.
Fig. 1. Une tranche de la visualisation graphique (points de réseau reliés par des arêtes représentant un possible flux de données point à point
BOINC et les défis de la science moderne
Dans le "Forum académique" (Forum Akademickie 7-8 / 2014) mon article intitulé BOINC - pas seulement des calculs. BOINC (extension complète de l'anglais: Berkeley Open Infrastructure for Network Computing) représente une plate-forme bien connue pour l'informatique distribuée utilisant des ressources informatiques connectées par Internet. Les internautes peuvent mettre des ressources informatiques à la disposition des scientifiques qui mènent leurs travaux dans différents projets BOINC. En termes de sujets, ces projets sont très diversifiés - des mathématiques pures (http://www.primegrid.com), en passant par la modélisation de problèmes de particules élémentaires (https://lhcathome.web.cern.ch) et l'apprentissage des lois des trous noirs (https://universeathome.pl), à des problèmes typiquement biologiques, médicaux ou directement liés à la pharmacie (http://boinc.bakerlab.org/rosetta). Alors que la situation de la COVID-19 s'aggravait, des équipes de recherche du monde entier ont également commencé à utiliser des projets BOINC pour soutenir les calculs qu'elles faisaient pour développer un vaccin (https://boinc.bakerlab.org/rosetta/forum_thread.php?id=13702). C'est un fil extrêmement intéressant - chaque internaute peut apporter une petite brique et soutenir la lutte contre un ennemi commun.
Passionnée depuis de nombreuses années, associée à BOINC et aux autres méthodes de traitement de données, j'ai lancé en septembre 2019 mon propre projet distribué. Au moment de la rédaction de l'article, ce projet n'effectue pas encore de tâches de calcul typiques - comme la plupart des systèmes BOINC. La tâche principale conçue sur la plate-forme dans la phase initiale était de cartographier et de surveiller les structures du réseau dans l'Internet moderne.
À partir de la source, les données envoyées sur Internet voyagent point par point à travers les périphériques du réseau jusqu'à ce qu'elles atteignent la destination définie. Si nous accédons au site Web à forumakademickie.pl (notre objectif) depuis notre ordinateur, les données, en fonction de la situation actuelle, peuvent circuler via le routeur domestique, puis tomber sur le premier appareil - déjà du côté de notre opérateur de télécommunications - d'où elles sautent plus loin jusqu'à ce qu'elles atteignent ton but. Le chemin du retour avec la réponse ne doit pas nécessairement passer par les mêmes points. La structure des réseaux et des flux de données dans l'Internet moderne peut être très compliquée, et nous - en tant qu'observateurs - ne sommes souvent pas au courant de tout. Certains appareils du réseau nous seront visibles, tandis que d'autres peuvent être «transparents» pour nous.
Fiabilité de la communication à haut débit dans des conditions d'urgence
Le concept de réseaux informatiques a été initialement créé avec des applications militaires à l'esprit. Le premier réseau étendu - ARPANET (Advanced Research Projects Agency Network), qui est le prédécesseur direct d'Internet, a été créé à l'initiative du ministère américain de la Défense. Le concept technologique supposait la possibilité d'une décentralisation du commandement en cas de guerre nucléaire. Les informations envoyées devraient arriver via un réseau informatique, malgré des pertes et des dommages même relativement importants aux infrastructures du pays. Si un chemin possible de la route de paquets est inaccessible ou surchargé, les algorithmes du réseau déplaceront automatiquement le trafic vers un ou plusieurs autres - théoriquement dans de meilleures conditions.
De nos jours, les solutions initialement conçues pendant la guerre froide défendent non seulement le haut niveau de sécurité nationale, mais nous permettent également de réduire la menace pendant une pandémie.
Internet avant, pendant et après la COVID-19
Le projet iThena (https://root.ithena.net/usr/), que j'ai lancé en septembre 2019, cartographie le plus possible Internet en utilisant plusieurs postes clients distribués. À la date de rédaction de cet article (13 avril 2020), plus de 5600 ordinateurs étaient enregistrés dans le système iThena. Tout le monde peut rejoindre le projet et les données obtenues sont destinées à être ouvertes. La figure 1 montre une minuscule tranche d'une visualisation graphique de la structure de l'Internet générée par iThena.
Lors de la construction du système iThena, je ne m'attendais absolument pas à ce que de tels changements se produisent sur la scène internationale. En raison des conditions extraordinaires et du grand dynamisme, le système - à partir de stations disséminées dans le monde entier - peut recevoir des informations beaucoup plus intéressantes que dans le cas d'une stagnation générale. D'un point de vue analytique, ces données peuvent être utilisées pour rechercher des réponses à de nombreuses questions. Le plus simple d'entre eux peut être : que faire pour rendre le réseau plus résilient aux problèmes des défis actuels et où sont les maillons les plus faibles ? et: Y a-t-il eu des anomalies particulières pendant cette période ?
Bien entendu, ce n'est pas le premier projet de ce type. L'une des plus grandes initiatives de ce type ces dernières années a été la solution DIMES conçue par des scientifiques de l'Université de Tel Aviv. IThena a fondamentalement les mêmes capacités et objectifs que DIMES. Le projet peut générer un «instantané» du graphe de connexion réseau (au niveau de détail des routeurs, via des points PoP plus généralisés, jusqu'à AS (voir l'encadré), en tenant compte de l'apparition de retards dans cet «instantané» et des erreurs possibles sur les relations de connexion individuelles. Ayant un "instantané" de la structure à partir d'un segment de temps donné, on peut confronter le routage actuel par rapport au meilleur itinéraire théoriquement, obtenu à l'aide de méthodes mathématiques (ex : recherche du chemin le plus court dans un graphe avec des poids) ou un itinéraire qui peut sembler trop bon, que nous avons obtenus à la suite de calculs évolutifs (par exemple, des algorithmes probabilistes, y compris des algorithmes de fourmis). Une telle analyse sur une sorte d '«organisme vivant» comme Internet n'est pas facile. Souvent, nous n'avons pas une connaissance complète et certaine de la structure actuelle du réseau. Dans une situation dynamique, il peut même être problématique de déterminer la géolocalisation des points de transit de données avec une précision suffisamment élevée.
Un autre domaine intéressant est celui des dysfonctionnements de routage. Dans le monde réel, les erreurs de routage peuvent être des erreurs humaines commises accidentellement par des techniciens ou, au contraire, intentionnelles. Si, par exemple, nous sommes en Pologne et que nous entrons sur le site Web forumakademickie.pl (le serveur Web est également situé en Pologne) et que l'itinéraire de notre flux de données n'est pas tout à fait rationnel, mais passe par divers points asiatiques (juste un exemple), vous pouvez souvent le considérer pour une certaine anomalie. En ayant une image cohérente de notre cyberespace - grâce aux données du projet - nous pouvons essayer de détecter de telles anomalies. La recherche peut souvent être comme chercher une aiguille dans une botte de foin. Cependant, après avoir développé un bon concept de fonctionnement et des données avec une résolution adéquate, vous pouvez trouver la plus petite aiguille dans la plus grande botte de foin.
Le moment de la pandémie de COVID-19 est très difficile pour nous tous, mais - malgré tous les problèmes - du point de vue scientifique et technique, c'est une période pendant laquelle nous pouvons apprendre beaucoup et tester beaucoup expérimentalement dans un environnement changé.
En résumé
Il y a certainement de nombreux défis à relever. Il n'est pas clair dans quelle mesure la situation actuelle affectera l'avenir - nous tous et notre civilisation dans laquelle Internet joue un rôle important. Dans de tels moments, cependant, nous devons particulièrement coopérer et nous soutenir mutuellement. Même si cet article a été écrit par un ingénieur, et a donc une solide expérience technologique, ces mots peuvent également s'appliquer à d'autres domaines de la vie socio-économique.
Pour ma part, en tant qu'architecte et administrateur de solutions système opérant dans le domaine distribué BOINC, je tiens à remercier tous les utilisateurs pour leur temps et leur aide précieuse.
PoP (Point of Presence) est le point de départ de la fourniture de services dans le réseau de télécommunications moderne. Il se compose de nombreux périphériques tels que des serveurs, des routeurs, des commutateurs réseau, des multiplexeurs et d'autres périphériques réseau, et il abrite l'intelligence / la logique pour exécuter les services. Ces types de points sont très souvent situés au niveau des points d'échange de données et des centres de colocalisation AS - Autonomous System, un ensemble d'adresses réseau IP sous contrôle administratif commun, dans lequel le schéma de routage (routage et envoi paquets). Par exemple, sous la désignation AS12324, il existe le système autonome LUBMAN-EDU-AS Poland, Lublin. L'AS peut contenir plusieurs PoP.
MSc. Łukasz Świerczewski est diplômé d'une maîtrise (informatique) de la Faculté de mathématiques, de physique et d'informatique de l'Université Maria Curie-Skłodowska de Lublin. Doctorant à l'Institut de recherche sur les systèmes de l'Académie polonaise des sciences. Les principaux intérêts sont dans le domaine de l'informatique distribuée et son accélération, ainsi que dans l'automatisation des processus dans les environnements informatiques avancés et les méthodes de collecte de données de masse et de traitement ultérieur.
Adresse e-mail:
traduction de l'article (en polonais) du Forum Akademickie : https://miesiecznik.forumakademickie.pl/czasopisma/fa-05-2020/globalna-%E2%80%A8siec-komputerowa-przed-i-po-pandemii%E2%80%A9/
mentionné dans le forum iThena : https://root.ithena.net/usr/forum_thread.php?id=87&postid=835#835
- Affichages : 1250
Un programme logiciel open-source aide à alimenter 30 ans de progrès dans la recherche informatique
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
AutoDock, le logiciel qui anime OpenPandemics et d'autres projets World Community Grid, a été créé il y a 30 ans chez Scripps Research.
Apprenez-en davantage sur ce logiciel puissant dans cet article et dans le document de recherche ci-joint récemment publié.
L'image ci-dessus, générée avec Python Molecular Viewer,
montre le résultat d'une simulation d'amarrage moléculaire effectuée avec AutoDock.
La recherche scientifique computationnelle était un domaine différent il y a quelques décennies, en grande partie à cause des limites de l'espace de stockage et de l'infrastructure informatique. Mais alors que la recherche de nouveaux et meilleurs traitements pour des maladies telles que le SIDA devenait plus urgente, les scientifiques de Scripps Research ont créé la première version d'AutoDock au début des années 1990.
Aujourd'hui, AutoDock a été utilisé dans de nombreuses études scientifiques dans des institutions et des entreprises pharmaceutiques du monde entier, notamment dans les projets FightAIDS@Home et OpenPandemics - COVID-19 du World Community Grid. Si ces projets sont tous deux axés sur la recherche de traitements contre le SIDA et COVID-19, respectivement, AutoDock a également été utilisé dans des études sur la méthodologie de conception des médicaments (ou la manière de concevoir des traitements).
AutoDock a été affiné et amélioré au cours des trois dernières décennies. Nombre de ces changements sont décrits dans un article sur l'histoire et l'évolution d'AutoDock publié dans la revue Protein Science. Vous pouvez lire l'article complet ici (traduction ci-dessous).
Merci à tous les bénévoles qui ont soutenu FightAIDS@Home, OpenPandemics - COVID-19, et d'autres projets pour la recherche de nouveaux et meilleurs traitements.
La suite AutoDock à 30 ans
David S. Goodsell 1,2, Michel Sanner 1 Arthur J. Olson 1 , Stefano Forli 1
1. Département de biologie structurelle et computationnelle intégrative, The Scripps Research Institut, La Jolla, CA USA
2. Collaboratoire de recherche pour la banque de données de protéines de bio-informatique structurelle, Rutgers, The State Université du New Jersey, Piscataway, NJ USA
titre courant : La suite AutoDock à 30 ans
Auteurs correspondants : David S. Goodsell, Stefano Forli
L'institut de recherche Scripps
10550 N Torrey Pines Road
La Jolla, CA 92037Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. ,Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Résumé
La suite AutoDock fournit un ensemble complet d'outils pour l'arrimage moléculaire par ordinateur des ligands et la conception et le développement de médicaments. La suite s'appuie sur 30 ans de développement de méthodes, notamment les champs de force empiriques à énergie libre, les moteurs d'arrimage moléculaire, les méthodes de prédiction des sites et les des outils de visualisation et d'analyse. Des outils spécialisés sont disponibles pour les systèmes difficiles, y compris les inhibiteurs covalents, les peptides, les composés à macrocycles, les systèmes où ils sont ordonnés. l'hydratation joue un rôle clé, et les systèmes avec une grande flexibilité de récepteurs. Toutes les méthodes d'AutoDock sont disponibles gratuitement pour l'utilisation et la réutilisation, ce qui a engendré la poursuite de la la croissance d'une communauté diversifiée d'utilisateurs principaux et de développeurs tiers.
Énoncé général : L'arrimage moléculaire par ordinateur est largement utilisé pour étudier les propriétés de liaison des ligands aux molécules biologiques et pour la découverte et la conception de nouveaux médicaments sur la base de leur structure. La suite AutoDock comprend une collection complète d'outils de calcul pour la préparation, l'exécution, la visualisation et l'analyse des expériences d'arrimage moléculaire par ordinateur. La suite AutoDock est librement disponible et a été utilisé par une communauté diversifiée d'utilisateurs et de développeurs.
Introduction
AutoDock a été présenté il y a trente ans comme la première méthode d'arrimage moléculaire des ligands flexibles à des protéines. À l'époque, les méthodes de prédiction de la structure biomoléculaire étaient souvent strictement limitées par l'état naissant de l'infrastructure informatique, qui était limitée à la fois en termes d'espace de stockage et la vitesse de calcul. De puissantes méthodes de dynamique moléculaire telles que AMBER 1 ont permis des représentations basées sur la physique, mais ils étaient limités à de courtes échelles de temps et exploraient généralement des espaces conformationnels autour d'un modèle de départ. La méthode révolutionnaire DOCK utilisait une représentation simplifiée des interactions ligand-récepteur, avec des ligands rigides et une méthode basée sur le score des champs d'interactions, et a ainsi pu rechercher les espaces conformationnels les plus importants nécessaires aux études d'arrimage moléculaire informatique et à la découverte de médicaments. AutoDock a pris une décision intermédiaire en utilisant un champ de force basé sur la physique, similaire à celui de l'AMBRE, mais en l'utilisant avec une approche volumétrique rapide d'évaluation énergétique pour permettre un amarrage qui explore les grands espaces conformationnels d'un ligand flexible.
Trente ans plus tard, la suite AutoDock a été utilisée dans de nombreuses recherches et des efforts de médecine dans le monde entier. En cherchant "AutoDock" dans PubMedCentral, on obtient plus de 7000 résultats et un total combiné de 30 000 citations sont signalées par Google Scholar pour les trois publications les plus citées de la suite AutoDock. Il s'agit notamment de rapports sur l'amarrage moléculaire, la méthodologie de conception des médicaments et les principales applications. Pour se faire une idée de la diversité de ces applications, nous avons fait une enquête sur les candidatures publiées dans le JACS à partir de la liste PubMedCentral, trouver des études portant, par exemple, l'analyse de substrats non naturels de la strictosidine synthase, la liaison du ligand dans une streptavidine artificielle Rh(III) métalloenzyme, la liaison des intercalaires de l'ADN covalent, la caractérisation de la liaison des colorants aux oligomères solubles des amyloïdes Aβ, l'évaluation des inhibiteurs covalents ciblés à partir d'un effort de découverte de ligands à base de fragments pour cibler un protéome de cellule de cancer du colon et le dépistage virtuel des glycanes contre la sialoadhésine.
Aujourd'hui, les utilisateurs disposent de multiples options académiques et commerciales pour l'amarrage moléculaire (voir, par exemple, plusieurs examens récents), et des copies d'écrans d'amarrage moléculaire virtuelles de plus en plus nombreux sont régulièrement effectués avec des résultats probants. Toutefois, l'efficacité de l'arrimage moléculaire et du dépistage virtuel reste limitée par les défis posés à la fois par l'interaction des utilisateurs et par les simplifications physiques nécessaires. Pour relever ces défis, le développement d'AutoDock se poursuit avec deux objectifs à l'esprit. Tout d'abord, une voie de développement fortement axée sur l'utilisateur a produit des outils validés pour une utilisation générale, y compris les interfaces graphiques, les modules d'ancrage et les outils d'analyse destinés à un large éventail d'experts et d'utilisateurs non experts. Deuxièmement, nous avons poursuivi de multiples voies parallèles de développement de nouvelles méthodes, en utilisant l'approche AutoDock comme un rat de laboratoire pour remédier aux limites actuelles des méthodes d'amarrage, y compris les lacunes dans les méthodes de notation et l'extension des recherche dans des espaces chimiques de plus en plus grands (figure 1).
La suite AutoDock
Les méthodes d'arrimage moléculaires informatique cherchent à prédire l'interaction entre les ligands et les cibles de protéines macromoléculaires. L'amarrage moléculaire est généralement utilisé dans le cadre d'une plus large exploration ou d'une ligne de conception (figure 2). Deux problèmes sous-jacents doivent être résolus dans toute méthode d'amarrage moléculaire efficace. Tout d'abord, un champ de force est requis pour marquer des poses d'essai du complexe, en espérant qu'elles reflètent les énergies sous-jacentes de l'interaction biomoléculaire. Deuxièmement, une méthode de recherche est nécessaire pour explorer suffisamment d'espace conformationnel d'interaction disponible afin de garantir qu'une réponse est obtenue. Au début du développement de la suite AutoDock, nous avons pris la décision de construire nos champs de force sur une base solide de méthodes basées sur la physique, qui ont montré beaucoup de succès dans la prédiction de la structure, des interactions et des propriétés biomoléculaires. Le défi a été de simplifier ces champs de force de manière à permettre leur utilisation dans les différentes méthodes de recherche nécessaires pour explorer les grands espaces conformationnels d'arrimage moléculaire.
La première version d'AutoDock combinait une approche volumétrique de l'évaluation énergétique avec une méthode tempérée de recherche simulée. Plusieurs approximations ont été nécessaires pour permettre l'amarrage moléculaire dans des temps raisonnables sur les niveaux VAX des ordinateurs de l'époque (figure 3). Des cartes volumétriques sont pré-calculées pour chaque type d'atome de ligand en balayant le scan des atomes examinés à travers l'espace occupé par la cible, avec pour conséquence qu'ils imposent une limitation d'un récepteur. En outre, les degrés de liberté conformationnels du ligand ont également été limités à des rotations de torsion, avec des longueurs et des angles de liaison contraints à la géométrie de la pose du départ. Cela repose sur l'hypothèse que la conformation liée est une variation en torsion de la conformation des entrées. Les limitations de l'espace de stockage ont également nécessité la réduction du nombre d'atomes et donc le nombre et la taille des cartes à calculer et à stocker. La suite AutoDock s'est développée à partir de cette base, fournissant actuellement de multiples méthodes d'amarrage moléculaire, des interfaces graphiques d'utilisateur et des outils d'analyse (tableau 1).
La version actuelle d'AutoDock, AutoDock4 (AD4), conserve une grande partie des concepts originaux d'évaluation de l'énergie et a nettement amélioré les capacités de recherche, en augmentant la complexité des ligands qui peuvent être arrimés moléculairement. Les améliorations du champ de force ont porté sur l'amélioration de la géométrie de la liaison hydrogène et la pondération empirique des paramètres du champ de force pour prévoir des pliages d'énergies libres, et les développements en cours décrits plus en détail ci-dessous. La collaboration avec les informaticiens a permis la mise en œuvre d'un algorithme génétique hybride/méthode de recherche local qui étend considérablement la portée de la recherche conformationnelle. Des améliorations récentes comprennent l'ajout de gradients à la description du champ de force et le portage de l'AD4 sur des unités de traitement graphique (GPU) pour améliorer encore les performances.
AutoDockVina (ADVina) est une méthode d'amarrage moléculaire clé en main qui a permis de faire le point sur l'état de l'art en 2010 en amarrage moléculaire. De nombreuses optimisations sont utilisées pour améliorer la vitesse d'amarrage moléculaire, notamment une fonction de notation par morceaux qui se prête à une évaluation rapide et qui a été calibrée en utilisant ~1300 complexes de PDB-Bind, et une méthode de recherche hautement optimisée basée sur un modèle de Monte-Carlo et l'optimisation locale basée sur les gradients. Une grande partie du mécanisme d'arrimage moléculaire qui est exposée dans les programmes AutoDock, comme l'utilisation de cartes pour l'évaluation énergétique, est cachée dans ADVina, ce qui en fait une bonne option à utiliser par des non-experts.
AutoDockFR (ADFR, "Flexible Receptor") est un effort de développement parallèle qui porte sur la limitation d'un récepteur rigide, s'appuyant sur le programme FLIPDock précédent comprenant la capacité à modéliser explicitement des chaînes latérales flexibles définies par l'utilisateur, mais l'ADFR crée une représentation du récepteur, permettant de définir les chaînes latérales, les boucles et les domaines subissant des mouvements lors des recherches conformationnelles. L'ADFR met en œuvre un algorithme génétique efficace qui permet de spécifier jusqu'à 15 chaînes latérales flexibles dans le site de liaison du récepteur. Il permet également de fixer des ligands covalents et de contraindre les atomes des ligands à des positions prédéfinies en utilisant les potentiels harmoniques. S'appuyant sur ces travaux, AutoDock CrankPep (ADCP) est un moteur d'amarrage moléculaire développé spécifiquement pour l'amarrage des peptides. L'ADCP combine l'échantillonnage de conformation des peptides Crankite avec les cartes d'affinité AutoDock pour un arrimage moléculaire efficace des peptides linéaires ou cycliques avec jusqu'à 20 acides aminés à partir de leur séquence.
La disponibilité du logiciel libre et la conception modulaire de la suite AutoDock ont également favorisé l'utilisation par de nombreux développeurs tiers. Citons par exemple Smina, une branche d'ADVina qui rationalise la personnalisation des champs de force, et PSO@AutoDock, une mise en œuvre de l'optimisation des essaims de particules dans AutoDock3.
Les avantages et les inconvénients des cartes
Le pré-calcul volumétrique des énergies d'interaction était l'innovation centrale qui a rendu possible l'amarrage moléculaire flexible dans les versions initiales d'AutoDock, et il reste essentiel pour réduire la complexité informatique du problème d'amarrage moléculaire. Dans le cas idéalisé d'un "verrouillage" parfait de l'interaction sous sa forme liée, définie et maintenue en place par des interactions spécifiques et stériques avec le récepteur voisin. En réalité, cependant, les macromolécules biologiques sont composées d'atomes de taille finie, de sorte que la forme du site actif est le résultat d'un compromis évolutif entre la nécessité de créer cette signature parfaite et contraignante, mais limitée par le produit chimique et les propriétés physiques de la protéine ou du polymère d'acide nucléique. Par conséquent, ces cartes nécessitent typiquement une certaine intuition chimique pour l'interprétation.
Néanmoins, les cartes d'interaction sont des outils puissants dans l'arsenal des méthodes de découverte de médicaments
et de la conception. S'appuyant sur l'idée que l'image latente des ligands préférentiels est contenue dans ces cartes, nous avons mis au point deux méthodes de prévision des sites de liaison. AutoLigand combine des cartes pour les atomes de carbone et les liaisons des atomes d'hydrogène, créant ainsi une carte combinée qui détermine le meilleur type d'atome pour chaque endroit. Ensuite, l'utilisateur définit une taille souhaitée pour le ligand et trouve le meilleur ensemble de points contigus dans les cartes ayant un tel volume.
AutoSite (Figure 4) adopte une approche légèrement différente, en localisant ces sites de liaison idéaux par regroupement des régions de haute affinité. Les deux méthodes peuvent être utilisées pour identifier les sites de liaison propices et pour caractériser la forme optimale des ligands qui se lieront aux sites.
Au fil des ans, nous avons également expérimenté des cartes spécialisées pour des applications particulières.
Par exemple, une simple carte qui indique la distance jusqu'à l'atome le plus proche peut être utilisée pour mettre des ligands en contact avec des protéines, réduisant ainsi l'exploration inutile de conformations complètement entourées de solvant. De petits niveaux de mouvement de la protéine peuvent être accommodés pendant l'amarrage moléculaire grâce à l'utilisation de cartes "lissées" qui évaluent l'énergie minimale dans un seuil de faible distance de chaque point, ou en créant des cartes qui combinent les contributions de multiples conformations de la protéine. Une approche plus directe peut également être adoptée, appelée "méthode des complexes relaxés", dans laquelle des instantanés d'une protéine sont pris à partir de la dynamique moléculaire, puis utilisés dans des expériences d'amarrage moléculaire individuelles. L'application d'AutoDock dans un ensemble d'arrimage
a joué un rôle dans le développement du premier inhibiteur de l'intégrase du VIH-1 cliniquement approuvé par Merck 3.
Interfaces graphiques utilisateur
Il est absolument essentiel de disposer d'un système frontal réactif pour aider les utilisateurs à tracer leur chemin dans leurs applications. AutoDockTools (ADT), basé sur les méthodes graphiques modulaires de MGLTools, a servi à cette fin pour les différentes versions d'AutoDock. Il fournit des outils graphiques pour ajouter des hydrogènes et définir l'articulation des ligands, préparer les parties flexibles et rigides des récepteurs, créer des fichiers de commande et enfin analyser les résultats des simulations d'amarrage moléculaire. Toutefois, ADT est un outil conçu en grande partie pour les utilisateurs ayant une connaissance approfondie de la modélisation moléculaire et des méthodes d'amarrage moléculaire, avec une grande partie de la machinerie d'AD4 exposée pour permettre la personnalisation pour des applications difficiles. En outre, il est principalement utile pour la spécification d'un petit nombre d'expériences d'amarrage moléculaire, et est lourd lorsqu'il est appliqué à des problèmes plus importants comme le dépistage virtuel. Ces limitations ont été et sont encore prises en compte par de nouveaux outils.
Chimera 35, PyMOL 36 et de nombreux autres outils tiers ont intégré la possibilité de spécifier et d'écrire des fichiers de commande pour ADVina, offrant ainsi une approche clé en main de l'amarrage pour les non-experts.
Nous sommes en train de développer un frontal clé en main similaire, qui fournit une interface de type "pointer-cliquer" permettant aux utilisateurs de personnaliser et d'organiser les coordonnées des ligands et des récepteurs à partir des entrées des archives PDB, et de spécifier des simulations d'amarrage moléculaire avec les choix résultants (voir ci-dessous).
Nous avons développé Raccoon comme un outil permettant de spécifier et de gérer des écrans virtuels avec la suite AutoDock. Il utilise une approche de base de données flexible pour préparer et gérer de grandes bibliothèques de ligands, dispose de mécanismes pour lancer et contrôler les simulations d'amarrage moléculaire sur les groupes de calcul et, surtout, dispose d'un arsenal d'outils de filtrage flexibles pour analyser les résultats et isoler les composés prometteurs pour des études supplémentaires (figure 5).
Améliorations
La biologie étant la biologie, il y a des exceptions à toutes les règles. La fonctionnalité de base de la suite AutoDock a été créée pour être un outil général, paramétré et validé par rapport à un ensemble diversifié de ligands de type médicamenteux se liant à des sites de liaison de protéines de poche. Entre nos mains, ces méthodes de base donneront des résultats d'arrimage clés en main pour environ la moitié des nouveaux systèmes d'essai. Dans d'autres cas, la biologie impose de nouveaux aspects qui ne sont pas efficacement traités dans la suite principale, de sorte que nous avons passé la majeure partie des trois dernières décennies à créer une série d'améliorations pour relever ces défis.
Les effets des solvants restent l'un des plus grands défis à relever pour améliorer la précision et la spécificité des simulations d'amarrage moléculaire. AD4, ADVina et ADFR intègrent tous des approches empiriques pour estimer les conséquences énergétiques de la désolvabilité, basées sur des mesures qui se rapprochent de la quantité d'eau déplacée par un ligand lorsqu'il se lie. Ces méthodes utilisent des fonctions avec une très faible dépendance à la distance et ne tiennent pas compte des effets localisés de l'eau de pontage. Nous avons développé une approche plus explicite de ce problème en attachant les eaux à toutes les positions possibles d'interaction sur un ligand, puis en permettant à ces eaux d'interagir avec les protéines ou de disparaître pendant la simulation d'amarrage moléculaire (figure 1).
Des potentiels spécialisés peuvent être utilisés pour incorporer des liaisons covalentes dans les simulations d'amarrage moléculaire.
Ces dernières peuvent être abordées de plusieurs manières. Des potentiels internes peuvent être ajoutés pour créer des liaisons au sein des ligands. Cela a été utilisé avec succès pour modéliser des ligands avec des macrocycles flexibles : l'anneau est brisé à un endroit, et la simulation d'amarrage moléculaire est effectuée avec un potentiel personnalisé qui favorise la reconstitution de la liaison macrocyclique d'origine. De même, en s'appuyant sur des travaux antérieurs sur l'arrimage moléculaire covalent, nous avons développé notre approche la plus efficace pour la prédiction et la conception d'inhibiteurs covalents ciblés. Appelée "reactive docking", la méthode utilise un potentiel personnalisé entre le ligand et le récepteur pour évaluer la capacité des ligands à se lier à des sites sur la protéine et forment ensuite des liaisons covalentes avec les sites adjacents de la réaction chimique (figure 6).
Nous avons conçu des méthodes permettant d'exploiter des informations expérimentales ou dérivées d'une autre manière pour orienter les calculs vers l'établissement d'interactions précises entre le ligand et la protéine. Par exemple, l'analyse de la dynamique moléculaire du cosolvant a été utilisée pour identifier les points chauds de liaison à la surface de la protéine et orienter les positions du ligand pour établir des interactions spécifiques avec ces régions. De même, l'ADFR prend en charge les contraintes harmoniques qui pénalisent les atomes de ligands spécifiés par l'utilisateur qui s'éloignent de la position prédéfinie, permettant ainsi un "ancrage", où un groupe d'atomes de ligands est soumis à une telle contrainte. Elle met également en œuvre le concept de
la recherche de voisinage, où la recherche d'amarrage moléculaire se concentre sur l'exploration du "voisinage" d'une position initiale accostée, le voisinage étant défini par une coupure RMSD.
Le champ de force de base de la suite AutoDock est paramétré et optimisé pour des types d'atomes standard, lorsqu'ils sont disposés en molécules standard semblables à des médicaments. Plusieurs laboratoires ont effectué des paramétrages personnalisés pour des systèmes spécifiques, comme une approche optimisée pour la liaison des glucides aux protéines. Nous avons concentré notre attention sur les aspects du champ de force qui manquent, comme les nouveaux potentiels pour spécifier la coordination par des ions métalliques tels que le zinc. Nous avons également lancé un effort pour améliorer les potentiels utilisés pour spécifier la liaison de l'hydrogène, en commençant par une étude détaillée de la force et de la direction de la liaison de l'hydrogène en utilisant une analyse de mécanique quantique des composés modèles.
Performance et choix du meilleur outil
Comme mentionné ci-dessus, nous avons suivi une approche à plusieurs voies pour le développement de la suite AutoDock afin de permettre l'exploration de diverses nouvelles méthodes. Cette approche, ainsi que le fait que de nombreuses autres méthodes d'ancrage académiques et commerciales efficaces sont actuellement disponibles, peuvent rendre difficile le choix d'un outil pour une application particulière. Dans la suite AutoDock, nous proposons généralement ADVina comme approche de première ligne, clé en main, car elle est rapide pour les ligands typiques de type médicamenteux. Pour les systèmes présentant différents défis non conventionnels, tels que la réactivité chimique, la flexibilité des récepteurs ou les systèmes nécessitant des paramétrages ad hoc, d'autres outils de la suite peuvent être appliqués pour les modéliser. Le tableau 2 présente des suggestions d'outils appropriés pour diverses applications courantes.
De nombreuses études de tiers ont été présentées, qui quantifient les performances des méthodes de la suite AutoDock et les comparent avec d'autres outils disponibles. Par exemple, une récente étude détaillée de cinq méthodes commerciales et cinq méthodes académiques avec deux mille complexes de PDBBind a montré une performance comparable d'ADVina, Glide, GOLD, et plusieurs autres, obtenant les meilleures positions amarrées dans environ la moitié des systèmes à 2,0 A RMSD près, et des coefficients de corrélation d'environ 0,5 pour la prédiction de l'énergie. Ces résultats reflètent nos propres conseils aux utilisateurs, basés sur les résultats de nos études de validation : en général, les méthodes d'amarrage réussissent environ la moitié du temps, avec de meilleures statistiques pour les ligands plus petits et moins flexibles et les cibles à flexibilité limitée, et les énergies sont prévues à environ 2-3 kcal/mol près, ce qui permet de séparer les inhibiteurs milli-, micro- et nano-molaires, mais n'est pas efficace pour le classement avec des différences énergétiques plus fines.
Dépistage virtuel avec la suite AutoDock
L'efficacité et les limites des méthodes actuelles d'amarrage moléculaire deviennent plus apparentes dans les efforts de dépistage virtuel. L'état de l'art actuel de la suite AutoDock, et de même pour la plupart des méthodes d'amarrage moléculaire actuelles, fournit des conformations amarrées cohérentes pour des molécules ayant environ une douzaine de degrés de liberté en torsion, avec des énergies libres prévues à environ 2-3 kcal/mol près, dans des systèmes où le mouvement des protéines ne joue pas un rôle significatif. Ce niveau de précision s'est avéré suffisant pour assurer le succès des efforts de criblage virtuel, avec l'espoir qu'entre 1 et 10 % des résultats virtuels prévus se révèlent présenter une affinité de liaison détectable lors des tests expérimentaux.
Le filtrage virtuel est sans doute la principale application de la communauté actuelle des utilisateurs d'AutoDock, et une grande partie des efforts de développement de la dernière décennie ont été axés sur l'amélioration de l'infrastructure et des résultats. Raccoon est le principal frontal supportant les écrans virtuels fourni avec la suite AutoDock (figure 5). Divers services web sont également disponibles auprès de tiers, tels que MtiOpenScreen et DrugDiscovery@TACC
(https://drugdiscovery.tacc.utexas.edu/).
Le développement des champs de force a également permis de relever certains des défis posés par le filtrage virtuel. Par exemple, en 2007, nous sommes passés à un modèle énergétique basé sur un cycle thermodynamique qui comprend une évaluation explicite des états liés et non liés. Des résultats prédictifs légèrement meilleurs ont été obtenus avec un protocole qui estimait les énergies des contacts intramoléculaires dans les ligands libres dans le cadre de ce cycle, mais ce protocole a finalement été abandonné pour un modèle plus simple qui suppose que les effets intramoléculaires sont similaires dans les états liés et non liés du ligand. Le modèle plus complet a systématiquement classé en tête de liste un ensemble de molécules entassées avec des affrontements internes, en raison de l'instabilité informatique des très hautes énergies de la forme non liée.
Le dépistage virtuel a entraîné le besoin de ressources informatiques toujours plus importantes, car plus la botte de foin est grande, plus elle risque de contenir une aiguille dorée. Heureusement, le criblage virtuel peut être "parallèlement embarrassant" en affectant chaque arrimage moléculaire composé à un processeur différent fonctionnant en parallèle, ce qui donne une vitesse pratiquement linéaire. En 2000, en collaboration avec Entropia, une start-up spécialisée dans le calcul, nous avons lancé FightAIDS@Home (FAAH) pour démontrer l'utilité pratique du calcul sur grille dans la conception de médicaments. FAAH a été le premier projet biomédical développé pour une plateforme de volontariat sur grille, faisant suite à des projets antérieurs de science citoyenne comme SETI@Home et le GIMPS (Great Internet Mersenne Prime Search) qui ont utilisé le calcul bénévole pour résoudre des problèmes astronomiques et mathématiques. Avec une telle ressource faisant tourner AutoDock sur des milliers de processeurs largement distribués, nous avons pu étendre nos études de la biologie structurelle du VIH avec de grands écrans virtuels. En 2005, FAAH a rejoint le World Community Grid d'IBM, qui a amplifié les ressources disponibles pour plus de 3 millions de volontaires CPU, augmentant considérablement la taille des bibliothèques de composés recherchés, ainsi que les degrés de liberté dans les modèles des protéines cibles.
Au cours de ces 20 dernières années, l'application de la suite AutoDock (AD4 et ADVina) sur les plateformes FAAH et locales a permis d'informer et d'élargir les approches du développement thérapeutique du VIH. Nous avons examiné le rôle de la flexibilité des protéines dans l'inhibition allostérique de la protéase du VIH et de l'intégrase en utilisant un panel d'instantanés de la dynamique moléculaire ; nous avons évalué de nouveaux inhibiteurs de protéase à large spectre (VIH/FIV), identifié de nouvelles cibles pour le développement de médicaments comme la capside du VIH, et exploré les mécanismes de l'évolution de la résistance du VIH aux médicaments. Grâce à un nombre considérable de résultats d'arrimage moléculaire provenant de grands cribles virtuels FAAH, nous avons utilisé l'apprentissage machine sur les données générées par FAAH pour améliorer les critères de sélection des vrais positifs dans le dépistage. Afin d'affiner encore les résultats des criblages AutoDock avec des calculs plus intensifs d'énergie gratuite, FAAH a maintenant entamé une deuxième phase en collaboration avec le laboratoire Levy, dans laquelle des simulations de dynamique moléculaire sont utilisées pour fournir de meilleures estimations de l'énergie libre de la liaison.
Récemment, en collaboration avec IBM World Community Grid, nous avons lancé le projet OpenPandemics - COVID-19 utilisant AutoDock (https://www.worldcommunitygrid.org/research/opn1/overview.do) pour réaliser de grands écrans virtuels contre de multiples sites cibles dans le protéome du SRAS-CoV-2 afin de rechercher de nouveaux candidats thérapeutiques COVID-19 potentiels, y compris des inhibiteurs covalents réactifs. Outre nos propres efforts, nos moteurs d'amarrage moléculaire soutiennent d'autres projets du World Community Grid qui réalisent des criblages virtuels ciblant le cancer, la malaria et le virus Ebola. L'ampleur de ces efforts de calcul distribué pose des défis uniques en matière de gestion et d'analyse des données d'ancrage qui sont abordés dans nos efforts de développement actuels.
L'amarrage moléculaire des peptides
Depuis la première version d'AutoDock, les utilisateurs ont repoussé les limites de ce qui peut être efficacement modélisé avec l'arrimage moléculaire informatique. Les peptides, en particulier, ont suscité un intérêt constant de la part de la communauté des utilisateurs, mais qui nécessite une approche créative. La motivation est claire : les peptides thérapeutiques ont connu une renaissance ces dernières années, comme en témoignent les 60 médicaments à base de peptides actuellement approuvés sur les principaux marchés, et plus de 150 en développement clinique actif. Les peptides cycliques présentent un intérêt particulier, avec 40 exemples en usage clinique actuel et en moyenne un nouveau qui arrive sur le marché chaque année. L'amarrage moléculaire des peptides, cependant, présente des défis de taille, tant pour la recherche que pour la notation.
La taille de l'espace-solution à explorer lors de l'amarrage moléculaire croît de manière exponentielle avec chaque variable ajoutée à optimiser. Les méthodes de recherche développées pour les petites molécules de type médicamenteux, qui ont généralement une douzaine de liaisons rotatives, ont donc peu de chances d'échantillonner correctement les 50 à 100 liaisons rotatives des peptides. Les peptides ont également tendance à s'associer à leurs partenaires de liaison dans des sillons peu profonds à la surface, tandis que les molécules de type médicamenteux se lient plus souvent dans des poches profondes propices à l'amarrage moléculaire qui minimisent leurs interactions avec le solvant. Par conséquent, les fonctions de notation développées et calibrées pour les petites molécules médicamenteuses sont souvent peu performantes pour les peptides, même les plus courts.
Les premiers travailleurs ont résolu ces problèmes en divisant les peptides en fragments, en les amarrant séparément, puis en choisissant des positions qui pouvaient être recombinées en une séquence peptidique souhaitée. Étonnamment, même l'amarrage protéine-protéine se prête à cette approche. Nous nous attaquons actuellement à ces problèmes en explorant des représentations simplifiées de l'espace conformationnel basées sur les transformations de la rotation du pivot (figure 3). L'ADCP, qui permet actuellement l'amarrage moléculaire cohérent de peptides comportant jusqu'à 20 acides aminés (figure 7), est à la pointe de ce domaine dans une évaluation récente de 14 programmes d'amarrage de peptides. L'ADCP peut également cycliser les peptides tête-bêche (figure 7.A) et/ou en formant jusqu'à 2 ponts disulfure lorsque les cystéines sont présentes (Fig 7.B), soutenant ainsi des molécules à cycles multiples. La cyclisation est réalisée à la volée pendant la simulation d'amarrage moléculaire en utilisant des potentiels pour tirer les atomes de soufre N et C-terminaux ou de cystéine ensemble tout en ignorant la répulsion stérique entre ces atomes. Dans ce dernier cas, l'appariement des cystéines n'a pas besoin d'être spécifié par l'utilisateur, mais résulte plutôt de l'amarrage moléculaire.
Développement actuel et orientations futures
Si l'on examine le vaste ensemble de recherches et de développements qui citent les publications d'AutoDock, et notre correspondance permanente avec les utilisateurs, on constate que nos principaux utilisateurs sont généralement des travailleurs dans des domaines connexes - biochimistes, biologistes structurels, physiciens - qui n'ont pas de compétences approfondies en matière de chimie computationnelle et d'arrimage moléculaire. Pour cette communauté, la suite AutoDock, et ADVina en particulier, est un ensemble attrayant étant donné qu'il est gratuit, facilement disponible et relativement simple à démarrer. Cela a donné lieu à des centaines de rapports dans lesquels l'arrimage moléculaire est utilisé pour compléter des études de structure/fonction plus importantes. L'un des principaux objectifs de notre développement actuel et futur est de soutenir cette communauté d'utilisateurs, vaste et croissante. Nous travaillons actuellement à la mise au point d'un frontal graphique unifié qui permettra d'exploiter la facilité d'utilisation d'ADVina, mais aussi d'accéder clé en main aux niveaux de fonctionnalités supplémentaires disponibles dans les autres outils de la suite. Ce frontal intégrera des outils agile pour gérer les nombreux défis posés par les coordonnées d'entrée expérimentales : construction des boucles manquantes et des résidus, protonation et tautomérisation, modèles de charge, flexibilité des récepteurs de manipulation, et des dizaines d'autres obstacles, petits mais essentiels (figure 8). Le frontal fournira également des outils faciles pour gérer les expériences d'amarrage moléculaire, allant de simples études d'un ligand d'essai avec un récepteur à des écrans virtuels, ainsi que des outils d'analyse pour filtrer et interpréter les résultats. Enfin, le frontal comprendra une fonctionnalité complète pour saisir la provenance de chaque expérience, garantissant la reproductibilité du travail effectué au sein de la suite. Nous espérons que cette interface fournira à terme un accès principal à la suite AutoDock pour tous les niveaux d'expertise des utilisateurs. Nous développons actuellement des composants enfichables de cette interface qui feront partie du frontal que nous envisageons, offrant un chemin progressif vers l'objectif ultime d'un environnement unifié où les utilisateurs peuvent facilement accéder à tous les outils développés dans nos laboratoires.
Nous bénéficions également d'une communauté dynamique et créative de développeurs tiers, et en réponse, nous avons cultivé une approche ouverte du développement de la suite AutoDock pour soutenir l'extension et l'innovation de cette importante communauté d'utilisateurs. Tous les composants de la suite AutoDock sont disponibles sous licence open source et accessibles via le site web AutoDock. Ils sont implémentés dans les langages de programmation C, C++ et Python. La suite AutoDock est un vaste écosystème de logiciels composé de nombreux composants logiciels, dont beaucoup peuvent être utilisés indépendamment. Le code source et l'exécutable de ces composants logiciels sont disponibles dans des dépôts indépendants. Bien qu'il soit possible de fournir tous les composants logiciels dans un seul dépôt, le fait de les garder séparés favorise leur indépendance : c'est-à-dire que les utilisateurs téléchargent la source d'un composant logiciel donné, le construisent et l'utilisent sans que les autres soient présents. Si une dépendance est introduite par inadvertance, ce processus échouera et nous alertera de la nouvelle dépendance introduite.
Dans nos propres laboratoires et dans de nombreux autres, les principes de base de l'amarrage moléculaire et de l'évaluation de l'énergie sont découverts et développés. Nos propres travaux se concentrent actuellement sur l'amélioration des fonctions de notation afin de fournir une évaluation et un classement plus précis de l'énergie, y compris l'évaluation des approches d'apprentissage machine pour le réglage ou la mise en œuvre de ces fonctions, et l'extension des méthodes de recherche, les peptides étant un point d'intérêt particulier actuellement. Nous avons travaillé sous le capot pour rendre les méthodes de la suite AutoDock modulaires et extensibles afin de soutenir les travaux qui continueront à étendre la fonctionnalité et la précision des méthodes d'amarrage moléculaire. Nous espérons que la suite AutoDock continuera à bénéficier d'améliorations dans ce domaine, en particulier de la précision de la modélisation rendue possible par l'augmentation spectaculaire de la puissance de calcul ces dernières années. Grâce à l'énorme impulsion donnée par les architectures accélérées telles que les GPU, il sera possible d'effectuer des évaluations énergétiques plus coûteuses et plus précises, en surmontant certaines des limites imposées par le calcul dans les premiers temps. Les outils de la suite AutoDock ont été et continueront à être disponibles gratuitement grâce à une licence open source sur le site AutoDock (site web : https://ccsb.scripps.edu/), avec documentation et tutoriels. Des protocoles détaillés pour l'exécution d'applications communes dans AD4 et ADVina ont été présentés.
Remerciements
Nous remercions Diogo Santos-Martins et Giulia Bianco pour leur aide dans la réalisation du manuscrit. Au cours des 30 dernières années, le développement d'AutoDock a été continuellement soutenu par le NIGMS-NIH, et plus récemment par les subventions GM069832 (SF) et GM096888 (MS). Les auteurs n'ont aucun conflit d'intérêt à déclarer. Il s'agit du manuscrit n° 30005 du Scripps Research Institute.
Figure 1.
Résultat de l'amarrage moléculaire du D3R Grand Challenge 4, avec un ligand macrocyclique lié à BACE1, en utilisant une nouvelle approche d'amarrage moléculaire accéléré par le GPU et un nouveau modèle de ligand hydraté. Tous les sites possibles sur le ligand sont hydratés avec une géométrie idéale (sphères cyan), et après l'amarrage moléculaire, tous sauf un se chevauchent avec la protéine (surface jaune) et sont utilisés pour évaluer une contribution de désolvabilité à l'énergie libre. La pose cristallographique est représentée en vert.
Image générée dans Python Molecule Viewer, y compris AutoDockTools.
Figure 2.
Un ligne de conception d'amarrage moléculaire typique commence par les coordonnées d'un récepteur et d'un ligand, à partir de déterminations expérimentales de structure, de modélisation d'homologie, de génération idéalisée à partir de SMILES, etc., présentés ici schématiquement en haut. Les récepteurs et les ligands sont traités pour se conformer à la représentation utilisée dans la méthode d'amarrage moléculaire (attribution des types d'atomes et des charges, définition des modes de flexibilité, etc.), et souvent un site de liaison préféré sur le récepteur est identifié. Le moteur d'amarrage moléculaire prédit alors les positions énergétiquement favorables du ligand dans le site de liaison du récepteur. Dans le criblage virtuel, tout ce processus se déroule à une plus grande échelle, en préparant et en fixant une bibliothèque entière de ligands, puis en filtrant les résultats pour identifier les meilleurs candidats pour une étude plus approfondie.
Figure 3.
De nombreuses simplifications sont imposées pour améliorer la vitesse d'accostage.
A) Les énergies d'interaction pour les atomes de la sonde sont calculées de manière volumétrique. Ici, les emplacements favorables pour le carbone (contours blancs) et l'oxygène (contours rouges) sont calculés dans le site actif d'une protéase du VIH résistante aux médicaments (entrée PDB 2hc0). Remarquez les deux lobes de la densité du carbone correspondant aux sites P1 et P1', et l'emplacement favorable de l'oxygène entre les volets, correspondant à l'emplacement d'une eau ordonnée dans la plupart des structures.
B) Seuls les degrés de torsion des ligands (ici, un métabolite monophosphate du remdesivir) sont recherchés, et des types d'atomes limités sont utilisés (ici, des carbones aliphatiques en gris et des carbones aromatiques en vert, et seulement des hydrogènes polaires).
C) Des mouvements plus grossiers sont utilisés pour simplifier la recherche conformationnelle de ligands plus grands, comme les mouvements du vilebrequin pour les peptides.
Images générées dans Python Molecule Viewer, y compris AutoDockTools.
Figure 4.
Prédiction de poche en un clic avec AutoSite dans l'interface graphique utilisateur de l'ADFR. Les trois poches de la protéase majeure SARS-CoV-II (entrée PDB 6lu7) sont représentées, y compris une cavité à l'interface du dimère (vert) et les deux sites actifs (jaune et orange).
Figure 5.
Analyse de criblage virtuel à l'aide de Raccoon2 : mise en place d'une petite bibliothèque de ZINC 62 sur la kinase c-Abl, montrant la conformation de l'imatinib (entrée PDB 1iep) redécouplée, utilisée comme composé de référence.
Figure 6.
Méthodes de liaison covalente supportées dans l'AD4.
A) La méthode de l'attracteur à deux points utilise deux cartes spécialisées (X et Z) qui ont des énergies favorables au site de fixation sur la protéine, entraînant l'amarrage du ligand à l'endroit de la liaison covalente.
B) La méthode d'amarrage réactif utilise un potentiel personnalisé qui conduit l'atome réactif du ligand (R) à la position de quasi-attaque sur l'acide aminé cible.
C) L'approche liée utilise la méthode de la chaîne latérale flexible pour optimiser une position arbitraire du complexe covalent.
Figure 7.
Panneau supérieur : meilleure solution d'ancrage (cyan) et structure cristalline (magenta) d'un peptide linéaire qui forme un interrupteur auto-inhibiteur dans la formine mDia1 (entrée PDB 2f31). En partant de la séquence, ADCP plie et place le peptide dans le récepteur. Les interactions entre la chaîne latérale et le récepteur sont bien prévisibles, sauf pour E2, E11 et R20 qui trouvent des plaques polaires.
Panneau inférieur : épine dorsale des peptides cycliques amarrés (boule et bâtonnet) et structure cristalline (réglisse).
(A) La pose amarrée la mieux classée pour une protéine adaptateur de substrat d'ubiquitin ligase avec un peptide cyclique modifié provenant de l'une de ses cibles (entrée PDB 3zgc). Les résidus sont colorés de bleu à rouge pour indiquer un enregistrement correct.
(B) Résultat de l'enregistrement d'un peptide lié à un disulfure interne du virus Epstein Barr affiché par le CMH (entrée PDB 5grd). Les résidus sont codés par couleur selon le type de résidu et les chaînes latérales des deux cystéines montrent la liaison disulfure créée.
Figure 8.
Interface utilisateur graphique en cours de développement pour la préparation des molécules à l'amarrage moléculaire, représentée ici avec un mutant cancéreux p53 (entrée PDB 6ggd). Lorsque le fichier PDB est chargé, le contenu moléculaire est analysé, classé et présenté dans un widget d'arbre permettant la spécification des résidus qui seront inclus dans le récepteur ou le(s) ligand(s). Toutes les biomolécules sont disponibles ainsi que l'unité asymétrique. Les acides aminés standard avec des atomes de chaîne latérale manquants sont sélectionnés pour la reconstruction et un rotamer par défaut est sélectionné (ici, Arg290 et Lys291). D'autres emplacements sont affichés et, par défaut, celui qui est le plus occupé est sélectionné (par exemple, Leu252@A). Le ligand de la structure cristalline est marqué pour être préparé en tant que ligand pour l'amarrage. Les segments d'acides aminés manquants sont affichés (en orange). Le widget de l'arbre est lié à la vue 3D, ce qui permet à l'utilisateur de se concentrer sur les zones potentiellement problématiques et d'inspecter la solution proposée.
14 sept. 2020
traduction de l'article WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=645&messageId=175292.1002.1600178732444
- Affichages : 1125
- WCG - FightAIDS@Home : Mise à jour de septembre
- WCG - Africa Rainfall Project : Mise à jour de septembre
- WCG - Microbiome Immunity Project : Mise à jour de septembre
- GPUGrid : dernière publication scientifique
- WCG : Smash Childhood Cancer - Mise à jour d'août
- WCG : Mapping Cancer Markers - Mise à jour d'août
Page 18 sur 35