Les recherches de l'équipe MCM sur les biomarqueurs du cancer du poumon ont permis d'identifier 26 gènes présents avec les meilleurs scores dans toutes les tailles de signatures considérées. Cette mise à jour se concentre sur VAMP1, un gène lié à la survie des patients et exprimé différemment dans le poumon normal par rapport au cancer du poumon.
Projet : Mapping Cancer Markers
Publié le : 20 mars 2023
Terminologie
- Signature génétique : Un ensemble de gènes dont il est démontré qu'ils jouent un rôle spécifique dans une maladie est appelé signature génétique. Lorsqu'une telle signature peut prédire la présence d'une maladie, on parle de signature génétique diagnostique. Lorsque la signature est liée à la survie, on parle de signature pronostique.
- Coefficient de corrélation de Matthews : Méthode statistique utilisée pour évaluer la performance d'un modèle prédictif. Il mesure les différences entre les valeurs réelles et les valeurs prédites.
- Sondes : Courtes séquences d'ADN ciblant une petite région d'un transcrit (gène). Pour les rendre plus spécifiques, les sondes sont organisées en ensembles de sondes, qui sont utilisés pour détecter et quantifier la présence de séquences génétiques par hybridation en raison de la complémentarité entre la sonde et la cible.
Contexte
Le projet Mapping Cancer Markers vise à identifier les marqueurs associés à différents types de cancer à l'aide d'un algorithme de recherche heuristique. Le projet analyse des millions de points de données collectés à partir d'ensembles de tissus de patients et identifie des modèles permettant de détecter le cancer plus tôt, d'identifier les patients à haut risque et d'adapter le traitement à chaque patient. Initialement axé sur le cancer du poumon, le projet s'est étendu à l'étude du cancer de l'ovaire et, plus récemment, à l'analyse du sarcome.
En novembre 2021, les volontaires du WCG auront donné plus de 800 millions d'unités de travail pour la recherche sur plusieurs types de cancer, dont 193, 379 et 245 millions d'unités de travail pour les cancers du poumon, de l'ovaire et du sarcome, respectivement. À ce jour, plus de 810 000 années de recherche informatique ont été données à MCM, et près de 240 années sont générées chaque jour. Nous vous remercions de nous aider à comprendre les signatures du cancer.
Figure 1 : Nombre d'unités de travail achevées par type de cancer et taille de la signature.
Analyse du cancer du poumon
Plusieurs méthodes sont disponibles pour le diagnostic du cancer du poumon, mais la ponction transthoracique et la biopsie thoracoscopique sont les méthodes les plus sensibles. Bien que très précises, ces méthodes sont invasives et les scientifiques ont cherché d'autres méthodes de dépistage ou des biomarqueurs pour identifier les patients atteints d'un cancer, en particulier aux stades précoces. Pour identifier de nouveaux biomarqueurs potentiels, nous avons testé plusieurs signatures dans un ensemble de tissus appartenant à des patients ayant des antécédents de cancer du poumon, afin de trouver des groupes de sondes qui pourraient indiquer que le patient est atteint d'un cancer du poumon à un stade précoce.
L'ensemble de données que nous avons choisi d'exécuter sur le WCG comprend 192 épithéliums bronchiques histologiquement normaux de fumeurs obtenus lors d'une bronchoscopie clinique. Cette procédure est effectuée de manière routinière, et la possibilité d'identifier des marqueurs de cancer exprimés dans le tissu normal serait donc un avantage. Sur les 192 échantillons de patients, 97 avaient un cancer du poumon, 92 n'avaient pas de cancer du poumon et 5 étaient suspectés d'avoir un cancer du poumon. Nos analyses se concentrent sur la différenciation du cancer du poumon des 92 échantillons non cancéreux.
Les volontaires du WCG ont testé 9 billions (9×1012) de signatures candidates pour le cancer du poumon, réparties en plusieurs tailles de signatures diagnostiques. Nous avons ensuite pris en compte les signatures dont le coefficient de corrélation avec Matthews se situait dans le percentile 99,999 parmi toutes les signatures de la même taille. La figure 2 montre la distribution des biomarqueurs dans les signatures. Le nombre est le nombre de fois qu'une sonde est présente dans les meilleures signatures pour sa taille.
Figure 2 : Fréquence de chaque nombre (c'est-à-dire le nombre de fois qu'une sonde est présente) par taille de signature.
Comme on pouvait s'y attendre, les signatures les plus petites ont souvent des nombres plus faibles, probablement parce qu'elles ne sont pas assez grandes pour capter le signal. Les mécanismes biologiques sont exécutés par plusieurs gènes, ce qui crée une redondance dans le signal de la signature qui peut repérer n'importe quel gène du même mécanisme. Différents gènes peuvent donc être liés au même mécanisme, mais à première vue (et sans explorer le mécanisme auquel ils sont liés), les gènes des petites signatures peuvent être différents.
À mesure que les tailles augmentent, nous constatons que les nombres se stabilisent autour de 1 000, avant de diminuer à nouveau lorsque la taille des signatures augmente, probablement parce qu'il devient trop important d'extrapoler le signal en évitant la redondance.
Si l'on considère les probesets dans le 99e percentile de comptage et présents dans au moins 20 tailles de signature, on constate que le chevauchement est plus important dans les signatures de tailles comprises entre 10 et 23, ce qui indique que la meilleure fenêtre de taille de signature se situe dans cette fourchette (figure 3). Cette constatation sera importante pour les études futures sur les signatures diagnostiques. Notre objectif est de publier toutes les données calculées avec l'aide des volontaires du WCG dans une base de données librement accessible, où d'autres chercheurs pourront comparer leurs résultats à la "molécule pulmonaire".
Figure 3 : Carte thermique des 143 sondes présentes dans plus de 20 tailles de signature et des tailles dans lesquelles elles sont présentes.
En approfondissant les résultats, nous avons constaté que 28 ensembles de sondes (correspondant à 26 gènes) sont présents dans toutes les tailles de signature. L'un de ces gènes, VAMP1, est particulièrement prometteur car sa protéine est impliquée dans la fusion des vésicules synaptiques avec la membrane présynaptique. Vous trouverez ci-dessous les localisations cellulaires de VAMP1 selon UniProt, ainsi que sa structure 3D prédite par AlphaFold.
GO ID - Terme GO qualifié
GO:0005739 - mitochondrie
GO:0005741 - localisé_dans la membrane externe de la mitochondrie
GO:0005829 - localisé_dans le cytosol
GO:0005886 -est_actif_dans la membrane plasmique
GO:0005887 - membrane plasmique
Figure 4 : Annotations des composants cellulaires et structure de la protéine VAMP1 (telle que prédite par AlphaFold).
En étudiant VAMP1 dans des ensembles de données externes pour valider son importance, nous avons découvert qu'il est significativement lié au statut de fumeur chez les patients atteints de cancer du poumon (par le biais du cBioPortal). Dans notre étude précédente, nous avons pris en compte les microARN spécifiques au tabagisme qui peuvent réguler VAMP1 (comme déterminé par notre portail de données mirDIP). Il est intéressant de noter que hsa-miR-1262, un microARN spécifique aux anciens fumeurs, régule VAMP1. Aucun des microARN spécifiques aux fumeurs actuels ou aux personnes n'ayant jamais fumé ne semble être pertinent. Il est important de noter que VAMP1 protège la survie globale dans le cancer du poumon (une forte expression entraîne une survie plus longue), ce qui en fait un marqueur pronostique potentiel.
Figure 5. Le diagramme de Kaplan-Meier montre que les individus ayant une forte expression de VAMP1 (en rouge) survivent significativement plus longtemps que les individus ayant une faible expression de VAMP1 (en noir). Cela montre que VAMP1 est un marqueur pronostique.
La valeur protectrice de VAMP1 est encore renforcée par l'expression du gène dans les deux principales histologies de cancer du poumon, comme le montre la figure 6. Les échantillons normaux expriment un niveau beaucoup plus élevé de VAMP1 que les échantillons cancéreux. Cela montre que VAMP1 est également un marqueur diagnostique potentiel.
Figure 6. Expression de VAMP1 dans des échantillons normaux et des échantillons de cancer du poumon.
En étendant notre observation au-delà du cancer du poumon, comme décrit dans notre description initiale du projet WCG, nous constatons que VAMP1 se comporte de manière similaire dans la majorité des cancers testés, comme le montre la figure 7. Cela suggère que VAMP1 est un acteur clé de la cancérogenèse et qu'il pourrait être impliqué dans un mécanisme lié aux caractéristiques du cancer.
Figure 7. Expression de VAMP1 dans les cellules normales et cancéreuses pour 22 types ou sous-types de cancer différents. (Les différences significatives selon le test U de Mann-Whitney sont indiquées en rouge).
Nous sommes enthousiasmés par ces résultats et nous en partagerons d'autres à l'avenir, au fur et à mesure que nous poursuivrons la validation de nos résultats d'analyse du cancer du poumon.
Si vous avez des commentaires ou des questions, n'hésitez pas à les laisser dans ce fil de discussion pour que nous puissions y répondre. Nous vous remercions de votre soutien.
L'équipe du WCG
Source : https://www.worldcommunitygrid.org/about_us/article.s?articleId=782
Deepl, quand tu nous tiens.