SETI@home: Skymaps

Visualisation des données

SOMMAIRE :

 

Les cartes célestes


Les cartes célestes de SETI@Home sont des représentations rectangulaires en 2D de l'espace. Elles sont utilisées pour localiser les ondes radio détectées. Vous trouverez ci-dessous les descriptions des principales caractéristiques visibles sur une carte du ciel de ce type.
Cliquez pour voir la carte en grandeur réelle
Cliquez pour voir la carte en grandeur réelle


 
La zone du ciel sondée
click for full-sized map
Les lignes violettes sur nos cartes célestes représentent les secteurs du ciel sondés par le radio-télescope d'Arecibo. La ligne sur l'image à gauche est le résultat d'un balayage sur la journée du 13 août 2000. Si vous regardez attentivement, vous noterez que la ligne est elle-même composée de spikes (pics) détectés ce jour là (avec les petits points bleus et rouges balisant les pics particulièrement puissants).

 
Le système de coordonnées spatiales ( Ascension et déclinaison)
click for full-sized map
click for full-sized map
Tout comme la latitude et la longitude localisent un endroit sur Terre, la déclinaison (DEC) et l'ascension droite (RA) localisent un point de la sphère céleste. Les pôles nord et sud ainsi que l'équateur de la sphère céleste sont analogues aux pôles et à l'équateur sur Terre, mais projetés dans l'espace. La déclinaison (l'axe en ordonnée sur nos cartes du ciel) est mesurée en degrés Nord (valeur positive) ou degrés Sud (valeur négative) par rapport à l'équateur céleste. L'ascension droite (en abscisse) peut également être mesurée en degrés mais est généralement mesurée en temps (heures, minutes, secondes). Vue depuis la Terre, le ciel tourne de 15 degrés par heure (c'est à dire, 360 degrés toutes les 24 heures).

Notez que SETI@home ne publie pas des coordonnées détaillées des candidats avant que les candidats aient été réobservés avec une précision suffisante pour confirmer ou infirmer définitivement son statut.

 
La zone du ciel accessible depuis Arecibo
click for full-sized map
Le radio-téléscope d'Arecibo est fixe, détectant les signaux sur une bande de 20° de chaque côté de la position au zénith du radiotélescope. La zone grise sur cette carte du ciel représente la partie du ciel qui peut être observé par Arecibo.

 
La voie lactée, notre galaxie
click for full-sized map La zone en bleu représente la Voie Lactée

Les constellations
click for full-sized map L'écritue en bleu clair représente les abbrévations montrant la localisation approximative des 88 constellations officielles qui existent à ce jour.

 

Examinons précisément les signaux à l'aide des graphes cliquables

Les scientifiques de SETI@home doivent faire face au défi d'identifier les communications extraterrestres potentielles parmi l'énorme quantité de signaux (ou pics) capturés parmi les données du radio-télescope. Les utilisateurs de SETI@home détectent près d'un million de signaux puissants pour chaque période de 15 heures d'écoute des données du radiotélescope. Comme rapporté dans notre précédent bulletin n°6, la plus grande partie (sinon tous) des signaux que nous détectons sont attribuables au bruit ou aux I.R.F. (Interférences en Radio-Fréquences — signaux d'origine Terrestre.) Vouloir y discriminer des signaux E.T. est la quintessence même de l'expression "trouver une aiguille dans une botte de foin"

Une approche importante pour interpréter les signaux est d'afficher les données d'une façon telle que les scientifiques peuvent visuellement distinguer les signaux anormalement puissants dans toute cette foule. Les signaux habituels pourraient être des signaux d'une force excessive ("puissance"), ou démontrer une consistance au travers de leur fréquence, du temps et/ou de la position, ou se produire en motifs inhabituels qui se détachent nettement de leur champ. Les graphiques en cascade (graphiques obtenus en traçant les signaux en fonction de la fréquence et du temps) sont d'excellents outils pour ces tâches d'identification. (Se reporter au bulletin n°6 pour une discussion sur ces graphiques de cascades.)

La figure 1 ci-dessous est un graphe en cascade des signaux crête trouvés dans les données de la journée du 23 septembre 2000. L'axe vertical y (le temps) représente une bande d'enregistrement d'environ 57 000 secondes, et l'axe horizontal x (la fréquence) représente l' étendue des fréquences que couvre nos données (de 1 418,5 à 1 421,5 MHz). Croyez-le ou non, prêt de 100 000 unités de travail ont été traitées pour produire ces données, ce qui signifie que jusqu'à 100 000 utilisateurs de SETI@home ont contribué à cette analyse. Ces utilisateurs ont détecté et retourné un total de 985 599 pics. La figure 1 affiche en fait 1/16 ème de ces points, puisque le tracé de d'avantage de points rendrait le graphique ridiculement encombré. Sachant que la zone de tracé dans la figure 1 est haute de près de 220 pixels et large de 510 pixels, le graphique peut contenir un total de 112 200 pixels (220 * 510 = 112 200.) Aussi, pour plus de lisibilité nous nous sommes fixé une densité maximale de remplissage d'environ 50 %, soit près de 61 100 points tracés, au lieu de près d'un million.

Le codage en couleur de la puissances des signaux crête est effectué comme suit :

  • Signal d'une puissance de 0 à 20 => Bleu foncé
  • Signal d'une puissance de 20 à 25 => Rouge foncé
  • Signal d'une puissance de 25 à 50 => Rouge
  • Signal d'une puissance de 50 à 100 => Orange
  • Signal d'une puissance de 100 à 1000 => Jaune
  • Signal d'une puissance supérieure à 1000 => Blanc

Comme vous pouvez voir sur le schéma 1, la plupart des signaux ont une puissance comprise entre 20-25, avec également une partie significative entre 25 et 50.

Caractéristiques communes d'une distribution de signaux crête.

Notez les éléments visibles sur la figure 1. Les deux lignes jaunes verticales aux fréquences de 1 419 à 1 421 MHz sont des "chants d'oiseau" (ou "birdies" en Anglais) — des signaux de test injectés dans le récepteur du télescope par SETI@home pour s'assurer que l'instrumentation et les logiciels fonctionnent correctement. Si nous ne voyions pas ces chants d'oiseau aux positions attendues, nous saurions qu'il y a eu un problème avec notre équipement de mesure et de collecte ou dans le codage.

La bande verticale épaisse située à 1 420 MHz (correspondant à une longueur d'onde radio proche de 21,1 cm) est un artéfact de notre technologie de découpage. Sans entrer dans des détails trop précis, voici une tentative d'explication brève. Lorsque nous découpons les données (les fréquences) en unités de travail assez petites pour être analysées par les clients SETI@home, nous effectuons un calcul appelé Transformée de Fourier Rapide (FFT). Un des effets secondaire de ce calcul est que la puissance des signaux au centre de la bande de fréquence étudiée sont artificiellement amplifiés ; le centre de cette bande de fréquences se situe justement à 1 420 MHz.

Nous ôtons alors ces données erronées, mais en procédant ainsi, nous abaissons la ligne de base de la puissance des signaux immédiatement adjacents à 1 420 MHz, ce qui fait en retour que les signaux "normaux" à ces fréquences apparaissent plus puissants qu'ils ne le sont réellement (c'est à dire plus puissant que la "moyenne" représentée par la ligne de base de puissance des signaux sur toute l'étendue des fréquences retournées par une FFT, et cela affecte toutes les unités de travail portant sur cette fréquence centrale, dont le seuil de détection est plus facilement atteint). Aussi, la bande à 1 420 MHz apparaît plus épaisse et d'avantage remplie car elle consiste en fait en des signaux plus nombreux détectés juste avant et juste après 1 420 MHz.

Voyez également la ligne verticale rouge à environ 1420,8 MHz. C'est un exemple d'un signal puissant à une fréquence spécifique qui reste consistant à travers le temps. Il s'agit probablement d'une télécommunication en provenance de la Terre ou d'un satellite ; une exploration plus fine sera nécessaire pour en déterminer la source.

 

Regardons de plus près

Maintenant que nous avons une idée générale sur la façon dons les pics sont distribués à travers le temps et la fréquence, regardons de plus près quelques unes des caractéristiques les plus intéressantes.

La figure 2 ci-dessous trace les pics dans une étendue plus faible de temps et de fréquence (respectivement de 15 000 à 30 000 secondes et de 1 420,6 à 1 421,2 MHz). Ce graphique produit une vision rapproché à la fois du chant d'oiseau à 1 421 MHz, et de la bande verticale à 1 420,8 MHz. Avec une vue suffisamment rapprochée, il est possible de prendre en compte tous les signaux détectés dans cette étendue sans dépasser la limite de densité que nous nous étions fixé dans le graphique initial.

Les bandes horizontales noires sont claires également (correspondant à des réductions momentanées, mais heureusement pas trop fréquentes, de la sensibilité du télescope, probablement à cause de phénomènes météorologiques qui peuvent provoquer des changements de la température du capteur cryogénique suspendu au dessus du foyer du télescope, et saturer le système de contrôle du gain du capteur).

Notez également le petit groupe de signaux blancs à 21 000 secondes et 1421,1 MHz. Rapprochons nous encore de cet amas.

La figure 3 ci-dessous est une cascade tracée sur sur la plage allant de 18 750 à 22 500 secondes et de 1 421,09 à 1421,25 MHz. L'amas blanc a en fait la forme d'un petit rectangle large de près de 0,01 MHz et haut de 107 secondes. Cette taille correspond exactement à une unité de travail. (Les utilisateurs de SETI@home analysent les données en incréments d'une unité de travail à la fois.) Clairement il y a eu un problème avec les résultats retournés pour cette unité de travail. La plupart du temps, nous recevons des résultats erronés de la part de participants SETI@home qui utilisent des microprocesseurs surcadencés dans leurs ordinateurs ; ces processeurs surcadencés, même s'ils ne plantent pas le système d'exploitation ou le logiciel, tendent à produire des erreurs lors des calculs complexes en virgule flottante, ce qui produit parfois des résultats avec des puissances de signaux boguées (comme c'est le cas ici).

Graphes cliquables — Comment rassembler le tout.

Comme démontré dans les 3 exemples de graphiques ci-dessus, nous voulons clairement disposer de la capacité de zoomer sur des caractéristiques particulières d'un tracé tout en restant capable de voir la figure entière. Un tel scénario permet une grande efficacité pour identifier et éliminer les caractéristiques de signaux. Nous accomplissons cette tâche d'une manière assez simple et directe — nous générons des graphes cliquables (ou "clickplots"). Les graphes cliquables sont simplement des fichiers GIF avec une carte d'image insérée dans un document HTML tel qu'un clic souris sur une portion particulière du graphique affiche un graphique d'une résolution plus élevée dans la zone sélectionnée. Ces graphiques cliquables sont rapides, et leur production est facilement automatisée, implémentable, et gérable sur de grandes quantités d'ensembles de données très larges.

Dans un futur proche, nous prévoyons de développer un répertoire de graphes cliquables et utilisables par chacun sur le web, incluant également les tracés des gaussiens, impulsions et triplets. Nous prévoyons également de lier ces graphes cliquables à une carte des étoiles, de sorte que pour chaque point dans le ciel vous pourrez voir un graphe cliquable des signaux collectés par SETI@home à cet endroit. Restez en ligne et revenez nous voir pour d'autres ajouts et de nouvelles possibilités.

Les liens suivants affichent des graphes cliquables pour différentes classifications des résultats à partir des données collectées le 23 septembre 2000 (incluant les vitesses de dérives en fréquences et les longueurs de FFT).

Notez ci-dessus que la longueur de FFT = 128K correspond à la résolution la plus fine en fréquence de 0,075 Hz, mais aussi à la résolution la plus faible dans le temps (seulement 8 valeurs d'amplitudes calculées sur chaque fréquence, durant les 107 secondes d'une unité de travail comprenant 1M d'échantillons, soit au plus un signal toutes les 13,3 secondes).

Instructions simples pour utiliser un graphe cliquable.

Essayez de jouer avec les graphes cliquables ci-dessus. Cliquez sur une portion particulière du graphique pour charger une vue rapprochée de cette portion. Il est actuellement suffisant de pouvoir cliquer à une profondeur de 2 niveaux ; après 2 clics, vous atteindrez le niveau bas de l'image cliquable. Pour étendre à nouveau l'image, utilisez simplement le bouton "Retour arrière" de votre navigateur.

 

 

Les Graphiques de Persistance


Une étape importante dans le processus de détection d'un signal est d'identifier les ondes radio qui gardent une fréquence cohérente sur la durée. Des graphiques de persistance sont utilisés pour examiner les détails de ces événements continus, et des graphiques multiples sont utilisés, souvent en complément, pour comparer les caractéristiques des événements ainsi que pour se concentrer sur les distributions spécifiques des signaux crête, gaussiens, pulsés, et triplés

Le graphique en lui-même est une réelle combinaison de graphiques dit en casacade ("waterfall") et de deux histogrammes, leur explication est fournit ci-dessous. Bien qu'un graphique de persistance pourrait tracer deux variables quelconques les unes par rapport aux autres (en abscisse et en ordonnée), nous utiliserons à titre d'exemple un graphique de persistance de la fréquence en fonction du temps.

click for full-sized map
Cliquez pour voir le graphique à sa taille réelle


Titre du graphique  


Chaque graphique de persistance a un titre qui décrit le type d'événements tracés ("tous les signaux" - "All Signals" , "signaux crêtes" - " Spikes" , "signaux gaussiens" - Gaussians , "signaux triples" - Triplets ou des "signaux pulsés" - "Pulses"), le numéro d'identification (ID) de l'événement persistant identifié, et la date de détection de l'événement.

Le graphique en cascade (waterfall plot)

click for full-sized map
La partie en haut à gauche du graphique contient un nuage de points - chaque point corresponds à une détection en fonction du temps (l'axe des ordonnées) et de la fréquence (l'axe des abscisses). Au centre de ce graphique, vous pouvez voir un losange violet qui cible un événement particulier. Nous avons identifié cet événement comme persistant par rapport à un ou plusieurs autres événements du même endroit dans l'espace. Si le graphique retrace "tous les signaux" (voir le titre du graphique - "All Signals"), les points sont multicolores avec les signaux crête en bleu, les signaux gaussiens en blanc, les signaux pulsés en jaune, et les signaux triples en orange ; tous les autres points sont blancs.


L'histogramme de fréquence (axe des abscisses)

click for full-sized map
L'histogramme de fréquence partage son axe des abscisses (fréquence) avec le graphique en cascade. Il montre le nombre d'événements à proximité de l'événement cible (le losange violet dans le graphique en cascade) pour chaque fréquence. Un signal crête dans l'histogramme (par exemple à 1419,903 mégahertz dans le graphique témoin) signifie qu'il y a un nombre particulièrement grand d'événements détectés à cette fréquence. Ces histogramme de signaux crête représentent généralement des bandes d'I.R.F. ; si un événement ciblé a la même fréquence qu'une de ces bandes, c'est probablement une interférence radio.

L'histogramme temps (axe des ordonnées)

click for full-sized map
L'histogramme temps partage son axe des ordonnées (temps) avec le graphique en cascade. Comme beaucoup d'événements pour différentes fréquences sont détectés à des instants particuliers, la courbe admettra un pic à droite - une caractéristique d'un signal à bande large. Comme les signaux à bande large exigent de produire beaucoup d'énergie, la source de tels signaux a de très grandes chances d'être des I.R.F.


Les histogrammes de fréquence

SETI@home utilise des histogrammes de fréquence pour repèrer les fréquences pour lesquelles nous avons détecté un nombre démesuré d'ondes radio. De tels "signaux crête" pour une fréquence particulière représentent généralement les signaux tests injectés dans notre système d'enregistrement (pour vérifier son bon fonctionnement) ou des I.R.F. qui utilisent des fréquences de transmission spécifiques.

 
 

Ci-dessus vous pouvez voir deux exemples d'histogrammes de fréquence pour des signaux crête enregistrés le 24 mai 2000. L'histogramme à gauche retrace toutes les signaux crête enregistrés ce jour-ci; celui de droite ignore les signaux crête artificiellement injectés aux fréquences de 1418 MHz, à 1420 Mhz, et 1421 Mhz. Vous pouvez aussi visionner les histogrammes de puissance pour le même jour.

Les histrogrammes de puissance

La « puissance » d'une onde radio correspond à sa force par rapport au "bruit" de l'univers. Nous ne nous attendons pas à ce que les communications extraterrestres aient une grande puissance après avoir traversé des distances interstellaires (bien que ce soit théoriquement possible). Au lieu de cela, les ondes radio de grande puissance sont généralement créées par des I.R.F. proches ou par les signaux tests injectés artificiellement. SETI@home utilise des histogrammes de puissance pour examiner la distribution de cette puissance pour des modèles anormaux et isolés

Une fois que les I.R.F. connus ont été effacées de nos données, la plupart des événements de grande puissance devraient disparaître de ces distributions. Ci-dessus, vous pouvez visionner deux exemples d'histogrammes de puissance pour des signaux crête enregistrés le 24 mai 2000. L'histogramme à gauche retrace toutes les signaux crête enregistrés ce jour-ci; celui de droite ignore les signaux crête artificiellement injectés aux fréquences de 1418 MHz, à 1420 Mhz, et 1421 Mhz.

 
 

Une discussion détaillée sur les histogrammes de puissance peut être trouvé dans la lettre d'information scientifique -- Comment distinguer les possibles signaux extraterrestres, au milieu du bruit et des IRF.