Les résultats peuvent êtres comparés sous divers aspects : quantité de signal extrait, rapport signal à bruit obtenu, contamination par l'hôte, robustesse, rapidité, convivialité, souplesse...
Il y a une différence systématique entre les extractions : l'échantillonnage MIDAS est à pas constant en , alors que le mien est irrégulier : il suit celui réalisé par les pixels sur la fonction de dispersion.
Souvent, une autre différence provient de choix de PSF différents. Je tiens compte d'une inclinaison déduite des profils intégrés par filtres photométriques, comparés aux reférence issues du suivi CFHT. D'autre part, l'hôte est extrait en utilisant ce même profil de référence.
Ma procédure d'extraction dédiée a été baptisée PHASE (PHotometry Assisted Spectra Extraction), et je m'y réfèrerai par ce nom, par opposition à la procédure standard basée sur MIDAS dénotée Temps-Réel.
Dans l'hypothèse d'un pointé précis (que la supernova soit bien dans la fente), d'un bon seeing (inférieure à l'étendue de l'hôte, et à celle de la fente), et en négligeant la courbure de la trace, le flux de la supernova est éffectivement séparé de celui de la galaxie hôte.
Quand bien même la galaxie est brillante, le flux extrait pour la supernova peut être très faible si la supernovæ l'est effectivement. Son spectre sera affecté par le bruit de photons de l'hôte, mais la contamination sera idéalement nulle. Le cas idéal correspond : (i) à une adéquation parfaite de la résolution spatiale de l'image de référence et de celle du spectrogramme combiné, (ii) à une galaxie hôte de spectre uniforme (galaxie elliplique), sans vitesse radiale de rotation (vue de face).
Dans le cas d'une mauvaise modélisation du spectrogramme (seeing à Paranal meilleur que les images de référence), la forme exacte de la source n'est pas reproduite par le modèle gaussien, et l'image résiduelle en montre l'écart (c.f. Fig. 5.2).
Au-delà d'une comparaison visuelle des spectres extraits, on peut les comparer qualitativement via le rapport signal à bruit. Ce rapport peut faire intervenir soit le niveau de bruit statistique propagé (S/N), soit le niveau de fluctuation à faible échelle (S/rms), mesuré par l'écart-type d'un groupe de quelques points de mesures (8) autour d'un ajustement de bas ordre (cubique). Le premier correspond à un rapport signal à bruit que l'on peut qualifier de théorique, quand le second s'apparente à un rapport empirique. Il faut noter que les fines raies d'émission risquent d'accroître artificiellement l'écart-type si elles sont ignorées par l'ajustement de bas ordre, ce qui mène à sous estimer S/rms.
La comparaison des deux estimations du rapport signal à bruit, moyenné sur tout les pixels, permet de valider le niveau de bruit statistique propagé : s'il est exact, les deux valeurs doivent être comparables. Les exemples présentés ci-après montrent que le S/rms est toujours plus élevé que le S/N. L'ajustement cubique est probablement à l'origine d'une sous-estimation de l'écart-type, qui induit cette différence. Toutefois, la différence reste proche de 50% pour la procédure dédiée, alors qu'elle varie de 100% à 400% pour la procédure standard. On peut supposer que le niveau de bruit est sur-estimé par cette dernière.
Lorsque la supernova ne se trouve être superposée à aucune source, ou que l'algorithme d'extraction l'a fusionné à l'hôte non résolu, l'extraction correspond au cas le plus simple : celui d'une source ponctuelle. Les extraction se doivent donc de produire de résultats compatibles.
|
Le cas d'une SNIa lointaine (z=0.6), prise dans de bonnnes conditions de seeing (0.75 '') et d'hôte indécelable, est présentée en Figure 5.3. Les spectres sont ici parfaitement comparables. Les résidus de la raie d'émission atmosphérique O[I] sont souvent moindres avec la procédure dédiée. Le niveau des fluctuations est légèrement plus faible (S/rms plus grand) avec la procédure standard car le rééchantillonnage de l'échelle des corrèle les points de mesure. Le niveau de bruit statistique estimé est cependant plus élevé, menant à un rapport signal à bruit (S/N) plus faible.
Le cas le plus général qui puisse être rencontré correspond à une supernova explosant au sein d'une galaxie possédant un cur et des bras spiraux, créés par une galaxie voisine. Sa plus proche voisine physique peut éventuellement apparaitre proche d'elle par projection, mais la galaxie que nous observons à plus courte distance d'elle n'appartient pas forcément au même groupe, et peut avoir un redshift bien plus faible ou bien plus grand.
En ces cas là, la définition des sources est cruciale pour une extraction efficace. Le cas le plus subtil soluble correspond à une supernova explosant dans un bras spiral. Si la galaxie est résolue, on peut estimer le spectre du bras spiral par celui du bras symétrique, non contaminé par la lumière de la supernova, pour le soustraire. De manière standard, ceci est fait par deux extractions dont on soustraira une fraction de l'une à l'autre pour retrouver le spectre de la supernova seule. Cette fraction de galaxie hôte affecte la couleur et les rapports de raies du spectre « décontaminé ».
La procédure dédiée, si le profil des sources est bien construit, sépare en une unique extraction l'ensemble de ces sources. En conséquence, si le spectre des bras est bien symétrique et que les deux bras ont bien été regroupés en une seule source à extraire, le flux supplémentaire attribuable à la supernova lui sera bien affecté, et rien de plus (c.f. Fig. 5.4).
|
Lorsque la supernova se trouve proche du centre dense d'une galaxie sysmétrique peu étendue, on voudrait utiliser son profil, même peu étendu, pour contraindre la composante galactique au centre et réduire la contamination du spectre de la supernova. L'algorithme à une conception large du point source, et tend à considérer une telle galaxie comme ponctuelle (cette largesse à pour but de séparer les paires de galaxies proches, c.f. 04D4it). Les résidus d'extraction montrent que l'on extrait bien le cur de la galaxie et le coté de la supernova, mais que l'autre coté de la galaxie n'est pas extrait. Et donc que son symétrique contamine le spectre de la supernova.
Il y a moins du cinquième du flux du cur dans les bras pour qu'ils ne soient pas considérés ( =0.2). Le spectre de la supernova peut donc contenir jusqu'à (1/2 x 1/5)/(1+1/5)=1/12 du flux total de la galaxie. 5/6 seront affectés au cur, et le 1/12 restant ne sera pas extrait. En ce cas, l'extraction sera similaire à ce qui est obtenu avec la procédure standard. Mais il est possible de refaire l'extraction en utilisant une coupure différente pour définir les sources étendues : c'est ce qui a été fait pour 03D1bm, présentée en Figure 5.5.
|
Lorsque les conditions d'observation sont mauvaises, ou que la supernova est trop faible par rapport à une galaxie hôte géante, l'absence de signal séparable du fond diffus de l'hôte n'est hélas pas récupérable. On se trouve dans la même impuissance, quelque soit la complexité de la procédure choisie.
La précision des coordonnées fournies à l'ESO et du pointé du télescope, ainsi que la stabilité atmosphérique, tous conjugés et rapportés à la largeur de la fente choisie, peuvent aboutir à former un spectrogramme inutilisable. Soit car il n'y a pas de source résolue sur le fond galactique prévu, soit car il n'y a visiblement pas eu flux dans cette direction, cette nuit là.
Lors des premiers mois, les cas difficilement identifiables furent demandés une seconde fois à l'ESO. C'est bien pour cela qu'il faut traiter rapidement ces données : la supernova est sûrement déjà à son maximum de lumière, et plus l'on attend, plus le seeing premettant d'en obtenir quelques photons devra être exceptionnel.
En fait, la décision depend aussi de la longueur de la liste d'attente, de la couleur et de l'évolution du candidat s'il y a de nouvelles observations au CFHT, et de la difficulté d'observation du couple supernova/galaxie : Une supernova proche du centre d'une galaxie elliptique à moyen redshift ne sera probalement pas réobservée si la première observation ne donne rien. En revanche, une supernova isolée, faible, rouge et lente captera toutes nos attentions. Ainsi, 05D2ci, à un redshift de 0.63, découverte peu de temps après son maximum, fut spectrée à trois reprises. La dernière a eu lieu 11 jours après le maximum de lumière tel que l'on peut l'estimer d'après la courbe de lumière; et de la certitude que cela soit bien une supernova de type Ia; ce dont on a pu finalement se convaincre au vu de la dernière séquence spectrale (seeing 0.75).
Parfois, le spectrogramme combiné ne permet pas à l'il humain de distinguer une composante un tant soit peu séparée de la galaxie hôte. Poutant, l'algorithme est tout de même capable de séparer les contributions respectives de la supernova et de la galaxie. Le candidat 04D2bt en est un exemple : c'est une supernova de type Ia, à un redshift de 0.22, séparée de seulement 0.35'' du centre de la galaxie. Ici, la quantité de flux disponible ainsi qu'un bon seeing (0.62'') favorisent le bon comportement de l'extraction (c.f. Figure 5.6).
|
Et, de ses doigts frêles, retire le caillou importun.
Lorsque le cri n'est plus perceptible, la machine est prête à servir. Cependant, il existe des aberrations -défaillances-, qui réfutent le modèle de notre échantillon de données, et nous obligent à l'agrandir, à relaxer certaines hypothèses faites implicitement auparavant. On englobe ainsi au final une grande majorité des cas de figures possibles, relativement à toutes les variables intervenant dans la chaîne de réduction.
On comprend que le choix des paramètres internes à l'algorithme determinent son comportement dans les cas complexes, donc la qualité des spectres finaux. Dans quelques cas, lorsque le seeing à Paranal est mauvais, les valeurs par défaut des paramètres définissant les sources ne sont pas adaptées. Une extraction personnalisée est alors réalisée, qui consiste par exemple à augmenter afin de réunir une galaxie hôte faible avec une supernova proche du cur. Ainsi, au lieu de deux spectres contenant un fort bruit anticorrélé, on obtient la somme des deux. La séparation supernova/galaxie échoue donc, et l'on ne peut éviter d'ajuster une composante galactique au moment d'identifier la nature de la supernova.
Sur les 208 observations réalisées, après quelques ajustements spécifique des paramètres ( , , ...) pour une douzaine d'entre elles, on dénombre :
Au compte de l'ESO :
Au compte de la Pacha Mama5.1 :
Au compte de mon algorithme :
Image : | brute | combinée | du bruit |
Effet d'un pixel nul à droite d'un pixel saturé | |||
Effet des aigrettes autour d'un puissant cosmique |
Les préliminaires nécessaires que me semblaient être une calibration fine et une extraction adaptée se sont révélés suffisant à remplir, et même à déborder mon temps de thèse. Nous disposons au final d'une chaîne de réduction faite sur mesure pour notre échantillon de données. Elle ne fait appel qu'à des fonctions élémentaires implémentées en C++ et en Python, dont les libraires cfitsio et lapack de la cernlib. Le nombre de fichiers intermédiaires a été limité tant que possible. La position des pixels rejetés, les modèles de ciel calculés, et diverses variables intermédiaires sont conservés dans un fichier au format FITS. Le niveau de bruit statistique est calculé et propagé au cours de la réduction et de l'extraction.
Par rapport à une réduction standard, les principales différences résident dans la conservation de l'échantillonnage irrégulier des pixels selon , afin de ne pas corréler les pixels voisins. Les rayons comiques sont filtrés temporellement au moment de combiner les spectrogrammes calibrés du CCD et dont le ciel a été soustrait. Enfin, l'extraction est guidée par l'adéquation du signal spectral avec les images profondes obtenues au CFHT.
L'efficacité de l'algorithme est conditionnée à l'exactitude des coordonnées de la supernova par rapport au système astrométrique des images de référence : Une imprécision biaisera le calcul de la position à laquelle le signal de la supernova doit être extrait. Un seeing à Paranal meilleur que celui des images profondes est également souhaitable, bien que dans certaines configurations (supernova proche du centre d'une galaxie piquée) cela puisse mener à un flux extrait négatif (c.f. 03D1fb).
Le changement majeur par rapport à la chaîne de réduction directe réside surtout dans l'absence, en première approximation, d'intervention humaine. Le graal que je poursuivais, et dont mes directeurs avaient bien préssenti à quel point il est utopique, était l'auto-suffisance algorithmique, par laquelle le signal serait proprement distillé par une saine machinerie prolongeant naturellement le télescope et l'instrument qui l'habille.
Ce projet n'est pas vain, mais bien escarpé. La faille nous attend là où l'on ne l'a pas imaginée : de la multiplicité des sources qui sont invoquées tour à tour, nécessaires et cruciales à la réussite du projet, ainsi que de l'hypothèse d'homogénéité parfaite des données. Utiliser uniquement les spectrogrammes pour extraire le signal d'une source sur un fond inhomogène est une gageure : il faut nécessairement savoir auparavant où se trouve la source sur l'axe spatial. Si l'on connaît bien notre instrument, et qu'il est stable, on peut prévoir le déplacement de cette position en fonction de la longueur d'onde mesurée. Pour FORS1, le problème ne se pose quasiment pas, et l'on peut se satisfaire d'une position indépendante de . Et l'homme conserve ce privilège de pouvoir reconnaître avec acuité la position à laquelle se trouve la source, pour peu qu'il dispose de la carte de pointé et d'une interface graphique adaptée.
Pourtant, l'erreur est humaine, et l'extraction quotidienne, répétée cent fois lorsque le cas est subtil pour explorer les possibles, si elle tient parfois du jeu, prend aussi des airs de cauchemars lorsque la journée est longue et que décidément rien ne va.
En bon humaniste, je me proposais donc d'utiliser toutes les informations disponibles mais encore non exploitées pour simplifier le travail d'identification. À commencer par le calcul des décalages entre les spectrogrammes de science successifs à partir des coordonnées référencées, plutôt que de devoir les deviner en comparant les images. Ensuite, il faut à l'évidence disposer d'un spectre contenant non pas le plus de signal, mais le plus de signal provenant effectivement de la source étudiée, et non de sa galaxie hôte. À priori, toutes les étapes de calibration jouent un rôle plus ou moins critique dans la qualité du signal final. Ainsi, on peut méthodiquement rebâtir une chaîne de calibration pour s'assurer que rien ne soit perdu dans les rouages.
Je ne sais si j'y ai conduit les rouages ou si ce sont eux qui m'ont entraîné sur ce long chemin, mais la chose dont je suis assuré à présent, est que l'on peut imaginer autant de mèthodes optimales de traitement de données qu'il a de prises de données.
Chaque négatif photo suppose un temps de révélation propre pour restituer la scène qui l'a exposé. L'art du photographe est de régler l'exposition pour rendre aisée la restitution. Si la scène ne s'accommode pas avec les exigences d'une bonne exposition, le bon photographe ne prend pas la photo. Si la scène est vraiment unique et magnifique, on tentera pourtant d'en graver une silhouette, en comptant sur le traitement en laboratoire photographique pour en restituer une ébauche.
Nos poses vers les supernovæ lointaines présentent la difficulté de devoir être obtenues au moment où la supernova est éclatante, en particulier pour les plus lointaines. Il faut alors que les condition météo soient bonnes durant les heures où l'objet est visible depuis l'observatoire, sans que le soleil ni la lune ne soient trop gênants. Si ce n'est pas le cas, nous n'aurons pas de spectre, et si ce n'était pas vraiment la cas mais qu'ils y ont cru, nous aurons un mauvais spectre. C'est dur, mais c'est ainsi.
Au final, l'échantillon est d'une qualité remarquable, avec une centaine de supernovæ identifiées en deux ans.
La procédure d'extraction dédiée a permis d'identifier certaines erreurs faites lors de l'analyse directe. Dans certains cas favorables, le spectre obtenu est beaucoup moins contaminé par la galaxie hôte. Dans de nombreux cas, à grand redshift en particulier, les produits sont comparables : soit la supernova et la galaxie sont extraites ensembles, soient leurs spectres présentent un fort bruit corrélé.
Surtout, nous disposons à présent de deux méthodes indépendantes de traitement des spectres, chacune ayant ses spécificités. L'interface de XspecSNLS est intuitive, le logiciel est relativement simple à installer et permet de travailler sur une copie des images sur son ordinateur de bureau. Ma procédure dédiée permet de traiter les données de toute une année en quelques jours, avec idéalement aucune manutention. Sa prise en main doit être longue et fastidieuse pour une personne non avertie. Au final, certains choix sont difficilement délégués à l'algorithme, et après un premier passage identique sur tout l'échantillon, au vu des produits d'extraction, on raffine ceux qui penvent l'être (c.f. Fig. 5.7 : lorsque l'adéquation spectro-photométrique laisse à désirer).
|
Le coté agréable de tout cela, surtout pour moi, c'est non seulement de disposer des images combinées et des résidus d'extraction qui permettent un diagnostic fiable sur la présence ou non d'une raie galactique à 7654 Å, mais aussi de pouvoir produire toutes les quantités dérivées que l'on puisse souhaiter. Seul maître à bord, je mène ma chaloupe.
Cela serait bien beau, sans les multiples sources extérieures d'information évoquées précédement. Car à les invoquer, on en devient dépendant. Et ces produits pour ma cuisine sont en fait les plats cuisinés d'autres collaborateurs, qui n'ont de cesse, et moi de même, d'en vouloir modifier la recette. Il faut alors s'adapter aux maigres differences entre une version et sa suivante, et cela est aussi vrai lorque l'on modifie son propre ouvrage. La solution est simplement plus facile à deviner lorsque l'on a construit la chose.
Cette remarque concerne les quatres sources discriminantes d'information pour une bonne extraction : le seeing au cours des poses, le profil galactique sous-jacent à la source intégré dans la fente, les coordonnées et le flux de l'objet au moment des poses. Leur pertinence conditionne la qualité de l'extraction.
Ainsi, si aucun point de photométrie n'est disponible durant plusieurs jours autour de la date d'observation spectroscopique, la précision de l'estimation de la position risque de ne pas être parfaite. Les résidus d'extraction peuvent faire apparaître une telle imprécision, mais pas nécessairement : à condition qu'il y ait assez de signal, et que les profils extraits ne soient pas dégénérés, auxquel cas l'algorithme n'aurait aucun mal à minimiser les résidus, disposant de plus de paramètres qu'il n'y en a effectivement dans l'image, il corrèle allègrement les bruits.