next up previous contents
Next: 3.3 Propagation des erreurs Up: 3. Les promesses de Previous: 3.1 Les points faibles

Sous-sections



3.2 L'atout d'une campagne homogène

La politique de calibration en temps-réel est d'utiliser les images de calibration les plus contemporaines des observations. On minimise ainsi les fluctuations possibles du niveau de piedestal, des poussières, de la fonction de dispersion ou de la réponse instrumentale.

Les références de calibration sont donc propres à chaque jeu d'images de calibration dispensé par l'ESO, et sont créées à partir de 5 images dans le cas du piédestal et du champ plan.

On aimerait cependant que la calibration apporte un bruit négligeable aux images de sciences, c'est à dire que le niveau de bruit résiduel des modèles de référence soit petit devant le bruit de lecture et de fond de ciel des images de science.

Le précieux temps VLT investi dans ce programme industriel, et l'homogénéité de ces données méritent bien que l'on y regarde à deux fois, et avec des outils spécialement conçus pour eux. Au lieu de fabriquer les modèles de calibration au vol, disons en aveugle, l'approche présentée ici est d'utiliser l'ensemble des données pour forger des modèles de calibration à priori de l'instrument.

3.2.1 Le flot de données de calibrations

Après un an d'accumulation d'images de calibrations, on disposait de quelques centaines d'images de calibration brutes. La statistique Poissonnienne, qui s'applique aux variables aléatoires $ \mathbf{X}$ discrètes incohérentes à taux constant $ \mu $ (tel le nombre $ X_i$ de gouttes de pluie par m$ ^2$ par seconde i), statue que la variance3.1de $ \mathbf{X}$ est égale à son espérance mathématique $ \mu $ .

L'écart-type, racine de la variance, vaut donc $ \sigma = \sqrt{\mu}$ , et le rapport signal à bruit $ \frac{\mu}{\sigma} = \sqrt{\mu}$ (s'il tombe 25 gouttes$ /m^2/s$ , on en comptera entre 20 et 30 sur 1m$ ^2$ durant une seconde $ \sim $ 73 % des fois. Et plus de 40 seulement $ \sim $ 0.2 % des fois). Pour doubler le rapport signal à bruit, il faut donc quadrupler le taux moyen d'événements (compter les gouttes toutes les 4 secondes, ou compter 4 fois durant une seconde).

Ainsi, la moyenne de 5 images de piédestal aura un bruit de lecture résiduel $ \sqrt{5}$ =2.23 fois moindre que le bruit de lecture original.

À soustraire ce modèle moyen, on introduit son bruit résiduel dans les images de science. Si l'on moyenne un plus grand nombre d'images de calibations, on peut réduire davantage cette contamination externe : la moyenne de 25 images aura un bruit résiduel 5 fois moindre, et celle de 100 images un bruit 10 fois moindre que le bruit de lecture original.

Si l'on se convainc que le piédestal est uniforme, soustraire un modèle constant n'apportera aucun bruit statistique. Mais les éventuels écarts à l'uniformité ne seront pas corrigés, apportant une source d'erreur systématique.

Concernant le champ plan normalisé, le bruit de grenaille résiduel est en sus normalisé par la moyenne F du flux : $ \sigma $ = 1/( $ \sqrt{N \times F}$ ) où N est le nombre d'images moyennées.

Le modèle sera donc d'autant meilleur que l'illumination y est forte et que le nombre d'images moyennées est grand.

Il faut cependant mettre un bémol à ce discours : ceci ne s'applique que dans le cas où les images moyennées sont des réalisations obtenues dans des conditions identiques (qu'il pleuve identiquement à chaque comptage). Si le niveau du piédestal fluctue, ou que des poussières se déposent, la variance sera affectée par ces incertitudes de modélisation. Il faut, dans ce cas, pouvoir estimer et corriger ces fluctuations avant de moyenner les images. Réciproquement, il faudra estimer les corrections à appliquer au modèle pour qu'il s'accorde aux images qu'il servira à calibrer.

3.2.2 La possibilité de créer une chaîne de réduction dédiée

On comprend que la meilleure calibration à notre portée est conditionnée à la stabilité de l'instrument et à la quantité d'images de calibration disponibles.

Dans le cas de FORS1, un instrument hermétique conçu pour durer sans coup férir, on peut supputer, et l'on vérifiera, que la calibration est très stable au cours des mois, voire des années.

Il est donc justifié d'utiliser l'ensemble des images de calibration pour calculer un modèle systématique valable pour un mois, voire pour une année, et d'étudier par la même occasion la stabilité de l'instrument.

La mise en place d'un tel atelier, qui perturba longtemps mon sommeil, passe par l'implémentation des algorithmes de modélisation des références de calibrations, mais aussi de groupement des images brutes par type pour alimenter ces routines de modélisation.

Le choix du language informatique utilisé n'est pas anodin, car il détermine la simplicité d'implémentation des problèmes rencontrés. Les images brutes étant au format FITS, régi par la librairie CFITSIO (écrite en language C), la lecture et l'écriture des images seront faciles si l'on utilise cette librairie, donc que l'on programme en language C ou avec son successeur orienté objet C++.

Déjà familier du language C++, et converti à sa modularité, j'ai choisi de l'utiliser pour les routines de modélisation, qui effectuent des opérations simples sur un grand nombre de pixels. Elles se doivent donc d'être raisonnablement rapides.

En revanche, le groupement des données est une étape complexe, mais qui s'applique à un nombre raisonnable de fichiers. Plus que la rapidité d'exécution, c'est la concision et la lisibilité du programme qui seront recherchés. La création d'une base de données listant les images brutes disponibles et leur type rend aisé leur groupement.

SNLS dispose d'une base de données des images de Mégacam pour les réduire, implémentée en MySQL/Python. MySQL est un environnement gérant les bases de données, et Python est un language interprété3.2fondé sur des classes d'objets, ayant une bonne gestion des erreurs et de l'import de modules extérieurs. La syntaxe est simplifiée par rapport au C++, et la quantité de modules disponibles est énorme, grandissante et bien documentée. Python apparut donc comme un outil de choix pour l'enrobage logistique de la nouvelle chaîne de réduction.


next up previous contents
Next: 3.3 Propagation des erreurs Up: 3. Les promesses de Previous: 3.1 Les points faibles
Sylvain Baumont
2010-01-11