Résumé de thèse de Grégoire Mercier


Études de modèles de compression et de fusion de données satellitaires pour images de télédétection multisources dans le cadre d'une utilisation opérationnelle en temps réel pour des stations éloignées.


Avec l'intérêt grandissant des images de télédétection, et la pléthore d'informations que celles-ci peuvent mettre quotidiennement à disposition, le recours à la compression est devenu incontournable. La compression permet de diminuer le volume de ces images, mais selon certaines contraintes et problématiques bien précises, il est possible de définir des stratégies bien particulières permettant d'augmenter le taux de compression avec, pour contre partie, la perte d'informations considérées comme inutiles.

L'aspect bruité des images ROS induit une valeur assez élevée de l'entropie. La compression sans perte des images radar est donc particulièrement faible. Pour l'archivage des images, il est nécessaire de comprimer les images, sans perte d'information puisque l'on n'a aucune idée a priori de la manière dont seront utilisées ces images. L'aspect générique de la compression s'accompagne alors d'une très faible efficacité. Cependant, lorsqu'il s'agit d'acheminer une image en un lieu donné (dans un délai, et un coût, acceptable), pour une utilisation bien particulière, il est parfaitement envisageable de définir des stratégies de compression de ces images avec une perte ciblée de l'information inutile.

Le présent travail de thèse est en cours pour définir des algorithmes de compression permettant l'acheminement en un délai raisonnable d'images de télédétection. Pour cela, il a été choisi de construire des algorithmes avec perte d'information permettant de comprimer fortement les images, tout en minimisant les erreurs d'interprétation (visuelle ou algorithmique) de ces images après décompression.

La nature très texturée et la présence dans certains cas de speckle, met en défaut les hypothèses, classiques en compression d'images dites naturelles, qui considèrent l'image comme un processus stationnaire auto-régressif. Ainsi, la plupart des algorithmes de compression avec perte basés sur une décorrélation et/ou prédiction d'un tel signal n'est pas assez efficace. Les algorithmes de compressions basés sur les notions de prédiction buttent sur les faibles corrélations des coefficients entre eux. Les algorithmes basés sur les transformations orthogonales (comme JPEG avec la transformée en Cosinus) sont limités par le caractère non stationnaire du signal. Les algorithmes basés sur la quantification vectorielle sont desservis par leur manque de précision spatiale dans la localisation des détails restitués. Plus généralement, tous les algorithmes de compression sont basés sur une économie de l'information à coder en ignorant l'information contenue dans les hautes fréquences (correspondant aux détails fins). Cette stratégie est payante sur les images naturelles (où il y a peu d'information dans ces fréquences-ci) lorsque la validation est purement visuelle (parce que le système visuel humain tolère très bien cette perte d'information). Or les images radar sont beaucoup plus riches en hautes fréquences et l'utilisation escomptée exige une résolution suffisante pour pouvoir déterminer avec précision les positions géographiques de chaque structure remarquable. Des études ont montré qu'un mouvement brownien fractionnaire représentait de manière satisfaisante le gabarit du signal image. La transformée en ondelettes a été utilisée de manière à obtenir de nouveaux signaux stationnaires.

Un premier codage à été proposé, utilisant les paquets d'ondelettes avec une adaptation spatio-fréquentielle et la minimisation d'une fonction de coût liant le débit et la distorsion induite, déterminé par l'opérateur de Lagrange (dont le facteur multiplicatif a été calculé de manière théorique en fonction de la limite de Shannon du débit-distorsion sur une quantification scalaire uniforme). Ce codage permet d'obtenir de bons taux de compression (30:1) sur des images ERS-1 de Guyane, qui restent de qualité suffisante pour l'illustration de carte géologique (obtenues à partir d'une analyse de texture).

En se basant sur le fait qu'un mouvement brownien fractionnaire devient stationnaire après transformation en ondelettes (dans le domaine spatial et à travers les différents niveaux de résolution), un algorithme de compression forçant le caractère auto-régressif de ce signal stationnaire a été proposé. La difficulté de cet algorithme est la définition du masque de prédiction des coefficients d'ondelettes puisqu'il doit prendre en compte les corrélations spatiales, inter-bandes (il faut considérer les trois directions de décomposition -- horizontal, vertical et diagonal -- pour un signal à deux dimensions) ainsi que les corrélations rencontrées le long des coefficients d'ondelettes de même position spatiale, à des résolutions différentes. Finalement, ce codage très rigoureux (qui est déjà utilisé pour la synthèse du mouvement brownien fractionnaire en deux dimensions) butte sur les faibles corrélations des coefficients d'ondelettes et ne permet pas de dépasser raisonnablement des taux de compression de 10:1, sur des images ERS-1.

Un intérêt tout particulier a été porté au cas des séries multi-temporelles (et accessoirement multi-spectrales dans le cas des images optiques). Les systèmes imageurs ROS ont ceci de particulier qu'ils peuvent garantir l'acquisition d'une image de qualité constante à chaque passage du satellite au dessus d'un lieu déterminé. Là encore, l'évolution de la réalité terrain et le recalage approximatif des différentes scènes mettent en défaut les hypothèses courantes de signaux auto-régressifs, et de corrélation pixel-à-pixel des images. il a alors été proposé un système de codage permettant de définir une image à l'aide d'une image de référence (qui est représentée par l'image au temps t-1, ou plus généralement par une image connue à l'instant t0). La formule de passage est réalisée à l'aide de la théorie du codage par fractales qui est utilisée dans un contexte non convergent (et dépendant fortement de l'image de référence). Cet algorithme très efficace permet une compression très importante (supérieure à 30:1) avec une très bonne qualité visuelle et une bonne localisation des détails francs. Une amélioration est également proposée pour accélérer la phase de codage et pour permettre la décompression sélective, à travers la transformée en ondelettes. Nous travaillons actuellement sur différentes partitions de l'images permettant une meilleure caractérisation des structures de l'image.

Il est cependant plus judicieux, de s'intéresser à présent, d'une part à la discrimination du bruit par rapport à l'information utile, et d'autre part à la définition de nouvelles transformations pour la compression d'image fixe. La discrimination du bruit doit permettre de distinguer des informations (utiles) liées aux structures de l'images (dans un environnement bruité) et des informations sans importances telles que le bruit ou le speckle, ou même des structures inintéressantes pour une problématique donnée (la restitution fidèle d'un pont est inutile lorsqu'il s'agit de caractériser une couverture végétale !). La définition de nouvelles transformations répond à un besoin de stratégie de codage progressif (qui sous entend une approche en multi-résolution permettant un décodage sélectif), adaptée au contexte de l'image (c'est-à-dire conserver une bonne localisation spatiale des coefficients transformés pour garder des stratégies spécifiques à la nature du terrain) sans provoquer systématiquement des erreurs de lissages (perte des informations liées aux hautes fréquences) lors des phases de quantification.

grégoire
4/17/1998