Compression et débruitage des signaux
Description
Ce cours est une introduction à la représentation, l’analyse, la compression et le débruitage des signaux et des images. Ces notions forment le socle des traitements modernes utilisés pour le stockage de musique, de vidéos, l’amélioration des images photographiques dans les téléphones portables, le traitement des images médicales ou issues de l’astrophysique...
Avec la quantité croissante de données collectées et stockées, la compression de signaux (images, sons, vidéos, etc.) reste un enjeu majeur en sciences des données, permettant de limiter la quantité de stockage nécessaire, ainsi que les flux de données sur les divers réseaux de télécommunications. Des méthodes de restauration de signaux (dont le débruitage est un exemple particulier) sont embarquées dans les smartphones récents permettant de pallier les limitations des capteurs photographiques en résolution et sensibilité.
Les méthodes présentées dans le cours auront pour point commun d'être frugales en calculs, énergie, et quantité de données nécessaires à leur conception et leur utilisation.
Après un rappel des notions fondamentales de signal et d'analyse harmonique (filtrage, série et transformée de Fourier, processus aléatoires), un premier aperçu du débruitage et de la compression de signaux sera donné par le filtrage de Wiener et le codage LPC de la parole.
L'introduction du codage entropique de source permettra ensuite de concevoir des codeurs sans perte d'images (type PNG) et de sons (type FLAC).
La compression avec perte, avec des taux de compression supérieurs (JPEG, MP3, etc.), sera ensuite abordée.
Enfin, les bases orthogonales d'ondelettes seront définies, avec pour applications la compression d'image (JPEG2000) et le débruitage non-linéaire d'images.
Période(s) du cours
Prérequis
Syllabus
1- Introduction
- Processus aléatoires
2- Filtrage de Wiener et codage de parole
- Débruitage linéaire de processus aléatoires
- Modèles de production de la parole
- Coefficients de prédiction linéaire
- Codage LPC
3 - Codage de source et quantification
- Codage de source, entropie
- Compression d'images sans perte (PNG)
- Codage universel et compression audio sans perte (FLAC)
- Quantification
4 - Représentations temps-fréquence
- Bases et frames temps-fréquence (Transformée de Fourier à court terme, bases de cosinus)
- Compression d'image JPEG
- Masquage audio et application au codage audio (MP3, Vorbis, etc.)
5 - Bases d'ondelettes
- Application à la compression d'image, JPEG2000
- Seuillage d'ondelettes pour la compression d'images