Compression de données multimédias
Ref: 3SQ2100
Description
Le contenu audiovisuel et multimédia devient omniprésent de nos jours, avec des applications telles que le streaming vidéo, la vidéo à la demande et les médias sociaux. Cette évolution est également rendue possible par des appareils toujours plus puissants, notamment les smartphones et les tablettes, ainsi qu’une meilleure connectivité réseau. Pour permettre une gestion efficace de ce contenu multimédia, des méthodes de compression efficaces sont nécessaires. Dans ce module, dans un premier temps, nous passerons en revue les concepts théoriques de base pour le codage de source et la compression. Après ces préliminaires, dans une deuxième étape, nous présenterons certaines des normes de codage d'image et vidéo les plus utilisées. Comme dans la plupart des applications, ce contenu multimédia est consommé par des êtres humains, nous présenterons également certaines des propriétés du système visuel humain et comment elles peuvent être exploitées afin d'évaluer de manière fiable la qualité visuelle du contenu compressé.
Numéro de trimestre
SM10
Prérequis
Des bases en traitement du signal, en théorie des probabilités et en algèbre linéaire sont utiles
Syllabus
Cours: Codage de source
Modèles de source (source sans mémoire, source Markovienne)
Codage de source (codes décodables de manière unique, codes instantanés, codes préfixes, inégalité Kraft-McMillan, code optimal)
Code de Huffman, codage arithmétique, code de Liz-Zempel, codage par plages
Cours: Quantification
Quantification scalaire (quantification uniforme, quantification non uniforme, algorithme de Lloyd-Max)
Quantification vectorielle (k-means ou LBG)
Cours: Codage par transformation
Transformations linéaires, transformations unitaires, conservation d'énergie
Transformation de Karhunen-Loeve (KLT)
Transformation cosinus discrète (DCT)
Allocation optimale des bits
Cours: Codage prédictif
Modulation par impulsions et codage différentiel (DPCM)
Prédiction en boucle fermée
Application au codage vidéo: prédiction spatiale (intra) et temporelle (inter) en vidéo
Cours: Normes de codage d'images et de vidéos
JPEG
JPEG 2000
HEVC (High Efficiency Video Coding)
Cours: Système visuel humain
Principales propriétés du système visuel humain, photorécepteurs bâtonnets et cônes de la rétine, sensibilité au contraste, masquage
Évaluation subjective de la qualité
Mesures de qualité objectives (perceptuelles)
Composition du cours
Cours magistraux
Notation
Epreuve écrite
Ressources
Intervenant: Frederic Dufaux (L2S)
Résultats de l'apprentissage couverts par le cours
Former les étudiants sur des sujets associés à la compression de contenu multimédia, afin qu'ils puissent appréhender les problèmes techniques et les défis scientifiques associés. Codage de source, quantification, codage par transformation, codage prédictif, normes de codage d'image et vidéo, système visuel humain, évaluation de la qualité visuelle
Description des compétences acquises à la fin du cours
C1.2 Use and develop appropriate models, choose the right scale of modelling and relevant simplifying assumptions to address the problem
C1.3 Solve the problem using approximation, simulation and experimentation
C2.1 Have developed an area or discipline related to the basic or engineering sciences.
Support de cours, bibliographie
T. Cover et J. Thomas, Elements of Information Theory, 2nd ed., Wiley, 2006.
K. Sayood, Introduction to data compression, 2nd ed., Morgan Kaufman, 2005.
A. K. Jain, Fundamentals of Digital Image Processing, Prentice Hall, Englewood Cliffs, 1989
S. Winkler, “Digital Video Quality”, Wiley, 2005
D. Taubman and M. Marcellin, “JPEG 2000: Image Compression Fundamentals, Standards and Practice”, Kluwer Academic Publishers, 2002.
V. Sze, M. Budagavi, G. J. Sullivan, High Efficiency Video Coding (HEVC), Springer, 2014