Apprentissage automatique, traitement du signal et des images
Ref: 3SQ3050
Description
Le traitement du signal et des images est une des composantes fondamentales mais quelque peu invisible du monde moderne, sans laquelle de nombreuses technologies que nous considérons comme acquises n'existeraient pas : téléphonie numérique, radio numérique, télévision, MP3, WiFi, radar, etc. Les techniques récentes d’apprentissage automatique cherchent à exploiter l'analogie entre le traitement de l'information dans les cerveaux biologiques et les techniques de modélisation et d'inférence statistique. Ces méthodes sont à la base de nouvelles technologies qui commencent à atteindre un niveau de performance et d'omniprésence important, comme les techniques de reconnaissance automatique d'images, de reconnaissance vocale, de détection de défauts sur les chaînes de montage, d’aide à la pose de diagnostic médical, de guidage des robots et de navigation autonome. Les nombreux chevauchements qui existent entre le traitement du signal et des images et l'apprentissage automatique peuvent être exploités pour produire de nouveaux algorithmes d'une efficacité surprenante, et d'une large applicabilité, très adaptés au monde contemporain des capteurs omniprésents et du traitement embarqué et connecté.
De nombreux problèmes rencontrés en traitement du signal et des images consistent à extraire des variables cachées d’intérêt à partir d'observations/mesures potentiellement incomplètes et/ou bruitées. Les approches à mettre en œuvre pour aborder ce type de problèmes dépendent de la nature des variables cachées d’intérêt (variables continues, discrètes, signaux ou images structurés, etc.) et de la disponibilité ou non de données d’entraînement étiquetées.
Vous souhaitez découvrir comment extraire de l'information cachée dans des données de nature variée ? Dans ce cours vous apprendrez à utiliser des outils mathématiques pour traiter, analyser et interpréter des signaux/images, ainsi que des méthodes d'apprentissage automatique pour créer des modèles prédictifs à partir de données. Préparez-vous à explorer les données cachées dans le monde qui nous entoure !
Période(s) du cours
SM10
Prérequis
Notions de base en statistiques, apprentissage automatique et traitement du signal.
Syllabus
Programme :
- Traitement des signaux audio et parole : séparation de sources, modèle source-filtre de production de la parole et prédiction linéaire
- Le modèle parcimonieux
- Apprentissage de représentation et analyse en composantes principales
- Super résolution en microscopie de fluorescence
- ML : Modélisation, inférence, et apprentissage
- Modèle de mélange de gaussiennes
- Apprentissage supervisé discriminatif
- Régression logistique multinomiale
Composition du cours
Le module est organisé en séances de cours de 3 heures alternant théorie, exercices et/ou mise en pratique en Python, et en séances de travaux pratiques (TPs) de 3 heures. Chaque séance de TP nécessitera un travail préparatoire et la rédaction d’un compte rendu.
En autonomie, les élèves exploreront un sujet de leur choix en lien avec la thématique du cours. Cette étude devra intégrer des composantes scientifiques et techniques mais aussi humaines, sociétales et/ou économiques. Elle sera présentée par l'intermédiaire d’un rapport écrit et d’un exposé vidéo.
Ressources
Equipe enseignante : Clément Elvira, Catherine Soladié, Simon Leglaive, intervenant·e·s externes.
Outils logiciels : Anaconda (gestionnaire de packages Python).
Résultats de l'apprentissage couverts par le cours
Acquis n°1 : Posséder un socle de connaissances générales et fondamentales en apprentissage automatique, traitement du signal et des images.
Acquis n°2 : Comprendre les aspects de formalisation d’un problème, de modélisation et d’algorithmes pour le traitement et l’analyse de données/signaux/images.
Acquis n°3 : Concevoir et implémenter des solutions algorithmiques pour répondre à des problèmes de traitement et d’analyse de données/signaux/images.
Acquis n°4 : Conduire et présenter une étude sur un sujet nouveau intégrant des composantes scientifiques et techniques mais aussi humaines, sociétales et/ou économiques.
Support de cours, bibliographie
Les supports de cours (présentations, notebooks Jupyter, code Python et activités pédagogiques) seront mis à disposition sur Edunao.
Références :
J. Friedman, T. Hastie, & R. Tibshirani, « The elements of statistical learning » (Vol. 1, No. 10). New York: Springer series in statistics, 2001 (disponible en ligne gratuitement)
C.M. Bishop, « Pattern Recognition and Machine Learning », Springer, 2006 (disponible en ligne gratuitement)
M. P. Deisenroth, A. Aldo Faisal, and Cheng Soon Ong, « Mathematics for Machine Learning », Cambridge University Press, 2020 (disponible en ligne gratuitement)
K. P. Murphy, « Machine Learning, A Probabilistic Perspective », MIT Press, 2012 (disponible à la bibliothèque)
S. Foucart and H. Rauhut, « A mathematical introduction to compressive sensing », Birkhauser, 2013
S. Ben-David and S. Shalev-Shwartz, « Understanding Machine Learning: From Theory to Algorithms », Elsevier, 2009 (disponible en ligne gratuitement)