Traitement automatique du langage naturel
Description
Numéro de trimestre
Prérequis
- Compétences de codage. Tous les exercices seront effectués en python
- La connaissance des bibliothèques pertinentes (scikit-learn, spacy, kears, pytorch, tensorflow) n'est pas obligatoire mais utile.
- Algèbre linéaire
- Une connaissance de base de l'apprentissage automatique sera utile
- Concepts de base en informatique
Syllabus
PREMIÈRE PARTIE
1. Introduction
2. Modèle linguistique
3. Représentation des mots et des documents
4. Balisage, reconnaissance d'entités nommées
5. Analyse syntaxique
DEUXIÈME PARTIE
6. Extraction de contenu généré par l'utilisateur
7. Traduction automatique et génération de langage naturel
8. Lecture automatique
9. Dialogue
Composition du cours
Lectures, lab sessions and project. The course consist of two sections. The first one introduces typical NLP tasks, while the second focuses on end application.
Notation
L'évaluation du cours se fera par trois exercices, notés de manière égale. L'évaluation sera principalement automatique (performance sur un ensemble de tests), mais l'évaluation qualitative (fichier texte contenant des explications, qualité du code, etc) sera également prise en compte.
Tous les projets seront réalisés en groupes de 4 étudiants maximum.
Résultats de l'apprentissage couverts par le cours
L'objectif de ce cours est de fournir une introduction au domaine du traitement du langage naturel. À la fin du cours, l'étudiant devra :
saura quelles sont les principales applications, pourquoi elles sont difficiles et comment elles peuvent être utilisées.
aura une bonne compréhension des méthodes éprouvées et de leur fonctionnement interne
sera exposé aux directions de recherche actuelles, et aura les bases fondamentales pour être capable de suivre le domaine dans les années à venir.
Support de cours, bibliographie
The main reference will be Speech and Language Processing. Jurafsky & Martin. Draft of 3rd edition online at https://web.stanford.edu/~jurafsky/slp3/