Traitement automatique du langage naturel

Ref: 3MD3060

Description

Ce cours donnera un aperçu des sujets d'étude du domaine du traitement du langage naturel. Il adoptera une approche centrée sur les problèmes, en présentant des problèmes de plus en plus complexes, en commençant par des éléments de base comme la modélisation du langage, l'étiquetage et l'analyse syntaxique, et en progressant vers des problèmes complexes comme l'extraction d'opinions, la traduction automatique, les questions-réponses et le dialogue. Les méthodes historiques importantes seront mentionnées (et étudiées si elles sont toujours pertinentes), mais l'accent sera mis sur l'état actuel de la technique, qui implique des avancées souvent récentes dans la formation des réseaux neuronaux et les nouvelles architectures.

Période(s) du cours

SM10

Prérequis

Compétences de codage. Tous les exercices seront effectués en python
La connaissance des bibliothèques pertinentes (scikit-learn, spacy, kears, pytorch, tensorflow) n'est pas obligatoire mais utile.
Algèbre linéaire
Une connaissance de base de l'apprentissage automatique sera utile
Concepts de base en informatique

Syllabus

PREMIÈRE PARTIE

1. Introduction

2. Modèle linguistique

3. Représentation des mots et des documents

4. Balisage, reconnaissance d'entités nommées

5. Analyse syntaxique

DEUXIÈME PARTIE

6. Extraction de contenu généré par l'utilisateur

7. Traduction automatique et génération de langage naturel

8. Lecture automatique

9. Dialogue

Composition du cours

Lectures, lab sessions and project. The course consist of two sections. The first one introduces typical NLP tasks, while the second focuses on end application.

Résultats de l'apprentissage couverts par le cours

L'objectif de ce cours est de fournir une introduction au domaine du traitement du langage naturel. À la fin du cours, l'étudiant devra :

saura quelles sont les principales applications, pourquoi elles sont difficiles et comment elles peuvent être utilisées.

aura une bonne compréhension des méthodes éprouvées et de leur fonctionnement interne

sera exposé aux directions de recherche actuelles, et aura les bases fondamentales pour être capable de suivre le domaine dans les années à venir.

Support de cours, bibliographie

The main reference will be Speech and Language Processing. Jurafsky & Martin. Draft of 3rd edition online at https://web.stanford.edu/~jurafsky/slp3/

Responsable(s) :

Fragkiskos Malliaros

Matthias Galle

Langues du cours :

FRANCAIS

Nombre d'heure :

40 h

Nombre d'heure sur site :

24 h

Année académique :

2024-2025

Niveau avancé :