What's up?

[2025-06-27] Le programme de la journée des M2 R&D PluriTAL est publié ICI
(avec diapos vers les projets de recherche présentés par l'équipe pédagogique).

Généralités

CM mardi, 8h-10h, Amyot A5. Premier CM le 21 janvier
TD jeudi, 8h-10h, Amyot A2. Premier TD le 23 janvier
Enseignants Pascal Amsili, Jean Barré, Mathieu Dehouck
Moodle https://moodle.psl.eu/course/view.php?id=29195
Contenu
  • Introduction à la discipline du traitement automatique des langues (TAL), qui se concentre sur la manipulation informatique du langage humain (texte, parole), avec des méthodes symboliques (formelles) mais surtout statistiques et neuronales.
  • Présentation des outils élaborés pour le traitement des données textuelles (segmentation, étiquetage, analyse syntaxique), et des méthodes utilisées pour les tâches courantes dans le domaine (traduction automatique, recherche d'information, résumé automatique...).
  • Introduction aux études littéraires computationnelles, discipline récente qui s'est construite avec la disponibilité de vastes corpus numérisés (BNF, HathiTrust...) et des méthodes d'IA performantes.
  • Utilisation des méthodes du TAL pour l'opérationalisation des concepts de la théorie littéraire, ce qui donne la possibilité de mener des études empiriques à large échelle.

Contrôles

Modalités Deux épreuves de TP notés comptant pour 30% chacun, et une épreuve écrite en temps limité (sans documents) comptant pour 40%.
Calendrier semaine 10: TP noté,
semaine 13: TP noté,
semaine 15 (créneau TP, 02 juin): examen écrit.
Résultats notes (instructions)

Manipulations (travaux pratiques)

Ce tableau donne accès aux énoncés, ressources et code uniquement pour les TP dont je (P. Amsili) suis responsable; ces éléments, accessibles pendant la durée du cours sur le github du cours, sont placés ici pour des raisons d'accessibilité et d'archivage.
N-grammes (sem 4) Énoncé
Corpus d'apprentissage : latin1, utf-8
Ébauche de code premières fonctions
Taille de la fenêtre (sem 5) Énoncé
Corpus d'apprentissage : latin1, utf-8
Ébauche de code premières fonctions
Perceptron (sem 8) Énoncé
Proposition de code avec affichage des droites

Planning

No Cours Date Salle Intervenant Thème
1CMMardi 21/01/25A5-AmyotJean BarréIntroduction aux études littéraires computationnelles
1TDJeudi 23/01/25A2-AmyotJean BarréAnalyse textuelle ; décompte de mots
2CMMardi 28/01/25A5-AmyotMathieu DehouckIntroduction au TAL
2TDJeudi 30/01/25A2-AmyotMathieu DehouckDonnées annotées; POS-tagging par règles
3CMMardi 04/02/25A5-AmyotJean BarréApproches Computationnelles des Genres Littéraires
3TDJeudi 06/02/25A2-AmyotJean BarréTokenisation et lemmatisation avec Spacy
4CMMardi 11/02/25A5-AmyotPascal AmsiliModèles de langue simples
4TDJeudi 13/02/25A2-AmyotPascal AmsiliProgrammation d'un modèle n-grammes
5CMMardi 18/02/25A5-AmyotPascal AmsiliHypothèse distributionnelle
5TDJeudi 20/02/25A2-AmyotPascal AmsiliInfluence de la taille de la fenêtre sur les embeddings distributionnels
--Mardi 25/02/25Congés-----
--Jeudi 27/02/25Congés-----
6CMMardi 04/03/25A5-AmyotJean BarréDistances entre textes
6TDJeudi 06/03/25A2-AmyotJean BarréDistances entre genres littéraires
7CMMardi 11/03/25A5-AmyotMathieu DehouckRéduction de dimensionalité
7TDJeudi 13/03/25A2-AmyotMathieu DehouckReprésentation de textes et de caractères
8CMMardi 18/03/25A5-AmyotPascal AmsiliEmbeddings statiques: Word2vec
8TDJeudi 21/03/25A2-AmyotPascal AmsiliPerceptron
9CMMardi 25/03/25A5-AmyotPascal AmsiliTâches de TAL: Coref, NLI
9TDJeudi 27/03/25A2-AmyotJean BarréManipulations BookNLP
10CMMardi 01/04/25A5-AmyotJean BarréApprentissage supervisé
10TDJeudi 03/04/25A2-AmyotJean BarréClassification
11CMMardi 08/04/25A5-AmyotPascal AmsiliApprentissage non supervisé
11TDJeudi 10/04/25A2-AmyotJean BarréTopic Modelling
12CMMardi 15/04/25A5-AmyotMathieu DehouckRéseaux de neurones
12TDJeudi 17/04/25A2-AmyotMathieu DehouckPos-tagging, morphologie, dépendance
--Mardi 22/04/25Congés-----
--Jeudi 24/04/25Congés-----
13CMMardi 29/04/25A5-AmyotMathieu DehouckAttention et architecture transformer (BERT)
--Jeudi 01/05/25Férié-----
13TDMardi 06/05/25A5-AmyotMathieu DehouckModel Probing
--Jeudi 08/05/25Férié-----
14CMMardi 13/05/25A5-AmyotPascal Amsili(Grands) modèles de langue
14TDJeudi 15/05/25A2-AmyotMathieu Dehoucktbd
--Mardi 20/05/25Révisions-----
--Jeudi 22/05/25Révisions-----
15CMMardi 27/05/25A5-AmyotMathieu DehouckLinguistique computationnelle
--Jeudi 29/05/25Férié-----
15EXAMLundi 02/06/25A2-AmyotPascal Amsili