Informations pratiques

Calendrier Mardi, 16h-17h30, Censier, salle D11 526 sauf 28/01, 04/02 et 10/03 : salle 507
Mardi, 17h-18h30, Censier, salle 520
Lien iCampus https://icampus.univ-paris3.fr/course/view.php?id=5367
Codes LZOU005, LZML051, SDUB410a

Contrôles

Modalités Projet effectué en cours, par groupes de 2 ou 3 étudiants.
Intitulé du projet L'objectif du projet est de réaliser une "grammaire locale" (au sens où ce terme est employé dans l'application Unitex) pour repérer, dans des textes littéraires, le plus grand nombre possible d'occurrences de déclencheurs de présupposition.
Chaque groupe de 2 ou 3 personnes choisit une classe de déclencheurs dans la liste suivante. Plusieurs groupes peuvent choisir la même classe, même si l'idéal serait de bien les répartir.
  • Prédicats Aspectuels
  • Adverbes Restrictifs
  • Subordonnées Causales
  • Subordonnées Temporelles
  • Prédicats Factifs
  • Constructions Clivées
  • Adverbes Additifs
Méthode 1. Dans un premier temps, en utilisant l'article déjà évoqué en cours, il est possible de déterminer un ensemble de mots et un ensemble de contextes correspondant à des occurrences de déclencheurs. Par exemple, le verbe regretter est un déclencheur de présupposition, mais seulement lorsqu'il sous-catégorise une proposition complétive introduite par que ou une proposition infinitive introduite par de. On demande donc de réaliser un automate dans Unitex qui permette de retrouver les occurrences de ce déclencheur dans le texte de Jules Verne (disponible ici). On demande ensuite un automate qui retrouve les occurrences de tous les déclencheurs de la classe. Il est facile de vérifier que l'automate est efficace puisque l'article indique le nombre d'occurrences de chacun de ces déclencheurs.
2. Dans un second temps, on cherchera à appliquer l'automate trouvé à un autre texte (par exemple un autre texte de Jules Verne) de façon à découvrir de nouvelles occurrences, et peut-être à faire évoluer la grammaire locale de façon à augmenter sa précision.
Rendu On demande de fournir 3 documents:
  • la grammaire locale finale
  • une série d'occurrences obtenue dans un fichier autre que le fchier de départ
  • un rapport d'1 à 3 pages (formet pdf) décrivant les difficultés rencontrées, les choix effectués, et les commentaires du groupe
Ces éléments devront être déposés sur iCampus. Dates limites pour former les groupes: 3 avril 2020 ; date limite de rendu du projet (sur iCampus): 15 mai 2020.
Notes Notes pour les étudiants en CTI la première session : notes (instructions)

Séances

2020-01-14 Manip: évaluation de la qualité d'un corpus annoté: Frantext tableur partagé
2020-01-21 Cours: Les expressions régulières. 1. Automates
2020-01-28 Attention au changement de salle : 507 (au lieu de 526)
Cours: Les expressions régulières. 2. Langage de base et extensions
2020-02-04 Manip: expressions régulières avec Frantext Doc: expressions régulières avec Frantext ; modèle de tableur
2020-02-11 Manips: 1. Un peu d'entraînement avec regex 101 (consignes) ; 2. Suite manip semaine dernière Texte: Candide
2020-02-18 Pas de séance (réussite à l'université)
2020-02-25 Manipulation avec Frantext.
2020-03-03 Pas de séance (pour cause de participation au mouvement de grève)
2020-03-10 Unitex_GramLab Install party ; présentation du projet Manuel Unitex ; Corpus de travail: « de la Terre à la Lune » (Verne) format utf-8 ; à propos des présuppositions en corpus: article
2020-03-17 Confinement (semaine 1: mise en place)
2020-03-24 Confinement (semaine 2: énoncé détaillé du projet, forum)
2020-04-02 Confinement (semaine 3)
2020-04-07 Pas de séance (vacances de printemps)
2020-04-14 Confinement (semaine 5)

Pointeurs (références, bibliographie, ressources en ligne)

  • Des outils francophones d'exploitation de corpus : TXM, Unitex/gramlab.
  • Deux outils en ligne pour tester des expressions régulières: regexpal, et regexp 101.
  • Regexp: documentation abondante et pédagogique : Rex EGG.