Informations pratiques
Calendrier | Mardi, Mardi, 17h-18h30, Censier, salle 520 |
Lien iCampus | https://icampus.univ-paris3.fr/course/view.php?id=5367 |
Codes | LZOU005, LZML051, SDUB410a |
Contrôles
Modalités | Projet effectué en cours, par groupes de 2 ou 3 étudiants. |
Intitulé du projet | L'objectif du projet est de réaliser une "grammaire locale" (au sens où ce terme est employé dans
l'application Unitex) pour repérer, dans des textes littéraires, le plus grand nombre possible d'occurrences de
déclencheurs de présupposition.
Chaque groupe de 2 ou 3 personnes choisit une classe de déclencheurs dans la liste suivante. Plusieurs groupes peuvent choisir la même classe, même si l'idéal serait de bien les répartir.
|
Méthode | 1. Dans un premier temps, en utilisant l'article déjà évoqué en
cours, il est possible de déterminer un ensemble de mots et un ensemble de contextes correspondant à des occurrences de déclencheurs. Par exemple, le
verbe regretter est un déclencheur de présupposition, mais seulement lorsqu'il sous-catégorise une proposition complétive introduite par que ou
une proposition infinitive introduite par de. On demande donc de réaliser un automate dans Unitex qui permette de retrouver les occurrences de ce
déclencheur dans le texte de Jules Verne (disponible ici). On demande ensuite un automate qui retrouve les
occurrences de tous les déclencheurs de la classe. Il est facile de vérifier que l'automate est efficace puisque l'article indique le nombre d'occurrences de
chacun de ces déclencheurs.
2. Dans un second temps, on cherchera à appliquer l'automate trouvé à un autre texte (par exemple un autre texte de Jules Verne) de façon à découvrir de nouvelles occurrences, et peut-être à faire évoluer la grammaire locale de façon à augmenter sa précision. |
Rendu | On demande de fournir 3 documents:
|
Notes | Notes pour |
Séances
2020-01-14 | Manip: évaluation de la qualité d'un corpus annoté: Frantext | tableur partagé |
2020-01-21 | Cours: Les expressions régulières. 1. Automates | |
2020-01-28 | Attention au changement de salle : 507 (au lieu de 526)
Cours: Les expressions régulières. 2. Langage de base et extensions |
|
2020-02-04 | Manip: expressions régulières avec Frantext | Doc: expressions régulières avec Frantext ; modèle de tableur |
2020-02-11 | Manips: 1. Un peu d'entraînement avec regex 101 (consignes) ; 2. Suite manip semaine dernière | Texte: Candide |
2020-02-18 | Pas de séance (réussite à l'université) | |
2020-02-25 | Manipulation avec Frantext. | |
2020-03-03 | Pas de séance (pour cause de participation au mouvement de grève) | |
2020-03-10 | Unitex_GramLab Install party ; présentation du projet | Manuel Unitex ; Corpus de travail: « de la Terre à la Lune » (Verne) format utf-8 ; à propos des présuppositions en corpus: article |
2020-03-17 | Confinement (semaine 1: mise en place) | |
2020-03-24 | Confinement (semaine 2: énoncé détaillé du projet, forum) | |
2020-04-02 | Confinement (semaine 3) | |
2020-04-07 | Pas de séance (vacances de printemps) | |
2020-04-14 | Confinement (semaine 5) |
Pointeurs (références, bibliographie, ressources en ligne)
- Des outils francophones d'exploitation de corpus : TXM, Unitex/gramlab.
- Deux outils en ligne pour tester des expressions régulières: regexpal, et regexp 101.
- Regexp: documentation abondante et pédagogique : Rex EGG.