Généralités
Créneau | mardi, 17h-18h30. Premier cours le 26 janvier 2021 |
Enseignant | Pascal Amsili |
Lien iCampus | https://icampus.univ-paris3.fr/course/view.php?id=15021 |
Contenu | En première partie du cours, on travaillera de façon théorique et pratique sur certains concepts pertinents pour la manipulation de corpus (automates, expressions régulières...). La seconde partie sera consacrée à une utilisation approfondie d'un outil de manipulation de corpus, dans le cadre d'un projet en groupe qui portera cette année sur la présupposition. |
Organisation | « Distanciel intégral
|
Délégué(e)s | Pour faciliter la communication entre nous, je propose que vous élisiez une ou deux personnes qui accepteraient de jouer le rôle de délégué/représentant des étudiants (uniquement pour ce cours), avec comme rôle de synthétiser les questions et les difficultés que vous pourriez rencontrer pendant le semestre. |
Archives | Lien vers la page de l'année 2019-2020 |
Contrôles
Modalités | Une épreuve en temps limité à mi-semestre portant sur les concepts de la première partie du cours comptera pour 50% de la note; un projet en groupe, mené pendant la deuxième partie du semestre, donnera lieu à une note qui comptera pour 50%. |
Modalités (CTI) | Pour les étudiants en contrôle terminal intégral, l'épreuve sera constituée par un oral organisé
vendredi 30 avril 2021, par Zoom
|
Organisation | L'épreuve organisée à mi-semestre consiste en un test sur iCampus, comprenant 10 questions brèves
(de type QCM ou assimilé; les réponses erronnées apportent des points négatifs).
Il est permis de consulter tous les documents que vous souhaitez pendant l'épreuve, mais toute communication sous quelque forme que ce soit entre les étudiants est interdite: le travail soumis à évaluation est un travail personnel et individuel. Les personnes qui contreviennent à ces règles, même de façon passive, seront systématiquement sanctionnées (un passage en conseil de discipline peut aller jusqu'à l'exclusion définitive de tout établissement public d'enseignement supérieur ; toute sanction disciplinaire pour fraude entraîne la nullité de la session d'examen, et l'incapacité pour la personne sanctionnée de valider son semestre).
|
Projet (principe) | Le projet est présenté de façon légèrement plus détaillée dans ce document.
L'objectif du projet est de réaliser une "grammaire locale" (au sens où ce terme est employé dans l'application Unitex) pour repérer, dans des textes littéraires, le plus grand nombre possible d'occurrences de déclencheurs de présupposition. Chaque groupe de 2 ou 3 personnes choisit une classe de déclencheurs dans la liste suivante. Plusieurs groupes peuvent choisir la même classe, même si l'idéal serait de bien les répartir.
|
Projet (méthode) | 1. Dans un premier temps, en utilisant
l'article
déjà évoqué en cours, il est possible de déterminer un ensemble de mots et un ensemble de contextes
correspondant à des occurrences de déclencheurs. Par exemple, le verbe regretter est un
déclencheur de présupposition, mais seulement lorsqu'il sous-catégorise une proposition complétive
introduite par que ou une proposition infinitive introduite par de. On demande donc de
réaliser un automate dans Unitex qui permette de retrouver les occurrences de ce déclencheur dans le
texte de Jules Verne (disponible ici lien corrigé). On
demande ensuite un automate qui retrouve les occurrences de tous les déclencheurs de la classe. Il
est facile de vérifier que l'automate est efficace puisque l'article indique le nombre d'occurrences
de chacun de ces déclencheurs. 2. Dans un second temps, on cherchera à appliquer l'automate trouvé à un autre texte (par exemple un autre texte de Jules Verne) de façon à découvrir de nouvelles occurrences, et peut-être à faire évoluer la grammaire locale de façon à augmenter sa précision. 3. Les occurrences extraites seront mise en forme dans un tableur, et éventuellement filtrées manuellement. |
Projet (rendu) | On demande un rapport qui décrit les étapes du projet, les difficultés rencontrées et les choix
effectués. On demande aussi les fichiers présentant la ou les grammaires locales (graphes)
élaborés. Enfin, on demande un fichier excel/csv contenant les données extraites sur le nouveau texte.
Calendrier: 27 avril 2021 pour le choix du groupe et du corpus ; |
Résultats | notes (instructions) |
Rattrapage | L'épreuve de rattrapage est planifiée le vendredi 25 juin, à partir de 11h, sous la forme d'une épreuve orale de 15'. Le lien Zoom est donné sur iCampus. Les personnes qui doivent prendre part à l'épreuve de rattrapage doivent me contacter pour confirmer leur prise en compte. |
Séances
2021-01-26 | Ch1. Automates | Plan du chapitre, copie tableau |
2021-02-02 | Ch1. Automates (suite) | copie tableau |
2021-02-09 | Ch1. Automates (fin) Ch2. Expressions rationnelles |
copie tableau |
2021-02-16 | Ch2. Expressions rationnelles (suite) | feuille d'exercices, copie tableau |
2021-02-23 | Pas de séance (réussite à l'université) | |
2021-03-02 | Ch2. Expressions rationnelles (suite) |
Liens pour démos: regexp 101, regexper
fiche ; copie tableau |
2021-03-09 | Exercices sur automates et expressions rationnelles | copie tableau |
2021-03-16 | 17h00: Présentation du logiciel Unitex
17h30: Epreuve de contrôle continu (1h) |
diapos de présentation d'Unitex/gramlab |
2021-03-23 | « Install Party » Unitex: installation, mise en route, consignes pour Unitex. | Voir sur iCampus le lien vers un forum Discord. |
2021-03-30 | Ch3. Les présuppositions Séance annulée suite à une agression |
poly à annoter |
2021-04-06 | Ch3. Les présuppositions | Voir séquences disponibles sur iCampus. |
2021-04-13 | Ch3. Les présuppositions (suite) Le projet sur les présuppositions. |
article; corpus de travail; textes de J. Verne |
2021-04-19 | Pas de séance (vacances de printemps) | |
2021-04-27 | Séance de questions : sur le forum discord. |
Pointeurs (références, bibliographie, ressources en ligne)
- Des outils francophones d'exploitation de corpus : TXM, Unitex/gramlab.
- Deux outils en ligne pour tester des expressions régulières: regexpal, et regexp 101.
- Regexp: documentation abondante et pédagogique : Rex EGG.
- Regexp: fiche de triche (cheat sheet) qui permet de comparer les syntaxes. Une autre version plus compacte, et encore une autre, plus sommaire mais pratique (empruntée à Michael Yoshitaka Erlewine)
- Regexp & automates: ce site permet de passer des unes aux autres.
- Un polycopié avec quelques animations pour comprendre le principe des diagrammes d'états (en anglais).
- Présupposition: moyen quelquefois utilisé pour présenter comme déjà connue une information qu'on veut en fait apporter mais sans en avoir l'air: J'ai garé ma Porsche en bas de la maison. Voir my girlfriend dans ce dessin. Ça marche (plus ou moins bien) quand l'allocutaire accepte d'accommoder la présupposition.