Généralités

Créneau mardi, 17h-18h30. Premier cours le 26 janvier 2021
Enseignant Pascal Amsili
Lien iCampus https://icampus.univ-paris3.fr/course/view.php?id=15021
Contenu En première partie du cours, on travaillera de façon théorique et pratique sur certains concepts pertinents pour la manipulation de corpus (automates, expressions régulières...). La seconde partie sera consacrée à une utilisation approfondie d'un outil de manipulation de corpus, dans le cadre d'un projet en groupe qui portera cette année sur la présupposition.
Organisation « Distanciel intégral synchrone »: le cours aura lieu à distance.
  • Les séances auront lieu sur Zoom (lien sur iCampus), en synchrone. Les étudiants seront invités à allumer leur caméra.
  • L'essentiel du cours se fera grâce à un tableau partagé, dont une copie sera disponible après la séance sur cette page.
  • À l'occasion, des diapos ou des exempliers seront utilisés, ils seront alors disponibles dès le début du cours sur cette page.
Suite à l'agression choquante qui s'est produite pendant la séance du 30 mars, les séances restantes seront assurées de façon asynchrone et non interactive.
Délégué(e)s Pour faciliter la communication entre nous, je propose que vous élisiez une ou deux personnes qui accepteraient de jouer le rôle de délégué/représentant des étudiants (uniquement pour ce cours), avec comme rôle de synthétiser les questions et les difficultés que vous pourriez rencontrer pendant le semestre.
Archives Lien vers la page de l'année 2019-2020

Contrôles

Modalités Une épreuve en temps limité à mi-semestre portant sur les concepts de la première partie du cours comptera pour 50% de la note; un projet en groupe, mené pendant la deuxième partie du semestre, donnera lieu à une note qui comptera pour 50%.
Modalités (CTI) Pour les étudiants en contrôle terminal intégral, l'épreuve sera constituée par un oral organisé vendredi 30 avril 2021, par Zoom pendant les deux premières semaines de mai 2021 ou pendant la dernière semaine de cours selon la situation. Si vous êtes concerné(e) vous devriez recevoir une convocation individuelle.
Organisation L'épreuve organisée à mi-semestre consiste en un test sur iCampus, comprenant 10 questions brèves (de type QCM ou assimilé; les réponses erronnées apportent des points négatifs).
Il est permis de consulter tous les documents que vous souhaitez pendant l'épreuve, mais toute communication sous quelque forme que ce soit entre les étudiants est interdite: le travail soumis à évaluation est un travail personnel et individuel. Les personnes qui contreviennent à ces règles, même de façon passive, seront systématiquement sanctionnées (un passage en conseil de discipline peut aller jusqu'à l'exclusion définitive de tout établissement public d'enseignement supérieur ; toute sanction disciplinaire pour fraude entraîne la nullité de la session d'examen, et l'incapacité pour la personne sanctionnée de valider son semestre).
  • L'épreuve commence à 17h30, et dure une heure (1h20 pour les étudiants bénéficiant d'un tiers-temps).
  • Pendant la durée de l'épreuve, la réunion Zoom habituelle sera active, et il sera donc possible de poser des questions à l'enseignant.
  • En cas de difficulté matérielle (réseau/ordinateur) prendre des copies d'écran et les envoyer immédiatement par mail, éventuellement avec les réponses.
Projet (principe) Le projet est présenté de façon légèrement plus détaillée dans ce document.
L'objectif du projet est de réaliser une "grammaire locale" (au sens où ce terme est employé dans l'application Unitex) pour repérer, dans des textes littéraires, le plus grand nombre possible d'occurrences de déclencheurs de présupposition.
Chaque groupe de 2 ou 3 personnes choisit une classe de déclencheurs dans la liste suivante. Plusieurs groupes peuvent choisir la même classe, même si l'idéal serait de bien les répartir.
  • Prédicats Aspectuels
  • Adverbes Restrictifs
  • Subordonnées Causales
  • Subordonnées Temporelles
  • Prédicats Factifs
  • Constructions Clivées
  • Adverbes Additifs
Projet (méthode) 1. Dans un premier temps, en utilisant l'article déjà évoqué en cours, il est possible de déterminer un ensemble de mots et un ensemble de contextes correspondant à des occurrences de déclencheurs. Par exemple, le verbe regretter est un déclencheur de présupposition, mais seulement lorsqu'il sous-catégorise une proposition complétive introduite par que ou une proposition infinitive introduite par de. On demande donc de réaliser un automate dans Unitex qui permette de retrouver les occurrences de ce déclencheur dans le texte de Jules Verne (disponible ici lien corrigé). On demande ensuite un automate qui retrouve les occurrences de tous les déclencheurs de la classe. Il est facile de vérifier que l'automate est efficace puisque l'article indique le nombre d'occurrences de chacun de ces déclencheurs.
2. Dans un second temps, on cherchera à appliquer l'automate trouvé à un autre texte (par exemple un autre texte de Jules Verne) de façon à découvrir de nouvelles occurrences, et peut-être à faire évoluer la grammaire locale de façon à augmenter sa précision.
3. Les occurrences extraites seront mise en forme dans un tableur, et éventuellement filtrées manuellement.
Projet (rendu) On demande un rapport qui décrit les étapes du projet, les difficultés rencontrées et les choix effectués. On demande aussi les fichiers présentant la ou les grammaires locales (graphes) élaborés. Enfin, on demande un fichier excel/csv contenant les données extraites sur le nouveau texte.
Calendrier: 27 avril 2021 pour le choix du groupe et du corpus ; 30 14 mai 2021 pour le rendu final.
Résultats notes (instructions)
Rattrapage L'épreuve de rattrapage est planifiée le vendredi 25 juin, à partir de 11h, sous la forme d'une épreuve orale de 15'. Le lien Zoom est donné sur iCampus. Les personnes qui doivent prendre part à l'épreuve de rattrapage doivent me contacter pour confirmer leur prise en compte.

Séances

2021-01-26 Ch1. Automates Plan du chapitre, copie tableau
2021-02-02 Ch1. Automates (suite) copie tableau
2021-02-09 Ch1. Automates (fin)
Ch2. Expressions rationnelles
copie tableau
2021-02-16 Ch2. Expressions rationnelles (suite) feuille d'exercices, copie tableau
2021-02-23 Pas de séance (réussite à l'université)
2021-03-02 Ch2. Expressions rationnelles (suite) Liens pour démos: regexp 101, regexper
fiche ; copie tableau
2021-03-09 Exercices sur automates et expressions rationnelles copie tableau
2021-03-16 17h00: Présentation du logiciel Unitex
17h30: Epreuve de contrôle continu (1h)
diapos de présentation d'Unitex/gramlab
2021-03-23 « Install Party » Unitex: installation, mise en route, consignes pour Unitex. Voir sur iCampus le lien vers un forum Discord.
2021-03-30 Ch3. Les présuppositions
Séance annulée suite à une agression
poly à annoter
2021-04-06 Ch3. Les présuppositions Voir séquences disponibles sur iCampus.
2021-04-13 Ch3. Les présuppositions (suite)
Le projet sur les présuppositions.
article; corpus de travail; textes de J. Verne
2021-04-19 Pas de séance (vacances de printemps)
2021-04-27 Séance de questions : sur le forum discord.

Pointeurs (références, bibliographie, ressources en ligne)

  • Des outils francophones d'exploitation de corpus : TXM, Unitex/gramlab.
  • Deux outils en ligne pour tester des expressions régulières: regexpal, et regexp 101.
  • Regexp: documentation abondante et pédagogique : Rex EGG.
  • Regexp: fiche de triche (cheat sheet) qui permet de comparer les syntaxes. Une autre version plus compacte, et encore une autre, plus sommaire mais pratique (empruntée à Michael Yoshitaka Erlewine)
  • Regexp & automates: ce site permet de passer des unes aux autres.
  • Un polycopié avec quelques animations pour comprendre le principe des diagrammes d'états (en anglais).
  • Présupposition: moyen quelquefois utilisé pour présenter comme déjà connue une information qu'on veut en fait apporter mais sans en avoir l'air: J'ai garé ma Porsche en bas de la maison. Voir my girlfriend dans ce dessin. Ça marche (plus ou moins bien) quand l'allocutaire accepte d'accommoder la présupposition.