Généralités

Créneau Jeudi 15h00-17h00, distanciel. Premier cours jeudi 28 janvier 2021.
Code LZSY005
Lien iCampus https://icampus.univ-paris3.fr/course/view.php?id=15554
Contenu Enseignement élaboré à neuf pour cette année 2020-21.
On y présentera un panorama du domaine technique du TAL, on étudiera plusieurs formalismes pertinents pour le TAL (automates, grammaires formelles...); on y présentera (succinctement et selon le temps) les nouvelles approches dans le domaine (apprentissage machine, méthodes «neuronales», sémantique distributionnelle).
Organisation « Distanciel intégral synchrone »: le cours aura lieu à distance.
  • Les séances auront lieu sur Zoom (lien sur iCampus), en synchrone.
    Les étudiants seront invités à allumer leur caméra.
  • L'essentiel du cours se fera grâce à un tableau partagé, dont une copie sera disponible après la séance sur cette page.
  • À l'occasion, des diapos ou des exempliers seront utilisés, ils seront alors disponibles dès le début du cours sur cette page.
  • Les séances seront constituées de 3 séquences de 30 à 35' chacune, séparées par des pauses.
  • Les séances ne seront pas enregistrées
Evaluation A l'issue de ce cours, vous serez invités à remplir un questionnaire d'évaluation anonyme (sur iCampus) qui vous permettra d'exprimer vos critiques et compliments à propos de ce cours. Cette année, à titre expérimental, le questionnaire est ouvert dès le début du semestre, n'hésitez pas à vous en servir ! Le questionnaire sera fermé le dimanche 23 mai au soir.
Archives Lien vers la page de l'année 2019-2020

Contrôles

Modalités Une épreuve en temps limité à mi-semestre, portant sur la première partie du cours, comptera pour 50%. Les autres 50% seront obtenus grâce à une fiche de lecture. La note finale sera obtenue en prenant la note de la fiche de lecture, éventuellement moyennée avec la note de partiel, seulement si le résultat est favorable.
Epreuve écrite L'épreuve écrite de mi-semestre va être organisée à distance, pendant le créneau horaire du cours. Les étudiants seront invités à se connecter sur Zoom (lien habituel) et à allumer leur caméra pendant la durée de l'épreuve.
Il sera aussi demandé aux étudiants d'envoyer dès le début de l'épreuve une déclaration sur l'honneur.
L'épreuve sera découpée en deux phases. Dans chaque phase, après que l'énoncé aura été mis en ligne (ou sur iCampus), les étudiants seront invités à composer, devant la caméra, de préférence sur papier. Il sera permis aux étudiants de consulter tous les documents possibles, mais en revanche, toute communication entre les étudiants est interdite.
Une fois le temps écoulé, il sera demandé aux étudiants de transmettre leur travaux en scannant leur copie, de préférence en utilisant une application de type 'Simple Scanner' qui permet d'envoyer des pdf pas trop lourds et bien contrastés (par rapport aux photos).
Consignes (fiche de lecture) La fiche de lecture doit porter sur un article portant sur le TAL ou la linguistique computationnelle. On demande un texte de 5 à 10 pages, dactylographié, qui présente le projet de l'article, sa thèse principale (ou ses principaux résultats), et les arguments employés. Il est important que l'essai soit critique: la démarche critique ne consiste pas à exprimer une opinion à propos du texte (ou de dire s'il nous a plu) mais à tenter de remettre en question autant que possible les affirmations du texte en convoquant d'autres exemples ou d'autres sources.
Le choix de l'article (avec l'accord de l'enseignant) doit être déterminé au plus tard le 25 mars 2021 (tableur partagé sur iCampus).
Le travail doit être rendu au plus tard le 02 mai 2021, sous la forme d'un fichier pdf, qui sera déposé sur iCampus.
Tout plagiat, aussi minime soit-il, sera réprimé avec la plus grande sévérité.
Date(s) 18 mars 2021, 15h: Devoir en temps limité (à distance)
25 mars 2021, minuit: Choix final de l'article pour la fiche de lecture
02 mai 2021, minuit: dépôt de la fiche de lecture sur iCampus
Résultats Epreuve du 18 mars: énoncé ; corrigé ; notes (instructions)

Séances

2021-01-28 Ch1. Panorama du TAL (1) diapos, copie tableau
2021-02-04 Ch1. Panorama du TAL (2) copie tableau
à propos de RTE: Textual Entailment Ressource Pool de l'ACL; (Dagan et al 2013).
2021-02-11 Ch1. Panorama du TAL (fin)
Ch2. Automates
copie tableau
2021-02-18 Ch2. Automates copie tableau
2021-02-25 Pas de séance
2021-03-04 Ch3. Expressions régulières copie tableau
2021-03-11 Ch3. Expressions régulières poly annoté
2021-03-18 Epreuve en temps limité
2021-03-25 Séance annulée
2021-04-01 Ch4. Classification de documents diapos
2021-04-08
2021-04-15
2021-04-22 Pas de séance (vacances)
2021-04-29

Pointeurs

Pointeurs généraux

  • La revue scientifique (ephémère) « Linguistic Issues in Language Technologies » présente des travaux intéressants portant sur la relation entre linguistique et TAL. Le numéro spécial Interaction of Linguistics and Computationnal Linguistics, paru en 2011, contient un lot d'articles intéressants et toujours d'actualité en grande partie.
  • L'ATALA publie depuis 1960 la revue TAL (Traitement Automatique des Langues), qui est en ligne et en accès libre depuis 2006. Si beaucoup d'articles comportent une certaine dimension technique, on trouve aussi des textes plus accessibles au non spécialiste, que ce soit des articles de synthèse ou des discussions.
  • L'ATALA organise depuis 1994 la conférence TALN qui est un lieu de rencontre de la communauté (essentiellement francophone) du TAL. Les communications à ces conférences sont systématiquement sélectionnées et publiées sous formes d'articles courts de 6 à 12 pages, qui ne sont malheureusement pas encore rassemblés sur un site unique, mais qui sont assez facile à trouver, en particulier pour les dernières années, sur les sites respectifs de chaque édition.
  • Conférences en TAL/NLP les plus importantes.

Références bibliographiques

  • Dickinson, Brew & Meurers, 2013: Language and computers. Wiley-Blackwell. Companion web site.
  • Partee, Barbara H, ter Meulen, Alice & Wall, Robert, 1990. Mathematical methods in Linguistics. Dordrecht: Kluwer. version pdf