Généralités
Créneau | Jeudi 15h00-17h00, distanciel. Premier cours jeudi 28 janvier 2021. |
Code | LZSY005 |
Lien iCampus | https://icampus.univ-paris3.fr/course/view.php?id=15554 |
Contenu |
Enseignement élaboré à neuf pour cette année
2020-21. On y présentera un panorama du domaine technique du TAL, on étudiera plusieurs formalismes pertinents pour le TAL (automates, grammaires formelles...); on y présentera (succinctement et selon le temps) les nouvelles approches dans le domaine (apprentissage machine, méthodes «neuronales», sémantique distributionnelle). |
Organisation | « Distanciel intégral synchrone »: le cours aura lieu à distance.
|
Evaluation | A l'issue de ce cours, vous serez invités à remplir un questionnaire d'évaluation anonyme (sur iCampus) qui vous permettra d'exprimer vos critiques et compliments à propos de ce cours. Cette année, à titre expérimental, le questionnaire est ouvert dès le début du semestre, n'hésitez pas à vous en servir ! Le questionnaire sera fermé le dimanche 23 mai au soir. |
Archives | Lien vers la page de l'année 2019-2020 |
Contrôles
Modalités | |
Epreuve écrite | L'épreuve écrite de mi-semestre va être organisée à distance, pendant le créneau horaire du
cours. Les étudiants seront invités à se connecter sur Zoom (lien habituel) et à allumer leur caméra
pendant la durée de l'épreuve. Il sera aussi demandé aux étudiants d'envoyer dès le début de l'épreuve une déclaration sur l'honneur. L'épreuve sera découpée en deux phases. Dans chaque phase, après que l'énoncé aura été mis en ligne (ou sur iCampus), les étudiants seront invités à composer, devant la caméra, de préférence sur papier. Il sera permis aux étudiants de consulter tous les documents possibles, mais en revanche, toute communication entre les étudiants est interdite. Une fois le temps écoulé, il sera demandé aux étudiants de transmettre leur travaux en scannant leur copie, de préférence en utilisant une application de type 'Simple Scanner' qui permet d'envoyer des pdf pas trop lourds et bien contrastés (par rapport aux photos). |
Consignes (fiche de lecture) | La fiche de lecture doit porter sur un article portant sur le TAL ou la linguistique
computationnelle. On demande un texte de 5 à 10 pages, dactylographié, qui présente
le projet de l'article, sa thèse principale (ou ses principaux résultats), et
les arguments employés. Il est important que l'essai soit critique: la démarche
critique ne consiste pas à exprimer une opinion à propos du texte (ou de dire s'il nous a plu) mais
à tenter de remettre en question autant que possible les affirmations du texte en convoquant
d'autres exemples ou d'autres sources. Le choix de l'article (avec l'accord de l'enseignant) doit être déterminé au plus tard le 25 mars 2021 (tableur partagé sur iCampus). Le travail doit être rendu au plus tard le 02 mai 2021, sous la forme d'un fichier pdf, qui sera déposé sur iCampus. Tout plagiat, aussi minime soit-il, sera réprimé avec la plus grande sévérité. |
Date(s) | 18 mars 2021, 15h: Devoir en temps limité (à distance)
25 mars 2021, minuit: Choix final de l'article pour la fiche de lecture 02 mai 2021, minuit: dépôt de la fiche de lecture sur iCampus |
Résultats | Epreuve du 18 mars: énoncé ; corrigé ; notes (instructions) |
Séances
2021-01-28 | Ch1. Panorama du TAL (1) | diapos, copie tableau |
2021-02-04 | Ch1. Panorama du TAL (2) |
copie tableau
à propos de RTE: Textual Entailment Ressource Pool de l'ACL; (Dagan et al 2013). |
2021-02-11 | Ch1. Panorama du TAL (fin)
Ch2. Automates |
copie tableau |
2021-02-18 | Ch2. Automates | copie tableau |
2021-02-25 | Pas de séance | |
2021-03-04 | Ch3. Expressions régulières | copie tableau |
2021-03-11 | Ch3. Expressions régulières | poly annoté |
2021-03-18 | Epreuve en temps limité | |
2021-03-25 | Séance annulée | |
2021-04-01 | Ch4. Classification de documents | diapos |
2021-04-08 | ||
2021-04-15 | ||
2021-04-22 | Pas de séance (vacances) | |
2021-04-29 |
Pointeurs
Pointeurs généraux
- La revue scientifique (ephémère) « Linguistic Issues in Language Technologies » présente des travaux intéressants portant sur la relation entre linguistique et TAL. Le numéro spécial Interaction of Linguistics and Computationnal Linguistics, paru en 2011, contient un lot d'articles intéressants et toujours d'actualité en grande partie.
- L'ATALA publie depuis 1960 la revue TAL (Traitement Automatique des Langues), qui est en ligne et en accès libre depuis 2006. Si beaucoup d'articles comportent une certaine dimension technique, on trouve aussi des textes plus accessibles au non spécialiste, que ce soit des articles de synthèse ou des discussions.
- L'ATALA organise depuis 1994 la conférence TALN qui est un lieu de rencontre de la communauté (essentiellement francophone) du TAL. Les communications à ces conférences sont systématiquement sélectionnées et publiées sous formes d'articles courts de 6 à 12 pages, qui ne sont malheureusement pas encore rassemblés sur un site unique, mais qui sont assez facile à trouver, en particulier pour les dernières années, sur les sites respectifs de chaque édition.
- Conférences en TAL/NLP les plus importantes.
Références bibliographiques
- Dickinson, Brew & Meurers, 2013: Language and computers. Wiley-Blackwell. Companion web site.
- Partee, Barbara H, ter Meulen, Alice & Wall, Robert, 1990. Mathematical methods in Linguistics. Dordrecht: Kluwer. version pdf