Informations pratiques
Calendrier | Jeudi, 15h-17h, salle Rousselot |
Lien iCampus | https://icampus.univ-paris3.fr/user/index.php?id=8523 |
Contenu | Depuis les révolutions chomskyennes en linguistique, le traitement automatique de la langue (TAL) joue un rôle déterminant dans la perception de cette science : mais à quel point la capacité de reproduire techniquement la compétence langagière de l'humain nous rapproche-t-elle de la compréhension du fonctionnement de la langue ? Le TAL est un domaine de la recherche en intelligence artificielle, à mi-chemin entre l'ingénierie linguistique qui pose les défis et les besoins concrets et la linguistique informatique qui essaie de proposer des solutions théoriques. Le but de ce cours est d'une part de présenter les objectifs et techniques centraux du TAL, et d'autre part de montrer ses influences historiques et actuelles sur la linguistique. |
Pendant le confinement | Pour diminuer les difficultés et le stress causé par cette période inédite, je propose d'annuler simplement les séances planifiées pendant la période de confinement.
Un forum est ouvert sur iCampus https://icampus.univ-paris3.fr/user/index.php?id=8523, qui nous permettra de maintenir un contact pédagogique. Je serai connecté sur ce forum aux horaires habituels du cours (et aussi sans doute à d'autres moments dans la semaine). N'hésitez pas à me contacter par mail (pascal.amsili@gmx.fr) pour toute difficulté ou question plus personnelle. |
Contrôles
Modalités | Une fiche de lecture sur un article portant sur le TAL ou la linguistique computationnelle (50%) |
Nouvelles modalités | Je propose que la note finale de ce cours soit simplement la note de la fiche de lecture. La date de rendu de la fiche peut être modifiée en fonction de l'évolution de la situation. |
Consignes (fiche de lecture) | On demande un texte de 5 à 10 pages, dactylographié, qui présente le projet de l'article, sa thèse principale (ou ses
principaux résultats), et les arguments employés. Il est important que l'essai soit critique: la démarche critique ne consiste pas à
exprimer une opinion à propos du texte (ou de dire s'il nous a plu) mais à tenter de remettre en question autant que possible les affirmations du texte en
convoquant d'autres exemples ou d'autres sources.
Le travail doit être rendu au plus tard le 30 avril 2020, sous la forme d'un fichier pdf, qui sera déposé sur iCampus. Tout plagiat, aussi minime soit-il, sera réprimé avec la plus grande sévérité. |
Séances
2020-01-16 | Séance annulée pour cause de grève | |
2020-01-23 | Ch1. Panorama du TAL | |
2020-01-30 | Séance annulée pour cause de grève | |
2020-02-06 | Ch1. Panorame (suite & fin) | tester Eliza ; Introduction to N-Grams |
2020-02-13 | Ch2. Automates et expressions régulières | |
2020-02-20 | Pas de séance (réussite à l'université) | |
2020-02-27 | Ch2. Automates et expressions régulières (suite) | |
2020-03-05 | Pas de séance (journée d'action) | |
2020-03-12 | Ch2. Automates et expressions régulières (suite) Ch3. Sémantique distributionnelle |
pour tester des expressions régulières: regexp 101. |
2020-03-19 | Pas de séance (semaine 1 du confinement) | |
2020-03-26 | Pas de séance (semaine 2 du confinement) | |
2020-04-02 | Pas de séance (semaine 3 du confinement) | |
2020-04-09 | Pas de séance (vacances de printemps) | |
2020-04-16 | Pas de séance (confinement) |
Références et ressources bibliographiques
Pointeurs généraux
- La revue scientifique (ephémère) « Linguistic Issues in Language Technologies » présente des travaux intéressants portant sur la relation entre linguistique et TAL. Le numéro spécial Interaction of Linguistics and Computationnal Linguistics, paru en 2011, contient un lot d'articles intéressants et toujours d'actualité en grande partie.
- L'ATALA publie depuis 1960 la revue TAL (Traitement Automatique des Langues), qui est en ligne et en accès libre depuis 2006. Si beaucoup d'articles comportent une certaine dimension technique, on trouve aussi des textes plus accessibles au non spécialiste, que ce soit des articles de synthèse ou des discussions.
- L'ATALA organise depuis 1994 la conférence TALN qui est un lieu de rencontre de la communauté (essentiellement francophone) du TAL. Les communications à ces conférences sont systématiquement sélectionnées et publiées sous formes d'articles courts de 6 à 12 pages, qui ne sont malheureusement pas encore rassemblés sur un site unique, mais qui sont assez facile à trouver, en particulier pour les dernières années, sur les sites respectifs de chaque édition.
Petite sélection d'articles récents
- Charlotte Rochereau, Benoît Sagot and Emmanuel Dupoux (2019). Modeling German Verb Argument Structures: LSTMs vs. Humans. arXiv e-prints.
- Suzanne Mpouli (2019). Chronique d’un échec : identification des métaphores dans les écrits des géographes. Traitement Automatique des Langues, Volume 60 Numéro 3.
- Rémy Kessler, Guy Lapalme (2017). AGOHRA : génération d’une ontologie dans le domaine des ressources humaines. Traitement Automatique des Langues, Volume 58 Numéro 1.
- Roze C., Braud C. and Muller P., Which aspects of discourse relations are hard to learn? Primitive decomposition for discourse relation classification, In Proceedings of Special Interest Group on Discourse and Dialogue (SIGDIAL 2019), Stockholm, 11/09/2019-13/09/2019, Association for Computational Linguistics.