Informations pratiques

Calendrier Jeudi, 15h-17h, salle Rousselot
Lien iCampus https://icampus.univ-paris3.fr/user/index.php?id=8523
Contenu Depuis les révolutions chomskyennes en linguistique, le traitement automatique de la langue (TAL) joue un rôle déterminant dans la perception de cette science : mais à quel point la capacité de reproduire techniquement la compétence langagière de l'humain nous rapproche-t-elle de la compréhension du fonctionnement de la langue ? Le TAL est un domaine de la recherche en intelligence artificielle, à mi-chemin entre l'ingénierie linguistique qui pose les défis et les besoins concrets et la linguistique informatique qui essaie de proposer des solutions théoriques. Le but de ce cours est d'une part de présenter les objectifs et techniques centraux du TAL, et d'autre part de montrer ses influences historiques et actuelles sur la linguistique.
Pendant le confinement Pour diminuer les difficultés et le stress causé par cette période inédite, je propose d'annuler simplement les séances planifiées pendant la période de confinement.
Un forum est ouvert sur iCampus https://icampus.univ-paris3.fr/user/index.php?id=8523, qui nous permettra de maintenir un contact pédagogique. Je serai connecté sur ce forum aux horaires habituels du cours (et aussi sans doute à d'autres moments dans la semaine).
N'hésitez pas à me contacter par mail (pascal.amsili@gmx.fr) pour toute difficulté ou question plus personnelle.

Contrôles

Modalités Un examen sur table pendant la dernière séance et comptant pour 50% de la note ;
Une fiche de lecture sur un article portant sur le TAL ou la linguistique computationnelle (50%)
Nouvelles modalités Je propose que la note finale de ce cours soit simplement la note de la fiche de lecture. La date de rendu de la fiche peut être modifiée en fonction de l'évolution de la situation.
Consignes (fiche de lecture) On demande un texte de 5 à 10 pages, dactylographié, qui présente le projet de l'article, sa thèse principale (ou ses principaux résultats), et les arguments employés. Il est important que l'essai soit critique: la démarche critique ne consiste pas à exprimer une opinion à propos du texte (ou de dire s'il nous a plu) mais à tenter de remettre en question autant que possible les affirmations du texte en convoquant d'autres exemples ou d'autres sources.
Le travail doit être rendu au plus tard le 30 avril 2020, sous la forme d'un fichier pdf, qui sera déposé sur iCampus.
Tout plagiat, aussi minime soit-il, sera réprimé avec la plus grande sévérité.

Séances

2020-01-16 Séance annulée pour cause de grève
2020-01-23 Ch1. Panorama du TAL
2020-01-30 Séance annulée pour cause de grève
2020-02-06 Ch1. Panorame (suite & fin) tester Eliza ; Introduction to N-Grams
2020-02-13 Ch2. Automates et expressions régulières
2020-02-20 Pas de séance (réussite à l'université)
2020-02-27 Ch2. Automates et expressions régulières (suite)
2020-03-05 Pas de séance (journée d'action)
2020-03-12 Ch2. Automates et expressions régulières (suite)
Ch3. Sémantique distributionnelle
pour tester des expressions régulières: regexp 101.
2020-03-19 Pas de séance (semaine 1 du confinement)
2020-03-26 Pas de séance (semaine 2 du confinement)
2020-04-02 Pas de séance (semaine 3 du confinement)
2020-04-09 Pas de séance (vacances de printemps)
2020-04-16 Pas de séance (confinement)

Références et ressources bibliographiques

Pointeurs généraux

  • La revue scientifique (ephémère) « Linguistic Issues in Language Technologies » présente des travaux intéressants portant sur la relation entre linguistique et TAL. Le numéro spécial Interaction of Linguistics and Computationnal Linguistics, paru en 2011, contient un lot d'articles intéressants et toujours d'actualité en grande partie.
  • L'ATALA publie depuis 1960 la revue TAL (Traitement Automatique des Langues), qui est en ligne et en accès libre depuis 2006. Si beaucoup d'articles comportent une certaine dimension technique, on trouve aussi des textes plus accessibles au non spécialiste, que ce soit des articles de synthèse ou des discussions.
  • L'ATALA organise depuis 1994 la conférence TALN qui est un lieu de rencontre de la communauté (essentiellement francophone) du TAL. Les communications à ces conférences sont systématiquement sélectionnées et publiées sous formes d'articles courts de 6 à 12 pages, qui ne sont malheureusement pas encore rassemblés sur un site unique, mais qui sont assez facile à trouver, en particulier pour les dernières années, sur les sites respectifs de chaque édition.

Petite sélection d'articles récents