Introduction au TAL

Introduction au TAL
Master Sciences du langageParcours Sciences du langage

Description

LT41GM22 – Introduction au traitement automatique des langues
Mme TODIRASCU
Ce cours propose une initiation dans le domaine du Traitement Automatique des langues (maitrise des outils, applications, ressources).

Les applications en TAL les plus répandues  : chatbots, traduction automatique, calcul de la coréférence, extraction d’information. Les approches en TAL : approche à base de règles, approche statistique, approche par apprentissage profond. Ressources utiles pour construire des applications TAL : lexiques, corpus, modèles de langues (plongements lexicaux).

Compétences requises

Etudiants doivent être capable de :

  • formuler des commandes en ligne de commande (invité de commandes)

  • maîtriser des notions de base en linguistique (morphologie, syntaxe, sémantique)

Compétences visées

  • maîtrise d'un outil d'étiquetage automatique et d'analyse automatique en dépendances;
    - connaître les approches en TAL (symbolique, statistique, apprentissage profond);
    - connaître les resources nécessaires pour les diverses applications TAL;
    - connaître le fonctionnement des applications TAL (traduction, extraction de terminologie, chatbots)
  • Macrocompétences: Développer, se servir de façon autonome des outils et des ressources numériques avancés (outils d’annotation, concordanciers, bases lexicales, terminologiques etc) pour un projet professionnel ou de recherche en Sciences du langage

Modalités d'organisation et de suivi

6 séances de 2 heures (septembre octobre). Jeudi 14h-16h (semaine 1-7)

Syllabus

Objectifs d'apprentissage 

A la fin de cet enseignement les étudiants seront capables de

  • appliquer une chaîne de traitement sur un texte sans annotation afin d’obtenir une annotation automatique à granularité variable

  • comprendre le fonctionnement des approches en TAL (à base de règles, statistiques, par apprentissage profond)

  • configurer des outils de TAL pour sa propre étude

Informations complémentaires

 12/09/2024

2 TD 

A la fin de ce cours les étudiants seront capable de

  • identifier les applications les plus repandues en TAL

  • identifier les enjeux du TAL

  • connaître les étapes d’une chaîne de traitement complète pour ajouter plusieurs couches d’annotation 

  • comprendre les avantages et limites des approches en TAL

19/09/2024 

2 TD 

  • Maîtriser des outils pour la segmentation, la tokenisation, la catégorisation des textes

  • reconnaître les défis que le développement de ces outils posent

  • S’approprier les divers approches (à base de règle, statistique, modèle de langue) et ressources pour réaliser ces tâches

26/09/2024 

2TD 

  •  Maîtriser des outils pour l’analyse morpho-syntaxique et lemmatisation

  • Identifier les enjeux du dévelopement de ces outils

  • S’approprier les divers approches (à base de règle, statistique, modèle de langue) et ressources pour réaliser ces tâches

3/10/2024 

 2TD

  •  Apprendre les différences entre l’analyse en constituents et l’analyse en dépendances syntaxiques

  • maîtriser les outils d’analyse automatique syntaxique (un outil par type d’analyse)

10/10/2024 

2TD 

  •  Apprendre les enjeux de l’analyse sémantique automatique

  • identifier le fonctionnement des plongements lexicaux

  • apprendre à utiliser les modèles de langues de type transformer

  • utiliser quelques ressources (bases lexico-sémantiques)

  

 17/10/2024

2TD 

Identifier les étapes de développement d’une application TAL en contexte industriel 

Développer une mini-chaîne de traitement

24/10/2024 

1TD 

Examen écrit 

Contacts

Responsable(s) de l'enseignement