Initiation à la recherche : Recueil et traitement des données S3
Licence Sciences du langageParcours Sciences du langage
Description
Mme Todirascu (CM) et M. Ilic (TD)
Les étudiant(e)s seront initié(e)s aux notions de donnée, de corpus, de documentation, d'archivage et de gestion de données. Ils/Elles mettront en place un protocole de collecte de données. Ils apprendront quelques mesures statistiques permettant l'exploitation des corpus.
Modalités d'organisation et de suivi
Travail sur machine
Exposé interactif
Disciplines
- Sciences du langage
Syllabus
C'est quoi une donnée ? (définitions, exemples, brainstorming)
Méthodes de collecte de données (manuelle, automatisée, définir un protocole)
Ethique et qualité de données, métadonnées
Focus sur les corpus écrits (définition, collecte, documentation, exemples)
Pourquoi travailler sur corpus ? Exemples d'exploitation des corpus oraux et écrits
Méthodologie de création de corpus
Collecte de données: sources, aspects éthiques
Documenter un corpus: les métadonnées
Exploiter des corpus: concordanciers, expressions régulières
Notions de statistique lexicale
Présentation des dossiers
Examen écrit sur machine
Bibliographie
Documents et ressources distribués en cours