Collecte de données et constitution de corpus écrits : numérisation, crowdsourcing

Collecte de données et constitution de corpus écrits : numérisation, crowdsourcing
Master Sciences du langageParcours Sciences du langage et sciences des données

Catalogue2024-2025

Description

LT36GM05/LT36GM10 – Collecte de données et constitution de corpus écrits
Mme TODIRASCU
Les corpus : définition et exemples (Frantext, Scientext). Critères de constitution de corpus. Corpus bruts vs corpus annotés. Méthodes de collecte de données écrites: numérisation, crowdsourcing, scraping.

Compétences visées

  • connaître les notions de base en linguistique de corpus (corpus écrits vs corpus oraux, mesures statistiques, lexique du corpus, collocatif);
  • savoir constituer son propre corpus selon des critères bien définis;

Modalités d'organisation et de suivi

6 heures en présentiel (semaines 1-3)

Contacts

Responsable(s) de l'enseignement

MCC

Les épreuves indiquées respectent et appliquent le règlement de votre formation, disponible dans l'onglet Documents de la description de la formation.

Régime d'évaluation
ECI (Évaluation continue intégrale)
Coefficient
1.0

Évaluation initiale / Session principale - Épreuves

LibelléType d'évaluationNature de l'épreuveDurée (en minutes)Coéfficient de l'épreuveNote éliminatoire de l'épreuveNote reportée en session 2
Epreuve écriteExercice sur machine
ACPT201.00