Cet article donne accès au rapport final du projet Mulce rendu à l’ANR, programme "Corpus et Outils en SHS" en mars 2011

Table des matières du rapport

  • 1. Enjeux, situation du sujet, objectifs et problématique 4
  • 2. Matériels (terrains, sources, données…), méthodes et travaux réalisés 6
  • 3. Résultats scientifiques obtenus, présentation de leur caractère original, mise en perspective avec les attentes initiales et l’état de l’art 7
  • 4. Appréciation du degré de réalisation des objectifs initiaux, des obstacles rencontrés, des travaux qui restent à conduire 9
  • 5. Perspectives ouvertes par les résultats 9
  • 6. Appréciation de l’impact (scientifique, social, culturel, économique…) 10
  • 7. Pour les projets impliquant la constitution d’un corpus ou de base de données préciser les modalités de création, d’accès et les conditions de pérennisation 11
  • 8. Exploitation et dissémination des résultats 12

Résumé

La recherche sur les interactions en ligne en situation d’apprentissage offre encore trop peu souvent la possibilité d’accéder aux données à partir desquelles les chercheurs ont élaboré les analyses présentées dans les publications. Cela restreint, d’une part, la compréhension des phénomènes étudiés et, d’autre part, empêche toute réplication dans le but de comparaisons, d’analyses cumulatives ou contrastives. Dans le projet Mulce, nous défendons le point de vue méthodologique suivant : pour permettre une analyse des interactions situées, il convient de relier les différentes données issues de formations en ligne pour construire un objet d’analyse, exploitable par différentes équipes et disciplines. Le constat actuel est que les données sont souvent décontextualisées, parcellaires ou simplement inaccessibles à la communauté des chercheurs.

Nous proposons donc de structurer les données en corpus d’apprentissage (LEarning & TEaching Corpora, LETEC) de façon à rendre possible leur échange et la capitalisation des analyses. Le protocole de recherche, le scénario pédagogique, les interactions, productions et traces, les licences et les analyses capitalisables en sont les constituants. Une structure de données a été définie (Mulce-struct, 2010). Elle assemble dans une enveloppe au standard IMS-CP, les éléments précédents décrit en XML avec les ressources associées. Une structure de métadonnées a également été définie pour chaque corpus suivant les recommandations OLAC (Open Language Archives Community). La question de l’éthique a fait l’objet d’une attention particulière. Des procédures d’anonymisation ont été appliquées sur les corpus et les licences intégrées à la structure de corpus.

Une banque de corpus a été constituée (Mulce-databank, 2011). Elle permet l’accès libre aux données suivant le protocole OAI (Open Archive Initiative). 6 corpus d’apprentissage y ont été déposés, correspondant à 6 formations en ligne. A cela viennent s’ajouter 26 corpus distinguables (Mulce-contenu, 2011). Un tel corpus est tout à la fois un sous-corpus du corpus d’apprentissage et un corpus en soi. Il en existe de 3 types : corpus associant une publication scientifique et les données associées ; rassemblant des données prêtes à l’analyse avec la mise en forme pour des outils/logiciels libres ; partageant des analyses avec des outils associés. Cette banque est aujourd’hui déclarée au sein de l’archive OLAC (Olac-Mulce, 2011). Nous y avons défini un nouveau type de corpus (Olac-Letec, 2010). Un site de documentation développe toute notre démarche méthodologique (Mulce.org, 2011).

Des contacts réguliers se sont établis avec des équipes de chercheurs extérieurs permettant d’utiliser leurs outils d’analyse des interactions avec nos données structurées. Enfin nous avons participé ou organisé des symposiums ou ateliers dans des conférences internationales rassemblant les chercheurs travaillant sur les données ou outils d’analyse des interactions en ligne en situation d’apprentissage (Eurocall-Mulce, 2010).

Rapport complet

Accès

Maison des Sciences de l'Homme
4, rue Ledru, 2ème étage - TSA 70402
63001 Clermont-Ferrand Cedex 1

Laboratoire de Recherche sur le Langage © 2024. Tous droits réservés.