Atelier EIAH : Partager des données d’observation pour la recherche en EIAH : traces d’activité d’apprentissage. Une bonne participation et des discussions prometteuses...

Afin de donner un aperçu, voici la liste des 6 communications retenues (sur 8 soumises) qui ont nourri cet atelier auquel ont participé 25 chercheurs.

  • Traces de navigation des apprenants dans un environnement de formation sur le Web - Nabila Bousbia
  • BEATCORP : une plate-forme de benchmarking pour l’analyse de corpus de traces - Hajer Chebil, Christophe Courtin, Jean-Jacques Girardot
  • Partage d’un corpus de données d’observation issues d’activités d’apprentissage - Valentin Butoianu, Philippe Vidal, Julien Broisin
  • Indicateurs de synchronisation des échanges écrits : analyse comparative de deux dispositifs de formation à distance - Raquel Becerril-Ortega, Florent Carlier, Pierre-André Caron, Philippe Teutsch
  • PSLC DataShop and Tatiana : Joint experience on two tools for sharing data and analyses - Gregory Dyke, John Stamper, Carolyn Rosé

Vous retrouverez tous les résumés, textes complets et diaporamas ainsi que la liste des membres du comité scientifique sur le site de cet évènement (url à modifier)

Extrait de l’appel à communication

Introduction

Dans certaines disciplines (physique, biologie, géographie, géologie, économie), le partage de données est déjà inscrit dans les pratiques. De plus, des modèles et outils qui permettent ce partage se développent en particulier sur les technologies du web. Enfin, de nombreuses incitations sont faites pour le partage de données scientifiques (bases de données, corpus, etc.) et le développement de grands projets (TGE Adonis) en direction des SHS. Pour autant, force est de constater que le partage des données dans la communauté des EIAH dépasse rarement les limites d’un projet, voire d’une équipe de recherche. C’est pour tenter de faire le point sur la question du partage de données dans la communauté EIAH que nous proposons cet atelier.

Pourquoi partager nos données de recherche ?

Le potentiel qu’offre le partage de données semble aussi important que varié. Les jeux de données (si possible authentiques) issus de situations caractéristiques peuvent être ré-utilisés pour les confronter à une méthode, un indicateur, une représentation. Cela permet aux chercheurs de répliquer certaines analyses pour apprendre à déployer une méthode ou comprendre plus en profondeur la méthode ou les résultats publiés. Faire le travail de documentation de ces données en vue de les partager ne les rend pas seulement plus lisibles, mais aussi et surtout plus pérennes et partageables. Combien y a-t-il de jeux de données enfermés, cachés ou oubliés qu’aucun chercheur (y compris ceux qui en sont à la source) ne peut vraiment réutiliser ? Dans certains cas, on peut aussi croiser les données partagées avec d’autres pour les enrichir ou les comparer. Cela ouvre la voie à des investigations utilisant plusieurs jeux de données (dans différents contextes : culturels, géographiques, temporels, etc.). À la manière des benchmarks (en informatique), on peut aussi utiliser certains jeux de données de référence (jeux de données clairement caractérisés et accessibles à tous) pour comparer des algorithmes (efficacité, capacité à traiter des gros volumes de données, précision des résultats,…), des outils (indicateurs, tableaux de bord, feedback utilisateur, etc.) ou même des méthodes d’analyse (semi-automatiques) concurrentes pour vérifier la convergence des diagnostics ou la cohérence des résultats. Accéder à d’autres données, c’est se donner la possibilité d’élargir ou de consolider (ou au contraire de restreindre ou invalider) certaines hypothèses. Donner l’accès aux données de recherche facilite aussi l’apprentissage des jeunes chercheurs : lire les données produites par d’autres aide à construire soi-même un jeu de données plus partageable.


Quelles données de recherche pourrions-nous partager ?

Dans notre communauté, il existe de nombreux recueils de traces issues de l’utilisation des EIAH, que les chercheurs formalisent, analysent (fouille de données, analyses variées), transforment (fusion, filtrage, regroupement, etc.), ou convertissent (simples modifications de format) pour fabriquer de nouvelles traces, nécessaires pour élaborer des indicateurs ou des retours utiles aux acteurs de la situation. Suivant les projets, ces traces sont de nature bien différentes : interactions Homme-Machine (IHM) ou interactions humaines médiées (CMC), qui peuvent être combinées aux connaissance didactiques ou disciplinaires (ex : algèbre, géométrie, électricité) dans des EIAH célèbres de notre communauté (ex : Aplusix, Cabri-géomètre, TP-Elec) pour détecter des erreurs ou « miss conceptions », élaborer des profils ou suggérer des exercices de médiation. Dans certains cas, pour mieux saisir la complexité de la situation et interpréter les résultats, le contexte peut être enrichi par d’autres données : enquêtes, entretiens, enregistrements audio ou vidéo, etc.

Comment partager nos données de recherche ?

Les diverses disciplines qui forment notre communauté emploient des méthodes et outils différents pour analyser ce matériau de base que sont les données. Comment peut-on organiser ces échanges pour que les données soient visibles, accessibles, lisibles par les chercheurs et par les outils ? Faut-il les rendre publiques ? Dans quelles conditions et sous quelle forme ? Faut-il de nouveaux modèles, langages, infrastructures et interfaces pour les stocker et les manipuler ? En particulier, comment exploiter l’émergence de méta-modèles de traces d’interactions qui pourraient se décliner de manière explicite dans les différents types de traces sus-cités ? La notion de trace « modélisée » constitue-t-elle une opportunité à saisir pour faciliter la constitution, gestion et exploitation de dépôts de traces ?

Quelques initiatives arrivent à leur terme (Mulce, Calico) ou sont en cours de développement (Projet « Personnalisation des EIAH », Cluster ISLE Rhône-Alpes). Pourtant, le partage d’outils et le dépôt/partage de jeux de données restent exceptionnels. Ce type de diffusion peut-il être considéré comme une publication scientifique ?

Objectif de l’atelier

C’est pour faire le point sur ces questions que nous invitons nos collègues à soumettre/partager leur réflexions, leurs outils, leurs solutions, leurs avancées sur le partage des outils et données de recherche, mais aussi les freins et les difficultés techniques, institutionnelles, juridiques ou culturelles qu’il nous faut encore dépasser pour faire du partage une réalité dans la communauté EIAH.
Cet atelier pourrait être l’occasion de rassembler une première collection d’échantillons de données prototypiques, candidates au partage. Cette collection pourra ensuite servir de base de référence pour les activités de test (benchmark) d’outils ou de prototypes (d’analyse, de mesure, de visualisation, etc.) développés dans notre communauté pour tester leur capacité à prendre en charge les différents types de données.

Voir en ligne : Partager des données d’observation pour la recherche en EIAH : traces d’activité d’apprentissage (url à modifier)

Accès

Maison des Sciences de l'Homme
4, rue Ledru, 2ème étage - TSA 70402
63001 Clermont-Ferrand Cedex 1

Laboratoire de Recherche sur le Langage © 2024. Tous droits réservés.