LRL - Diffusion

Format de présentation

S’adressant à des praticiens chercheurs essentiellement issus de la communauté CALL, mais aussi EIAH au sens large, les intervenants de l’atelier "Dissemination and comparison of research findings : developing Learning and Teaching Corpora (LETEC)" mettront en exergue les aspects applicatifs de leur recherche en préparant un extrait de leur corpus d’interactions (langues ou de situation d’apprentissage en ligne d’autres disciplines) au format de leur logiciel d’analyse et en donnant la possibilité au public de l’atelier de s’entrainer à l’utilisation de leur démonstration, après celui-ci. Pour ce faire, les intervenants renseigneront un court questionnaire comportant le contexte pédagogique de leur corpus, une brève description de l’extrait de corpus choisi pour démonstration et le format utilisable dans l’outil, une brève description de l’outil téléchargeable, lien et codes d’accès, ainsi que les questions de recherche associées. Ces informations seront ensuite publiées dans les actes de l’atelier.

Programme

Matinée

9h30- 10h00 : Présentation de la journée et de ses deux perspectives CSCL et CALL
10h00-10h30 : Analyser différents types de données d’interaction avec SAMSA, un outil pour l’analyse des réseaux sociaux (A. Martinez-Mones, Université de Valladolid).
10h30-11h00 : Les apports de la structuration des corpus d’apprentissage à la compréhension des apprentissages et des interactions en ligne (C. Reffay, ENS Cachan)
Pause
11h15-11h45 : Echange de corpus et intéropérabilité des traces : le projet Calico (E. Bruillard, ENS Cachan et Alain Mille, Université Lyon1)
11h45-12h15 : Tatiana : un logiciel pour l’analyse des interactions humaines médiatisées par ordinateur (K. Lund, Université Lyon2)
12h15-12h30 : Bilan de la matinée : Structuration, instrumentation, collaboration, mutualisation en CSCL.
Pause déjeuner

Après-midi

14h00-14h15 : Présentation de la perspective CALL
14h15- 14h45 : Quelle(s) recherche(s) sur corpus en CALL : méthodologie(s), enjeux et perspectives (M-N Lamy, Open University)
14h45-15h15 : Conception et développement du corpus pédagogique Backbone : une approche autonomisante (K. Kohn, Université de Tübingen).
Pause
15h45-16h15 : Spécificité de la recherche sur corpus d’apprentissage contextualisés : outils et interface d’interrogation de données hétérogènes (équipe Mulce)
16h15-16h45 : Adapter les outils du elearning aux besoins des apprenants : la contribution des Learner corpora (S. Granger, Université Catholique de Louvain)
16h45-17h45 : Table ronde autour des potentialités de la recherche sur corpus (E. Bruillard (ENS Cachan), T. Chanier (Université de Clermont-Ferrand), M-N. Lamy (Open University, GB), R. O’Dowd (Université de León, ES), et C. Tschichold (University of Wales, Swansea), et A. Boulton (Université Nancy 2)).
17h45 : fin de la journée

Publication envisagée à l’issue de l’atelier

Une publication, sous la direction de Marie-Laure Betbeder et de Maud Ciekanski, rassemblera un article libre de droits de la part de chaque intervenant (soit 9 articles) et une synthèse des échanges ayant eu lieu durant la journée. Les articles seront suivis des indications nécessaires pour la consultation des corpus et des outils téléchargeables présentés. La publication fera l’objet d’un dépôt dans Archive Edutice.

Objectifs scientifiques

Cet atelier fait suite au Symposium "Corpus d’apprentissage en ligne : conception, réutilisation, échange" organisé par l’équipe MULCE (MUltimodal contextualized Learner Corpus Exchange) lors du colloque EPAL07 (France), invitant des chercheurs d’horizons divers à ausculter les types de données recueillies lors de formations en ligne, les outils et méthodes de traitement et d’analyse en vue de construire des corpus échangeables pour qu’ils puissent être traités par chacun.

L’objectif de cet atelier est de rassembler chercheurs et praticiens-chercheurs impliqués ou souhaitant s’impliquer dans la constitution de corpus à partir de données issues de formations en ligne autour de la méthodologie de recherche sur corpus dans les domaines des EIAH (Environnements Informatiques pour l’Apprentissage Humain) et des CALL et de ses potentialités tant en recherche qu’en formation.

A l’heure où il est technologiquement de plus en plus aisé de sauvegarder les traces des interactions d’apprentissage en ligne apparaît un intérêt grandissant dans la communauté pour la constitution d’ensembles de données à partir desquels réfléchir les pratiques d’apprentissage. Or, ces ensembles de données ne sont souvent pas conçus comme des corpus, ce qui rend difficile toute comparaison et analyse multiple. La constitution d’un corpus demande de rassembler des données de façon systématique autour d’une convergence thématique et représentant une couverture significative du thème concerné, puis de les organiser, les renseigner, les structurer selon des standards partagés (XML, TEI, etc.), et de les rendre accessibles (donc récupérables en ligne) pour interrogation (par des outils de recherche) ou annotation. La nature hétérogène et complexe des données suggère de synchroniser et de relier de nombreux fragments de données (traces d’accès, d’interactions, productions, tests, entretiens, etc.) pour qu’ils puissent faire sens dans une analyse des interactions a posteriori.

Organisée sous la forme d’une mise en regard des deux communautés EIAH et CALL, la matinée sera plus spécifiquement dédiée à la question de la recherche sur corpus et à leur structuration dans la communauté CSCL, notamment autour des questions de spécification, d’instrumentation, d’implémentation et d’intéropérabilité permettant des analyses multiples. Les intervenants montreront des exemples d’environnements et d’outils destinés, entre autre, à aider les chercheurs à gérer, synchroniser, visualiser et analyser leurs données afin de créer de nouvelles représentations facilitant la compréhension de la collaboration instrumentée. Ces exemples feront donc une part importante à la communication en ligne, quelque soit le domaine d’application. L’après-midi rassemblera des chercheurs travaillant à la constitution de corpus dans le domaine de la linguistique ou de l’apprentissage des langues, champ d’application qui pose de nouveaux défis notamment par l’intérêt porté au synchrone et à la multimodalité. Les différentes interventions permettront de balayer la variété des domaines d’applications dans lesquels la notion de corpus est devenue un incontournable pour la recherche (les corpus d’interactions en apprentissage des langues en ligne, les corpus d’apprenants, les corpus oraux).

Un dialogue fécond entre les méthodologies choisies, les outils d’analyse et les applications dans le domaine, entre autre, de l’apprentissage des langues permettra de mettre en exergue à la fois les enjeux et les potentialités de la recherche sur corpus dans nos domaines. Les intervenants illustreront leurs propos à partir d’une démonstration d’un logiciel d’analyse sur un extrait de corpus. Une partie de la discussion se centrera sur les questions d’éthique et de droits portant sur les données concernant des individus. L’atelier sera conduit en anglais sur des exemples issus de différentes langues. Les outils et les interfaces utilisées sont en anglais et en français.

Contacts : Maud CIEKANSKI (maud.ciekanski at univ-paris8.fr , Marie-Laure BETBEDER (Marie-Laure.Betbeder at univ-fcomte.fr)

Accès

Maison des Sciences de l'Homme
4, rue Ledru, 2ème étage - TSA 70402
63001 Clermont-Ferrand Cedex 1

Mentions légales