
Corpus de communication médiée par les réseaux
CoMeRe a pour objectif, à l’horizon 2014 ,de créer un noyau de corpus de communication médiée par les réseaux (Computer Mediated Communication – CMC) en français. Chaque corpus rassemblera un ensemble de conversations intervenant sur la Toile et les réseaux. Nous nous intéressons à une variété de systèmes de communication synchrone ou asynchrone, mono ou multimodaux (éventuellement) : blogues, tweets, SMS / textos, courriels , clavardage, forums, etc.
Les corpus et leurs métadonnées seront structurés suivant des formats standard : TEI (Text Encoding Initiative), CLARIN, OLAC. La banque de corpus sera diffusée en accès libre en 2014 sur le site Ortolang. L’assemblage des corpus se fera sur les serveurs de la MSH (Maison des Sciences de l’Homme) de Clermont-Ferrand et du Laboratoire de Recherche sur le Langage (LRL). Le travail s’effectue avec partenariat européen sur la TEI (groupe d’annotation TEI-CMC) avec relation avec l’infrastructure DARIAH. Ce noyau de corpus sera intégré au futur « Corpus de référence du français »
Une première version de cette banque de corpus est disponible sur Ortolang à l'adresse suivante :
http://hdl.handle.net/11403/comere
(l’identifiant 11403 correspondant à ORTOLANG)
Les membres du projet CoMeRe appartiennent au groupe de travail "Nouvelles formes de communication" du consortium Corpus-écrits. Le projet a reçu l’appui de Corpus-écrits et de Ortolang.
Crédits
Université Blaise Pascal, Clermont : Thierry Chanier, Paul Lotin ;
Université de Nice : Céline Poudat ;
Ortolang : Kun Jin ;
Consortium Corpus-écrits : Linda Hriba ;
Université Cergy-Pontoise : Julien Longhi ;
Université Rennes 2 : Gudrun Ledegen ;
Université Stendhal, Grenoble : Georges Antoniadis ;
Université Paris 7 / Inria : Benoit Sagot ;
Université Lyon 2 : Ciara Wigham ;
CNAM, Paris : Camille Paloques-Berges ;
Université Paris 3 : Georgeta Cislaru.
