Cette page permet d'accéder aux différents corpus ALIPE composés d’enregistrements sonores, transcriptions structurées mettant en relief les phénomènes de liaison, métadonnées.

Deux types de corpus sont accessibles :

  • les corpus distinguables,
  • les corpus globaux.

Un corpus distinguable dans ALIPE correspond à une session d’enregistrement d’interactions orales enfant-parent(s) n’excédant pas une heure. Il est possible de trouver pour le même enfant plusieurs sessions d’enregistrements réalisées dans une même journée.

Un corpus global dans ALIPE correspond à l’ensemble des corpus distinguables associés à un enfant.

 

Formats des fichiers disponibles 

Les corpus ALIPE sont disponibles dans deux formats de structuration : le format XML-TEI et le format CHAT (Codes for the Human Analysis of Transcripts) permettant l’analyse de corpus via le programme CLAN (Computerized Language ANalysis). Pour plus d’informations sur ces formats de structuration, voir l’onglet « Documentation ».
Les fichiers permettant la lecture en flux continu (« streaming ») des fichiers sonores anonymisés sont également disponibles en téléchargement.

 

Recherche des corpus

La base de corpus Alipe contient actuellement 12h 50mn de dialogue et 90 616 mots.
Les fichiers de ce corpus sont maintenant disponibles et de manière pérenne sur l'équipement d'excellence Ortolang.
Ils sont accessibles via ce permalien : http://hdl.handle.net/11041/alipe-000853

Accès

Maison des Sciences de l'Homme
4, rue Ledru, 2ème étage - TSA 70402
63001 Clermont-Ferrand Cedex 1

Laboratoire de Recherche sur le Langage © 2024. Tous droits réservés.