Speech & Language Data Repository (SLDR)
Not a member yet
268 research outputs found
Sort by
Oursel/Service des relations internationales
Meetings between foreign students at the end of their sojourn in France and the secretary of the service of international relations in a university. Administrative questions.Rencontres entre des étudiants étrangers en fin de séjour et la secrétaire du service des relations internationales d'une université. Questions administratives
Données brutes du projet CATSEM (MEG)
Study of the intellectual correlates of oral and written language in magnetoencephalography.The objective is to study the intellectual mechanisms which underlie the perception(collection) of word and the reading by means of the technique of magnetoencephalography (MEG). The purpose is to specify the role and the properties of activation of the various intellectual structures implied (involved) in the treatment (processing) of the language and to compare the dynamics of activation of the intellectual networks according to the sensory modality (method) of presentation (display) of the language (oral vs. written). A particular interest is concerned the interactions between oral and written language.Etude des corrélats cérébraux du langage oral et écrit en magnétoencéphalographieL'objectif est d'étudier les mécanismes cérébraux qui sous-tendent la perception de parole et la lecture à l'aide de la technique de magnétoencéphalographie (MEG). Le but est de spécifier le rôle et les propriétés d'activation des différentes structures cérébrales impliquées dans le traitement du langage et de comparer la dynamique d'activation des réseaux cérébraux selon la modalité sensorielle de présentation du langage (oral vs. écrit). Un intérêt particulier est porté sur les interactions entre langage oral et écrit.<br /
Projet ADys (MEG)
Traitement morphologique, orthographique et sémantique dans la lecture des étudiants dyslexiques mis en évidence avec la MEGMorphological, orthographic and semantic processing in reading of dyslexic university students revealed by MEG<br /
Corpus-e/ɛ
Ce corpus se compose d'un enregistrement de quatre listes de mots contenant /e/ et /ɛ/ dans des positions différentes, produites par des locuteurs méridionaux. Le but de ce corpus est de montrer la difficulté de discrimination de contraste /e/-/ɛ/ en situation de production par des sujets méridionaux
Transcriptions du corpus CID
8 French dialogues involving 2 participants, with the following data:+ a wav file for each speaker+ the inter-pausals units (IPU) annotation aligned with audio signal+ enriched orthographic transcription (TOE) aligned with audio signal+ phones aligned with audio signal+ syllables aligned with audio signal+ tokens aligned with audio signal+ syntax aligned with the signal at the level of tokens8 diálogos francés participación de dos participantes, con los siguientes datos:* Un wav archivo para cada altavoz* Las unidades entre pausals (UIP) de anotación alineada con la señal audio* Transcripción ortográfica enriquecida (TOE) alineada con la señal audio* Fonemas alineada con la señal audio* Sílabas alineada con la señal audio* Tokens alineada con la señal audio* Sintaxis alineada con la señal en el token8 dilogues avec les données suivantes : + fichiers sons des micro-casques : un fichier par locuteur+ annotation des unités inter-pausales (IPU)+ transcription orthographique enrichie (TOE) des IPU, alignée avec le signal audio+ transcription phonétique alignée avec le signal audio+ syllabes alignées avec le signal audio+ tokens alignés avec le signal+ syntaxe alignée sur le signal au niveau du tokenBLACHE, P.; BERTRAND, R.; BIGI, B. et al. (2010). Multimodal annotation of conversational data. Proceedings of the Fourth Linguistic Annotation Workshop.http://portal.acm.org/citation.cfm?id=186874
MARC-Fr
Corpus français manuellement phonétisé et aligné d'une durée de 7 minutes. Composé de 3 sous-corpus : CID, AixOx et Grenelle
Oursel/Ecrivain public
Meetings between users and a public writer. Non native French speaking users, native speaking French public writer. Miscelaneous administrative problems.Rencontres entre des usagers et une écrivain public. Usagers francophones non natifs. Ecrivain public francophone native. Problèmes administratifs divers
Berlin
Corpus pseudo-longitudinal de récits oraux d'une séquence filmique muette. Les récits sont produits en français L2 par des adolescents berlinois, en situation de face à face avec un locuteur dont le français est la L1. Une fiche de vocabulaire est à disposition des narrateurs.Le film vu est un extrait de Modern Times de Charlie Chaplin, plus précisément la version expérimentale conçue par l'équipe de Heidelberg pour l'étude de l'acquisition de l'allemand L2 par des adultes migrants turcophones et italophones (Projet ESF, Perdue 1993).Les narrateurs sont des adolescents scolarisés en allemand dans un établissement berlinois. Ils ont un bagage langagier commun qui contient l'allemand langue de scolarisation, et l'anglais et le français langues étrangères apprises en classe. Certains connaissent aussi d'autres langues apprises dans leur famille ou dans des pays dans lesquels ils ont séjourné et/ou ont été scolarisés antérieurement.Les récits oraux se répartissent selon 4 niveaux institutionnels correspondant aux 1ère, 2e, 3e et 4e année d'apprentissage du français
Corpus audio de teko (émérillon)
Collection of recordings of the Teko (Emerillon) language, a Tupi-Guarani language spoken in French Guiana. Recordings are linked to a transcription, French translation, morphological parsing with parts of speech information (data exported from Toolbox).Collection d'enregistrements de la langue teko (émérillon), une langue tupi-guarani parlée en Guyane française. Les enregistrements sont accompagnées d'une transcription, d'une traduction en français, d'une segmentation morphologique et d'indication sur les parties du discours (données exportées du logiciel Toolbox)