Speech & Language Data Repository (SLDR)
Not a member yet
    268 research outputs found

    CrowdED_english

    No full text
    Crowdsourced corpus of English native speakers answering business-topic questions of the type found in language learning oral exams. Contains soundfiles and annotated transcriptions. Reported in special session on 'Advanced Crowdsourcing for Speech and Beyond' at the INTERSPEECH Conference 2015. Funded by Crowdee and CrowdFlower

    CREAGEST

    Full text link
    CREAGEST rassemble des discours de Langue des signes française (LSF). Il comprend deux corpus :1) “CREAGEST - Acquisition“ est un corpus de LSF enfantine recueilli auprès de 65 enfants sourds (bilingues LSF-Français) et 17 adultes sourds (50 heures), piloté par quatre enquêtrices sourdes de quatre régions de France différentes (4 stimuli, 2 caméras);2) “CREAGEST - Dialogue entre adultes sourds“ est un corpus de dialogues entre adultes sourds (106 heures) : 51 entretiens, animés par quatre enquêteurs sourds de quatre régions de France différentes (entretiens semi-directifs, 3 caméras).Garcia, B., L'Huillier, M.-T. et Sallandre, M.-A. (2013).”CREAGEST : enjeux linguistiques, patrimoniaux et socio-éducatifs d'un grand corpus de langue des signes française”, La nouvelle revue de l'adaptation et de la scolarisation n° 64, numéro coordonné par A. Benvenuto et D. Séguillon, éditions de l'INS HEA, 81-91.Balvet, A., Courtin, C., Boutet, D., Cuxac, C., Fusellier-Souza, I., Garcia, B., L'Huillier, M-T. et Sallandre, M.-A., (2010). ”The Creagest Project: a Digitized and Annotated Corpus for French Sign Language (LSF) and Natural Gestural Languages”, Proceedings of the International Language Resources and Evaluation Conference (LREC'2010), Malte, May 19-21, 2010. 469-47

    Projet anti-tabac (IRMf)

    No full text
    oai:sldr.org:blri-000943Effet des avertissements sanitaires combinés anti-tabac sur l'activité cérébrale évoquée par des stimuli liés au tabac ou « smoking cue reactivity »

    GypsyLang (transcriptions)

    No full text
    Transcriptions du corpus “GypsyLang

    ACORFORMed

    No full text
    Corpus de formation des médecins à l'annonce d'événements indésirables graves.Deux sources du corpus : l'Institut Paoli-Calmettes de Marseille et le CHU d'Angers

    CoFee

    No full text
    4 corpora used as primary dataset for the ANR JCJC “Conversational Feedback“. Some of the corpora were pre-existing while some other have been created within this project. In addition to Primary data, annotations (ELAN files) and resulting datasets (CSV files) related to conversational feedback are alao included

    CREAGEST - Dialogue entre adultes sourds

    No full text
    Il s'agit d'un corpus de dialogues entre adultes sourds (106 heures) : 51 entretiens, animés par quatre enquêteurs sourds de quatre régions de France différentes (entretiens semi-directifs, 3 caméras).Les vidéos mises à disposition ici constituent une sous-partie du corpus global : 7 extraits filmés avec trois caméras (soit 21 fichiers)

    Lexical functions of Spanish verb-noun collocations

    No full text
    The resource include first most frequent 1000 verb-noun pairs extracted automatically from the Spanish Web Corpus (located at http://www.sketchengine.co.uk). Each pair is classified as a free word combination (FWC), a collocation, or an error (of parsing). In FWCs and collocations, verbs and nouns are annotated with the Spanish WordNet senses. Each collocation is annotated with its lexical function. Lexical function is a concept within the Meaning-Text Theory of I. Melchuk

    SITAF (tandems anglais/français)

    No full text
    Video-recorded corpus of tandem interactions between French-speaking students and English-speaking students at the University Sorbonne Nouvelle- Paris 3. Each of the 21 tandem pairs performs the collaborative speaking tasks (story-telling, debating, reading) on 2 occasions (2 recording sessions) 3 months apart. The corpus also comprises L1-L1 control interactions for the participants.Metada is also available (the participants' linguistic profiles at the start of the tandem project, questionnaires about the tandem experience after the experiment).Corpus vidéo d'interactions tandem entre des étudiant-e-s francophones étudiant-e-s anglophones à l'Université Sorbonne Nouvelle- Paris 3. Chacune des 21 paires tandem réalise les tâches de production orale collaborative (narration, argumentation, lecture) à deux occasions (sessions d'enregistrements) espacées de 3 mois. Le corpus comprend aussi des interactions contrôle L1-L1 pour les participant-es.Des métadonnées sont aussi disponibles (profil linguistique des participant-e-s au départ du projet tandem, questionnaire sur l'expérience tandem post enregistrement).Horgues, C. & Scheuer, S. (in press). Why some things are better done in tandem? In: J. A. Mompeán & J. Fouz-González (Eds.), Investigating English Pronunciation: Current Trends and Directions. Basingstoke and New York: Palgrave Macmillan

    Corpus St-Maur (corpus)

    No full text
    Le “Corpus Saint-Maur“ a été recueilli de Mai 2008 à juin 2009 dans le cadre du travail doctoral « Interactions et pratiques d'un processus d'innovation pédagogique en environnement carcéral » (Alidières 2013).Il est constitué d'enregistrements audiovisuels portant, d'une part, sur les activités dans l'espace informatique de la Maison d'Arrêt et, d'autre part, sur des réunions avec l'équipe pédagogique et des entretiens avec les différents acteurs

    24

    full texts

    268

    metadata records
    Updated in last 30 days.
    Speech & Language Data Repository (SLDR)
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇