Speech & Language Data Repository (SLDR)
Not a member yet
    268 research outputs found

    CrowdED_bilingual

    No full text
    Crowdsourced corpus of German/English bilingual speakers answering business-topic questions of the type found in language learning oral exams, in both German and English. Contains soundfiles and annotated transcriptions. Reported in special session on 'Advanced Crowdsourcing for Speech and Beyond' at the INTERSPEECH Conference 2015. Funded by Crowdee and CrowdFlower

    GypsyLang (corpus)

    No full text
    Données primaires du corpus “GypsyLang

    Loup garou - annotations

    No full text
    Annotations of interactions betweeen players of the 'Werewolf' game. Students of the LEX Master course (SCLQ41) on 7 October 2014.Annotations des interactions entre joueurs du « Loup garou ». Étudiants en master LEX, cours corpus 1 (SCLQ41) le 7 octobre 2014

    La compétence pragmatique en négociation (Français Langue Etrangère par des Singapouriens, niveaux A2 et B1)

    No full text
    Two role plays have been proposed to the speakers, both in formal and casual contexts.Deux jeux de rôles ont été proposés aux étudiants : un premier visant une négociation en milieu institutionnel et un deuxième en milieu familial

    Oursel/Ateliers socio-linguistiques

    No full text
    Practical courses in French as a foreign language. A dozen participants, non native French speakers and a non professional teacher.Ateliers socio-linguistiques. Une dizaine de participants, francophones non natifs, et un enseignant bénévole

    Français parlé dans le nord du Gabon

    No full text
    Français parlé par des Gabonais du nord du pays, des locuteurs âgés peu ou pas scolarisés et de jeunes adultes moyennement scolarisés

    Corpus ANCOR Centre

    Full text link
    ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licenceANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution.MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland.http://hal.archives-ouvertes.fr/hal-01075679Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562].http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdfhttps://hal.archives-ouvertes.fr/hal-0101656

    Script praat pour recueil infos acoustiques

    No full text
    Script à utiliser à partir d'un TextGrid (en particulier généré sous SPPAS). Permet de récupérer les infos suivantes pour chaque partie segmentée : étiquette, durée, F0, F1, F2, F3, F4, et pour chacune la std et la bandw. Les mesures de formants sont calculées à partir de la médiane des valeurs recueillies toutes les 10 ms sur la partie segmentée. Ce script a été modifié pour récupérer un ensemble d'informations clé dans un TextGrid généré sous SPPAS (par exemple : le mot et la syllabe contenant le phonème cible ou encore la structure de la cible sonore

    Read speech in Italian L1

    No full text
    Env. 50 locuteurs de langue maternelle italienne. Enregistrements de trois types de lecture : phrases de type 'bene, Iris e Ugo, mangiamo una bella pesca'; texte de “Il Vento di tramontana e il sole“; phrases sans signification : 'V, hai detto V, V come in CV'.Circa 50 locutori italiano lingua materna. Registrazioni di tre tipi di lettura : frasi di tipo 'bene, Iris e Ugo, mangiamo una bella pesca'; testo di “Il Vento di tramontana e il sole“; frasi senza senso : 'V, hai detto V, V come in CV'

    Oursel/Préfecture

    No full text
    Administrative conversations between agents of the prefecture (bureau of visas) and foreign users.Interactions administratives entre des agents de la préfecture (bureau de remise des visas) et des usagers étrangers

    24

    full texts

    268

    metadata records
    Updated in last 30 days.
    Speech & Language Data Repository (SLDR)
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇