Speech & Language Data Repository (SLDR)
Not a member yet
268 research outputs found
Sort by
CrowdED_bilingual
Crowdsourced corpus of German/English bilingual speakers answering business-topic questions of the type found in language learning oral exams, in both German and English. Contains soundfiles and annotated transcriptions. Reported in special session on 'Advanced Crowdsourcing for Speech and Beyond' at the INTERSPEECH Conference 2015. Funded by Crowdee and CrowdFlower
Loup garou - annotations
Annotations of interactions betweeen players of the 'Werewolf' game. Students of the LEX Master course (SCLQ41) on 7 October 2014.Annotations des interactions entre joueurs du « Loup garou ». Étudiants en master LEX, cours corpus 1 (SCLQ41) le 7 octobre 2014
La compétence pragmatique en négociation (Français Langue Etrangère par des Singapouriens, niveaux A2 et B1)
Two role plays have been proposed to the speakers, both in formal and casual contexts.Deux jeux de rôles ont été proposés aux étudiants : un premier visant une négociation en milieu institutionnel et un deuxième en milieu familial
Oursel/Ateliers socio-linguistiques
Practical courses in French as a foreign language. A dozen participants, non native French speakers and a non professional teacher.Ateliers socio-linguistiques. Une dizaine de participants, francophones non natifs, et un enseignant bénévole
Français parlé dans le nord du Gabon
Français parlé par des Gabonais du nord du pays, des locuteurs âgés peu ou pas scolarisés et de jeunes adultes moyennement scolarisés
Corpus ANCOR Centre
ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licenceANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution.MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland.http://hal.archives-ouvertes.fr/hal-01075679Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562].http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdfhttps://hal.archives-ouvertes.fr/hal-0101656
Script praat pour recueil infos acoustiques
Script à utiliser à partir d'un TextGrid (en particulier généré sous SPPAS). Permet de récupérer les infos suivantes pour chaque partie segmentée : étiquette, durée, F0, F1, F2, F3, F4, et pour chacune la std et la bandw. Les mesures de formants sont calculées à partir de la médiane des valeurs recueillies toutes les 10 ms sur la partie segmentée. Ce script a été modifié pour récupérer un ensemble d'informations clé dans un TextGrid généré sous SPPAS (par exemple : le mot et la syllabe contenant le phonème cible ou encore la structure de la cible sonore
Read speech in Italian L1
Env. 50 locuteurs de langue maternelle italienne. Enregistrements de trois types de lecture : phrases de type 'bene, Iris e Ugo, mangiamo una bella pesca'; texte de “Il Vento di tramontana e il sole“; phrases sans signification : 'V, hai detto V, V come in CV'.Circa 50 locutori italiano lingua materna. Registrazioni di tre tipi di lettura : frasi di tipo 'bene, Iris e Ugo, mangiamo una bella pesca'; testo di “Il Vento di tramontana e il sole“; frasi senza senso : 'V, hai detto V, V come in CV'
Oursel/Préfecture
Administrative conversations between agents of the prefecture (bureau of visas) and foreign users.Interactions administratives entre des agents de la préfecture (bureau de remise des visas) et des usagers étrangers