Speech & Language Data Repository (SLDR)
Not a member yet
268 research outputs found
Sort by
RATP-DECODA
Ce corpus contient environ 2000 dialogues collectés dans le centre d'appel de la RATP, à Paris, dans le cadre du projet ANR DECODA (CONTINT 2009). Ces dialogues sont anonymisés, transcrits manuellement (Transcriber) et étiquetés syntaxiquement (POS, disfluences, entités nommées, analyse en dépendance). Cette ressource contient les fichiers sons et les diverses annotations effectuées
Ngbugu digital wordlist: Archival form
A recording of a 204-item wordlist of Ngbugu elicited in French. The original recording was on analogue cassette tape. The responses are transcribed in IPA (converted from the original Ngbugu orthographic transcription) and aligned to the recording. The wordlist instrument is based on Moñino's (1988) list. Ngbugu is an Ubangian language spoken by some 95,000 people in Central African Republic
apero nextgen
Reconstruction du corpus apero en manipulant le langage python pour en faire un fichier xml afin de mieux exploiter les données
Corpus oral, lecture, parole préparée, parole spontanée
Ce corpus audio est enregistré dans une classe de maternelle de 32 enfants par un enregistreur Zoom. l'enregistrement est constitué de deux parties, dans la première partie la maîtresse réalise la tâche de lecture d'une histoire et dans la deuxième elle raconte l'histoire sans support écrit. Les transcriptions sont faites sous Praat avec des fichiers Textgrid
Cyberbase Gradignan
Le corpus 'Cyberbase Gradignan' a été recueilli de juillet 2010 à juin 2012 dans le cadre de l'expérimentation Cyber-base®Justice mise en œuvre la Maison d'Arrêt de Gradignan et finalisée à l'accès à l'information, à l'apprentissage de l'informatique et à l'enseignement. Il est constitué d'enregistrements audiovisuels portant, d'une part, sur les activités dans l'espace informatique de la Maison d'Arrêt et, d'autre part, sur des entretiens avec les différents acteurs. L'ensemble du corpus a d'abord été segmenté et indexé (l'indexation, à la fois contextuelle et thématique, a été reportée dans les noms de fichiers). Une partie des séquences a ensuite été transcrite et annotée
Labial vibrants in Mangbetu: Archival form
A recording of lexical items in the Meegye variety of Mangbetu, elicited in French. The lexical items exemplify occurrences of bilabial trills and the labiodental flap in the language. The original recording was made in March 2004 on analog cassette tape. The responses are transcribed in orthography and IPA and aligned to the recording. The recording was digitized in March 2005. Mangbetu is a Central Sudanic language spoken by about 620,000 people in the Democratic Republic of the Congo
Impact de l'amorçage rythmique sur la production de la parole chez l'enfant sourd prélingual
Échantillons de corpus enregistrés lors d'une étude (soumise à publication) menée conjointement par l'Institut des Neurosciences des Systèmes et le CAMSP Déficiences Auditives de la Timone. 14 enfants sourds prélinguaux âgés de 5 à 13 ans ont été soumis à des répétitions de phrases sans (baseline), puis avec répétition d'un amorçage rythmique (expérience); cet amorçage étant congruent (match) ou non congruent (mismatch) avec la métrique de la phrase cible