Speech & Language Data Repository (SLDR)
Not a member yet
    268 research outputs found

    OpenProDat - Italian

    No full text
    A corpus of read texts in Italia

    RATP-DECODA

    No full text
    Ce corpus contient environ 2000 dialogues collectés dans le centre d'appel de la RATP, à Paris, dans le cadre du projet ANR DECODA (CONTINT 2009). Ces dialogues sont anonymisés, transcrits manuellement (Transcriber) et étiquetés syntaxiquement (POS, disfluences, entités nommées, analyse en dépendance). Cette ressource contient les fichiers sons et les diverses annotations effectuées

    Ngbugu digital wordlist: Archival form

    No full text
    A recording of a 204-item wordlist of Ngbugu elicited in French. The original recording was on analogue cassette tape. The responses are transcribed in IPA (converted from the original Ngbugu orthographic transcription) and aligned to the recording. The wordlist instrument is based on Moñino's (1988) list. Ngbugu is an Ubangian language spoken by some 95,000 people in Central African Republic

    OpenProDat - French

    No full text
    A corpus of read texts in Frenc

    apero nextgen

    No full text
    Reconstruction du corpus apero en manipulant le langage python pour en faire un fichier xml afin de mieux exploiter les données

    Corpus oral, lecture, parole préparée, parole spontanée

    No full text
    Ce corpus audio est enregistré dans une classe de maternelle de 32 enfants par un enregistreur Zoom. l'enregistrement est constitué de deux parties, dans la première partie la maîtresse réalise la tâche de lecture d'une histoire et dans la deuxième elle raconte l'histoire sans support écrit. Les transcriptions sont faites sous Praat avec des fichiers Textgrid

    Cyberbase Gradignan

    No full text
    Le corpus 'Cyberbase Gradignan' a été recueilli de juillet 2010 à juin 2012 dans le cadre de l'expérimentation Cyber-base®Justice mise en œuvre la Maison d'Arrêt de Gradignan et finalisée à l'accès à l'information, à l'apprentissage de l'informatique et à l'enseignement. Il est constitué d'enregistrements audiovisuels portant, d'une part, sur les activités dans l'espace informatique de la Maison d'Arrêt et, d'autre part, sur des entretiens avec les différents acteurs. L'ensemble du corpus a d'abord été segmenté et indexé (l'indexation, à la fois contextuelle et thématique, a été reportée dans les noms de fichiers). Une partie des séquences a ensuite été transcrite et annotée

    OpenProDat - Thai

    No full text
    A corpus of read texts in Tha

    Labial vibrants in Mangbetu: Archival form

    No full text
    A recording of lexical items in the Meegye variety of Mangbetu, elicited in French. The lexical items exemplify occurrences of bilabial trills and the labiodental flap in the language. The original recording was made in March 2004 on analog cassette tape. The responses are transcribed in orthography and IPA and aligned to the recording. The recording was digitized in March 2005. Mangbetu is a Central Sudanic language spoken by about 620,000 people in the Democratic Republic of the Congo

    Impact de l'amorçage rythmique sur la production de la parole chez l'enfant sourd prélingual

    No full text
    Échantillons de corpus enregistrés lors d'une étude (soumise à publication) menée conjointement par l'Institut des Neurosciences des Systèmes et le CAMSP Déficiences Auditives de la Timone. 14 enfants sourds prélinguaux âgés de 5 à 13 ans ont été soumis à des répétitions de phrases sans (baseline), puis avec répétition d'un amorçage rythmique (expérience); cet amorçage étant congruent (match) ou non congruent (mismatch) avec la métrique de la phrase cible

    24

    full texts

    268

    metadata records
    Updated in last 30 days.
    Speech & Language Data Repository (SLDR)
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇