Speech & Language Data Repository (SLDR)
Not a member yet
268 research outputs found
Sort by
Cyberbase Gradignan
Le corpus 'Cyberbase Gradignan' a été recueilli de juillet 2010 à juin 2012 dans le cadre de l'expérimentation Cyber-base® Justice mise en oeuvre la Maison d'Arrêt de Gradignan et finalisée à l'accès à l'information, à l'apprentissage de l'informatique et à l'enseignement. Il est constitué d'enregistrements audiovisuels portant, d'une part, sur les activités dans l'espace informatique de la Maison d'Arrêt et, d'autre part, sur des entretiens avec les différents acteurs
ORCHID.fr
A dataset composed of: (i) Primary resources extracted from the CID corpus (1h30 of Narrative Sequences), (ii) Annotation produced in the framework of ORCHID and OTIM projects.Un jeux de données composé de : (i) Des ressources primaires extraites du corpus CID (1h30 de séquences narratives), (ii) des annotations produites dans le cadre des projets OTIM et ORCHID
Description de vignettes type Bandes dessinées
Description de vignettes de bandes dessinéesIl s'agit initialement d'un corpus d'enregistrements de 20 sujets répartis en deux groupes. Dans le cadre d'une étude portant sur l'évaluation de la théorie de l'esprit (e.g. attribution d'états mentaux tels que croyances, connaissances aux autres) en situation de discours chez des patients atteints de schizophrénie (Tosello, 2011). Les données ici présentes sont extraites des données du groupe contrôle apparié en âge et en niveau d'éducation au groupe de patients. La consigne était de raconter l'histoire à l'expérimentateur. Les transcriptions sont faites sous Praat en utilisant la TOE et enregistrées dans des fichiers Textgrid. Ces transcriptions sont ensuite traitées automatiquement pour être annotées à différents niveaux puis transformées en un document XML avec fichier style associé.Reference : Tosello, A.L. (2011). Evaluation de l'attribution d'états mentaux, en situation de discours, dans la schizophrénie. Mémoire Master 2 de Psychologie et neuropsychologie des perturbations cognitives. Université d'Aix-Marseille
Arabic Treebank : Part 2 v 3.1
Arabic Treebank: Part 2 (ATB2) v 3.1 , Linguistic Data Consortium (LDC) catalog number LDC2011T09 and isbn 1-58563-590-1, was developed at LDC. It consists of 501 newswire stories from Ummah Press with part-of-speech (POS), morphology, gloss and syntactic treebank annotation in accordance with the Penn Arabic Treebank (PATB) Guidelines developed in 2008 and 2009
Français parlé par une personne lusophone
Ce corpus de français parlé est traité d'une part dans le cadre d'une description syntaxique et d'autre part dans le cadre d'une approche sociolinguistique
Entretiens avec Julien Gaillard
Entretiens avec Julien Gaillard, locuteur du patois de Valjouffrey, en vue d'explicitation de vocabulaire, syntaxe et prononciation
Toponymes de Valjouffrey
Dessins des montagnes visibles de la vallée de Valjouffrey et annotation des toponymes selon leur appelation ancienne