Speech & Language Data Repository (SLDR)
Not a member yet
    268 research outputs found

    Corpus St-Maur

    No full text
    Le “Corpus Saint-Maur“ a été recueilli de Mai 2008 à juin 2009 dans le cadre du travail doctoral « Interactions et pratiques d'un processus d'innovation pédagogique en environnement carcéral » (Alidières 2013).Il est constitué d'enregistrements audiovisuels portant, d'une part, sur les activités dans l'espace informatique de la Maison d'Arrêt et, d'autre part, sur des réunions avec l'équipe pédagogique et des entretiens avec les différents acteurs

    MarsaTag

    No full text
    Tools for textual data enrichment (written text and speech transcription) : tokenizer, morphosyntactic & POS tagger, ...Plataforma para enriquecer datos textuales (texto escrito y transcripción del habla) : tokenizer, etiquetado morfo-sintáctico, POS tagger, ...Plateforme d'enrichissement de données textuelles (texte écrit et transcription de l'oral) : tokenizer, étiquetage morphosyntaxique, POS tagger, ...RAUZY, Stéphane; BLACHE, Philippe (2009). Un point sur les outils du LPL pour l'analyse syntaxique du français. Actes, Journée ATALA Quels analyseurs syntaxiques pour le français ? (2009 octobre 10 : Paris, FRANCE). 2009, p. 1-6http://hal.archives-ouvertes.fr/hal-00433879BLACHE, Philippe; RAUZY, Stéphane (2011). Robustesse et analyse syntaxique. In P. Bellot (ed.) Recherche d'information contextuelle, assistée et personnalisée. Paris: Hermès Sciences. 2011, p. 57-72.RAUZY, Stéphane; MONTCHEUIL Grégoire; BLACHE, Philippe (2014). MarsaTag, a tagger for French written texts and speech transcriptions. Second Asia Pacific Corpus Linguistics Conference (2014 March 7-9 : Hong Kong). 2014

    GypsyLang

    No full text
    Le présent corpus « Paroles de locuteurs gitans et non gitans sur trois générations à Perpignan » a été recueilli entre septembre 2013 et juin 2014. Il est issu d'une recherche financée par un fonds social européen (FSE) en partenariat avec l'Education Nationale, la Direction de l'Action Éducative et de l'Enfance de la Ville de Perpignan, afin de mieux comprendre les mécanismes d'apprentissage scolaire dans le contexte de plurilinguisme et d'oralité multiséculaire de la population gitane des quartiers Saint-Jacques et Nouveau-Logis de Perpignan.S'attarder plus précisément sur la langue gitane parlée par les familles, la définir linguistiquement pour mieux la connaître, permet de sortir des fantasmes et pouvoir mieux la mettre en perspective avec le français pour en développer, de façon plus efficace, son apprentissage.Notre objectif a donc été d'analyser les types de variations spécifiques au catalan de la population gitane de Perpignan.Tout d'abord, il y a une première forme de variation, qui est déjà en soi une forme de minoration, qui est que le catalan de la population est du roussillonnais et non le catalan central et valorisé de Barcelone. Ce catalan est peu écrit, peu graphié, mis à part quelques écrits d'information. Ensuite, la seconde minoration du parler de la population provient de l'insertion de lexique calo. Mais finalement, il semble que la prosodie (plus communément l'accent, même si ce terme recouvre une réalité plus complexe) joue un grand rôle dans l'identification du parler gitan/ non gitan de la Catalogne roussillonnaise. Il existe 21 dialectes du catalan dont le roussillonnais qui a la particularité d'être issu de l'occitan et du français.Pour mesurer les spécificités entre le catalan roussillonnais de la population gitane de Perpignan et celui des non-gitans nous avons mis en œuvre une étude expérimentale en enregistrant des locuteurs de trois générations racontant une histoire à partir d'un même support (une planche de BD). L'objectif est de voir s'il y a de grandes différences entre population gitane-non gitane en fonction de l'âge et du sexe (les femmes ont tendance à utiliser une langue toujours plus normée que les hommes) en comparant des segments semblables. Les données récoltées à partir de la glose de la BD ont été enregistrées puis retranscrites dans le corpus présenté

    Corpus St-Maur (documents)

    No full text
    Documents et travaux portant sur le corpus “Corpus St-Maur

    VILLA : Varieties of Initial Learners in Language Acquisition

    No full text
    VILLA (ANR, DFG, NWO) investigates the very first phases of foreign language acquisition under controlled input conditions. Our learners, total beginners with five different native languages (French, German, Dutch, English, Italian) were exposed to 14 hours of target language Polish. Regular tasks in Polish documented the acquisitional path of all learners.Le projet VILLA (ANR, DFG, NWO) examine les premières étapes d'acquisition d'une langue étrangère dans des conditions contrôlées. Des vrais débutants (de 5 langues maternelles différentes: néerlandais, anglais, français, allemand, italien) ont été exposés à 14 h d'une nouvelle langue (polonais). Les tâches en polonais ont permis de suivre leurs itinéraires acquisitionnels

    Projet Intermod (IRMf)

    No full text
    The role of consciousness and top-down processes on the contribution of the auditory cortex during reading.Rôle de la conscience et des processus top-down sur la contribution du cortex auditif pendant la lecture

    Projet Neuroling (IRMf)

    No full text
    Reconnaissance de la langue arabe

    Projet Noms Verbes (MEG)

    No full text
    Response preparation and encoding in word production. Testing recent models (2011-2012-2013) of word production based on psycholinguistics, motor control and neuroscience.Response preparation and encoding in word production. Tester des modèles actuels (2011-12-13) de la production de mots, ancrés dans la psycholinguistique, le contrôle moteur et les neurosciences.<br /

    Corpus IPC

    No full text
    Corpus de formation des médecins à l'annonce d'événements indésirables graves.Source du corpus : l'Institut Paoli-Calmettes de Marseille.Corpus vidéo/audio avec transcriptions et annotations

    MarsaGram

    No full text
    Tool to explore treebanks.Extract a context-free grammar (CFG) and properties over the CFG rules.Generate HTML pages to explore the rules and their properties.Versatile : for constituents or dependencies treebanks.Herramienta de exploración de treebanks.Extrae una gramática libre de contexto (CFG) y propiedades sobre las reglas de la gramática.Genera unas páginas HTML para exlorar las regals y sus propiedades.Adaptable a los treebanks de constituyentes o de dependencías.Outils d'exploration de treebanks.Extraction d'une grammaire hors-contexte (CFG) et de propriétés sur les règles de la grammaire.Production de pages HTML pour explorer les règles et leurs propriétés.S'adapte aux treebanks de constituants et de dépendance.BLACHE, Philippe; MONTCHEUIL, Grégoire; RAUZY, Stéphane(2015).Typologie des langues automatique à partir de treebanks.Actes de la conférence TALN-RECITAL 2015 (22-25 Juin 2015, Caen, France

    24

    full texts

    268

    metadata records
    Updated in last 30 days.
    Speech &amp; Language Data Repository (SLDR)
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇