SWISSUbase
Not a member yet
1302 research outputs found
Sort by
Language Quantification Dataset
This dataset contains a series of documents produced by the Federal Statistical Office (FSO) that are currently publicly accessible. These documents are administrative letters and presentations on the collected data. A readme file is also included. The rest of the data from this project are not available in open access because they are sensitive, private, and/or not anonymized. An exhaustive list of these files is to be found in the readme file
Mehrsprachigkeitsdidaktik: Open Data
Dieser Datensatz umfasst alle ohne weitere Restriktionen öffentlich freigegebenen Daten zu dem Projekt "Fremdsprachen lehren und lernen im Zeichen der Mehrsprachigkeit", d.h. insbesondere das im Rahmen des Projekts erstellte merhsprachigkeitsdidaktische Material. Der Datensatz richtet sich an Forschende und Lehrende in diesem Bereich
Everyday Dialogues
This dataset contains a readme file with all of the necessary metadata, plus seven audio files (MP3) of the "Alltagsdialoge" ("Everyday Dialogues"). A list with the title of every audio file is to be found in the readme file. These are supplementary materials for beginner lessons in the area of German as a Second Language (DaZ)
CANDORspeech: A large-scale corpus of phonetically annotated conversational speech from dyadic online conversations with human quality control
Existing speech corpora for phonetic analysis are typically recorded in controlled environments, have restricted sample sizes (in terms of voices and materials recorded), and frequently focus on read speech, making them less suitable for studying naturalistic speech and voice phenomena. The CANDOR corpus (Reece et al., 2023) was recently introduced as a large multimodal dataset of naturalistic conversations containing audio and video from 1656 dyadic conversations in English. This dataset presents CANDORspeech - a transcribed, force aligned and manually screened audio subset of the original CANDOR corpus. We outline the processing pipeline and the resulting CANDORspeech corpus with around 30 utterances from more than 900 speakers (more than 26,000 utterances in total). The corpus is suitable for large-scale phonetic analysis, voice feature extraction, and perceptual testing of naturalistic within-speaker variability
Erwerbsunterstützung mündlicher Textfähigkeiten im Kindergarten (EmTiK)
Die Daten sind verfügbar im CSV-Format. Die Datendatei enthält alle publizierbaren Daten der Studie geordnet nach Fällen (Kinder) und Variablen. Die Daten sind den einzelnen Testkindern zugeordnet (1 Fall = 1 Zeile = 1 Testkind). Pro Klasse sind Daten von 4–5 Testkindern vorhanden. Die Daten zu den Klassen und Lehrpersonen sind deshalb bei jeweils 4–5 Kindern identisch
StoBerMan - Ein Instrument zur Erhebung von Bewegungsereignisbeschreibungen
Dieser Datensatz umfasst eine Präsentation mit Videos, die in der Studie als Stimuli verwendet wurde, um Beschreibungen von Bewegungsereignissen zu erheben. Eine ausführliche Beschreibung und Anleitung liegt dem Datensatz bei: Die Datei Readme.md erklärt, wie die Präsentation konfiguriert werden kann, während die Datei description_stimuli.pdf den Aufbau des Experiments erläutert
Multilingual Sequences Dataset
This dataset contains one readme file, as well as all the open access research data from the project, generated out of intercomprehension tasks with think-aloud-protocols. The data has been generated during two different phases, and in the framework of two pilot studies. The research data is organised in 3 subfolders. A short description of all the items in each subfolder is to be found in the readme file
Participation, Cooperation and Conflict in UN Climate Negotiations
This dataset records negotiation interventions and negotiation interactions by country parties and groupings in the multilateral negotiations under the United Nations Framework Convention on Climate Change (UNFCCC). The data is obtained by scraping and automatically coding the negotiation summaries published in the Earth Negotiations Bulletins (ENBs) between 1995 and 2025. The data is validated by comparing it with a previously published hand-coded dataset of negotiation interactions under the UNFCCC. We describe possible uses of this data in research.
The ENB reports of the UNFCCC negotiations, published by the International Institute for Sustainable Development (IISD), are publicly available and can be accessed at https://enb.iisd.org/negotiations/un-framework-convention-climate-change-unfccc. They are published under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) licence. We therefore publish this dataset with the same type of licence
LiSa Open Data
Enthält alle öffentlich verfügbaren Daten zum Projekt "Literatursynthese Sprachaustausch in der obligatorischen Schulzeit und der Sekundarstufe II (LiSa)". Sie umfassen die Dokumentenvariablen und das Codebuch, welche der Studie zugrunde lagen
Zeigen im pandemieskeptischen Diskurs – Anhänge
Der Datensatz besteht aus Anhängen der Dissertation mit dem Titel "Zeigen im pandemieskeptischen Diskurs. Bedingung, Praxis und Ordnung":
1) Inputdatei und Projektdatei des Zeigenetzwerks; 2) Kodebuch; 3) URL-Liste, die die Datengrundlage des PANSKEP-Korpus bilde