BieColl - Bielefeld Electronic Collections
Not a member yet
1004 research outputs found
Sort by
Concept Extraction for Time Series With ECLAD
Concept Extraction (CE) methods are being increasingly used in the image domain for explaining deep learning models, which are not inherently interpretable. However, there have not been transfer studies yet for their usage in the time series domain. The purpose of this work is to explore the use of CE methods in time series. We propose to modify the ECLAD algorithm for this domain by changing the latent space representation used to extract concepts. This method is then tested on an InceptionTime model trained on the Gunpoint dataset. Preliminary results show that we can successfully extract concepts from time series models on datasets with local features and provide conceptual explanations that effectively explain how the model works
Persistente Identifikatoren in Deutschland – Vorbereitung und Durchführung einer Umfrage zur Verbreitung und Nutzung an Kultur- und Wissenseinrichtungen sowie erste Zwischenergebnisse
Das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt „PID Network Deutschland“ (https://www.pid-network.de) führt aktuell eine Umfrage zur Nutzung von persistenten Identifikatoren (PID) im wissenschaftlichen Kontext in Deutschland durch. Mit dieser Umfrage möchte das Projekt, an dem das Helmholtz Open Science Office, die Deutsche Nationalbibliothek (DNB), die Technische Informationsbibliothek (TIB), DataCite und die Universitätsbibliothek Bielefeld beteiligt sind, einen Einblick in den aktuellen Stand der Erfahrung, Nutzung, Herausforderungen und Lücken bei der Anwendung und Implementierung von PIDs an universitären und außeruniversitären Forschungseinrichtungen systematisch erfassen und analysieren.
Nach einer kurzen Einführung in das „PID Network Deutschland“ fokussiert der Vortrag auf die Umfrage und gibt einen ersten Einblick in die Umfrage-Ergebnisse zur Erfahrung, Nutzung sowie der Bedarfe und Lücken bei der Anwendung von persistenten Identifikatoren unter den universitären und außeruniversitären Forschungsinfrastrukturen
Nonlinear Prediction in a Smart Shoe Insole
In our previous work, we have investigated different methods to compute the ideal placement of pressure sensors in a smart shoe insole. There, we used a linear model to predict the weight put on the foot/leg. In this work, we investigate how using a quadratic model instead changes the sensor placement and improves prediction performance
Beyond Trial and Error in Reinforcement Learning
In this work, we address the trial-and-error nature of modern reinforcement learning (RL) methods by investigating approaches inspired by human cognition. By enhancing state representations and advancing causal reasoning and planning, we aim to improve RL performance, robustness, and explainability. Through diverse examples, we showcase the potential of these approaches to improve RL agents
Closing the Loop with Concept Regularization
Convolutional Neural Networks (CNNs) are widely adopted in industrial settings, but are prone to biases and lack transparency. Explainable Artificial Intelligence (XAI), particularly through concept extraction (CE), allows for global explanations and bias detection, yet fails to offer corrective measures for identified biases. To bridge this gap, we introduce Concept Regularization (CoRe), which uses CE capabilities alongside human feedback to embed a regularization term during retraining. CoRe allows for the adjustments in model sensitivities based on identified biases, aligning model prediction process with expert human assessments. Our evaluations on a modified metal casting dataset demonstrate CoRe's efficacy in bias mitigation, highlighting its potential to refine models in practical applications
Open Access Policies und Bücher im Europäischen Forschungsraum: Ein Rückblick auf zwei Jahre EU-Projekt PALOMERA
Bücher spielen eine wichtige Rolle in der Wissenschaftskommunikation - besonders in den Sozial- und Geisteswissenschaften. Das von der Europäischen Union geförderte Projekt "Policy Alignment of Open Access Monographs in the European Research Area" (PALOMERA) hat das Ziel, die Open Access-Transformation für Bücher zu beschleunigen. Unter der Annahme, dass Bücher in Open Access Policies im Vergleich zu Zeitschriftenartikeln unterrepräsentiert sind, ermittelt und analysiert PALOMERA kritische Hindernisse für Open Access und hat Empfehlungen für zukünftige Policies erarbeitet. Der Vortrag gibt eine Einführung in das im Dezember 2024 auslaufende Projekt, fasst wichtige Aspekte von Datenerhebung und -analyse zusammen und führt durch die kürzlich vorgestellten Handlungsempfehlungen für Policies im Buchbereich
Implementierung einer automatischen DDC-Klassifikation für die Suchmaschine BASE auf Basis von Annif
Dieser Vortrag präsentiert die Ergebnisse einer Masterarbeit, die im Rahmen des Studiengangs MALIS an der TH Köln verfasst wurde.
In der Suchmaschine BASE werden bereits seit Jahren Dokumente maschinell nach der Dewey Decimal Classification (DDC) erschlossen, es besteht jedoch der Wunsch, das mittlerweile veraltete System zur automatischen Klassifikation zu ersetzen. Zu diesem Zweck war es erforderlich, Daten aus BASE zu gewinnen, die als Trainingsmenge eines maschinellen Lernverfahrens dienen können. Es wird gezeigt, wie mithilfe einer explorativen Analyse aus einem Korpus von über 220 Mio. Dokumenten geeignete Daten extrahiert, kuratiert und zu sprachspezifischen Lernkorpora umgearbeitet wurden. Auf dieser Grundlage wurden mithilfe des Toolkits Annif eine Reihe von Klassifikatoren erstellt, deren Leistungsfähigkeit anschließend evaluiert und ein geeigneter Kandidat ausgewählt. Ein Vergleich zeigt, dass das in dieser Ausarbeitung erstellte System dem zur Zeit im Einsatz befindlichen BASE-Klassifikator weit überlegen ist
Langzeitverfügbarkeit mit Rosetta: ein Werkstattbericht
Für wissenschaftliche Bibliotheken in NRW ist seit Anfang 2022 durch das Kulturgesetzbuch (KulturGB NRW) vorgesehen, Verfahren zur Langzeitverfügbarkeit (LZV) für digitale Bestände zu etablieren. Die Landesinitiative Langzeitverfügbarkeit (LZV.NRW) baut zu diesem Zweck eine kooperative Infrastruktur auf, die sich an alle NRW-Hochschulen und ihre Bibliotheken richtet. Die UB Bielefeld nutzt das Angebot der Landesinitiative, das eine Lizenz für die Archivierungssoftware „Rosetta“ sowie Service und Support durch das hbz umfasst.
Im Rahmen des Projekts „Langzeitverfügbarkeit mit Rosetta“ evaluieren UB und Kompetenzzentrum Forschungsdaten die Archivierungssoftware, ein kommerzielles Produkt der Fa. Ex Libris. Es wird getestet, ob die Software dazu geeignet ist, ausgewählte bibliothekseigene Bestände langzeitverfügbar zu machen. Im zweiten Schritt soll ein Dienstleistungsangebot zur Langzeitverfügbarkeit von Forschungsdaten entwickelt werden, das sich an Bielefelder Forschende richtet
Comparing Shapley Value Approximation Methods for Unsupervised Feature Importance
Assigning importance scores to features is a common approach to gain insights about a prediction model’s behavior or even the data itself. Beyond explainability, such scores can also be of utility to conduct feature selection and make unlabeled high-dimensional data manageable. One way to derive scores is by adopting a game-theoretical view in which features are understood as agents that can form groups and cooperate for which they obtain a reward. Splitting the reward among the features appropriately yields the desired scores. The Shapley value is the most popular reward sharing solution. However, its exponential complexity renders it inapplicable for high-dimensional data unless an efficient approximation is available. We empirically compare selected approximation algorithms for quantifying feature importance on unlabeled data
Linguistic-Based Reflection on Trust Calibration in Conversations with LLM-Based Chatbots
This paper presents a linguistic approach to trust in human conversations with LLM-based chatbots. Using the concept of trust calibration as a starting point, we aim to address the question of how to increase user AI literacy and prevent misuse of as well as overtrust in the information provided by LLM-based chatbots in educational contexts. We propose a linguistic-based model of trust calibration that supports users in adopting a critical perspective on trust calibration and controlling their trust level. The method combines previous studies on trust in human interaction, specifically linguistic trust cues displayed by human trustors to indicate their level of trustworthiness in naturally occurring contexts with studies on proactive human-computer interaction and the social influence of conversational agent's embodiment in educational contexts