Universität Rostock, Lehrstuhl Datenbank- und Informationssysteme: Dbis Repository
Not a member yet
940 research outputs found
Sort by
WossiDiA
This article sheds light on the digital transformation of Richard Wossidlo’s regional ethnographic and linguistic collection into the research environment WossiDiA. The Digital Wossidlo Archive is based on making handwritten sources and their indexing visible to users. It has been implemented as a hypergraph database, whose abundance of node and hyperedge types is suitable for representing the diversity and delicate nature of the tradition archive. This paper will discuss how proprietary properties have been preserved in the transformation process and how the digital collection is compatible with big data scenarios. Follow-up projects have contributed to this. “Efficiency,” the necessity of resource-saving, will also be problematized. Finally, it will be shown how a sparse ethnographic fieldnote can be enriched into a complex hypergraph extract, a method which is reminiscent of dragnet detection
Spatial analysis of graph data in the WossiDiA System
The ISEBEL project aims to build an international search engine that is able to harvest data from folktale databases. The initial project concentrates on belief legends [1] found in the three well known digital collections by Evald Tang Kristensen from Denmark (etkspace), Richard Wossidlo from Mecklenburg (wossidia) and several collectors and narrators from the Netherlands (verhaalenbank). Part of the project is on data and graph mining [2,3] for frequent patterns. Therefore, the XML story data is harvested using OAI-PMH and
transformed into graph data.
The WossiDiA system [4] itself as one of the databases harvested by ISEBEL uses typed, directed hypergraphs [5] for representing the collections by Richard Wossidlo. The content encompasses field notes [6], correspondences with scholars, contributors and informants as well as references to published work on the everyday life in the country Mecklenburg from late 19th century to the 30s of 20th
century. Most of the field notes are annotated with localization [7]. To support the researchers in analyzing, browsing and visualizing certain aspects in the collected data using the graph paradigm and algorithms developed not only restricted to the WossiDiA graph data, the master thesis should aim at a combined spatial clustering [8] in conjunction with a graph based clustering [9,10] of property graph data [11] and provide different graph mining techniques on the resulting graph data, especially spatial distribution maps of motif clusters from story data but not restricted to that. Therefore, a general framework has to be developed for a spatial analysis of graph-based data from the Wossidlo archive [12,13,14]. It’s functionality has to be demonstrated by sample scenarios from the WossiDiA and ISEBEL project, i.e. from the narrative cultural heritage and folkloristics [15]
The ISEBEL Project
ISEBEL is an online database for belief legends. The acronym stands for:
Intelligent Search Engine for Belief Legends. The database contains more than 70,000 traditional legends in Dutch, Frisian, Danish and German, while another 6,000 Icelandic legends are currently being added. The initiative for this project was taken several years ago by the Meertens Institute in Amsterdam, the University of Rostock/the Wossidlo Research Center and UCLA/UC Berkeley. The ambition is to create a European database, with an intelligent search function and geographical visualizations. What makes the search engine ‘intelligent’ is that it can always be searched in English, thanks to high-quality automatic translations in the background. The legend material that is brought together can also form the basis of sophisticated graphs that network themes, motifs, narrators, repertoires, and places. This article includes examples of international legends about mermaids and
werewolves
Comparison and implementation of the combined approaches of Text to Speech and Text Translation
Computing Provenance Using the Negated Chase
Since different challenges of data processing are interconnected, we describe them in a unified manner using a classic algorithm of database theory: the Chase. Explaining the origin of query results is one of the challenges considered in this research project. Previously, the Chase has been used to calculate why-provenance of simple conjunctive queries. However, applying the Chase to more realistic scenarios requires an extension of the algorithm, for example with negation. This work reveals opportunities for the extended Chase by calculating both why- and why-not provenance of conjunctive queries with negation
Aufbau eines Online-Portals zum automatisierten Prüfen von SQL-Anfragen
Diese Bachelorarbeit präsentiert die Konzeption, Entwicklung und Implementierung eines innovativen Online-Portals zur automatisierten Bewertung von SQL-Anfragen in Lehrumgebungen. Angesichts der zunehmenden Notwendigkeit der automatisierten Bewertung von SQL-Anfragen in Bildungseinrichtungen zielt diese Arbeit darauf ab, eine effiziente und benutzerfreundliche Lösung bereitzustellen, die sowohl Lehrkräfte als auch Studierende unterstützt. Das entwickelte Portal ermöglicht es Lehrern, Übungen und Aufgaben im SQL-Bereich zu erstellen und automatisch von Studierenden eingereichte SQL-Anfragen zu bewerten. Die Implementierung umfasst sowohl Backend- als auch Frontend-Technologien und bietet Benutzer eine benutzerfreundliche Oberfläche zur Einreichung, Überprüfung und Bewertung von SQLAnfragen
k-Means-Clustering von Textdokumenten mit teilweise fixierten Clustermittelpunkten
von Techniken aus den Bereichen maschinelles Lernen und natürliche Sprachverarbeitung (Natural Language Processing, NLP) präsentiert. Die Arbeitsschritte der Textanalyse, von der Vorverarbeitung bis zur Merkmalsextraktion, wurden mit Schwerpunkt auf dem Einsatz des FCK-Means Clustering-Algorithmus detailliert beschrieben. Dieser Algorithmus ermöglicht die Gruppierung ähnlicher Textdokumente auf Basis hochdimensionaler,semantischer Darstellungen, die durch den Einsatz von TF-IDF und BERT-Einbettungen gewonnen werden. In der vorliegenden Arbeit wurde ein System entwickelt und implementiert, das auf Python und mehreren maschinellen Lern- und NLP-Bibliotheken, einschließlich Scikit-Learn, NLTK und Transformers, basiert. Der entwickelte Ansatz wurde
auf verschiedenen Anwendungsfällen getestet. Weiterhin wurden praktische Herausforderungen, die bei der Implementierung des Systems auftraten, wie das Management großer Datenmengen und die Sicherstellung der Qualität der Eingabedaten, gründlich diskutiert und Lösungsansätze vorgeschlagen. Zusammenfassend bietet die Arbeit einen tiefgreifenden Einblick in die Methodik und Implementierung eines auf NLP und Clustering basierenden Textklassifikationssystems und unterstreicht dessen Potential in diversen Anwendungsgebieten
Flottenmanagement und dynamische kürzeste Pfade
In einem gerichteten und gewichteten Graphen wird das Single-Pair Shortest Path Problem im Kontext der maritimen Navigation unter Berücksichtigung dynamischer Aspekte untersucht.
Dabei können verschiedene Faktoren betrachtet werden, die zu dynamischen Veränderungen im Graphen führen können. Insbesondere wird der Fokus auf Unwetterereignissen gelegt, da
diese ein häufiges und schwerwiegendes Ereignis im maritimen Kontext darstellen. Zur Lösung des Problems werden vier verschiedene Ansätze vorgeschlagen und diskutiert. Diese umfassen die Suche nach einem alternativen Pfad, die Manipulation der Geschwindigkeit des Schiffs, die Anpassung der Abfahrtszeit sowie das Warten an einem oder mehreren Knoten. Jeder dieser Ansätze wird im Hinblick auf seine Anwendbarkeit analysiert und im Falle der Umsetzbarkeit werden dafür konkrete Algorithmen vorgestellt und getestet. Im Anschluss werden die resultierenden Algorithmen verglichen. Hierbei werden spezifische Bewertungskriterien wie die Länge der ermittelten kürzesten Pfade und die Wartezeit herangezogen. Ziel ist es nicht, den effizientesten Algorithmus zu finden, sondern denjenigen, der den kürzesten Weg findet. Die Ergebnisse dieser Arbeit leisten einen bedeutenden Beitrag zur Anwendung von Algorithmen im maritimen Kontext und bieten konkrete Handlungsempfehlungen für die Praxis. Insbesondere können die untersuchten Ansätze und Algorithmen dazu beitragen, die Leistungsfähigkeit und Sicherheit des Seeverkehrs zu erhöhen und damit langfristig sowohl ökonomische als auch ökologische Vorteile zu generieren
Computing Provenance Using the Negated Chase
Since different challenges of data processing are interconnected, we describe them in a unified manner using a classic algorithm of database theory: the Chase. Computing the origin of query results is one of the challenges considered in this research project. Previously, the Chase has been used to calculate why-provenance of simple conjunctive queries. However, applying the Chase to more realistic scenarios requires an extension of the algorithm, for example with negation. This work reveals opportunities for the extended Chase by calculating both why- and why-not provenance of conjunctive queries with negation
Provenance Management unter Verwendung von Schemaabbildungen mit Annotationen
Ziel des Promotionsprojekts ProSA (Provenance Management using Schema Mappings with Annotations) ist die Anwendung und Verallgemeinerung von Techniken des Provenance-Managements im Bereich des Forschungsdatenmanagements unter Verwendung des mit zusätzlichen Provenance-Informationen erweiterten Chase&Backchase