Portail HAL ENC (École nationale des chartes-PSL)
Not a member yet
    3792 research outputs found

    Utilisation de grands modèles de langue pour prédire les passages perdus dansles manuscrits médiévaux : Un programme de recherche axé sur le manuscrit L.II.14 dela bibliothèque de Turin

    No full text
    International audienceThis paper explores the innovative application of Large Language Models (LLMs) to predict andreconstruct lost passages in medieval manuscripts, with a specific focus on a partially burned manuscriptfrom the library of Torino. By analyzing the potential of LLMs to interpret and generate text based onthe extant writings of the same scribe, this study aims to bridge the gap in computational philologyconcerning the restoration of damaged historical texts.Cet article explore l'application de grands modèles de langage pour prédire et reconstruire lespassages perdus dans les manuscrits médiévaux, en prenant pour exemple le cas d’unmanuscrit partiellement brûlé de la bibliothèque de Turin. En analysant le potentiel des LLMpour interpréter et générer des textes basés sur les écrits existants du même scribe, cette étudevise à combler les lacunes de la philologie informatique en ce qui concerne la restauration destextes historiques endommagés

    Le Chronicon d’Hélinand de Froidmont, ou reconstruire pour comprendre

    No full text
    International audienc

    Anne-Marie Châtelet, Amandine Diener, Marie-Jeanne Dumont et Daniel Le Couëdic (dir.), L’architecture en ses écoles. Une encyclopédie de l’enseignement de l’architecture au XXe siècle, Châteaulin, éditions Locus solus, 2022, 703 p.

    No full text
    International audienceCompte rendu de lecture de : Anne-Marie Châtelet, Amandine Diener, Marie-Jeanne Dumont et Daniel Le Couëdic (dir.), L’architecture en ses écoles. Une encyclopédie de l’enseignement de l’architecture au XXe siècle, Châteaulin, éditions Locus solus, 2022, 703 p

    Archiving the vernacular web: The example of skyblogs

    No full text
    In 2002, the French radio station Skyrock created a free blogging platform which experienced unique success in France, with 10 million "skyblogs" live in 2007 and a peak of 33 million in 2011. Used mainly by teenagers, the platform became a marker of the generation who is in their thirties today. The platform's shutdown in the summer of 2023 instilled fear that all the content that was still online (more than 12.6 million blogs) would disappear for good. Pierre Bellanger, founder of the Skyrock radio station, called on the Bibliothe que nationale de France (BnF) and Institut national de l'audiovisuel (Ina) to safeguard the skyblogs for heritage purposes. The two cultural institutions undertook an urgent and massive harvest of these blogs : by the end of 2023, they had collected over 12 million blogs, 1 million audio files and identified 5 million embedded videos. The shutdown of the platform also raised the interest of several research teams: the E8 cole nationale des Chartes -PSL was one of them. In 2023, the BnF started a four-year research project entitled "Skybox, Skyblogs a ciel ouvert" (literally Skybox, Skyblogs in open-air), aimed at developing an epistemology of web archives using the Skyblogs collection as a field of study. In 2024, this endeavour was complemented by the launch of SkyTaste (Skyblogs, a Terrain for the Analysis of Senses, Technology and Emotions), a twin project funded under PSL's Young Researcher Starting Grant. In this paper, we provide contextual information regarding the creation of web archives. Then, we explore the challenges of a specific crawl such as the one BnF achieved for the Skyblog platform. We then introduce examples of research projects recently undertaken with the Skyblog archive as a main source, including Skybox and SkyTaste, and question major ethical issues raised by the study of such material.</div

    Quand la peur devient virale : exploration d’un genre de littérature numérique, les Creepypastas

    No full text
    This M.A. thesis is dedicated to the in-depth exploration of creepypastas, a distinct genre of viral digital literature. To achieve this, it mobilized a resolutely quantitative approach, relying notably on Natural Language Processing techniques. This methodology allowed for the analysis of a vast corpus of texts and the identification of significant trends. The study thus reveals that, contrary to expectations often associated with horror literature, these narratives are distinguished by a notable structural simplicity and a marked predominance of themes related to intimacy and personal experience. Furthermore, lexical analysis showed an surprisingly less pronounced presence of explicit horrific vocabulary, suggesting that the dread in creepypastas stems more from ambiguity, familiar elements twisted, and suggestion, rather than graphic or grotesque horror. Regarding the virality of these contents, the regression results indicate that the predominant factors are text readability and sentence length, these elements having a more significant impact on their propagation than the degree of fear or the themes addressed themselves. The analysis of evolution within a platform confirmed the hypothesis that certain platforms evolve based on a cumulative history of all production since their origin.Ce mémoire se consacre à l’exploration approfondie des creepypastas, un genre distinct de littérature numérique virale. Pour ce faire, il a mobilisé une approche résolument quantitative, s’appuyant notamment sur les techniques du Traitement Automatique des Langues. Cette méthodologie a permis d’analyser un vaste corpus de textes et de dégager des tendances significatives. L’étude révèle ainsi que, contrairement aux attentes souvent associées à la littérature d’horreur, ces récits se distinguent par une simplicité structurelle notable et une prédominance marquée de thèmes liés à l’intime et à l’expérience personnelle. De plus, l’analyse du lexique a montré une présence étonnamment moins prononcée du vocabulaire horrifique explicite, suggérant que l’effroi dans les creepypastas émane davantage de l’ambiguïté, du familier détourné et de la suggestion, plutôt que de l’horreur graphique ou du grotesque. Concernant la viralité de ces contenus, les résultats de la régression indiquent que les facteurs prépondérants sont la lisibilité du texte et la longueur des phrases, ces éléments ayant un impact plus significatif sur leur propagation que le degré de peur ou les thématiques abordées en elles-mêmes. L’analyse de l’évolution au sein d’une plateforme a permis de confirmer l’hypothèse que certaines plateformes évoluent en fonction d’un historique cumulatif de toute la production depuis leur origine

    Interroger la mémoire d’entreprise par l’IA : le RAG face aux archives orales. Enjeux et limites pour l’histoire appliquée

    No full text
    This thesis examines the extent to which RAG (Retrieval Augmented Generation) technology is changing the relationship between researchers and archives, and assesses whether it truly constitutes a revolution in access to historical documents. The study is set in the professional context of applied history, conducted within the company Perles d’Histoire, an archival and historical engineering agency specialising in the promotion of corporate heritage. The mission was to develop a RAG prototype to query oral archive transcripts produced during a collection campaign for a client company in the Swiss IT sector. After presenting RAG in the contemporary artificial intelligence ecosystem and analysing its role in documentary research and the humanities, this work outlines the methodology used to create the prototype, detailing the technical choices made and the operational functioning of the tool. The evaluation of the prototype reveals its advantages in optimising documentary research, but also its technical limitations. The analysis concludes that while a simple RAG prototype alone will not revolutionise access to archives, the principle it embodies is part of the emergence of the “era of assistance” and could, if developed with advanced components, significantly transform historical research practices while preserving the researcher’s critical thinking.Ce mémoire examine dans quelle mesure la technologie RAG (Retrieval Augmented Generation) modifie le rapport du chercheur aux archives et évalue si elle constitue véritablement une révolution dans l’accès aux documents historiques. L’étude s’inscrit dans le contexte professionnel de l’histoire appliquée, menée au sein de l’entreprise Perles d’Histoire, agence d’ingénierie archivistique et historique spécialisée dans la valorisation du patrimoine d’entreprise. La mission consistait à développer un prototype de RAG pour interroger les transcriptions d’archives orales produites lors d’une campagne de collecte pour une entreprise cliente du secteur informatique suisse. Après avoir présenté le RAG dans l’écosystème de l’intelligence artificielle contemporaine et analysé son rôle dans la recherche documentaire et les sciences humaines, ce travail expose la méthodologie suivie pour réaliser le prototype, détaillant les choix techniques adoptés et le fonctionnement opérationnel de l’outil. L’évaluation du prototype révèle ses avantages dans l’optimisation de la recherche documentaire, mais aussi ses limites techniques. L’analyse conclut que si un prototype de RAG simple ne révolutionne pas à lui seul l’accès aux archives, le principe qu’il incarne s’inscrit dans l’émergence de l’« ère de l’assistance » et pourrait, développé avec des composants avancés, transformer significativement les pratiques de recherche historique tout en préservant l’esprit critique du chercheur

    Les Caumont de La Force: Grandeur et déclin institutionnel d’un lignage au cœur des mutations du régime de l’édit de Nantes

    No full text
    International audienc

    Digital Humanities in the TIME-US Project: Richness and Contribution of Interdisciplinary Methods for Labour History

    No full text
    International audienceThis paper explores the interdisciplinary approach of the TIME-US project, which aims to reconstruct the working conditions of men and women in the French textile industry from the seventeenth to the twentieth century. Faced with sparse and heterogeneous historical data—particularly on women’s work—TIME-US combines methods from labour history, digital humanities, and natural language processing (NLP) to transform qualitative archival sources into structured, analyzable data. Drawing on the concept of “datafication,” the project builds a richly annotated corpus of digitized documents, processed using OCR, handwritten text recognition, and semantic annotation pipelines. It demonstrates how computational methods, including the “verb-oriented method,” enable the identification of work-related activities in large text corpora. The article highlights the methodological innovations and collaborative practices between historians and computer scientists that made this possible. TIME-US contributes not only to labour history by making invisible work more visible but also to digital humanities by showcasing blended reading approaches that combine distant and close reading. It advocates for historians' active involvement in the design of digital tools to ensure meaningful, critically-informed research

    0

    full texts

    3,792

    metadata records
    Updated in last 30 days.
    Portail HAL ENC (École nationale des chartes-PSL)
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇