Publikationer från KTH
Not a member yet
    57933 research outputs found

    Att frikoppla popularitetsbias och användarrättvisa i LLM-baserade rekommendationssystem : En snabb och effektiv metod för att uppnå korrekta, långsiktiga och demografiskt rättvisa rekommendationer

    No full text
    Large Language Models (LLMs) are rapidly being adopted as “plug-and-play” recommenders that require no task-specific training, although their recommendations can still face two long-standing problems: popularity bias (overexposing blockbusters) and consumer unfairness (unequal treatment of users who differ only in sensitive attributes). This thesis investigates whether these problems can be decoupled and simultaneously mitigated purely through prompt engineering, with no access to model weights. Working with the MovieLens-1M corpus, we generate 434,880 prompts that vary three dimensions: how a user’s historical tastes are sampled (top-rated, most recent, or a newly proposed ’polarized’ mix of likes and dislikes), whether sensitive attributes are disclosed (neutral versus gender– age, occupation, or all), and which popularity debiaser has been applied (from a hard ’exclude-popular’ order to a gentle “temporal-diverse” request). We evaluate every prompt with a triad of metrics: Hit-Rate for accuracy, log-popularity difference (LPD) for popularity bias, and Jaccard similarity for the stability of recommendations when sensitive attributes are toggled on or off. The results reveal four insights. First, supplying the LLM with a rich, polarized taste signal increases accuracy by 42%. Second, temporal diversity reduces popularity bias by 0.6 log-units while incurring only a 1% loss in accuracy, whereas hard “exclude-popular” filters decrease accuracy by up to 65%. Third, popularity bias and user fairness are orthogonal; once popularity is neutralized, adding even minimal demographic information still halves list overlap, confirming that the two dimensions must be audited separately. Finally, only one configuration, polarized sampling strategy, temporal-diverse debiaser, and attribute-neutral prompt, simultaneously satisfies strict thresholds on accuracy (HR≈0.85), popularity bias (|LPD|<0.8), and fairness (Jaccard≈0.41). These results show that lowering popularity bias alone does not guarantee fairness, underscoring the need to handle each bias independently. These findings establish prompt engineering as a lightweight yet powerful lever for balancing accuracy, long-tail exposure, and demographic fairness in LLM-driven recommender systems without model retraining. Beyond empirical insights, the thesis contributes a rigorous evaluation framework and practical guidelines to build fair, bias-aware recommendation systems with large language models.Stora språkmodeller antas snabbt som ”plug-and-play”-rekommendationer som inte kräver någon uppgiftsspecifik utbildning, även om deras rekommendationer fortfarande kan förvärra två långvariga problem: popularitetsbias (överexponering av storfilmer) och orättvisa bland konsumenter (ojämlik behandling av användare som bara skiljer sig åt i skyddade attribut). Denna avhandling undersöker om dessa problem kan frikopplas och samtidigt mildras enbart genom prompt engineering, utan tillgång till modellvikter. Med hjälp av MovieLens-1M-korpusen genererar vi 434 880 prompts som varierar i tre dimensioner: hur en användares historiska smak samplas (topprankad, senaste eller en nyligen föreslagen ”polariserad” blandning av gilla- och ogilla-attribut), om känsliga attribut avslöjas (neutral kontra kön- ålder, yrke eller alla), och vilken popularitetsdebiaser som har tillämpats (från en hård ”exkludera-populär” ordning till en mild ”tidsmässig-divers” begäran för filmer hämtade från flera epoker). Vi utvärderar varje prompt med en triad av mätvärden: Hit-Rate för noggrannhet, log-popularitetsskillnad (LPD) för popularitetsbias och Jaccard-likhet för rekommendationernas stabilitet när känsliga attribut är aktiverade eller avaktiverade. Resultaten avslöjar fyra insikter. För det första ökar noggrannheten med 42 % om LLM förses med en rik, polariserad smaksignal. För det andra minskar tidsmässig mångfald popularitetsbias med 0,6 log-enheter samtidigt som det bara medför en förlust på 1 % i noggrannhet, medan hårda ”exkludera populära” filter minskar noggrannheten med upp till 65 %. För det tredje är popularitetsbias och användarrättvisa ortogonala; när popularitet är neutraliserad, halverar även minimal demografisk information listan, vilket bekräftar att de två dimensionerna måste granskas separat. Slutligen uppfyller endast en konfiguration, polariserad samplingsstrategi, tidsmässigt diversifierad debiaser och attributneutral prompt, samtidigt strikta trösklar för noggrannhet (HR≈0,85), popularitetsbias (|LPD|<0,8) och rättvisa (Jaccard≈0,41). Dessa resultat visar att enbart minskad popularitetsbias inte garanterar rättvisa, vilket understryker behovet av att hantera varje bias separat. Dessa fynd etablerar prompt engineering som en lätt men kraftfull hävstång för att balansera noggrannhet, exponering med lång svans och demografisk rättvisa i LLM-drivna rekommendationssystem utan modellomskolning. Utöver empiriska insikter bidrar avhandlingen med ett rigoröst utvärderingsramverk och praktiska riktlinjer för att bygga rättvisa, biasmedvetna rekommendationssystem med stora språkmodeller

    Beläggningsprognos med Temporal Fusion Transformer : En djupinlärningsbaserad metod för att förutspå kontorsbeläggning

    No full text
    Accurately modeling building occupancy is essential for optimizing energy usage and enhancing indoor climate control. This thesis, conducted in collaboration with Codon Consulting, explores the application of a Temporal Fusion Transformer, a deep learning architecture designed for interpretable multi-horizon time series forecasting, for short-term occupancy prediction in a commercial office building. The model was trained on multivariate data, including CO2 sensor readings, elevator logs, cold-water usage, and various temporal and calendar features. Model performance was evaluated using walk-forward validation to ensure robustness. The model achieved an average Mean Absolute Error of 2.71 across validation folds and 5.62 on a held-out test set when training on the full dataset, substantially outperforming two baseline dummy regressors. Interpretability tools such as feature importance and attention mechanisms revealed that recent occupancy and temporal patterns were the most influential predictors. While the results demonstrate the Temporal Fusion Transformer’s effectiveness in modeling occupancy dynamics, the use of data from a single building and a limited training window pose constraints on generalizability. The study concludes that the Temporal Fusion Transformer is a promising model for data-driven occupancy forecasting. Future work should investigate scalability across multiple buildings, extend the forecasting horizon, and assess the feasibility of real-time deployment.Att modellera byggnaders beläggning på ett tillförlitligt sätt är avgörande för att optimera energianvändning och förbättra inomhusklimatet. Detta examensarbete genomfördes i samarbete med Codon Consulting och undersöker användningen av en Temporal Fusion Transformer, en djupinlärningsmodell utformad för tolkningsbara prognoser av tidsserier med olika horisonter, för kortsiktig prognos av beläggning i en kommersiell kontorsbyggnad. Modellen tränades på multivariata data, inklusive CO2-sensorvärden, hissloggar, kallvattenförbrukning samt olika temporala och kalenderbaserade faktorer. Modellens prestanda utvärderades med hjälp av så kallad walk-forward validering för att säkerställa robusthet. Modellen uppnådde ett genomsnittligt medelabsolutfel på 2,71 över valideringsfönstren och 5,62 på separat testdata när modellen tränades på hela datasetet, vilket var en tydlig förbättring jämfört med två enkla baseline-modeller. Tolkbarhetsverktyg såsom variabelviktning och uppmärksamhetsmekanismer visade att nylig beläggning samt temporala mönster var de mest betydelsefulla faktorerna. Trots goda resultat begränsas generaliserbarheten av att endast en byggnad och en kort träningsperiod ingick i studien. Slutsatsen är att Temporal Fusion Transformer är en lovande modell för datadriven beläggningsprognos. Framtida arbete bör fokusera på skalbarhet över flera byggnader, längre prognoshorisonter och utvärdering av möjligheten till realtidsanvändning

    Adaptiv felkommunikation i människa-robot-samarbete : Utnyttjande av stora språkmodeller för kontextmedvetna förklaringar av fel

    No full text
    In human-robot collaboration tasks, robots sometimes fail to complete their tasks due to the complexity of the real-world environment. In these situations, it is crucial for robots to effectively communicate the failure to the human users and provide explanations that help them understand and resolve the robot’s failure. Previous research has explored the effectiveness of different levels of explanations, which convey varying amounts of information about the robot’s failure to the user. However, these explanations are handcrafted based on templates, which lacks the ability to truly interact with the user when the user needs further information about the robot’s failure. In this thesis, we proposed a failure communication module that leveraged Large Language Models (LLMs) to generate context-aware explanations of robot failures in human-robot collaboration tasks. We also explored the adaptation of the explanation level based on the user’s behavior, which predicted the most proper explanation level for the user to resolve the robot’s failure. We evaluated the failure communication module and the explanation level adaptation in a user study with 44 participants. The results showed that the proposed failure communication module could effectively improve the failure resolution rate for challenging tasks, while the explanation level adaptation did not have a significant impact on the failure resolution performance and user satisfaction.När människor och robotar samarbetar misslyckas robotarna ibland med att slutföra sina uppgifter på grund av den komplexa miljön. I dessa situationer är det viktigt att robotarna effektivt kommunicerar misslyckandet till de mänskliga användarna och ger förklaringar som hjälper dem att förstå och lösa robotens misslyckande. Tidigare forskning har undersökt effektiviteten hos olika nivåer av förklaringar, som förmedlar varierande mängder information om robotens misslyckande till användaren. Dessa förklaringar är dock handgjorda baserat på mallar, vilket saknar förmågan att verkligen interagera med användaren när användaren behöver ytterligare information om robotens fel. I den här avhandlingen föreslog vi en kommunikationsmodul för fel som utnyttjade stora språkmodeller (LLM) för att generera kontextmedvetna förklaringar av robotfel i samarbetsuppgifter mellan människa och robot. Vi undersökte också anpassningen av förklaringsnivån baserat på användarens beteende, vilket förutspådde den mest lämpliga förklaringsnivån för användaren för att lösa robotens fel. Vi utvärderade modulen för felkommunikation och anpassningen av förklaringsnivån i en användarstudie med 44 deltagare. Resultaten visade att den föreslagna felkommunikationsmodulen effektivt kunde förbättra felsökningsgraden för utmanande uppgifter, medan anpassningen av förklaringsnivån inte hade någon betydande inverkan på felsökningsprestanda och användarnöjdhet

    Peeling-Ballongstabilitetens beroende av plasmaformen i TCV-tokamaken : Plasmaformens påverkan på kantstabilitet i TCV

    No full text
    Nuclear fusion offers the promise of clean, sustainable and abundant energy to meet the long-term growth in global energy demand. Achieving fusion conditions requires extremely high temperatures on the order of millions of ◦C. The high-confinement mode (H-mode) facilitates these conditions but introduces challenges, particularly through an instability called edge-localised modes (ELMs), which can severely damage internal components of future fusion power plants. ITER, currently under construction in France, aims to demonstrate net energy gain and inform the design of commercial fusion reactors. To support ITER-relevant research, it is essential to reproduce ITER-like operational regimes in existing devices. This thesis investigates whether a peeling- limited ELM stability regime (expected in ITER) can be achieved in the TCV tokamak by modifying the plasma shape. A boundary parametrization was implemented to generate realistic plasma geometries, and the effects of squareness, triangularity and elongation were systematically studied using the Europed and ESSIVE simulation codes. The results show that variations in squareness and triangularity did not facilitate access to a peeling-limited regime; instead, they shifted the stability further from it. In contrast, increasing elongation to approximately κ = 2.0, combined with a higher plasma current of Ip ≈ 230 kA, significantly shifted the stability towards a peeling-limited regime. This effect was most pronounced at low densities (npede = 2.0 · 1019 m−3), which appear favourable, and potentially essential, for achieving the desired peeling-limited stability. These findings provide valuable guidance for future experimental validation in TCV, enabling the study of ITER-like stability regimes. Such investigations may offer insights that contribute to the optimization of ITER’s performance and advancing the prospects of future fusion power generation.Kärnfusion erbjuder löftet om ren, hållbar och långsiktigt tillgänglig energi för att möta den ökande globala energiefterfrågan. Att uppnå fusionsförhållanden kräver extremt höga temperaturer, i storleksordningen miljontals ◦C. Högkonfinementsläget (H-läge) underlättar dessa förhållanden men introducerar utmaningar, särskilt genom en instabilitet kallad kantlokaliserade-moder (ELMs), som kan orsaka allvarliga skador på interna komponenter i framtida fusionskraftverk. ITER, som är under konstruktion i Frankrike, syftar till att demonstrera nettoenergiproduktion och upplysa utformningen av kommersiella fusionsreaktorer. För att stödja ITER-relevant forskning är det avgörande att reproducera ITER- liknande driftregimer i befintliga experimentella maskiner. Detta examensarbete undersöker om en peeling-begränsad ELM-stabilitet (förväntat i ITER) kan uppnås i TCV-tokamaken genom att modifiera plasmats form. En formparametrisering imple- menterades för att generera realistiska plasmaformer, och effekterna av fyrkantighet, trianguläritet och elongation studerades systematiskt med hjälp av simuleringskoderna Europed och ESSIVE. Resultaten visar att variationer i fyrkantighet och trianguläritet inte underlättade tillträde till en peeling-begränsad regim; i stället försköts stabiliteten längre bort från den. Däremot skiftade en ökad elongation av omkring κ = 2.0, i kombination med en högre plasmaström på Ip ≈ 230 kA, stabiliteten avsevärt mot en peeling-begränsad regim. Denna effekt var mest påtaglig vid låga densiteter (npede = 2.0 · 1019 m−3), vilket verkar gynnsamt, och potentiellt avgörande, för att uppnå den önskade peeling- begränsade stabiliteten. Dessa resultat ger värdefull vägledning för framtida experimentell validering i TCV, vilket möjliggör studier av ITER-liknande stabilitetsregimer. Sådana undersökningar kan ge insikter som bidrar till optimeringen av ITERs prestanda och främjar utsikterna för framtida fusionsenergiproduktion

    Datadriven icke-linjär modellprediktiv reglering med NARX-modelle : en tillämpning av Takens sats

    No full text
    Data-driven control offers a solution in situations where control based on first-principles modeling is difficult or infeasible. This master thesis investigates the use of Takens’ embedding theorem to enable nonlinear, data-driven model predictive control (MPC). The proposed method involves learning time-delay embedded system dynamics using a nonlinear autoregressive model with exogenous inputs (NARX), which is then integrated into an MPC framework. The results show that increasing the number of past inputs and outputs used in prediction improves model accuracy; however, the selection of feature types is found to be even more critical for achieving strong performance in complex control tasks. Furthermore, the proposed controller demonstrates tracking performance comparable to that of standard model-based MPC and outperforms the regularized Data-enabled Predictive Control (DeePC) method, while significantly reducing computational complexity. To address the computational demands associated with optimizing nonlinear problems, several strategies are employed: model complexity is reduced through lasso regularization, nonlinear optimization problems are approximated as quadratic programs via linearization in a real-time iterative (RTI) approach, and convexity is enforced through structural constraints. A key limitation of the current approach is its restriction to single-input single-output systems. Future work may extend the methodology to multi-input multi-output systems and explore richer feature sets to enhance model expressiveness.Datadriven styrning erbjuder en lösning i falllet då reglering baserad på modellering av första principen är svår eller ogenomförbar. Detta masterarbete undersöker hur Takens sats kan användas för att möjliggöra ickelinjär datadriven modellprediktiv reglering (MPC). Metoden som föreslås i detta arbete innefattar inlärning av en autoregressiv modell med exogena insignaler (NARX) som integreras i MPC. Resultaten visar att modellens precision förbättras när fler tidigare in- och utsignaler inkluderas i modellen. Däremot tyder resultaten också på att valet av basfunktioner i modellen har större inverkan än antalet in- och utsignaler, särskilt vid utförandet av komplexa regleringsuppgifter. Vidare uppnår den föreslagna metoden jämförbar prestationsförmåga med klassisk MPC och överträffar regulariserad datadriven prediktiv reglering (DeePC), samtidigt som den minskar beräkningskomplexiteten avsevärt. För att hantera den höga beräkningskomplexitet som ickelinjära optimeringsproblem medför används följande strategier: reduktion av modellkomplexitet genom lasso-regularisering, approximation av optimeringsproblemet genom linjärisering baserad på en realtidsiterativ metod, samt påtvingad konvexitet genom att begränsa modellens struktur. En tydlig begränsning med detta arbete är att metoden enbart är tillämpbar på SISO-system. Ett naturligt nästa steg skulle därför kunna vara att utvidga metoden för användning på MIMO-system, samt att undersöka mer avancerade eller flexibla basfunktioner

    The meaning of land : A case study of the City of Stockholms work with social sustainability in the land development process

    No full text
    Sprängdåd och skjutningar har ökat i Sverige och vissa stadsdelsområden verkar vara mer drabbade än andra. Politiker höjer tonläget och föreslår dramatiska åtgärder som att riva hela bostadsområden. Forskningen lyfter däremot grundproblematiken som orsakat ökningen av våldsbrott. Några utpekade faktorer som bidragit till en negativ samhällsutveckling är ökade inkomstskillnader och växande segregation. Inom stadsutveckling diskuteras relationen mellan fysisk planering och sociala problem. I Stockholms stad implementeras allt mer social hållbarhet inom byggprojekt. Det kommer dock inte utan utmaningar. Dels för att det inte finns en enhetlig definition av begreppet social hållbarhet, dels för att det inte heller finns en enighet kring huruvida det bör finnas en enhetlig definition eller inte. Andra utmaningar handlar om hur politiska mål och styrdokument ska översättas till arbetssätt i praktiken samt huruvida de sociala åtgärderna följs upp eller inte.  Den här uppsatsen syftar därför till att undersöka hur Stockholms stad har implementerat social hållbarhet inom samhällsbyggnadsprocessen. Studien har antagit en induktiv ansats inom kvalitativ forskningsmetodik där intervjuer av representanter från stadens förvaltningar och olika byggbolag har genomförts angående deras upplevelse och tolkning av hur social hållbarhet har implementerats i specifika projekt. En annan viktig aspekt inom stadsutveckling handlar om relationen mellan markägaren och marken. Teorierna som ligger till grund för uppsatsen handlar om markägande, hur Stockholms stads markpolitik ändrats genom historien, implementationsforskning, teorier om uppföljning och utvärdering samt diverse forskning om social hållbarhet inom samhällsplanering. Studien visar att Stockholms stads relation till marken kan jämföras med den investerande markägaren som främst ser mark som en finansiell tillgång. Hanteringen av markanvisningar visar hur stadsutvecklingen i staden länge skett på initiativ från marknaden och där sociala hållbarhetskrav på byggbolag knappast följs upp. Uppsatsen diskuterar även att många sociala insatser är kortsiktiga och enbart fokuserar på individnivå.  Avslutningsvis konstateras att oavsett hur implementering av socialt hållbarhetsarbete inom Stockholms stad sker vore en förändring av stadens markpolitik avgörande för att det ska ske en rättvis fördelning av resurser till samtliga bostadsområden. Exempelvis genom att projekten inte behöver bära sina egna investeringar och genom att politiker vågar fattabeslut om tillfälliga projektekonomiska förluster men med långsiktiga positiva samhällseffekter.Bombings and shootings have increased in Sweden and some city districts seem to be more affected than others. Politicians are raising the stakes and proposing dramatic measures such as demolishing entire residential areas. However, research highlights the fundamental problems that have caused the increase in violence. Some of the factors that have been identified as contributing to the negative development are increased income inequality and segregation. Within the field of urban development, the relationship between spatialplanning and social issues is being discussed. In the city of Stockholm, social sustainability is more commonly implemented in urban development projects. However, this does not come without challenges. Partly because there is no standardized definition of the concept of social sustainability and because there is no consensus regarding whether there should be a standardized definition or not. Other challenges concern how policy should be implemented into practice and whether the effect of social measures in development projects areevaluated or not. This essay therefore aims to examine how the city of Stockholm has implemented social sustainability within urban development processes. The study has adopted an inductive approach in qualitative research methodology where interviews have been conducted with representatives from the city administrations and various construction companies regarding their experience and interpretation of how social sustainability has been implemented in specific projects. Another important aspect of urban development concerns the relationship between the landowner and the land. The theories that form the basis of the paper therefore concern land ownership, how the city of Stockholm's land policy has changed throughout history, implementation research, theories of evaluation, and various research on social sustainability in urban planning. The study shows that the relationship between the city of Stockholm's and its land is closely similar to the investment landownership who primarily considers land as a financial asset. The approach regarding the land allocation process shows how urban development in the city has long been driven by market initiatives and where requirements regarding social sustainability for construction companies are hardly followed up. The paper also discusses that many social measurements only focus on an individual level and the short-term effects. In conclusion, it is stated that regardless of how social sustainability is implemented within the City of Stockholm, a change in the city's land policy would be crucial to ensure a fair distribution of resources to all residential areas. For example, by ensuring that projects do not have to bear their own investments and by having politicians brave enough to decide ontemporary financial losses but with long-term positive social effects

    Platsskapande Aspekt av socialt engagemang inom offentlig konst och inkludering Fallstudie om Superkilen

    No full text
    This research is based on placemaking as a participatory approach to the design of public space, with particular attention to its artistic declinations. Starting from a reflection on the role of public art in urban regeneration, the thesis investigates how creative interventions can contribute to building inclusive and socially sustainable places.Through an interdisciplinary perspective combining urban planning, art, and social studies, the study focuses on the case of Superkilen, an urban park in Copenhagen’s multicultural district of Nørrebro. Acclaimed for its symbolic installations and the representation of over 60 cultures, Superkilen is critically analysed to highlight the tensions between aesthetics and real participation. The analysis shows how, despite the inclusive intent, the project risks turning into an operation of urban branding, more oriented to visibility than to social co-creation.The thesis uses a qualitative approach, based on field observations, documentary analysis, and study of secondary sources. The work was enriched by the internship experience at SIMKA, a multidisciplinary artistic practice based in Stockholm, whose creative method influenced the theoretical and methodological approach of the research. In particular, SIMKA’s approach, based on flexibility, site-specificity, and community involvement, is discussed as a possible design alternative that is more attentive to the context and participatory processes.Finally, the work proposes a reflection on the role of art in contemporary placemaking, underlining the need for practices capable of going beyond the symbolic dimension to generate truly shared and just spaces that are open to conflict and diversity.Forskningen baseras på placemaking som ett deltagande tillvägagångssätt för utformningen av det offentliga rummet, med särskild uppmärksamhet på dess konstnärliga deklinationer. Med utgångspunkt i en reflektion över den offentliga konstens roll i stadsförnyelse undersöker avhandlingen hur kreativa interventioner kan bidra till att bygga inkluderande och socialt hållbara platser.Genom ett tvärvetenskapligt perspektiv som kombinerar stadsplanering, konst och samhällsstudier fokuserar studien på Superkilen, en stadspark belägen i Köpenhamns mångkulturella stadsdel Nørrebro. Superkilen är hyllad för sina symboliska installationer och representationen av över 60 kulturer, och analyseras kritiskt för att belysa spänningarna mellan estetik och verkligt deltagande. Analysen visar hur projektet, trots den inkluderande avsikten, riskerar att förvandlas till en operation av urban branding, mer inriktad på synlighet än på socialt samskapande.Avhandlingen använder ett kvalitativt tillvägagångssätt, baserat på fältobservationer, dokumentanalys ochstudier av sekundära källor. Arbetet berikades av prakti- kupplevelsen på SIMKA, en multidisciplinär konstnärlig praktik baserad i Stockholm, vars kreativa metod påverkade forskningens teoretiska och metodologiska tillvägagångssätt. I synnerhet diskuteras SIMKA:s tillvägagångssätt - baserat på flexibilitet, platsspecificitet och samhällsengagemang - som ett möjligt design- alternativ som är mer uppmärksamt på sammanhanget och deltagandeprocesser.Slutligen föreslår arbetet en reflektion över konstens roll i samtida platsskapande, vilket understryker behovet av metoder som kan gå utöver den symboliska dimensionen för att skapa verkligt delade och rättvisa utrymmen, öppna för konflikt och mångfald

    Avskogning i den colombianska Amazonas : Fjärranalys, anpassningsstrategier och lokal påverkan

    No full text
    The deforestation in the Colombian Amazon has increased significantly, especially after the 2016 peace agreement with the FARC, current regions with the most critically affected parts are Meta and Guaviare.  This study examines changes in land use and vegetation between 2000 and 2020 in the regions with mixed methods. A combination of satellite-based time series analysis using the LandTrendr algorithm and qualitative interviews with local farmers and GIS experts within various institutions. Using NDVI and NBR indices, vegetation change over time is analyzed, while the interviews provide context to local drivers behind deforestation and adaptation strategies from local communities.  The results show patterns of forest conversion to pasture, impacts from illegal activities, and various local initiatives for reforestation and sustainable agriculture. This study highlights the importance of combining GIS with local knowledge to understand complex environmental changes and effective adaptation strategies that in turn contribute to two of the UN's global goals, 13 and 15: “Climate Action”, and “Life On Land”.Avskogningen i den colombianska Amazonas har ökat markant, särskilt efter fredsavtalet med FARC 2016, där regionerna Meta och Guaviare är de mest kritiskt påverkade.  Denna studie undersöker förändringar i markanvändning och vegetation mellan åren 2000 och 2020 i regionerna, genom blandade metoder. En kombination av satellitbaserad tidsserieanalys med LandTrendr-algoritmen och kvalitativa intervjuer med lokala jordbrukare och GIS-experter inom olika institutioner. Genom att använda NDVI och NBR index analyseras vegetationens förändring över tid, medan intervjuerna ger kontext till lokala drivkrafter bakom avskogningen samt anpassningsstrategier från lokalsamhällen.  Resultaten visar på mönster av skogsövergång till betesmark, påverkan från illegala aktiviteter och olika lokala initiativ för återbeskogning och hållbart jordbruk. Denna studie belyser vikten av att kombinera GIS med lokal kunskap för att förstå komplexa miljöförändringar och effektiva anpassningsstrategier som i sin tur bidrar till två av FN:s globala mål, 13 och 15: Bekämpa klimatförändringar, och ekosystem - och biologisk mångfald

    Förbättrad inlärning av lösningsoperatorer med hjälp av linjär approximation

    No full text
    Artificial neural networks have revolutionised the modelling of dynamic systems, offering a data-driven alternative to traditional differential equations. In this thesis, we study how to improve a state-of-the-art RNN-based architecture for learning flow functions of continuous-time control systems by integrating linearised system dynamics knowledge in the hypothesis space. The core problem addressed is whether embedding such prior knowledge can reduce the volume of required training data while improving prediction accuracy and training efficiency. This problem is significant in its complexity and impact. Learning models of high-dimensional nonlinear systems requires a large amount of data and computational resources. This project attempts to bridge the gap between theoretical modelling and practical implementation by combining data-driven learning with insights from linear system theory. To tackle the problem, we analyse in detail the RNN structure proposed in the baseline work. We then implemented a new architecture with a custom RNN cell which incorporates both hidden and system states. The cell update integrates the linearised dynamics, enabling the model to combine physics-informed and learned representations. The experimental results, validated on benchmark systems such as the Van der Pol oscillator, support our hypothesis. The modified architecture achieved comparable or improved accuracy using fewer training epochs, and outperformed the baseline architecture in test loss. These outcomes confirm that embedding approximate system knowledge within the network’s architecture enhances learning efficiency and generalisation. This work contributes to a hybrid modelling framework that can be extended to more complex dynamic systems.Artificiella neurala nätverk har revolutionerat modelleringen av dynamiska system och erbjuder ett datadrivet alternativ till traditionella differentialekvationer. I denna avhandling studerar vi hur man kan förbättra en toppmodern RNN-baserad arkitektur för inlärning av flödesfunktioner i kontinuerliga styrsystem, genom att integrera linjäriserad systemdynamikkunskap i hypotesutrymmet. Kärnproblemet som behandlas är huruvida inbäddning av sådan förkunskap kan minska volymen av nödvändig träningsdata samtidigt som prediktionsnoggrannheten och träningseffektiviteten förbättras. Detta problem är betydande i sin komplexitet och inverkan. Inlärningsmodeller av högdimensionella icke-linjära system kräver en stor mängd data och beräkningsresurser. Detta projekt försöker överbrygga klyftan mellan teoretisk modellering och praktisk implementering genom att kombinera datadrivet lärande med insikter från linjär systemteori. För att ta itu med problemet analyserar vi i detalj den RNN-struktur som föreslogs i baslinjearbetet. Vi implementerade sedan en ny arkitektur med en anpassad RNN-cell som innehåller både dolda och systemtillstånd. Celluppdateringen integrerar den linjäriserade dynamiken, vilket gör det möjligt för modellen att kombinera fysikinformerade och inlärda representationer. De experimentella resultaten, validerade på riktmärkessystem som Van der Pol-oscillatorn, stöder vår hypotes. Den modifierade arkitekturen uppnådde jämförbar eller förbättrad noggrannhet med färre träningsepoker och överträffade baslinjearkitekturen i testförlust. Dessa resultat bekräftar att inbäddning av approximativ systemkunskap i nätverkets arkitektur förbättrar inlärningseffektiviteten och generaliseringen. Detta arbete bidrar till ett hybridmodelleringsramverk som kan utökas till mer komplexa dynamiska system.Le reti neurali artificiali hanno rivoluzionato la modellazione dei sistemi dinamici, offrendo un’alternativa basata sui dati alle tradizionali equazioni differenziali. In questa tesi, studiamo come migliorare un’architettura all’avanguardia basata su RNN per l’apprendimento delle funzioni di flusso di sistemi di controllo a tempo continuo, integrando la conoscenza della dinamica dei sistemi linearizzata nello spazio delle ipotesi. Il problema principale affrontato è se l’integrazione di tale conoscenza pre-gressa possa ridurre il volume dei dati di addestramento richiesti, migliorando al contempo l’accuratezza delle previsioni e l’efficienza dell’addestramento. Questo problema è significativo per complessità e impatto. L’apprendimento di modelli di sistemi non lineari ad alta dimensionalità richiede una grande quantità di dati e risorse computazionali. Questo progetto cerca di colmare il divario tra la modellazione teorica e l’implementazione pratica combinando l’apprendimento basato sui dati con le intuizioni della teoria dei sistemi lineari. Per affrontare il problema, analizziamo in dettaglio la struttura RNN proposta nel lavoro di base. Abbiamo quindi implementato una nuova architettura con una cella RNN personalizzata che incorpora sia stati nascosti che stati di sistema. L’aggiornamento della cella integra la dinamica linearizzata, consentendo al modello di combinare rappresentazioni basate sulla fisica e apprese. I risultati sperimentali, validati su sistemi di riferimento come l’oscillatore Van der Pol, supportano la nostra ipotesi. L’architettura modificata ha raggiunto un’accuratezza comparabile o migliorata utilizzando un minor numero di epoche di addestramento e ha superato l’architettura di base in termini di perdita di test. Questi risultati confermano che l’integrazione di una conoscenza approssimativa del sistema all’interno dell’architettura della rete migliora l’efficienza di apprendimento e la generalizzazione. Questo lavoro contribuisce a un framework di modellazione ibrida che può essere esteso a sistemi dinamici più complessi

    Prognostisering av aggregerad elanvändning och produktion för portföljer med balansansvar : En jämförande studie med Transformer-, XGBoost- och LSTM-modeller

    No full text
    This thesis addresses the challenge of accurately forecasting day-ahead electricity consumption and production for bidding purposes in Nord Pool’s Day-Ahead Market. In this highly interconnected environment, even minor forecast errors can result in suboptimal bidding strategies and elevated imbalance costs for Balance Responsible Parties in the electricity system, highlighting the importance of robust and reliable prediction methods. In this study, the performance of Autoregressive Integrated Moving Average (ARIMA) as a baseline model is compared against more advanced approaches: Extreme Gradient Boosting (XGBoost), Long Short-Term Memory (LSTM) networks, and the Temporal Fusion Transformer (TFT). These models are evaluated based on their accuracy—measured through MAE, nMAE, MAPE, and RMSE—as well as interpretability, with the goal of identifying the most effective approach for day-ahead consumption and production forecasting. The results indicate that the Temporal Fusion Transformer demonstrates strong potential, achieving the lowest error metrics across the board among the models evaluated. Moreover, by leveraging Quantile Regression, TFT natively produces probabilistic prediction intervals, providing valuable uncertainty estimates without the need for external post-processing—a critical advantage for operational bidding under uncertainty. For the more challenging production case, a hybrid approach combining an XGBoost-based classifier with the TFT model further improved performance. The classifier outputs a probability of production per hour, which is then passed as a known real-valued input to the TFT model. This setup enhances the model’s ability to anticipate sparse and volatile production events, especially under high variance and zero-heavy regimes. Further, a simple theoretical framework for bidding optimization is proposed leveraging linear programming, in order to try to maximize revenue and minimize cost in the day-ahead market while staying risk-averse. By offering a clearer picture of future energy supply and demand, this forecasting framework can support more effective bidding strategies, reduce imbalance risks, and enhance overall market efficiency. This thesis makes a valuable contribution to the growing body of work in data-driven energy forecasting and lays the foundation for future research in hybrid modeling and real-time energy operations.Den här examensarbetet tar sig an utmaningen att prognostisera elförbrukning och elproduktion för budgivning i Nord Pools day-ahead-marknad. Även små prognosfel kan leda till sämre budstrategier och ökade obalanskostnader för balansansvariga parter i elsystemet, vilket gör robusta och tillförlitliga prognosmetoder extra viktiga. I studien jämförs en baslinjemodell, Autoregressive Integrated Moving Average (ARIMA), med mer avancerade metoder: Extreme Gradient Boosting (XGBoost), Long Short-Term Memory (LSTM) och Temporal Fusion Transformer (TFT). Modellerna utvärderas baserat på noggrannhet (mätt i MAE, nMAE, MAPE och RMSE) samt tolkbarhet, med målet att hitta den bästa metoden för dag-för-dag-prognoser av förbrukning och produktion. Resultaten visar att Temporal Fusion Transformer presterar bäst, med de lägsta felen i alla mätningar. Tack vare kvantilsregression kan TFT dessutom direkt generera probabilistiska prognosintervall, vilket innebär att osäkerheten i prognoserna fångas utan att behöva lägga till extra beräkningar i efterhand— en viktig fördel vid budgivning under osäkra förhållanden. För den mer utmanande produktionsdatan förbättrades resultaten ytterligare med en hybridmodell, där ett XGBoost-baserat klassificeringslager förutser sannolikheten för överproduktion varje timme. Dessa sannolikheter används som kända indata i TFT-modellen och ger en bättre grund för att hantera sparsamma och volatila produktionsmönster. Utöver detta så framhävs en simpel och risk-avers budgivningsstrategi baserad på linjärprogrammering för att maximera intäkter och minimera kostnader från day-ahead marknaden. Genom att ge en tydligare bild av framtida elproduktion och efterfrågan kan det här prognosramverket bidra till bättre budstrategier, minskad obalans och effektivare marknadsdeltagande. Rapporten bidrar med nya insikter inom datadriven energiprognostisering och lägger en grund för fortsatt forskning kring hybridmodeller och operativ energihantering

    0

    full texts

    57,933

    metadata records
    Updated in last 30 days.
    Publikationer från KTH
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇