Publikationer från KTH
Not a member yet
57933 research outputs found
Sort by
Cycloidal Gearbox Performance Characterization Using a Testing Rig : Automated Benchmarking and Performance Analysis of Cycloidal Gearboxes
Cycloidal gearboxes combine high reduction and precision, compact form, and stiffness,making them the preferred choice for articulating robot joints. At ABB’s robotics departmentin Västerås a heavy-duty test rig was built intended to benchmark such gearboxes, but the setupwas mostly unused and lacked automation. This project converted the rig into a measurementplatform ready to use. Mechanical limitations such as vibrations and unwanted friction weremitigated, a configurable logger enabled high frequency data capture, and a Python PID loopapplied precise bidirectional torque. Repeatable protocols were established for lost motion,hysteresis, torsional stiffness, efficiency/friction, and transmission error; results are averagedover multiple cycles and angular positions to suppress noise and reveal periodic effects. Atool for analysis was developed in Python that produces plots and summary tables, allowingranking of candidate gearboxes quantitatively. Validation on a new and a 50% L10 life RotaryVector (RV) reducer showed the used unit had 20% greater lost motion, 20% lower hysteresis,13% lower stiffness, and roughly double RMS transmission error. This work turns formerlylabor-intensive testing into a fully automated process. Future upgrades should add temperaturecontrol and monitoring as well as upgrading of axis output shaft bending capabilities with loadcells and friction compensation.
Utvärdering av effekten av Adaptive Instance Normalization-baserad stilöverföring på klassificering av anatomiska fosterplan
This thesis investigates how style transfer, used as a domain adaptation method, on synthetic data influences the performance of convolutional neural networks (CNNs) in fetal plane classification. The synthetic fetus data set, FPUS23, consisted of 9,550 images and included four anatomical planes: abdomen, head, arms and legs. The real world data set, FETAL_PLANES_DB, had in total 12,400 images, where 6,561 images had anatomical plane labeling. The images of FPUS23 were manipulated using an adaptive instance normalization (AdaIN) based style transfer method with a real sonogram as style reference, generating a data set with styled phantom sonograms. Seven models were trained in total. All of them, except the baseline that only used ImageNet weights, were pre-trained on either style transferred phantom fetal sonograms, unstyled phantom fetal sonograms or a combination of both. Three models also used the weights with ImageNet. Lastly, all models were fine-tuned and evaluated with real sonograms. The results revealed that the introduction of styled sonograms did not significantly improve model performance. The highest accuracy was achieved by a model trained on a combined data set using ImageNet weights. Despite being trained on double the data, it only scored one tenth of a percentage unit higher than the model pre-trained solely on ImageNet and FPUS23. This study concludes that AdaIN-based style transfer is ineffective for domain adaptation from phantom to real-world fetal sonograms. We encourage future work to explore alternative style transfer methods, the impact of ultrasound machine texture variations on model performance and how different ratios of styled, unstyled and real data may improve performance.Denna studie undersöker hur stilöverföring som domänanpassning på syntetisk data påverkar prestandan hos konvolutionella neurala nätverk (CNN) vid klassificering av anatomiska fosterplan. Den syntetiska datamängden, FPUS23, bestod av 9 550 bilder och omfattade fyra anatomiska plan: buk, huvud, armar och ben. Datamängden med riktiga ultraljudsbilder, FETAL_PLANES_DB, hade totalt 12 400 bilder, varav 6 561 bilder visade anatomiska fosterplan. Bilderna i FPUS23 manipulerades med en adaptive instance normalization (AdaIN) baserad stilöverföringsmetod med en riktig ultraljudsbild som stilreferens. Sju modeller tränades totalt. Baseline-modellen använde vikter från ImageNet och finjusterades på äkta ultraljudsbilder. Resten av modellerna förtränades antingen på stilöverförda syntetiska ultraljudsbilder, de originella ultraljudsbilderna eller en kombination av båda. Tre modeller använde även ImageNets vikter. Slutligen finjusterades och utvärderades alla modeller med de riktiga ultraljudsbilderna. Resultaten visade att användingen av stilöverförda ultraljudsbilder inte förbättrade modellernas prestanda avsevärt. Den högsta noggrannheten uppnåddes av en modell tränad på en kombinerad datamängd och som använde ImageNets vikter. Trots att den tränades på dubbelt så mycket data presterade den bara en tiondels procentenhet bättre än modellen som endast förtränats på FPUS23 med ImageNets vikter. Slutsatsen från denna studie är att AdaIN-baserad stilöverföring är ineffektiv för domänanpassning från syntetiska ultraljudsbiler till verkliga bilder. Framtida studier kan utforska alternativa stilöverföringsmetoder, inverkan av variationer i ultraljudstexturer från olika maskiner samt hur olika andelar stiliserade, originella och verkliga ultraljudsbilder kan påverka prestandan
Tolkning av dödsmekanismer hos gamma-delta T-celler med maskininlärningn
Gamma-delta (γδ) T-cells represent a unique and promising subset of immune cells with potential applications in cancer immunotherapy. However, the fundamental mechanisms underlying their cellular behavior remain poorly understood. This thesis aims to bridge this gap by studying their killing behavior patterns through machine learning and explainable artificial intelligence techniques. By developing a supervised and unsupervised computational framework, this research aims to identify the key features that predict γδ T-cell fate at the earliest possible time point from a live-cell image sequence and assess their biological relevance to determine the trustworthiness of the model. The methodology integrates specialized image pre-processing to segment the nuclei of the live-cell imagery, classification techniques based on the pretrained models ResNet101 and VGG16, and interpretable machine learning models to uncover previously unknown phenotypic differences. The study employs the AI4CellFate method, which encompasses an adversarial autoencoder and latent space perturbations for visualization of biologically relevant features. Our research reveals that machine learning can effectively distinguish between surviving and dying cells, with classification accuracy significantly improving as the cellular killing process progresses, particularly using ResNet101. Crucially, our explainable AI approach unveils the biological significance of the model’s decision-making process. Two key features are found as primary drivers of cell fate prediction: distinctive morphological changes and fluorescence intensity variations. This work not only advances our understanding of γδ T-cell mechanisms but also validates the potential of machine learning in immunological research by demonstrating that predictive models can extract biologically meaningful insights.Gamma-delta (γδ) T-celler utgör en unik och lovande undergrupp av immunceller med potentiella tillämpningar inom immunterapi av cancer. De grundläggande mekanismer som ligger till grund för deras cellulära beteende är dock fortfarande dåligt kända. Denna avhandling syftar till att överbrygga detta gap genom att studera deras dödande beteendemönster genom maskininlärning och förklarbara tekniker för artificiell intelligens. Genom att utveckla ett övervakat och oövervakat beräkningsramverk syftar denna forskning till att identifiera de viktigaste egenskaperna som förutsäger T-cellernas öde vid tidigast möjliga tidpunkt från en bildsekvens med levande celler och bedöma deras biologiska relevans för att avgöra modellens tillförlitlighet. Metoden integrerar specialiserad bildförbehandling för att segmentera kärnorna i live-cellbilderna, klassificeringstekniker baserade på de förtränade modellerna ResNet101 och VGG16 samt tolkningsbara maskininlärningsmodeller för att upptäcka tidigare okända fenotypiska skillnader. I studien används AI4CellFate-metoden, som omfattar en adversarial autoencoder och latenta rymdstörningar för visualisering av biologiskt relevanta funktioner. Vår forskning visar att maskininlärning effektivt kan skilja mellan överlevande och döende celler, med en klassificeringsnoggrannhet som förbättras avsevärt i takt med att celldödsprocessen fortskrider, särskilt med ResNet101. Avgörande är att vårt förklarbara AI-tillvägagångssätt avslöjar den biologiska betydelsen av modellens beslutsprocess. Två viktiga egenskaper upptäcks som primära drivkrafter för förutsägelse av cellöde: distinkta morfologiska förändringar och variationer i fluorescensintensitet. Detta arbete främjar inte bara vår förståelse av T-cellsmekanismerna γδ utan validerar också potentialen för maskininlärning inom immunologisk forskning genom att visa att prediktiva modeller kan extrahera biologiskt meningsfulla insikter
Effekten av tidig användbarhetstestning på användbarhetsmått för en prototyp av ett verktyg för hållbarhetsworkshop : Utvärdering av användbarhetsförbättringar från Mellan-Fidelity till Hög-Fidelity Prototyp inom Design Thinking Ramverket
This thesis investigates how gathering early user feedback from mid-fidelity (wireframe) prototype influences the usability metrics of the final version of high-fidelity prototype, within the Design Thinking framework. In UX (user-experience) design, deciding the right time for starting usability testing is challenging, and the impact of early user feedback is often unclear and understudied. This study, while following the design thinking process to design a user interface, incorporates early and iterative usability testing from interactive wireframe prototype to examine how early user feedback contributes to refining and improving the usability of the high-fidelity prototype of the tool. The usability testing focuses on measurable metrices which are- Task Completion Time, Task Success Rate, System Usability Scale (SUS), and Single Ease Question (SEQ) scores. A medium-fidelity interactive prototype was tested early with five users, and based on user feedback the prototype was refined into high-fidelity and retested with different users to see the change in the usability metrics. The findings from this study reveal that conducting early usability testing resulted in significant and measurable benefits, and that is evidenced by the improved task success rate by 4% (indicates increased effectiveness), decreased task completion time by nearly 5% (indicates increased efficiency), and improved SUS scores by nearly 12% (indicates increased satisfaction). Moreover, the SEQ scores dropped by 7.14%, which highlighted the potential areas for improvement and the need for more design iterations. These findings will guide the UX practitioners or design teams to take more informed decisions regarding when and how to conduct usability testing for better results.Den här examensarbete undersöker hur insamling av tidig användarfeedback från mid-fidelity (wireframe) prototyp påverkar användbarhetsmåtten för den slutliga versionen av en high-fidelity prototyp, inom ramverket för Design Thinking. Inom UX (användarupplevelse) design är det utmanande att bestämma rätt tid för att starta användbarhetstestning, och effekten av tidig användarfeedback är ofta oklar och understuderad. Denna studie, som följer design thinking-processen för att designa ett användargränssnitt, integrerar tidig och iterativ användbarhetstestning från interaktiva wireframe-prototyp för att undersöka hur tidig användarfeedback bidrar till att förfina och förbättra användbarheten hos verktygets high-fidelity prototyp. Användbarhetstestningen fokuserar på mätbara mätvärden som är - Task Completion Time (tid för uppgiftsslutförande), Task Success Rate (lyckfrekvens för uppgifter), System Usability Scale (SUS) och Single Ease Question (SEQ) poäng. En interaktiv prototyp med medium-fidelity testades tidigt med fem användare, och baserat på användarfeedback förfinades prototypen till high-fidelity och testades om med olika användare för att se förändringen i användbarhetsmåtten. Resultaten från denna studie visar att tidiga användbarhetstester resulterade i betydande och mätbara fördelar, vilket framgår av en förbättrad framgångsgrad för uppgifter med 4 % (indikerar ökad effektivitet), minskad slutförandetid för uppgifter med nästan 5 % (indikerar ökad effektivitet) och förbättrade SUS-poäng med nästan 12 % (indikerar ökad nöjdhet). Dessutom minskade SEQ-poängen med 7,14 %, vilket belyste potentiella förbättringsområden och behovet av fler designiterationer. Dessa resultat kommer att vägleda UX-utövare eller designteam att fatta mer välgrundade beslut om när och hur användbarhetstester ska genomföras för bättre resultat
Utvärdering av metoder för procedurell generation av vegetationsfördelning : Att balansera beräkningseffektivitet och visuell trovärdighet
Within the field of video game creation and design, procedural generation (PCG) is often applied to limit the time and financial effort required to create feasible virtual environments. One particular area of PCG that plays a large role in the visual fidelity of virtual worlds is procedural vegetation generation (PVG), in which virtual worlds are enriched with vegetation. As these methods become more complex, they place a greater demand on computational hardware. This in turn limits the accessibility of video game design to those with the economy to keep up with increased hardware demands. This thesis aimed to evaluate methods of PVG in relation to their computational demand and visual fidelity of the outcome, to determine which method is best suited to achieve a balance between the two fields, and as such is best suited for video game creation for those without advanced computational hardware. Three methods of procedural vegetation generation were evaluated and compared: Perlin Noise Distribution (PND), Poisson Disk Sampling Distribution (PDD) and Field-of-Neighborhood (FON). Through the Unity game engine, a 3D terrain was created and enriched with vegetation using each of the three methods. Each method placed four different 3D models of vegetation: a large conifer tree, a medium and a small deciduous tree, and a patch of grass. The aim was to utilize the methods to create a virtual version of a mixed forest with both types of trees, common in many countries around Europe. By implementing these methods and evaluating their computational efficiency in terms of processing time, a conclusion could be drawn on the most efficient method. Through a user study consisting of 25 participants, where each participant navigated through the different worlds from a first person perspective, the visual fidelity of each method could then be evaluated and ranked according to the best visual outcome. The results suggest that PND is the most computationally efficient method, but also the worst method in relation to visual fidelity. Both PDD and FON ranked high in terms of visual fidelity, with PDD receiving slightly higher scores. PDD also had a shorter processing time and was thus the most efficient of the two methods. The conclusions drawn from the results suggest that the best method of PVG to utilize when aiming for a balance between computational demand and visual fidelity is the Poisson Disk Sampling Distribution (PDD).Inom området av skapande och design av datorspel appliceras ofta procedurell generation (PCG) för att begränsa den tid och ekonomiska insats som krävs för att skapa trovärdiga visuella miljöer. Ett specifikt område inom PCG som spelar en stor roll i den visuella trovärdigheten av virtuella världar är procedurell generation av vegetation (PVG), i vilken virtuella världar blir berikade med vegetation. När dessa metoder blir mer komplexa ställer de större krav på datorhårdvara. Detta begränsar tillgängligheten av datorspelsdesign till de med ekonomin att följa dessa ökade krav på hårdvara. Genom utvärdering av beräkningseffektivtet och visuell trovärdighet med faktorerna behandlingstid och upplevd realism, ämnade detta examensarbete att utvärdera metoder för PVG och deras lämplighet för att uppnå en balans mellan de två områdena, och på så sätt avgöra vilken metod som är bäst lämpad för datorspelsdesign för de med begränsad datorhårdvara. Tre metoder av procedurell generation utvärderades och jämfördes: Perlin Noise Distribution (PND), Poisson Disk Sampling Distribution (PDD) och Field-Of-Neighborhood (FON). Genom spelmotorn Unity skapades en 3D terräng som därefter berikades med vegetation med hjälp av var och en av de tre metoderna. Varje metod placerade fyra olika 3D modeller av vegetation: ett stort barrträd, ett mellanstort lövträd och ett litet lövträd, och en gräsfläck. Målet var att använda metoderna för att skapa en virtuell version av en blandskog med både barr- och lövträd, en skog som är vanlig i många länder runtom Europa. Genom att implementera dessa metoder och utvärdera deras beräkningseffektivitet genom faktorn behandlingstid kunde en slutsats dras om den mest effektiva metoden. Genom en användarstudie med 25 deltagare, där deltagarna fick ta sig genom alla tre världar i ett förstapersons perspektiv, kunde den visuella trovärdigheten av varje metod utvärderas och rankas i enlighet med det bästa visuella resultatet. Resultaten tyder på att den mest beräkningseffektiva metoden av PVG var PND, men PND var även den metod med minst visuell trovärdighet. Både PDD och FON rankade högt i relation till deras visuella trovärdighet, där PDD fick något högre poäng. PDD hade även en lägre behandlingstid och var därav den mest effektiva av de två metoderna. Därav är slutsatsen av resultaten att den bästa metoden av PVG att använda, när en balans mellan beräkningseffektivitet och visuell trovärdighet eftersträvas, är Poisson Disk Sampling Distribution
En jämförande studie av GPT-4o och ett modernt ALPR-systems prestanda på multinationella registreringsskyltar : Utvärdering av modellens noggrannhet för olika landspecifika registreringsskyltformat
In an increasingly globalized context, where traffic is becoming more populated by vehicles from different parts of the world, ALPR systems often struggle to accurately identify unfamiliar country-specific license plate formats and designs. This study evaluates the accuracy performance of the multimodal AI model GPT-4o, with its advanced vision capabilities, against a state-of-the-art ALPR system, for the challenging task of identifying diverse multinational license plates. Both models were tested on a diverse range of datasets with images containing plates from nine countries, including European, Eurasian, and South American countries. For evaluation, the models were tested on plate-level; measuring accuracy as the percentage of correctly predicted license plates out of the total ground truth, and on character-level measuring the error rate on individual license plate characters. A Mcnemar test, z-test, and paired t-tests was applied to assess the statistical significance of the performance differences. Results show that GPT-4o achieves overall accuracy comparable to the ALPR, and in some cases superior, especially when recognizing country-specific license plate formats unfamiliar to the ALPR. This highlights the potential of GPT-4o in solving tasks in the license plate recognition domain, without the necessity of fine-tuning or training on specific formats. However, previous studies show that some fine-tuned real-time ALPR solutions will achieve superior performance, making GPT-4o a promising solution as a fallback on the employed ALPR, in environments where license plate formats can be expected to be diverse.I en alltmer globaliserad kontext, där trafiken i ökande grad består av fordon från olika delar av världen, har ALPR-system ofta svårt att korrekt identifiera land-specifika registreringsskyltar med ovanliga format och utseenden. Denna studie utvärderar noggrannheten hos den multimodala AI-modellen GPT-4o, med dess avancerade visuella förmågor, jämfört med ett modernt ALPR-system, för den utmanande uppgiften att identifiera olika multinationella registreringsskyltar. Båda modellerna testades på ett brett urval av dataset med bilder innehållande skyltar från nio olika länder, inklusive europeiska, euroasiatiska och sydamerikanska länder. För utvärdering testades modellerna på skylt-nivå, där noggrannheten mättes som andelen korrekt identifierade registreringsskyltar av det totala antalet faktiska skyltar, samt på teckennivå där felprocenten på enskilda tecken i registreringsskyltarna mättes. Ett McNemar-test, z-test och parat t-test användes för att bedöma den statistiska signifikansen av prestandaskillnaderna. Resultaten visar att GPT-4o uppnår en total noggrannhet som är jämförbar med ALPR-systemet, och är i vissa fall överlägsen, särskilt vid identifiering av land-specifika registreringsskyltar som är obekanta för ALPR-systemet. Detta belyser potentialen hos GPT-4o att lösa uppgifter inom området för registreringsskyltigenkänning utan behov av finjustering eller träning på specifika skyltformat. Tidigare studier visar dock att vissa finjusterade ALPR system med realtidslösningar kan prestera bättre, vilket gör GPT-4o till en potentiell lösning som ett komplement eller reservsystem till befintliga ALPR-system, särskilt i miljöer där en bred skara av skyltformat kan förväntas
AI as a Tool for Objective News Summarization : An experimental study of Perplexity AI
As AI-based search tools such as Perplexity AI become increasingly accessible and efficient, questions arise regarding the objectivity of the news summaries they generate. This study is grounded in theories from natural language processing (NLP) and sentiment analysis, where objectivity is defined as a function of two quantitative measures: polarity (emotional direction) and intensity (subjectivity). To assess Perplexity AI’s ability to generate news summaries, an experimental study was conducted using 20 different news topics. The generated summaries were compared with their referenced sources in terms of polarity and intensity, analyzed using the Google Cloud Natural Language API. In addition, a qualitative review of the types, availability, and distribution of the cited sources was performed. An interview with an AI director at a news organization was also conducted to provide further insight into Perplexity AI’s performance and the media industry's views on AI-based tools. The results showed that Perplexity AI's summaries had, on average, 33% higher polarity and 7.6% higher intensity compared to the sources they referenced, indicating a certain amplification of emotional tone. At the same time, the analysis revealed that most sources were drawn from established and credible outlets such as SVT. AI tools like Perplexity AI can serve as a support for news consumption, but should be used with awareness of their tendency to amplify emotional expressions and their reliance on the availability of trustworthy sources.I takt med att AI-baserade sökverktyg som Perplexity AI blir allt mer tillgängliga och effektiva, väcks frågan om hur objektiva nyhetssammanfattningar som genereras av sådana verktyg faktiskt är. Studien utgår från teorier inom naturlig språkbehandling (NLP) och sentimentanalys, där objektivitet definieras som en funktion av två kvantitativa mått: polaritet (emotionell riktning) och intensitet (subjektivitet). För att undersöka Perplexity AI:s förmåga att generera nyhetssammanfattningar genomfördes en experimentell studie där Perplexity AI testades med 20 olika nyhetsämnen. De genererade sammanfattningarna jämfördes med dess refererade källor med avseende på polaritet och intensitet som analyserades med hjälp av Google Cloud Natural Language API. Utöver detta genomfördes en kvalitativ granskning av källornas typ, tillgänglighet och fördelning. Efter undersökningen genomfördes en intervju med en AI-direktör på ett nyhetsföretag för att ge kommentarer kring Perplexity AI:s prestation samt medieaktörers ställningstagande till AI-baserade sökverktyg. Resultatet visade att Perplexity AI:s sammanfattningar i genomsnitt hade 33 % högre polaritet och 7,6 % högre intensitet jämfört med sina källor, vilket tyder på en viss förstärkning av känsloladdning. Samtidigt visar analysen att majoriteten av källorna kommer från etablerade och trovärdiga aktörer såsom SVT. AI-verktyg som Perplexity AI kan användas som stöd för nyhetskonsumtion, men bör användas med medvetenhet om dess benägenhet att förstärka känslouttryck och beroende av tillgång till trovärdiga källor
Adaptiv aktiehandel med Ichimoku Cloud och förstärkningsinlärning : Utvärdering av aktiehandel med Ichimoku Cloud och förstärkningsinlärning i olika marknadsregimer jämfört med en köp-och-behåll-strategi
Reinforcement Learning (RL) has gained increasing interest as a potential tool for developing data-driven trading strategies in financial markets. Traditional passive investment strategies, such as Buy-and-Hold, can underperform under certain market conditions, highlighting the need for more adaptive approaches. This thesis examines how a trading strategy based on reinforcement learning, using Proximal Policy Optimization (PPO) combined with the technical indicator Ichimoku Cloud, can outperform the Buy-and-Hold strategy across different market environments. The RL agent is trained on a continuous historical period containing a mix of bull, bear, and sideways markets to enable generalization across varying trends. The trained policy is then evaluated separately on selected periods representing bull, bear, and sideways markets. Performance is assessed quantitatively based on total return, Sharpe ratio, and maximum drawdown from an initial investment. The results indicate that the RL agent, integrating Ichimoku Cloud signals into its decision-making process, showed promising performance relative to the Buy-and-Hold strategy in both sideways and bear markets. During bull markets, however, Buy-and-Hold consistently outperformed the RL agent, which aligns with expectations in strongly trending environments. The developed RL+Ichimoku strategy thus demonstrated a strong ability to adapt to varying market conditions, particularly by limiting losses and managing risk in more challenging market environments. These findings support the hypothesis that a well-designed reward function, combined with technical indicators, can help shape adaptive and robust AI-based trading behaviors.Förstärkningsinlärning (Reinforcement Learning, RL) har fått allt större uppmärksamhet som ett verktyg för att utveckla datadrivna handelsstrategier på finansmarknaden. Traditionella passiva investeringsstrategier, såsom Buy-and-Hold, tenderar att underprestera under vissa marknadsförhållanden, vilket belyser behovet av mer adaptiva angreppssätt. Denna avhandling undersöker hur en handelsstrategi baserad på förstärkningsinlärning, med hjälp av Proximal Policy Optimization (PPO) i kombination med den tekniska indikatorn Ichimoku Cloud, står sig i jämförelse med en Buy-and-Hold-strategi i olika marknadsmiljöer. RL-agenten tränas på en kontinuerlig historisk period som innehåller en blandning av bull-, bear- och sidledesmarknader för att möjliggöra generalisering över olika trender. Den tränade policyn utvärderas därefter separat på utvalda perioder som representerar bull-, bear- och sidledesmarknader. Prestandan utvärderas kvantitativt baserat på total avkastning, Sharpe-kvot och maximal nedgång från en initial investering. Resultaten visar att RL-agenten, som integrerar Ichimoku Cloud-signaler i sitt beslutsfattande, uppvisade lovande resultat i jämförelse med Buy-and-Hold-strategin under både sidledes- och bear-marknader. Under bull-marknader presterade dock Buy-and-Hold-strategin konsekvent bättre än RL-agenten, vilket är i linje med förväntningarna i starkt uppåtgående marknadsmiljöer. Den utvecklade RL+Ichimoku-strategin visade därmed god förmåga att anpassa sig till varierande marknadsförhållanden, särskilt genom att begränsa förluster och hantera risk i mer utmanande miljöer. Dessa resultat stöder hypotesen att en väl utformad belöningsfunktion, i kombination med tekniska indikatorer, kan bidra till att forma adaptiva och robusta AI-baserade handelsbeteenden
An Empathetic Conversational Agent for Pain Self-Management and Well-Being
Chronic pain is highly prevalent and persistent, affecting a significant portion of the global population and causing reduced quality of life. Its complex nature requires a multifaceted, multidisciplinary approach that integrates medical, physical, psychological, and social interventions to achieve the best outcomes for patients. In recent years, digital health interventions have emerged as promising tools to support chronic pain management, aiming to enhance self-management. However, despite their potential, a major challenge for digital health interventions remains long-term user engagement and adherence, which can limit the effectiveness of these tools and undermine their benefits for chronic pain management. Among emerging digital health technologies, conversational agents represent a particularly underexplored yet promising avenue for chronic pain management. This study explores how an empathetic conversational agent, named Lindra (meaning ”Relief” in Swedish), can provide support and evidence-based interventions that complement existing pain management approaches. The research follows an iterative and user-centered methodology based on the Information Systems Research (ISR) framework, utilizing Hume AI’s Empathic Voice Interface (EVI) and Claude Sonnet 3.5 for developing an empathetic conversational agent that integrates cognitive behavioral therapy techniques, empathy-driven dialogue, and personalization. The pilot study employs mixed methods, including quantitative analysis through the Bot Usability Scale (BUS) and Motivation, Engagement, Thriving in User Experience (METUX) scales measuring psychological need satisfaction based on Self-Determination Theory, alongside qualitative analysis via think-aloud and semi-structured interviews with 9 adults with self-reported chronic pain. Participants reported multiple perceived benefits including 24/7 accessibility, non-judgmental support, emotional validation, practical guidance, and companionship, with the agent’s empathetic voice delivery being particularly valued. Preliminary results demonstrate that Lindra successfully supported users’ psychological needs, with participants reporting excellent autonomy support and competence support for pain self-management tasks. Cognitive Behavioral Therapy (CBT) techniques were effectively integrated, with cognitive restructuring, behavioral activation, and relaxation techniques providing immediate stress relief and emotional regulation support. Personalization emerged as a critical factor, with user profiles containing preferences and personality traits enhancing all three psychological needs and contributing to sustained engagement. In summary, this pilot study offers a user-centered framework for developing empathetic conversational agents, provides insights into the integration of CBT techniques, and reveals how personalization can enhance user motivation and engagement through the fulfillment of fundamental psychological needs. These preliminary findings inform future development of complementary digital health solutions that can support sustained user engagement and treatment adherence in chronic pain management.Kronisk smärta är mycket utbredd och ihållande, och påverkar en betydande del av den globala befolkningen samt orsakar försämrad livskvalitet. Dess komplexa natur kräver en mångfacetterad, tvärvetenskaplig strategi som integrerar medicinska, fysiska, psykologiska och sociala interventioner för att uppnå bästa möjliga resultat för patienter. Under de senaste åren har digitala hälsointerventioner framträtt som lovande verktyg för att stödja kronisk smärthantering, med syfte att förbättra självhantering. Trots deras potential kvarstår dock en stor utmaning för digitala hälsointerventioner i form av långsiktigt användarengagemang och uppföljning, vilket kan begränsa effektiviteten av dessa verktyg och undergräva deras fördelar för kronisk smärthantering. Bland framväxande digitala hälsotekniker representerar konversationsagenter en särskilt outforskad men ändå lovande väg för kronisk smärthantering. Denna studie undersöker hur en empatisk konversationsagent, som heter Lindra, kan ge stöd och empiriskt bevisade interventioner som kompletterar befintliga smärthanteringsmetoder. Forskningen följer en iterativ och användarcentrerad metodik baserad på Information Systems Research (ISR)-ramverket, Hume AI:s Empathic Voice Interface (EVI) och Claude Sonnet 3.5 för att utveckla en empatisk konversationsagent som integrerar kognitiv beteendeterapi-tekniker, empatidriven dialog och personalisering. Pilotstudien använder blandade metoder, inklusive kvantitativ analys genom Bot Usability Scale (BUS) och Motivation, Engagement, Thriving in User Experience (METUX)-skalor som mäter psykologisk behovstillfredsställelse baserat på självbestämmandeteori, tillsammans med kvalitativ analys via think-aloud och semistrukturerade intervjuer med nio vuxna med självrapporterad kronisk smärta. Deltagarna rapporterade flera upplevda fördelar inklusive 24/7-tillgänglighet, icke-dömande stöd, emotionell validering, praktisk vägledning och sällskap, där agentens empatiska röstleverans särskilt värderades. Preliminära resultat visar att Lindra framgångsrikt stödde användarnas psykologiska behov, med deltagare som rapporterade utmärkt autonomistöd och kompetensstöd för självhantering av smärta. Kognitiv beteendeterapi (KBT)-tekniker integrerades effektivt, där kognitiv omstrukturering, beteendeaktivering och avslappningstekniker gav omedelbar stresslindring och emotionell regleringsstöd. Personalisering framträdde som en kritisk faktor, där användarprofiler innehållande preferenser och personlighetsdrag förstärkte alla tre psykologiska behov och bidrog till hållbart engagemang. Sammanfattningsvis erbjuder denna pilotstudie ett användarcentrerat ramverk för utveckling av empatiska konversationsagenter, ger insikter i integrationen av KBT-tekniker, och avslöjar hur personalisering kan förbättra användarmotivation och engagemang genom uppfyllandet av grundläggande psykologiska behov. Dessa preliminära insikter informerar framtida utveckling av kompletterande digitala hälsolösningar som kan stödja hållbart användarengagemang och uppföljning av behandling inom kronisk smärthantering
En komparativ studie av bytekod i Scala 2 och 3 och dess inverkan på parsningsalgoritmer
This thesis investigates how the compiler-generated JVM bytecode changes from Scala 2 to Scala 3, and what those changes imply for a bytecode parsing algorithm. Bytecode parsing has many use cases, such as debugging, performance optimization and static code analysis. However, knowledge of the bytecode structure is necessary when designing parsing algorithms. When bytecode changes are introduced, such as with the release of a new compiler version, existing algorithms need to be adapted. As a case study, this thesis uses Modbat, a model-based testing tool that relies on parsing to retrieve debugging information when reporting a failed test case. Modbat is written in Scala 2 and updating such a tool to Scala 3 can be challenging since the structure of Scala 3 bytecode is different. This work thus consists of a comparison of generated bytecode, from Scala 2.11 through Scala 3.4, mainly focusing on the compilation of lambda expressions and function references. In addition, TASTy files, generated by the Scala 3 compiler that contain metadata about the source code, are investigated as an alternative to bytecode for retrieving debugging information. Small example programs, as well as Modbat system models, were compiled for comparison. We catalog identified bytecode differences and discuss their implications for bytecode parsing. We find that the bytecode overall is smaller and simpler, in terms of the number of methods and class files, in Scala 2.12 and later, potentially leading to simpler algorithms. This is mainly due to functional objects being created at runtime, rather than being implemented as individual classes in bytecode. We also find that debugging information, including source files and line numbers of functions, can be reconstructed from TASTy files and could thus serve as an alternative to bytecode for parsing. The results of this thesis is of interest to programmers writing bytecode parsing algorithms for Scala 3, especially those who are updating existing tools from Scala 2 to Scala 3.Denna avhandling undersöker hur kompilerargenererad JVM-bytekod ändras från Scala 2 till Scala 3, och vad dessa ändringar har för implikationer för algoritmer som parsar bytekod. Bytekodparsning har många användningsfall, som felsökning, prestandaoptimering och statisk kodanalys. Kunskap av byte-kodens struktur är dock nödvänding för design av bytekodparsningsalgoritmer. När ändringar i bytekoden introduceras, exempelvis när en ny version av kompilatorn släpps, måste existerande algoritmer anpassas. Som en fallstudie används Modbat, ett modellbaserat testningsverktyg som använder parsning för att hämta felsökningsinformation för att rapportera misslyckade testfall. Modbat är skrivet i Scala 2, och uppdatering av ett sådant verktyg till Scala 3 kan vara svårt eftersom bytekodstrukturen är annorlunda i Scala 3. Detta arbete innefattar därmed en jämförelse av genererad bytekod, från Scala 2.11 till Scala 3.4, med focus på kompilering av lambdauttryck och funktionreferenser. Dessutom undersöks TASTy-filer, genererade av Scala 3-kompilatorn som innehåller metadata om källkoden, som ett alternativ för bytekod i hämtning av felsökningsinformation. Små exempelprogram och systemmodeller från Modbat kompileras för jämförelse. Vi katalogiserar skillnader i bytekoden och diskuterar deras inverkan på bytekodparsning. Vi finner att bytekoden överlag är mindre och enklare, i termer av antalet metoder och klassfiler, i Scala 2.12 och senare, vilket potentiellt kan leda till enklare algoritmer. Detta är främst på grund av att funktionella object skapas vid körning, i stället för att implementeras som individuella klasser i bytekoden. Vi finner också att felsökningsinformation, inklusive källkodsfiler och radnummer av funktioner, kan rekonstrueras från TASTy-filer och kan därmed fungera som ett alternativ till bytekod för parsning. Dessa resultat är av intresse för programmerare som skriver bytekodparsningsalgoritmer för Scala 3, särskilt de som uppdaterar existerande verktyg från Scala 2 till Scala 3