1,720,970 research outputs found

    Transparency and Explainability in Financial Data Science

    Full text link
    Financial data science has experienced rapid developments in recent years with the expansion of ever-growing data at an exponential rate. The proponents of data science argue that data science techniques will dominate and improve many domains of science in the next decades. However, several critics and concerns remain about its widespread adoption in the financial field due to the absence of transparency and explainability in the current generation of data science techniques. For instance, researchers’ limited access to valuable data restrict the scientific developments and their benefits to both the academic community and industries. Additionally, while some state-of-the-art data science techniques, such as deep neural networks, have high prediction accuracy, they have been criticized for being black box methods that allow limited transparency into the decision process. This thesis contributes to increasing transparency and explainability in financial data science by solving three types of research problems in energy and financial credit markets. First, my results shed more transparency on the intraday electricity trading by showing the impact of renewable energies on trader’s strategies. In particular, I focus on the impact of wind and photovoltaic infeed on intraday electricity pricing. This study is particularly relevant to increasing transparency in intraday trading, since updates in weather forecasting errors are typically unavailable to researchers. Second, I employ state-of-the-art deep neural networks to price day-ahead electricity related to market coupling and use a post-hoc explainability technique to interpret prediction results. Third, I propose a data-driven explainable case-based reasoning method to predict financial credit risk, and show the relevance of its explainability in prediction results. For intraday market traders, this thesis sheds light on how updated forecasts of renewable energies influence traders‘ behavior in the intraday trading. Moreover, it benefits intraday traders by proposing ways to model renewable energies forecasts that will further enhance existing econometric models for intraday electricity prices. Further, this thesis provides an efficient hybrid deep neural networks framework to predict day-ahead electricity prices under the consideration of market coupling for day-ahead electricity market participants. A post-hoc explainability technique is used to interpret the importance of the feature inputs, demand/supply variables, which offers more information and knowledge for cross-border market regulators and traders to move towards an integrated electricity market in Europe. Last, this thesis shows that financial institutions can benefit from the explainable case-based reasoning system to better serve their customers and reduce financial risk, in line with regulatory requirements. Compared with other machine learning methods, the proposed method provides superior prediction results of financial risk and has a major relevance to the decision-making. This allows banks and other financial institutions to not only correctly map the probability of default for any borrower, but also to explain the underlying reason for default. In addition, results are highly relevant to borrowers, as it provides suggestions on how to improve their financial status to obtain new credit

    ESG and Stock Returns

    Full text link
    Denne masteroppgaven har som mål å undersøke sammenhengen mellom selskapers samfunnsansvar (CSR) og deres finansielle prestasjoner (CFP) i Europa og USA, målt ved henholdsvis ESG og aksjeavkastning. Vårt utvalg består av 458 selskaper fra Stoxx Europe 600 og 429 selskaper fra S&P 500 fra perioden 2016 til 2021. Selskapene ble sortert basert på deres ESG score, og videre delt inn i separate porteføljer bestående av selskapene som presterte best og dårligst. Dette resulterte i totalt 16 porteføljer, åtte for hver indeks. For å måle forskjellen i avkastning mellom porteføljene, estimerte vi alfaer fra en long-short zero-cost investeringsstrategi. Denne strategien innebærer å gå long i selskaper med høy ESG score og short i selskaper med lav ESG score. For å gjennomføre tidsserieregresjoner, benyttet vi Fama & French tre-faktor modellen, Carhart fire-faktor modellen og Fama & French fem-faktor modellen. I analysene av det amerikanske markedet fant vi en signifikant negativ sammenheng mellom CSR og CFP, noe som motsier flere tidligere studier. Resultatene fra Europa var mer tvetydige, hvor noen analyser indikerte en negativ sammenheng, mens andre ga uklare resultater. Vi konkluderer likevel til slutt med at det er en negativ sammenheng mellom CSR og CFP. Dette impliserer at å inkludere selskaper med lav ESG score i en investeringsstrategi bør generere meravkastning for en investor.This master thesis seeks to investigate the relationship between Corporate Social Responsibility (CSR) and Corporate Financial Performance (CFP) in Europe and the US, measured by ESG and stock returns, respectively. Our sample comprises 458 companies from Stoxx Europe 600 and 429 companies from S&P 500, over the period spanning from 2016 to 2021. The constituents were classified based on their ESG scores, and further divided into separate portfolios containing the best and worst performing companies. This resulted in a total of 16 portfolios, eight for each index. To measure the difference in returns between the portfolios, we estimated alphas from a long-short zero-cost investment strategy. This strategy involves holding a long position in companies with high ESG scores and shorting companies with low ESG scores. To conduct time series regressions, we applied the Fama & French three-factor model, the Carhart four-factor model, and the Fama & French five-factor model. In the analyses of the US market, we found a significant negative relationship between CSR and CFP, contradicting several previous studies. The results from the European analyses were more ambiguous, with some analyses indicating a negative relationship and others giving inconclusive results. We do, however, ultimately conclude that there is a negative relationship between CSR and CFP. This implies that including companies with low ESG scores in an investment strategy should generate excess returns for an investor

    How can Reinforcement Learning Algorithms be Used for Capital Allocation and Consumption for a Soveriegn Wealth Fund?

    Full text link
    Denne oppgaven ser på hvordan forsterkningslæring kan benyttes til porteføljeforvalting for et statlig investeringsfond. Oppgaven bygger på formålet til Statens Pensjonsfond Utland, som er å gi fremtidige generasjoner samme velferd og like muligheter som dagens generasjon. Dette gjøres gjennom å teste 5 ulike algoritmer fra PyTorch bliblioteket Stable Baseline 3. Hensikten med undersøkelsene er å se hvor godt tilpasset disse maskinlæringsalgoritmene er for å kunne ta investeringsbeslutninger på vegne av et investeringsfond. Maskinlæringsprosessen består av ulike agenter som skal lære å ta beslutninger i et miljø som representerer markedet fondet investerer i. Miljøet agentene samhandler med er dannet gjennom en blanding av investeringsbegrensninger og matematiske formuleringer. Særlig med inspirasjon fra tidligere studier av Knut Anton Mork samt Markovs beslutningsprosess, som er et matematisk rammeverk for beslutningstaking i en tidsdiskret stokastisk kontrollprosess. Gjennom straff og belønning skal agentene trene med den hensikt å finne optimal investeringsbeslutning, basert på ulike kriterier. De agentene som presterer best er de som tar beslutninger i tråd med miljøets spesifikke kriterier. Dette inkluderer blant annet porteføljesammensetning, årlig konsum og fremtidig nytte. For å undersøke ytelsen til forsterkningslæringsagentene vil de bli testet for ulike nivåer av straffeparametere, og bli målt opp mot hverandre basert på nytte og belønning. Undersøkelsene i denne oppgaven gir varierende resultater, som indikerer at forsterkningslæringsalgoritmene har potensiealet til å lage gode modeller for investeringsbeslutninger til et statlig investeringsfond. Det trengs likevel ytterligere arbeid for å forbedre disse algoritmene slik at de passer bedre til å løse dette spesifikke problemet.This thesis examines how reinforcement learning can be used for portfolio management for a sovereign wealth fund (SWF). Inspired by the Norwegian Pension Fund Global, and their aim to provide future generations with the same welfare and opportunities as the current generation. This study tests five different algorithms from the PyTorch library Stable Baseline 3 which is DDPG, PPO, A2C, SAC and TD3. The purpose of the research is to investigate how well these reinforcement learning algorithms can make investment decisions on behalf of an investment fund. The machine learning process involves various agents that learn to make decisions in an environment representing the market. A well-balanced mix of investment constraints and mathematical formulations creates the foundation for the environment. Drawing on previous studies by Knut Anton Mork and the Markov decision process. The Reinforcement learning model in this thesis have agents that learn through a system of penalties and rewards with the aim of finding optimal investment decisions. The best-performing agents are those that find solutions within the specific criteria of the environment. The output is optimal solutions for capital allocation and consumption rates with the aim of maximizing the utility and reward. The algorithms will be tested with different levels of penalty parameters, specifically two different values of smoothing and wealth penalty. The findings of this thesis suggest that reinforcement learning algorithms have the potential to develop effective models for making investment decisions for a sovereign wealth fund. However, further work is needed to refine these algorithms to better fit this specific problem

    Prediksjon av strømpriser ved bruk av nevrale nettverk

    No full text
    I denne bacheloroppgaven har vi gjennomført prediksjoner av strømpriser ved bruk av nevrale nettverk. Vi har ved bruk av programmeringsspråket Python kodet ulike nevrale nettverk til å kunne predikere strømpriser. Nevrale nettverk er ofte illustrert ved bruk av en menneskehjerne, hvor nervetråder er representert som noder. Ved å tilpasse nettverkene til datasettet fikk vi predikert en time med fremtidige strømpriser. Vårt datasett består av femten år med timebaserte historiske observasjoner. Strømpriser er satt som avhengig variabel, da det er denne vi ønsket å predikere. Videre valgte vi ut de uavhengige variablene som kunne antas å ha størst innvirkning på strømprisene. De variablene vi valgte var de mest relevante råvareprisene, målinger for værdata og en variabel for risiko i markedet. I oppgaven har det blitt brukt tre ulike typer nevrale nettverk: • “Feedforward neural network” (ANN) • “Recurrent neural network” (RNN) • “Long-short term memory” (LSTM) Forskjellen på nettverkene er at ANN ikke kan predikere fremtidig sekvensielle data, slik som er mulig for RNN og LSTM. Disse klarer å ta vare på predikerte data og benytte de til videre prediksjon. Vi benyttet likevel ANN i oppgaven for å sammenligne treffsikkerheten mellom nettverkene. I tillegg lagde vi to ulike versjoner av LSTM, for å teste om flere lag og noder kan være med å øke treffsikkerheten. De ulike nevrale nettverkene fikk alle prediksjoner med en gjennomsnittlig feilmargin på mellom 3,9 og 6,2 øre/kWh, avhengig av hvilken type nettverk som ble brukt. Videre forklarte de uavhengige variablene over 90 prosent av variansen til strømprisene i alle de ulike nevrale nettverkene. Det nettverket som ga de beste resultatene for prediksjon av fremtidige strømpriser var LSTM-nettverket med hele 96 prosent forklart varians og en gjennomsnittlig feilmargin på 4,4 øre/kWh. Nettverkene følger et reaktivt handlingsmønster, noe som gir svekkede muligheter for prediksjoner av ukjente fremtidige strømpriser. Oppgaven vil gå mer i dybden om de nevrale nettverkene og implikasjonene som følger av resultatene

    Analysis of the Norwegian power market with prediction of day-ahead spot prices by means of Linear Regression and Machine Learning.

    Full text link
    Elektrisk strøm skiller seg fra de fleste andre omsettelige råvarer ved at den egner seg dårlig til lagring. Ved å kombinere økonometri og maskinlæringsmetoder i kraftmarkedet kan man forsøke å predikere hvor det er balanse mellom produksjon og forbruk, samt forsøke å predikere prisen. De dominerende metodene som brukes for å gi prognoser er svært avanserte maskinlæringsmodeller. Ettersom de ulike metodene er bygget på ulike forutsetninger, må man kunne navigere og tilpasse seg typen data som er tilgjengelig. Vi har brukt data fra ulike åpne og private kilder for å benytte både statistiske og maskinlæringstilnærminger for å a) analysere og b) predikere kraftmarkedet. Resultatet av oppgaven er en noe presis maskinlæringsmodell, som til en viss grad er i stand til å forutsi strømprisen. Funnene våre har resultert i en dypere forståelse av hva som driver strømprisen, noe vi finner avgjørende for å lage prognoser. Variablene som blir benyttet ble valgt manuelt, noe som sett i ettertid kan ha ført til reliabilitetsproblemer på grunn av utvalgsskjevhet.Electricity differs from most other tradeable commodities in that it cannot easily be stored. Combining econometric and machine learning methods in the electricity market can help predict where there is a balance between generation and consumption, as well as what the price will be. The dominant methods used to provide forecasts are severely advanced machine learning models. As different methods are built on different assumptions, one must be able to navigate and adapt to the type of data available. We have used data from various open- and private sources to utilize both statistical and machine learning approaches to a) analyze and b) forecast the electricity market. The result of our study yields a some-what precise machine learning model, that to some degree can forecast the electricity price. Our findings have resulted in a deeper understanding of what drives the electricity price, which we find essential to make forecasts. The variables are chosen manually, and looking backwards, might have led to some reliability issues as it may have introduced selection bias to the dataset

    Prediksjon av strømpriser i Trondheim ved bruk av maskinlæring og statistisk modellering

    Full text link
    Formålet med denne oppgaven er å bruke modeller for sekvensiell data til å utføre prediksjoner av norske strømpriser. Ved å ta en grundig undersøkelse av det nordiske energimarkedet får vi et innblikk i relevante faktorer som er med på å påvirke de norske strømprisene. Datasettet som benyttes er bestående av forklaringsvariabler som anses som relevante for fluktuasjonene i kraftmarkedet. Det innebærer meteorologiske faktorer, energiutveksling og makroøkonomiske forhold. Den avhengige variabelen, som representerer fenomenet vi ønsker å prognostisere, er gjennomsnittlig daglig spotpris for prisområdet NO3 - Trøndelag de siste seks årene. For å predikere strømprisen i Trøndelag har vi utviklet tre modeller som følger en statistikk tilnærming, samt to modeller ved hjelp av kunstige nevrale nettverk. Den statistiske tilnærmingen består av tre ulike ARIMA modeller, der vi gradvis har inkludert eksogene variabler og sesongmessige svingninger i modelleringen. De kunstige nevrale nettverkene er basert på LSTM nettverk, der antall dager inkludert i predikeringen skiller de to ulike versjonene. Våre undersøkelser har vist at ingen av modellene presenterer nøyaktige og tilfredsstillende prediksjoner, da samtlige modeller viser begrenset evne til å fange opp de sentrale nyansene i datasettet. Dette påvirkes trolig av lav korrelasjon med forklaringsvariabler vi har identifisert, samt store svingninger i prisene de siste årene. Den fullverdige SARMAX er av høyest kvalitet blant de statistiske modellene. Blant maskinlæringsmodellene er det LSTM modellen som kun inkluderer data fra foregående dag som presterer best. Gjennom en visuell analyse av resultatene, observerer vi at dyplæringsmodellen i større fanger opp variasjonen i svingningene. På den andre siden presterer de statistiske modellene bedre basert på bruk av vurderingsverktøy.The purpose of this thesis is to utilize models for sequential data to forecast Norwegian electricity prices. Through a comprehensive examination of the nordic power market, we got an insight of relevant factors which influence the Norwegian electricity prices. The dataset used consists of explanatory variables deemed relevant for the fluctuations in the power market. That implies meteorological factors, energy exchange and macroeconomic conditions. The dependent variable, which represents the phenomenon we aim to forecast, is the average daily spot price for the price area NO3 - Trøndelag for the last six years. We have developed three models with a statistical approach, as well as two models by artificial neural network. The statistical approach consists of three ARIMA models, where we have gradually included exogenous variables and seasonality in the modeling. The artificial neural networks are built as LSTM networks, where the amount of days included in the predictions distinguish the different versions from each other. Our examinations have shown that neither of the models presents accurate and satisfactory predictions, as all models demonstrate limited capability to capture central nuances in the dataset. This is probably due to low correlation with the influence factors we have identified, as well as large fluctuations in price the last couple years. The SARMAX is of the highest quality among the statistical models. The LSTM model which only includes data from the previous day performs the best amid the machine learning models. Through a visual analysis of the results, we observe that the deep learning model more efficiently captures the variation in the fluctuations. Nevertheless, the statistical models perform better based on use of assessment tools

    En prediktiv analyse av Twitter-sentiment på Bitcoins daglige avkastning ved bruk av kunstige nevrale nettverk

    Full text link
    Denne oppgaven tar sikte på å analysere korrelasjonen og årsakssammenhengen mellom det sentimentale innholdet i Twitter data og den daglige prisavkastningen til fremtredende kryptovaluta Bitcoin, og å undersøke om Twitter sentimentet kan være en effektiv prediktiv faktor for Bitcoin-prisen. For å nå målene samles de tweetene som er relatert til Bitcoin på en tidsramme på 57 dager og kombineres med daglig tweetvolum og Bitcoins prisavkastning. For videre arbeid trekkes sentimental informasjon ut fra tweet-tekstene, og alle tweetene gis sentiment-score og kategoriseres i en av fire ulike polariteter, nemlig compound, positive, neutral og negative. Ved å bruke disse dataene utføres flere kvantitative analyser med allment anerkjente metoder, arkitekturer og modeller av kunstige nevrale nettverk. Funn av eksperimentene avslører at det ikke er noen statistisk signifikant sammenheng mellom Twitter sentiment og Bitcoins prisavkastning. Videre indikerer resultatene av studien at det ikke er tilstrekkelig bevis til å antyde at Twitter sentiment og daglig tweetvolum inneholder prediktiv informasjon for Bitcoin-prisen.This study aims to analyze the correlation and causality between the sentimental content of Twitter data and the daily price return of prominent cryptocurrency Bitcoin, and to research if the twitter sentiment can be an effective predictive factor for Bitcoin price. To achieve the aims, tweets related to Bitcoin of a timeframe of 57 days are gathered and combined with daily tweet volume and Bitcoin price return. For the further work, sentimental information is extracted from the tweet texts, and all tweets are given sentiment scores and categorized into one of four different polarities, namely, compound, positive, neutral and negative. Using this data, several quantitative analyzes are performed with widely acknowledged methods, architectures, and models of Artificial Neural Networks. Findings of the experiments reveals that there is no statistically significant correlation between Twitter sentiment and Bitcoin price return. Furthermore, results of the study indicates that there’s not sufficient evidence to suggest that Twitter sentiment and daily tweet volume contains predictive information for Bitcoin price

    Prediksjon av strømpriser ved bruk av nevrale nettverk

    Full text link
    I denne bacheloroppgaven har vi gjennomført prediksjoner av strømpriser ved bruk av nevrale nettverk. Vi har ved bruk av programmeringsspråket Python kodet ulike nevrale nettverk til å kunne predikere strømpriser. Nevrale nettverk er ofte illustrert ved bruk av en menneskehjerne, hvor nervetråder er representert som noder. Ved å tilpasse nettverkene til datasettet fikk vi predikert en time med fremtidige strømpriser. Vårt datasett består av femten år med timebaserte historiske observasjoner. Strømpriser er satt som avhengig variabel, da det er denne vi ønsket å predikere. Videre valgte vi ut de uavhengige variablene som kunne antas å ha størst innvirkning på strømprisene. De variablene vi valgte var de mest relevante råvareprisene, målinger for værdata og en variabel for risiko i markedet. I oppgaven har det blitt brukt tre ulike typer nevrale nettverk: • “Feedforward neural network” (ANN) • “Recurrent neural network” (RNN) • “Long-short term memory” (LSTM) Forskjellen på nettverkene er at ANN ikke kan predikere fremtidig sekvensielle data, slik som er mulig for RNN og LSTM. Disse klarer å ta vare på predikerte data og benytte de til videre prediksjon. Vi benyttet likevel ANN i oppgaven for å sammenligne treffsikkerheten mellom nettverkene. I tillegg lagde vi to ulike versjoner av LSTM, for å teste om flere lag og noder kan være med å øke treffsikkerheten. De ulike nevrale nettverkene fikk alle prediksjoner med en gjennomsnittlig feilmargin på mellom 3,9 og 6,2 øre/kWh, avhengig av hvilken type nettverk som ble brukt. Videre forklarte de uavhengige variablene over 90 prosent av variansen til strømprisene i alle de ulike nevrale nettverkene. Det nettverket som ga de beste resultatene for prediksjon av fremtidige strømpriser var LSTM-nettverket med hele 96 prosent forklart varians og en gjennomsnittlig feilmargin på 4,4 øre/kWh. Nettverkene følger et reaktivt handlingsmønster, noe som gir svekkede muligheter for prediksjoner av ukjente fremtidige strømpriser. Oppgaven vil gå mer i dybden om de nevrale nettverkene og implikasjonene som følger av resultatene.In this bachelor thesis, we have carried out predictions of electricity prices using neural networks. Using the programming language Python, we have coded various neural networks to be able to predict electricity prices. Neural networks are often illustrated using a human brain, where nerve fibers are represented as nodes. By adapting the networks to the dataset, we predicted an hour of future electricity prices. Our dataset consists of fifteen years of hourly historical observations. Electricity prices are set as a dependent variable, as this is what we wanted to predict. Furthermore, we selected the independent variables that could be assumed to have the greatest impact on electricity prices. The variables we chose were the most relevant commodity prices, measurements for weather data and a variable for risk in the market. Three different types of neural networks have been used in the thesis: • “Feedforward neural network” (ANN) • “Recurrent neural network” (RNN) • “Long-short term memory” (LSTM) The difference between the networks is that ANN cannot predict future sequential data, as is possible for RNN and LSTM. These are able to take care of predicted data and use it for further prediction. We still used ANN in the task to compare the accuracy between the networks. In addition, we created two different versions of LSTM, to test whether more layers and nodes can help increase accuracy. The various neural networks all received predictions with an average margin of error between 3.9 and 6.2 øre/kWh, depending on the type of network used. Furthermore, the independent variables explained over 90 percent of the variance in electricity prices in all the various neural networks. The network that gave the best results for predicting future electricity prices was the LSTM network with as much as 96 percent explained variance and an average margin of error of 4.4 øre/kWh. The networks follow a reactive pattern of action, which provides weakened opportunities for predictions of unknown future electricity prices. The thesis will go more in depth about the neural networks and the implications that follow from the results

    Analysis of the Norwegian power market with prediction of day-ahead spot prices by means of Linear Regression and Machine Learning.

    No full text
    Elektrisk strøm skiller seg fra de fleste andre omsettelige råvarer ved at den egner seg dårlig til lagring. Ved å kombinere økonometri og maskinlæringsmetoder i kraftmarkedet kan man forsøke å predikere hvor det er balanse mellom produksjon og forbruk, samt forsøke å predikere prisen. De dominerende metodene som brukes for å gi prognoser er svært avanserte maskinlæringsmodeller. Ettersom de ulike metodene er bygget på ulike forutsetninger, må man kunne navigere og tilpasse seg typen data som er tilgjengelig. Vi har brukt data fra ulike åpne og private kilder for å benytte både statistiske og maskinlæringstilnærminger for å a) analysere og b) predikere kraftmarkedet. Resultatet av oppgaven er en noe presis maskinlæringsmodell, som til en viss grad er i stand til å forutsi strømprisen. Funnene våre har resultert i en dypere forståelse av hva som driver strømprisen, noe vi finner avgjørende for å lage prognoser. Variablene som blir benyttet ble valgt manuelt, noe som sett i ettertid kan ha ført til reliabilitetsproblemer på grunn av utvalgsskjevhet

    En prediktiv analyse av Twitter-sentiment på Bitcoins daglige avkastning ved bruk av kunstige nevrale nettverk

    No full text
    Denne oppgaven tar sikte på å analysere korrelasjonen og årsakssammenhengen mellom det sentimentale innholdet i Twitter data og den daglige prisavkastningen til fremtredende kryptovaluta Bitcoin, og å undersøke om Twitter sentimentet kan være en effektiv prediktiv faktor for Bitcoin-prisen. For å nå målene samles de tweetene som er relatert til Bitcoin på en tidsramme på 57 dager og kombineres med daglig tweetvolum og Bitcoins prisavkastning. For videre arbeid trekkes sentimental informasjon ut fra tweet-tekstene, og alle tweetene gis sentiment-score og kategoriseres i en av fire ulike polariteter, nemlig compound, positive, neutral og negative. Ved å bruke disse dataene utføres flere kvantitative analyser med allment anerkjente metoder, arkitekturer og modeller av kunstige nevrale nettverk. Funn av eksperimentene avslører at det ikke er noen statistisk signifikant sammenheng mellom Twitter sentiment og Bitcoins prisavkastning. Videre indikerer resultatene av studien at det ikke er tilstrekkelig bevis til å antyde at Twitter sentiment og daglig tweetvolum inneholder prediktiv informasjon for Bitcoin-prisen
    corecore