1,721,073 research outputs found
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Extreme waarden statistiek: tweede orde modellen en toepassingen in metaalmoeheid.
Indien we geïnteresseerd zijn in de informatie van de extreme uiteinden van een verdeling, kunnen we geen gebruik maken van de klassieke statist ische technieken. Hiertoe zijn extreme waarden technieken ontwikkeld. De veralgemeende Pareto verdeling (GPD, Generalized Pareto Distribution) i s waarschijnlijk de meest populaire verdeling met betrekking op de staar t van een verdeling. Meer specifiek staat ze gekend om de verdeling van de overschrijdingen over een zekere hoge grenswaarde goed te benaderen. Opdat de GPD deze overschrijding goed zou modelleren moet echter vaak ee n hoge grenswaarde gebruikt worden, met als gevolg dat enkel een klein d eel van de data gebruikt wordt. Om dit probleem te overwinnen worden in dit werk twee uitbreidingen van de klassieke GPD voorgesteld. Beiden zij n gebaseerd op de tweede orde benadering van het onderliggend Pareto mod el. In de eerste wordt het model uitgebreid met één parameter en is enke l toepasbaar voor het domein van de zwaarstaartige verdelingen. Deze uit breiding heeft niet alleen als voordeel dat ze toepasbaar is op ee n grotere groep data, mar daarenboven blijkt dat de resulterende maximum likelihood schattingen van de extreme waarde index blijken ook nog onve rtekend te zijn. Het tweede model bevat twee extra parameters en is zo o pgesteld dat het toepasbaar is op het ganse domein. Beide modellen werde n getest en toegepast op reële data. Het tweede deel van de thesis bespreekt de toepassing van extreme waarde n statistiek in het domein van materiaalkunde, materiaalmoeheid. Falen v an metalen, wanneer deze onderhevig zijn aan mechanische krachten, wordt vaak veroorzaakt door onzuiverheden. Op de plaats waar deze zich bevind en, ontstaan er scheurtjes die kunnen groeien tot het metaal uiteindelij k zal falen. Tijdens het onderzoek naar de krachtlimiet, de hoogste krac ht waaronder het metaal kan gezet worden zonder dat scheuren groeien, is gebleken dat de grootte van de grootste onzuiverheden bepalend is voor deze limiet. Hoe groter de onzuiverheden hoe zwakker het metaal of hoe l ager de toegelaten krachten zijn. In deze thesis is gebruikt gemaakt van tweede orde extreme waarden technieken om de grootte van deze maximale onzuiverheden te schatten. Daarnaast blijkt de detectie van de onzuiverh eden voor het testen van metalen van groter belang te worden. Klassiek z ijn enkel twee-dimensionale doorsneden beschikbaar van de metalen voor d e detectie van de onzuiverheden, en de overgang naar drie-dimensionale i nformatie kan enkel gebeuren mits zware veronderstellingen. In deze stud ie werd ook een nieuwe methode voor het opsporen van onzuiverheden uitge werkt. Ruwe data van deze op ultrasonische technieken gebaseerde methode zijn aan de hand van statische technieken bruikbaar gemaakt voor de kla ssieke extreme waarden technieken.status: Publishe
Statistische technieken voor niet-leven verzekeringen : essays over schadereservering en premiebepaling voor panels en vloten
The research projects presented in this dissertation lie on the frontiers of actuarial science, statistics and econometrics. We deal with the important actuarial pillars of pricing and reserving in non-life insurance.
For the construction of a fair tariff structure actuaries apply risk classification based on regression techniques. When the explanatory variables used as risk factors express a priori correctly measurable information about the policyholder (or, for instance, the vehicle or insured building), the system is an a priori classification scheme. A posteriori rating systems re-evaluate the premium by taking the history of claims of the insured into account. In this thesis, we focus on a posteriori ratemaking with panel data (Chapter 2) and hierarchical data for fleets (Chapter 3).
Claims reserving is the actuarial discipline that deals with the calculation, or prediction, of provisions or reserves that should be set aside to meet future liabilities of the insurer towards its policyholders. The thesis is a collection of worked out suggestions to tackle some specific problems in ratemaking and claims reserving.
In Chapter 3 we discuss statistical techniques for a priori and a posteriori ratemaking in non-life insurance. For a priori rating, an overview of actuarial statistics with generalized linear models (`GLMs'), generalized count distributions (i.e.\ Negative Binomial, hurdle Poisson, zero-inflated Poisson) and flexible, parametric families of distributions (like Burr XII or Generalized Beta of the second kind) is presented. With respect to a posteriori ratemaking this Chapter discusses generalized linear mixed models (`GLMMs') for credibility type problems. Our contribution -- that puts focus on the connection between credibility techniques and GLMs -- is completed in this Chapter with an overview of recent, relevant contributions on ratemaking and related areas.
Chapter 3 discusses the statistical analysis of a data set with micro level observations on claim frequencies for fleet policies. Our statistical analysis uses multilevel statistics to explore the hierarchical structure of the data. As such, the approach presented in this Chapter is a statistical alternative for traditional hierarchical credibility models developed in the actuarial literature (see Jewell, 1975). Related work is in Desjardins (2001) and Angers (2006). Particularities of our work are the examination of the performance of various count distributions (namely Poisson, hurdle and zero-inflated Poisson and negative binomial) in the multilevel framework and the fully Bayesian estimation that is used. A priori premiums and a posteriori corrections under the various model specifications are extensively discussed. The Chapter ends with a short note on the hierarchical modelling of severities.
With Chapters 4 and 5 we switch from ratemaking techniques to models for claims reserving. Verrall (1996) and England & Verrall (2002) first considered the use of smoothing methods in the context of claims reserving. Using the statistical methodology of semiparametric regression and its connection with mixed models (see Ruppert, 2003), Antonio & Beirlant (2007) revisit smoothing models for loss reserving and credibility. Again our approach is Bayesian. Compared to classical reserving techniques based on run-off triangles with aggregate data, our work puts focus on more complicated data sets, dealing with quarterly development in a reserving context, heavy-tailed regression, semicontinuous data, extensive longitudinal data, and the inclusion of a stochastic discounting process to obtain the present value of reserves. These are hanging topics in claims reserving. Moreover, the approach developed in Chapter 4 is a unified, statistical approach for claims reserving and credibility.
Yet another issue in loss reserving is the question whether the run-off design should be left for micro models that follow the development of individual claims. We present such a micro model for individual data in Chapter 5. The interpretation of individual claims in the framework of longitudinal data analysis is explored. Using MCMC techniques, a Bayesian approach allows simulation from the complete predictive distribution of the reserves and the calculation of various risk measures from these distributions. The micro model is illustrated with a detailed case-study based on a data set from a Belgian reinsurance consultant.status: Publishe
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Statistisch modelleren van de doorbraak van tanden gebaseerd op multivariate interval-gecensureerde gegevens
Around the age of six the first permanent teeth emerge, i.e. they become visible in the mouth. Not only the timing, also the pattern of tooth emergence is of interest in dental practice to help in diagnosis and treatment planning. However, the timing of tooth emergence is often not observed exactly, e.g. in an (epidemiological) study, only at a visit to the dentist it is observed whether a tooth has emerged or not. Since the timing of tooth emergence is not exactly known, as it lies in between two visits to the dentist, tooth emergence is an “interval censored'' phenomenon. When a tooth has not yet emerged at the last visit before the study ends, it is a “right censored” observation. Similarly, if a tooth has already emerged at the first visit, it is called a “left censored” observation.
Questions about patterns of tooth emergence lead to the analysis of multivariate interval censored data because the emergence times of several teeth of one child can not be assumed to be independent from each other. There are two classes of questions depending on whether the association between the emergence times of different teeth is of interest. Firstly, we analysed several dental questions for which the dependence structure was not really of importance such as ``Is there a left-right symmetry with respect to the mean (median) emergence times?". Secondly, in order to get more insight in the tooth emergence patterns, we focused on the association between the emergence times leading to the analysis of the bivariate (or multivariate) density of the emergence times. Several approaches like the nonparametric maximum likelihood estimate, a smooth estimate and a copula approach were investigated. For these estimates, we looked at different measures to describe the association both globally and locally.status: Publishe
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Credit derivatives pricing under Lévy models
Financial institutions need credit derivative instruments to protect portfolios against failure events. By mitigating risk exposures, credit derivatives are helpful for relaxing Basel II capital requirements. This has lead to an exponential growth of the trades of such instruments over the last decade. The financial community is now demanding models for pricing credit derivatives.
Modelling credit risk supposes to define a default event and to estimate its associatedstatus: Publishe
Modern reserving techniques for the insurance business
In vele actuari#le en financi#le problemen is de verdeling van een som v an afhankelijke variabelen van belang. In het algemeen kan deze verdelin gsfunctie echter niet analytisch verkregen worden omwille van de complex e onderliggende afhankelijkheidsstructuur. In twee referentiewerken (Kaa s et al. (2000) en Dhaene et al. (2002)) lost men dit probleem op door b oven- en ondergrenzen voor (de verdelingsfunctie van) zulk een som te be schouwen die expliciete berekeningen van verschillende actuari#le grooth eden mogelijk maken. The originele afhankelijkheidsstructuur kan vervang en worden door een eenvoudigere structuur die leidt tot een 'gevaar lijkere' variabele, maar analytische berekeningen toelaat. Beslissingen (bv. Welk bedrag dient gereserveerd te worden?) gebaseerd op deze stocha stische veranderlijke leiden tot een veilige, conservatieve strategie. I n de (schade)reserveringscontext zal men provisies aanleggen die eerder te hoog te zijn. Daarom is het zinvol dat men ook een 'minder gevaa rlijke' variabele beschouwt die analytische berekeningen van verscheiden e risicomaten mogelijk maakt. Kaas et al. (2000) en Dhaene et al. (2002) werkten een wiskundige grondslag uit voor deze intu#tieve idee#n. Het c oncept van 'gevaarlijkheid' wordt gedefinieerd door de notie van co nvexe orde. Onder- en bovengrenzen worden afgeleid waarbij de termen in de betrokken som comonotoon zijn; wat betekent dat zij allemaal monotone (stijgende of dalend) functies zijn van dezelfde variabele. Wanneer bei de grenzen dicht bij elkaar liggen, kunnen ze betrouwbare informatie ver schaffen over de originele en meer complexe variabele. In het bijzonder is deze techniek erg nuttig om schattingen te bekomen van kwantielen en stop-loss premies. In deze bijdrage construeren we scherpere bovengrenzen voor stop-loss pr emies gebaseerd op de comonotone grenzen uit bovenstaande referentiewerk en en we veralgemenen bovenstaand idee van de convexe onder- en bovengre nzen naar scalaire produkten van niet-negatieve variabelen. Deze resulta ten worden toegepast op algemeen verdisconteerde cash flows met stochast ische betalingen. Verscheidene numerieke illustraties tonen aan dat de m ethodologie erg accurate benaderingen geeft voor de onderliggende verdel ingsfuncties en de corresponderende risicomaten. Deel I: Reservering in de sector leven We trachten conservatieve schattingen te bekomen voor kwantielen en stop -loss premies van een annu#teit en een ganse portefeuille van annu#teite n. Gelijkaardige technieken kunnen aangewend worden om schattingen te ve rkrijgen van meer algemene verzekeringsprodukten in de sector leven. Onz e techniek laat toe 'personal finance' problemen zeer nauwkeurig op te lossen. Het geval van een portefeuille van annu#teiten is reeds uitg ebreid onderzocht in de wetenschappelijke literatuur, maar enkel in het grensgeval - voor homogene portefeuilles, wanneer het sterfterisico voll edig gediversifieerd is. De toepasbaarheid van deze resultaten in de ver zekeringspraktijk kan echter in vraag gesteld worden: in het bijzonder h ier aangezien een typische portefeuille niet genoeg polissen bevat om te spreken over volledige diversificatie. Daarom stellen we voor het aanta l actieve polissen in de opeenvolgende jaren te benaderen gebruikmakend van een 'normal power' verdeling en de huidige waarde va n de toekomstige uitkeringen te modelleren als een scalair produkt van o nderling onafhankelijke vectoren. Deel II: Reservering in de sector niet-leven Het correct schatten van het bedrag dat een maatschappij moet opzij zett en om tegemoet te komen aan de verplichtingen (schadegevallen) die zich in de toekomst voordoen, is een belangrijke taak voor verzekeringsmaatsc happijen om een correct beeld van haar verplichtingen te krijgen. De his torische data die nodig zijn om schattingen te bekomen voor toekomstige betalingen worden meestal weergegeven in driehoek-vorm met incrementele betalingen. De bedoeling is deze schadedriehoek te vervolledigen tot een vierkant en zelfs eventueel tot een rechthoek indien schattingen nodig zijn die behoren tot afwikkelingsjaren waarvan geen data in de driehoek opgenomen zijn. Hiervoor kan de actuaris gebruik maken van aantal techni eken. De intrinsieke onzekerheid wordt beschreven door de verdeling van mogelijke uitkomsten en men zoekt steeds naar de beste schatting van de reserve. Schadereservering heeft te maken met de bepaling van de onzekere huidige waarde van een ongekend bedrag van toekomstige betalingen. Opdat d e reserveschatting werkelijk de beste schatting van de actuaris zou weer geven, moet zowel de bepaling van de verwachte waarde van niet betaalde schadegevallen alsook de geschikte verdisconteringsvoet de beste schatti ng van de actuaris weergeven (hiermee bedoelen we dat deze niet opgelegd moet worden door anderen of door de wetgeving). Aangezien de reserve ee n provisie is voor toekomstige betalingen van niet-afgehandelde schadege vallen, geloven we dat de geschatte schadereserve de tijdswaarde van gel d moet weergeven. In vele situaties is de verdisconteerde reserve nuttig , bv. in een dynamisch financi#le analyse, winstbepaling en het prijs ze tten, risico gebaseerd kapitaal, schadeportefeuille transfers,... . Idealiter zou de verdisconteerde reserve ook aanvaardbaar moeten zijn v oor rapportering. De huidige wetgeving laat het echter meestal niet toe. Niet verdisconteerde reserves bevatten in feite een zekere risicomarge afhankelijk van het niveau van de interestvoet. We beschouwen de verdisc onteerde schadereserve en leggen we een impliciete marge op gebaseerd op een risicomaat van de verdeling van de totale verdisconteerde reserve. We modelleren de schadebetalingen gebruikmakend van lognormale lineaire modellen, loglineaire locatie-schaal modellen en veralgemeende lineaire modellen en leiden accurate comonotone benaderingen af voor de verdiscon teerde reserve. Tenslotte leiden we enkele asymptotische resultaten af voor de staartver deling van sommen van zwaarstaartige afhankelijke variabelen. We tonen h oe we deze resultaten kunnen toepassen om bepaalde functies van (de verd elingsfunctie van) sommen van afhankelijke variabelen te benaderen. Onze numerieke resultaten geven aan dat de asymptotische benaderingen dicht liggen bij de Monte Carlo gesimuleerde waarden. Verder herhalen we kort de wiskundige technieken achter de moment gebaseerde benaderingen en de Bayesiaanse aanpak. We vergelijken al deze benaderingstechnieken met de comonotone benaderingen in de schadereserveringscontext. In geval de ond erliggende variantie van het statistische en financi#le gedeelte van de verdisconteerde IBNR reserve groter wordt, presteren de comonotone benad eringen slecht. We illustreren dit aan de hand van een eenvoudig voorbee ld en stellen de bekomen asymptotische resultaten als een alternatief vo or. We vergelijken al deze resultaten ook met de lognormale moment gebas eerde benaderingen. Ten slotte bekijken we ook de verdeling van de verdi sconteerde reserve wanneer we de data in de schadedriehoek modelleren me t behulp van een veralgemeend lineair model en vergelijken de resultaten van de comonotone benaderingen met de Bayesiaanse benaderingen. Referenties: Kaas R., Dhaene J. & Goovaerts M.J. (2000). "Upper and lower bounds for sums of random variables", Insurance: Mathematics and Economics 27(2), 151-168. Dhaene J., Denuit M., Goovaerts M.J, Kaas R. & Vyncke D. (2002 ). "The concept of comonotonicity in actuarial science and finance: Theo ry", Insurance: Mathematics and Economics 31(1), 3-33.status: Publishe
Versnelde falingsmodellen voor meervoudig interval gecensureerde gegevens onder soepele veronderstellingen over de stochastische verdeling.
status: Publishe
- …
