1,720,977 research outputs found
Advances in mixture models for ordinal data: theoretical insights and model-based clustering
Questa tesi di dottorato si concentra sull’analisi dei dati ordinali, un tipo di dati che ha ricevuto una limitata attenzione nella letteratura e che presenta diverse sfide a causa delle sue caratteristiche uniche. La prima parte della tesi fornisce una panoramica esaustiva dei principali modelli utilizzati per l’analisi dei dati ordinali, partendo dal contesto dei Modelli Lineari Generalizzati e arrivando a distribuzioni più recenti e specifiche, come i modelli CUB e BOS.
La seconda parte della tesi presenta la ricerca condotta negli ultimi due anni, con particolare enfasi sullo sviluppo di applicazioni, approfondimenti teorici e nuovi modelli all’interno del framework della classe CUB introdotto nella prima sezione. Questa parte segue una progressione strutturata, permettendo al lettore di costruire su ciascun nuovo contributo man mano che viene presentato.
Il primo contributo, presentato nel Capitolo 3, estende il cosiddetto modello CUM, un approccio specifico per l’analisi dei dati di valutazione provenienti da scale a differenziale semantico. Originariamente proposto per un uso generale e sviluppato specificamente per scale a sette punti, questa tesi introduce un adattamento innovativo del modello CUM per l’analisi di dati provenienti da scale a differenziale semantico con sette categorie. Le prestazioni del modello sono state testate sia con studi di simulazione che con applicazioni a dati reali.
Il secondo contributo, presentato nel Capitolo 4, confronta i modelli CUB e CUM nel contesto di scale con cinque e sette categorie. In particolare, questo lavoro mira a investigare analiticamente le condizioni in cui i modelli CUB e CUM sono equivalenti.
Il terzo contributo, presentato nel Capitolo 5, applica il modello CUM alle scale a differenziale semantico con sette categorie, con un duplice obiettivo. In primo luogo, dimostra come il modello funzioni nella pratica e come possa essere utilizzato per analizzare dati ordinali. In secondo luogo, offre un contributo utile sia alla società che alla città di Brescia (Italia), in quanto questa ricerca è stata condotta all’interno del progetto ”DS4BS — Arts and Cultural Places“, con l’obiettivo di analizzare le percezioni dei visitatori della Pinacoteca della città.
Il quarto contributo, presentato nel Capitolo 6, è stato sviluppato durante un periodo di visita presso il Laboratorio ERIC dell’Università Lumière Lyon 2 in Francia. Questo progetto ha introdotto un Modello Mistura per l’analisi dei dati di valutazione all’interno del framework CUB. Sono stati condotti studi di simulazione per valutare le prestazioni del modello, che è stato successivamente applicato a dati reali per dimostrarne l’applicazione pratica.This doctoral thesis focuses on the analysis of ordinal data, a type of data that has received limited attention in the literature and poses several challenges due to its unique characteristics. The first part of the thesis provides a comprehensive overview of the principal models used for analyzing ordinal data, beginning with the Generalized Linear Models framework and extending to more recent specialized distributions, including the CUB and BOS models. The second part of this thesis presents the research conducted over the past two years, with a particular emphasis on the development of applications, theoretical insights,
and new models within the framework of the CUB class introduced in the first section. This part follows a structured progression, allowing the reader to build on each new contribution as they are introduced.
The first contribution, presented in Chapter 3, extends the so-called CUM model, a specific approach for analyzing rating data from Semantic Differential Scales. Originally proposed for general use and specifically developed for seven-point scales, this thesis introduces a novel adaptation of the CUM model for analyzing data from fivepoint Semantic Differential Scales. The performances of the model have been tested both with simulation studies and applications to real data.
The second contribution, presented in Chapter 4, compares the CUB and CUM models in the context of five- and seven-category scales. Specifically, this work aims to analytically investigate the conditions under which the CUB and CUM models are equivalent.
The third contribution, presented in Chapter 5, applies the CUM model to sevenpoint Semantic Differential Scales, with a dual aim. First, it demonstrates how the model works in practice and how it can be used to analyze ordinal data. Second, it offers a valuable contribution to both society and the city of Brescia (Italy), as this research was conducted within the ”DS4BS — Data Science for Brescia“ project, aimed at analyzing visitors’ perceptions of the city’s Art Gallery.
The fourth contribution, presented in Chapter 6, was developed during a visiting period at the ERIC Laboratory at the University Lumière Lyon 2 in France. This project introduced a Mixture Model for analyzing rating data within the CUB framework. Simulation studies were conducted to evaluate the model’s performance, and it was subsequently applied to real data to demonstrate its practical application
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
Le risposte della biodiversità edafica alla gestione degli agroecosistemi: un approccio basato sull’Ecologial Network Analysis
La comprensione del ruolo della biodiversità nella genesi, regolazione e rigenerazione dei servizi ecosistemici richiede una adeguata analisi della sua struttura, dei suoi tratti funzionali e dell’interazione tra i tratti funzionali e processi ecosistemici. È inoltre necessario comprendere come questi processi sia influenzati da variabili ambientali abiotiche, dalle pratiche di gestione degli ecosistemi e dalle perturbazioni. Una adeguata conoscenza di questi aspetti può contribuire alla definizione di strategie sostenibili di gestione degli agroecosistemi.
L’indagine del legame tra la struttura delle comunità ecologiche, definita in termini di taxa presenti e della loro abbondanza, e i processi ecologici che esse promuovono e regolano richiede adeguati strumenti di modellazione. L’Ecological Network Analysis (ENA) rappresenta una prospettiva metodologica particolarmente interessante. Secondo questo approccio le comunità biotiche sono considerate come reti i cui nodi (componenti della biodiversità, come specifici taxon o gruppi funzionali) sono caratterizzati da attributi (quali, ad esempio, presenza/assenza, abbondanza, grado di attivazione di specifici tratti funzionali) e da specifici modelli di interazione con altri nodi. L’obiettivo di questo studio è l’utilizzo di un approccio basato sull’ENA per indagare come le variabili ambientali e le strategie di gestione influenzano la fauna di artropodi del suolo nell’agroecosistema vigneto. Nel lavoro sono stati considerati due approcci statistici alla valutazione delle relazioni di una rete ecologia: il Gaussian Graphical Model (GGM) e la Bayesian Network (BN).
Entrambi i modelli consentono una rappresentazione grafica delle reti investigate, elemento che rende i risultati ottenuti di più facile interpretazione. Il GGM è una rete non diretta basata su coefficienti di correlazione parziale e può essere utilizzata come strumento esplorativo di analisi dei dati. La BN è un modello grafico probabilistico che consente di investigare le dipendenze condizionali tra i nodi della rete. Entrambi i modelli consentono di valutare le relazioni sia con indicazione di presenza/assenza sia di abbondanza dei taxa considerati. Tali modelli sono stati applicati all’analisi della biodiversità degli artropodi edafici in oltre 290 vigneti, situati in diversi areali viticoli prevalentemente nel Nord Italia. Per ogni vigneto si è effettuato un campionamento del suolo a una profondità di circa 0-15 cm. In questi campioni di suolo sono stati identificati i diversi taxa di artropodi e si è definita la loro abbondanza. Per ogni sito sono state indagate le caratteristiche chimico fisiche dei suoli e di definite le modalità di gestione agronomica (conduzione convenzionale o biologica, modalità di gestione dell’inerbimento e di concimazione). Applicando i GGM e le BN a questa importante base dati, abbiamo stimato una serie di reti di biodiversità edafica diversificando i vigneti in base alle tipologie di conduzione, di gestione e alle caratteristiche geo-pedologiche dei siti. I modelli hanno consentito di identificare i taxa “centrali” nella determinazione delle relazioni di presenza e abbondanza degli altri taxa, quali ad esempio acari e isopodi. Lo sviluppo del lavoro prevede di caratterizzare in maniera dettagliata aspetti funzionali dei taxa per interpretare in che modo le relazioni individuate assumano un significato nei termini di relazione ecologiche tra i gruppi e come tali relazioni concorrano a determinare gli aspetti funzionali del suolo nel suo compless
- …
