1,721,001 research outputs found
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Information retrieval models for recommender systems
[Abstract]
Information retrieval addresses the information needs of users by delivering
relevant pieces of information but requires users to convey their
information needs explicitly. In contrast, recommender systems offer personalized
suggestions of items automatically. Ultimately, both fields help
users cope with information overload by providing them with relevant
items of information.
This thesis aims to explore the connections between information retrieval
and recommender systems. Our objective is to devise recommendation
models inspired in information retrieval techniques. We begin by
borrowing ideas from the information retrieval evaluation literature to analyze
evaluation metrics in recommender systems. Second, we study the
applicability of pseudo-relevance feedback models to different recommendation
tasks. We investigate the conventional top-N recommendation
task, but we also explore the recently formulated user-item group formation
problem and propose a novel task based on the liquidation oflong
tail items. Third, we exploit ad hoc retrieval models to compute neighborhoods
in a collaborative filtering scenario. Fourth, we explore the
opposite direction by adapting an effective recommendation framework
to pseudo-relevance feedback. Finally, we discuss the results and present
our concIusions.
In summary, this doctoral thesis adapts a series of information retrieval
models to recommender systems. Our investigation shows that many
retrieval models can be accommodated to deal with different recommendation
tasks. Moreover, we find that taking the opposite path is also
possible. Exhaustive experimentation confirms that the proposed models
are competitive. Finally, we also perform a theoretical analysis of sorne
models to explain their effectiveness.[Resumen]
La recuperación de información da respuesta a las necesidades de información
de los usuarios proporcionando información relevante, pero
requiere que los usuarios expresen explícitamente sus necesidades de
información. Por el contrario, los sistemas de recomendación ofrecen
sugerencias personalizadas de elementos automáticamente. En última
instancia, ambos campos ayudan a los usuarios a lidiar con la sobrecarga
de información al proporcionarles información relevante.
Esta tesis tiene como propósito explorar las conexiones entre la recuperación
de información y los sistemas de recomendación. Nuestro
objetivo es diseñar modelos de recomendación inspirados en técnicas de
recuperación de información. Comenzamos tomando prestadas ideas de
la literatura de evaluación en recuperación de información para analizar
las métricas de evaluación en los sistemas de recomendación. En segundo
lugar, estudiamos la aplicabilidad de los modelos de retroalimentación de
pseudo-relevancia a diferentes tareas de recomendación. Investigamos
la tarea de recomendar listas ordenadas de elementos, pero también exploramos
el problema recientemente formulado de formación de grupos
usuario-elemento y proponemos una tarea novedosa basada en la liquidación
de los elementos de la larga cola. Tercero, explotamos modelos
de recuperación ad hoc para calcular vecindarios en un escenario de
filtrado colaborativo. En cuarto lugar, exploramos la dirección opuesta
adaptando un método eficaz de recomendación a la retroalimentación de
pseudo-relevancia. Finalmente, discutimos los resultados y presentamos
nuestras conclusiones.
En resumen, esta tesis doctoral adapta varios modelos de recuperación
de información para su uso como sistemas de recomendación. Nuestra
investigación muestra que muchos modelos de recuperación de información
se pueden aplicar para tratar diferentes tareas de recomendación.
Además, comprobamos que tomar el camino contrario también es posible.
Una experimentación exhaustiva confirma que los modelos propuestos
son competitivos. Finalmente, también realizamos un análisis teórico de
algunos modelos para explicar su efectividad.[Resumo]
A recuperación de información dá resposta ás necesidades de información
dos usuarios proporcionando información relevante, pero require
que os usuarios expresen explicitamente as súas necesidades de información.
Pola contra, os sistemas de recomendación ofrecen suxestións
personalizadas de elementos automaticamente. En última instancia, ambos
os campos axudan aos usuarios a lidar coa sobrecarga de información
ao proporcionarlles información relevante.
Esta tese ten como propósito explorar as conexións entre a recuperación
de información e os sistemas de recomendación. O naso obxectivo é deseñar
modelos de recomendación inspirados en técnicas de recuperación
de información. Comezamos tomando prestadas ideas da literatura de
avaliación en recuperación de información para analizar as métricas de
avaliación nos sistemas de recomendación. En segundo lugar, estudamos
a aplicabilidade dos modelos de retroalimentación de seudo-relevancia a
diferentes tarefas de recomendación. Investigamos a tarefa de recomendar
listas ordenadas de elementos, pero tamén exploramos o problema
recentemente formulado de formación de grupos de usuario-elemento e
propoñemos unha tarefa nova baseada na liquidación dos elementos da
longa cola. Terceiro, explotamos modelos de recuperación ad hoc para
calcular veciñanzas nun escenario de filtrado colaborativo. En cuarto
lugar, exploramos a dirección aposta adaptando un método eficaz de
recomendación á retroalimentación de seudo-relevancia. Finalmente,
discutimos os resultados e presentamos as nasas conclusións.
En resumo, esta tese doutoral adapta varios modelos de recuperación
de información para o seu uso como sistemas de recomendación. A nosa
investigación mostra que moitos modelos de recuperación de información
pódense aplicar para tratar diferentes tarefas de recomendación.
Ademais, comprobamos que tomar o camiño contrario tamén é posible.
Unha experimentación exhaustiva confirma que os modelos propostos
son competitivos. Finalmente, tamén realizamos unha análise teórica
dalgúns modelos para explicar a súa efectividade
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
New Algorithms and Methodologies for Building Information Retrieval Collections
[Abstract] Information retrieval systems play a crucial role in addressing users’ information
needs by aiding their exploration of vast collections of information.
This thesis is framed in a critical information retrieval research aspect: evaluation.
In particular, we propose new approaches for creating annotated test
collections. Such collections are essential for evaluating retrieval systems’
effectiveness in controlled experiments. Reflecting real-world conditions
accurately in these test collections is pivotal for progress in the field.
We aim to introduce innovative techniques for efficiently assembling reliable
test collections, facilitating broader research and development in information
retrieval. The thesis first proposes a new method for building
new pooled test collections without requiring costly evaluation campaigns.
This approach simplifies and economizes the process of building new benchmarks.
Then, we introduce a novel adjudication method for determining
which pooled documents warrant human judgment, aiming to reduce the
need for extensive expert assessments. This method is both cost-effective and
efficient. Additionally, the thesis presents a fresh perspective on evaluating
adjudication methods, emphasizing statistical significance, an aspect often
overlooked in previous document adjudication research. As a demonstration
of the methods explored in this thesis, we applied them to develop a new test
collection whose construction process we describe here as an example of the
use of reduced-budget methods.
In summary, this thesis integrates established information retrieval knowledge
with new methodologies to create annotated collections that are both
cost-effective and reliable. This fusion is crucial for advancing the development
of more effective retrieval systems.[Resumen] Los sistemas de recuperación de información desempeñan un papel crucial a
la hora de satisfacer las necesidades de información de los usuarios, ayudándoles
a explorar vastas colecciones de información. Esta tesis se enmarca
en un aspecto crítico de la investigación en recuperación de información: la
evaluación. En concreto, proponemos nuevos enfoques para crear colecciones
de prueba. Éstas son esenciales para evaluar la eficacia de los sistemas de
recuperación en experimentos controlados. Reflejar con precisión las condiciones
del mundo real en estas colecciones es fundamental para avanzar en
este campo.
Nuestro objetivo es introducir técnicas innovadoras para construir colecciones
anotadas que sean fiables, y facilitar así la investigación y el desarrollo
en el campo de la recuperación de información. En primer lugar, la tesis
propone un nuevo método para crear nuevas colecciones de prueba sin necesidad
de costosas campañas de evaluación, simplificando y economizando
el proceso. A continuación, presentamos un nuevo método de adjudicación
para determinar qué documentos merecen un juicio humano, con el objetivo
de reducir el numero de juicios expertos necesarios. Este método es rentable y
eficiente. Además, la tesis presenta una nueva perspectiva de la evaluación de
los métodos de adjudicación, haciendo hincapié en la significancia estadística,
un aspecto que a menudo se pasa por alto en anteriores investigaciones sobre
adjudicación de documentos. Finalmente, aplicamos los métodos explorados
en esta tesis para construir una nueva colección de prueba, cuyo proceso de
construcción describimos, para demostrar la utilidad de nuestras propuestas.
En resumen, esta tesis integra conocimiento establecido en el campo con
nuevas metodologías para así crear nuevas colecciones de prueba fiables y
con bajo coste. Esta combinación es crucial para avanzar en el desarrollo de
sistemas de recuperación de información más efectivos.[Resumo] Os sistemas de recuperación de información desempeñan un papel crucial á
hora de satisfacer as necesidades de información dos usuarios, axudándolles
a explorar vastas coleccións de información. Esta tese enmárcase nun aspecto
crítico da investigación en recuperación de información: a avaliación. En
concreto, propoñemos novos enfoques para crear coleccións de proba. Estas
son esenciais para avaliar a eficacia dos sistemas de recuperación en experimentos
controlados. Reflectir con precisión as condicións do mundo real
nestas coleccións é fundamental para avanzar neste campo.
O noso obxectivo é introducir técnicas innovadoras para construír coleccións
anotadas que sexan fiables, e facilitar así a investigación e o desenvolvemento
no campo da recuperación de información. En primeiro lugar, a tese
propón un novo método para crear novas coleccións de proba sen necesidade
de custosas campañas de avaliación, simplificando e economizando o proceso.
A continuación, presentamos un novo método de adxudicación para determinar
que documentos merecen un xuízo humano, co obxectivo de reducir
o numero de xuízos expertos necesarios. Este método é rentable e eficiente.
Ademais, a tese presenta unha nova perspectiva da avaliación dos métodos
de adxudicación, facendo fincapé na significancia estatística, un aspecto que
a miúdo se pasa por alto en anteriores investigacións sobre adxudicación
de documentos. Finalmente, aplicamos os métodos explorados nesta tese
para consruir unha nova colección de proba, cuxo proceso de construción
describimos, para demostrar a utilidade das nosas propostas.
En resumo, esta tese integra coñecemento establecido no campo con novas
metodoloxías para así crear novas coleccións de proba fiables e con baixo custo.
Esta combinación é crucial para avanzar no desenvolvemento de sistemas de
recuperación de información máis efectivos
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
Depression Severity Estimation on the Internet: New Models and Resources
[Abstract] On the one hand, there is extensive evidence from medicine and psycholinguistics
fields of changes in language usage from people suffering
from mental health problems. On the other hand, social media platforms
provide a vast repository of written language.There is a recent trend in
computational linguistics where researchers aim to exploit social posts
to detect individuals at risk. In this thesis, we follow that line in the field
of depression detection. A shortcoming in actual research efforts is the
need for more interpretability of the models’ decisions. To mitigate that
problem, we investigate the development of models based on validated
clinical symptoms to identify depressive signs.
The contributions of this thesis are three-fold: (i) new models for depression
severity estimation based on symptom markers, (ii) the creation
of new datasets for helping the development of new symptom-based
approaches, and (iii) the exploration of recent massive large language
models for helping with the scaling up of the datasets construction. As a
final step, we incorporate the above contributions into a demonstrative
platform to be used by health professionals. This thesis contributes to
advancing the understanding and detection of depression through symptom
markers, and lays the foundation for future research in this critical
area of depression detection on social media.[Resumen] Existe evidencia proveniente de los campos de la medicina y psicolingüística sobre cambios en el uso del lenguaje de personas que sufren problemas de salud mental. Por otro lado, las redes sociales proporcionan un amplio repositorio de lenguaje escrito. Hay una tendencia reciente en lingüística computacional donde los investigadores buscan explotar publicaciones en las redes para detectar usuarios en riesgo. En esta tesis, seguimos esa línea en el campo de detección de la depresión. Sin embargo, un defecto de estas investigaciones es la necesidad de una mayor interpretabilidad de las decisiones de los modelos. Para mitigar ese problema, investigamos el desarrollo de modelos basados en síntomas validados clínicamente. Las contribuciones de esta tesis tienen tres enfoques: i): nuevos modelos para la estimación de la gravedad basados en marcadores de síntomas, ii) creación de colecciones para ayudar al desarrollo de métodos basados en síntomas, y iii) la exploración de los recientes modelos masivos de lenguaje para ayudar en la creación de colecciones. Buscando una integración práctica de los modelos de detección de la depresión, incorporamos nuestras aportaciones a una plataforma demostrativa para su uso por parte de clínicos. Esta tesis contribuye a avanzar en la comprensión y detección de la depresión a través de sus síntomas, y sienta bases para futuras investigaciones en el área de la detección de la depresión en las redes sociales.[Resumo] Hai unha evidencia extensa que provén dos campos da medicina e a
psicolingüística sobre os cambios no uso do lenguaxe das persoas que
sofren problemas de saúde mental. Por outro lado, as redes sociais proporcionan
un amplo repositorio de linguaxe escrito. Existe unha tendencia
recente na lingüística computacional onde os investigadores buscan explotar
publicacións nas redes para detectar usuarios en risco. Nesta tese,
seguimos esa liña no campo da detección da depresión. Porén, un defecto
das investigacións previas é a necesidade dunha maior interpretabilidade
das decisións dos modelos. Para mitigar ese problema, investigamos o desenvolvemento
de modelos baseados en síntomas validados clínicamente
para identificar sinais de depresión.
As contribucións desta tese teñen tres enfoques diferentes: i) novos
modelos para a estimación da gravidade baseados en marcadores de
síntomas, ii) a creación de coleccións para axudar ao desenvolvemento de
métodos baseados en síntomas, e iii) a exploración dos recentesmodelos
masivos de linguaxe para axudar a escalar a creación destes datasets.
Como último paso, e na nosa procura dunha integración práctica dos
modelos de detección da depresión, incorporamos as nosas aportacións
anteriores a unha plataforma demostrativa para o seu uso por parte de
clínicos. Esta tesis contribúe a avanzar na comprensión e detección da
depresión a través de marcadores de síntomas, e asenta as bases para
futuras investigacións nesta área crítica da detección da depresión nas
redes sociais.Xunta de Galicia; ED481A 2021/034I would also
like to thank the thesis defence committee, the external reviewers, and all
the researchers who have supported me during this stage. Lastly, I also
acknowledge the financial support offered by Xunta de Galicia through
grant ED481 A 2021/034
koamabayili/VECTRON-author-checklist: VECTRON author checklist
We have done our best to complete the author checklist relating to the use of animals in the hut study. Note that the objective for the hut study was to evaluate the IRS treatment applications for residual efficacy against Anopheles mosquitoes, including the local An. coluzzii mosquito population. Cows were only used to attract mosquitoes into the huts and no tests were carried out directly on the cows. The author checklist is intended for use with studies where experiments are carried out on animals, which is why we have had such difficulty in completing this for the hut study, as many of the questions do not relate to how the cows were used
- …
