1,721,152 research outputs found
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
koamabayili/VECTRON-author-checklist: VECTRON author checklist
We have done our best to complete the author checklist relating to the use of animals in the hut study. Note that the objective for the hut study was to evaluate the IRS treatment applications for residual efficacy against Anopheles mosquitoes, including the local An. coluzzii mosquito population. Cows were only used to attract mosquitoes into the huts and no tests were carried out directly on the cows. The author checklist is intended for use with studies where experiments are carried out on animals, which is why we have had such difficulty in completing this for the hut study, as many of the questions do not relate to how the cows were used
Extraction and prediction of chemotherapy responses from electronic health records
La chimiothérapie est le traitement prédominant pour soigner les cancers. C'est un traitement complexe au cours duquel des molécules cytotoxiques sont administrées au patient pour cibler les cellules cancéreuses et réduire la taille des tumeurs. Cependant, la réponse des patients à ces traitements varie considérablement, et l'administration de ces molécules entraîne souvent des toxicités de gravité variable. Mieux comprendre et gérer ces réponses individuelles est un sujet de recherche majeur en oncologie. Ainsi, extraire les informations sur les toxicités et évaluer l'efficacité du traitement sont des étapes essentielles dans les études qui visent à améliorer et personnaliser le traitement des cancers. L'objectif de cette thèse est d'exploiter les données hospitalières afin d'extraire, représenter et prédire les réponses aux chimiothérapies. Les informations individuelles sur les chimiothérapies suivies et leurs réponses sont disponibles dans les entrepôts de données hospitaliers, mais leur extraction présente plusieurs obstacles. Celle-ci sont irrégulièrement réparties et structurées dans des source hétérogènes, telles que des questionnaires, les données de suivi des chimiothérapies et des comptes rendus. De plus, les chimiothérapies suivent des protocoles complexes incluant les notions de cycles, lignes de traitement, de changements de doses et de temps d'administration qui ne sont pas facilement manipulables avec les entrepôts de données classiques.Pour répondre à ces défis, nous avons développé deux ontologies : ChemoOnto et OntoTox. ChemoOnto est une ontologie dédiée à la représentation du cours des chimiothérapies, en intégrant à la fois les protocoles théoriques et les lignes de traitement suivies par les patients. Elle réutilise des ontologies de référence pour représenter la temporalité et les médicaments. OntoTox, quant à elle, représente les toxicités induites par les chimiothérapies et leurs sévérité, extraites à partir de diverses parties d'un entrepôt de données hospitalier. OntoTox normalise ces toxicités en utilisant des thésaurus médicaux standardisés. Les deux ontologies ont été peuplées avec des données réelles, constituant ainsi deux bases de connaissances qui facilitent l'analyse de données sur les chimiothérapies et les réponses à ces traitements. Ces ressources ont été implémentées avec les outils du web sémantique qui permettent de surmonter certaines limites des entrepôts de données traditionnels en offrant une représentation standard et extensible des connaissances biomédicales. En parallèle, nous avons développé ProtoDrift, une métrique pour mesurer l'adhésion aux chimiothérapies. ProtoDrift évalue l'écart entre le protocole de chimiothérapie théoriquement suivi et le traitement effectivement suivi par un patient, en prenant en compte les décalages de jours d'administration et les réductions de doses. Cette métrique utilise une moyenne pondérée des dissimilarités à plusieurs niveaux (administration, molécule, cycle, ligne de traitement). L'optimisation des poids de ProtoDrift par des régression logistique ou de Cox montrent une amélioration significative des prédictions de survie par rapport à la méthode classique de mesure de l'adhésion aux chimiothérapies, la dose intensité relative. Ces résultats ont été reproduits dans deux hôpitaux différents, confirmant la robustesse et la pertinence de ProtoDrift pour évaluer l'adhésion aux chimiothérapies. Cette reproductibilité a notamment été facilitée par ChemoOnto que nous avons utilisé comme représentation standard pour calculer ProtoDrift. Les ontologies ChemoOnto et OntoTox, ainsi que la métrique ProtoDrift offrent des perspectives prometteuses pour la recherche en oncologie. Elles facilitent la considération de données médicales complexes et permettent une analyse plus fine des réponses aux chimiothérapies. De plus, ces ressources ont été développées en suivant les principes et bonnes pratiques de la sciences ouverte.Chemotherapy is the primary treatment for cancer, involving the administration of cytotoxic drugs to patients to target cancer cells and reduce tumor size. However, patient response to this treatment varies widely, and its administration often results in toxicities of various level of severity. Better understanding and managing these individual responses is a major focus in oncology research. Extracting toxicities and assessing treatment efficacy are crucial for studies that aim at improving and personalizing cancer treatments.The goal of this thesis is to leverage hospital data to extract, represent, and predict chemotherapy responses.Information about chemotherapies and their responses is available in hospital data warehouses, but its use faces several challenges. This information is irregularly distributed and structured across heterogeneous sources such as questionnaires, chemotherapy follow-up data, and medical reports, making its extraction difficult. Additionally, chemotherapies involve complex concepts such as treatment cycles, lines, theoretical protocols, toxicity grades, which are not easily handled by classical data warehouses.To address these challenges, we developed two ontologies: ChemoOnto and OntoTox. ChemoOnto is designed to represent the course of chemotherapy treatments, integrating both theoretical protocols and actual patient treatment lines. It employs reference ontologies to represent temporal aspects and drugs. OntoTox, on the other hand, focuses on the chemotherapy-induced toxicities and their severity, extracted from various parts of an hospital data warehouse. OntoTox normalizes these toxicities using standard medical thesauri. Both ontologies were populated with real world data to form knowledge bases that facilitate the analysis of chemotherapy data and outcomes. Additionally, they were implemented using Semantic Web tools to overcome the limitations of classical data warehouses by providing a standard and extensible representation of biomedical knowledge. Meanwhile, we developed ProtoDrift, a metric to measure the adherence to chemotherapy protocols. ProtoDrift evaluates deviations between the theoretical chemotherapy protocol supposed to be followed and the actual one, by considering administration day shifts and dose reductions. This metric uses a weighted average of dissimilarities at several levels (administration, molecule, cycle, treatment line). Optimizing ProtoDrift weights using logistic regression or Cox methods has shown significant improvements in survival predictions compared to the traditional measure of chemotherapy adherence, namely the relative dose intensity.These results were reproduced in two different hospitals, confirming the robustness and relevance of ProtoDrift in evaluating chemotherapy adherence. In addition, we relied on ChemoOnto to serve as a standard representation to compute ProtoDrift in the two settings.The ChemoOnto and OntoTox ontologies, along with the ProtoDrift metric, offer promising perspectives for oncology research. They facilitate the consideration of complex medical data and enable a fine-grained understanding of chemotherapy responses. Lastly, these resources have been developed using Open Science principles and good practices
Author-wise bibliometric analysis based on entropy.
Author-wise bibliometric analysis based on entropy.</p
Construction et utilisation d'une base de connaissances pharmacogénomique pour l'intégration de données et la découverte de connaissances
This thesis studies the use of ontology and knowledge base for guiding various steps of the Knowledge Discovery in Databases (KDD) process in the domain of pharmacogenomics.Data related to this domain are heterogeneous, complex, and disseminated through several data sources. Consequently, the preliminary step that consists in the preparation and the integration of data is crucial. For guiding this step, an original approach is proposed, based on a knowledge representation of the domain within two ontologies in description logics: SNP-Ontology and SO-Pharm. This approach has been implemented using semantic Web technologies and leads finally to populating a pharmacogenomic knowledge base. As a result, data to analyze are represented in the knowledge base, which is a benefit for guiding following steps of the knowledge discovery process. Firstly, I study this benefit for feature selection by illustrating how the knowledge base can be used for this purpose. Secondly, I describe and apply to pharmacogenomics a new method named Role Assertion Analysis (or RAA) that enables knowledge discovery directly from knowledge bases. This method uses data mining algorithms over assertions of our pharmacogenomic knowledge base and results in the discovery of new and relevant knowledge.Cette thèse porte sur l'utilisation d'ontologies et de bases de connaissances pour guider différentes étapes du processus d'Extraction de Connaissances à partir de Bases de Données (ECBD) et sur une application en pharmacogénomique. Les données relatives à ce domaine sont hétérogènes, complexes, et distribuées dans diverses bases de données, ce qui rend cruciale l'étape préliminaire de préparation et d'intégration des données à fouiller. Je propose pour guider cette étape une approche originale d'intégration de données qui s'appuie sur une représentation des connaissances du domaine sous forme de deux ontologies en logiques de description : SNP-Ontology et SO-Pharm. Cette approche a été implémentée grâce aux technologies du Web sémantique et conduit au peuplement d'une base de connaissances pharmacogénomique. Le fait que les données à fouiller soient alors disponibles dans une base de connaissances entraîne de nouvelles potentialités pour le processus d'extraction de connaissances. Je me suis d'abord intéressé au problème de la sélection des données les plus pertinentes à fouiller en montrant comment la base de connaissances peut être exploitée dans ce but. Ensuite j'ai décrit et appliqué à la pharmacogénomique, une méthode qui permet l'extraction de connaissances directement à partir d'une base de connaissances. Cette méthode appelée Analyse des Assertions de Rôles (ou AAR) permet d'utiliser des algorithmes de fouille de données sur un ensemble d'assertions de la base de connaissances pharmacogénomique et d'expliciter des connaissances nouvelles et pertinentes qui y étaient enfouies
- …
