1,721,414 research outputs found
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Genetic basis of hybrid vigour (heterosis) on maize (Zea mays L.) : QTL detection in a connected design and linkage disequilibrium based on fine mapping.
La vigueur hybride -ou hétérosis- est la supériorité d'un hybride par rapport au meilleur de ses parents. Ce phénomène majeur du monde vivant est étudié depuis plus de deux siècles. Il a permis des avancées importantes en amélioration des plantes, mais malgré sa large exploitation, de nombreuses questions restent ouvertes concernant ses bases génétiques. Une cartographie fine plus systématique des régions impliquées dans l'hétérosis représente aujourd'hui un enjeu majeur pour détecter les locus en cause avec la précision nécessaire pour une prédiction efficace. L'objectif de cette thèse était d'identifier les régions majeures impliquées dans le phénomène d'hétérosis chez le maïs par le biais de (i) une détection de QTL sur population multi-parentale et (ii) une approche de cartographie fine par génétique d'association. Pour la première approche, une extension du North Carolina III design a été utilisée : trois populations connectées de lignées recombinantes ont été développées puis croisées aux trois lignées parentales (appartenant à différents groupes hétérotiques majeurs) conduisant à 9 familles d'hybrides. Au total, 1289 hybrides ont été évalués dans quatre conditions expérimentales. Une détection de QTL a été réalisée sur les six familles d'hybrides provenant des croisements « consanguins » selon la méthode NCIII « classique » et pour l'ensemble du dispositif à l'aide d'un modèle multi-parental dans MCQTL. Une dizaine de QTL ont été mis en évidence pour chacun des caractères étudiés (rendement sec, hauteur de plante, humidité et précocité de floraison). La majorité des QTL détectés pour le rendement grain présentent des effets de superdominance avec peu de différences entre les génotypes hétérozygotes alors que pour l'humidité du grain le déterminisme semble plutôt additif. Les déterminismes de la date de floraison et la hauteur de plante présentent un comportement intermédiaire. Une proportion importante de QTL a été détectée près des régions centromériques, suggérant que le faible taux de recombinaison de ces régions favorise la détection de QTL liés en répulsion, conduisant à une superdominance apparente pour les caractères hétérotiques et de QTL liés en “coupling” renforçant l'effet additif apparent des autres caractères.Le second volet consistait à cartographier plus finement les zones impliquées dans le phénomène d'hétérosis par une approche de génétique d'association. Ce travail s'appuie sur 232 lignées historiques d'origines européennes et américaines complétées par 60 lignées récentes apportées par les actionnaires de Biogemma. Ces 292 lignées ont été croisées à trois lignées testeurs représentatifs de trois grands groupes hétérotiques. Les hybrides ainsi produits ont été évalués dans 5 lieux en 2009 et 2010. Le marquage génétique de la collection, réalisé pour l'ensemble du génome par deux puces illumina de 16 000 et 50 000 SNPs respectivement, a permis de caractériser la diversité génétique et le déséquilibre de liaison existant au sein de cette collection mais aussi d'évaluer l'effet de la structure et de l'apparentement dans les composantes d'aptitude générale et spécifique à la combinaison. Enfin, une approche de génétique d'association, conduite à l'aide de modèles développés spécifiquement, a permis de confirmer et affiner certaines zones impliquées dans le déterminisme de l'hétérosis et mises en évidence dans le premier volet de la thèse.Hybrid vigor, coined heterosis, is defined as the superiority of hybrid over the best of its parents. This major phenomenon has been studied for more than two centuries. Despite its wide exploitation, many questions remain open regarding its genetic bases. The comprehension and prediction of this phenomenon is then a major research issue. The goal of this thesis was the identification of major regions implied in this phenomenon in maize. To do so, two approaches were carried out: (i) a QTL detection in a multi-parental population and (ii) a fine mapping by association mapping in a hybrid panel of large diversity. For the first approach, we extended the North Carolina design III (NCIII) by using three populations of recombinant inbred lines derived from three parental lines belonging to different heterotic pools, crossed with each parental line to obtain 9 families of hybrids. A total of 1253 hybrids were evaluated in 4 environments. Quantitative trait loci (QTL) mapping was carried out on the six families obtained from crosses to parental lines following the “classical” NCIII method and with a multiparental connected model on the global design, adding the three families obtained from crosses to the non-parental line. Results of the QTL detection highlighted that most of the QTL detected for grain yield displayed apparent overdominance effects and limited differences between heterozygous genotypes, whereas for grain moisture predominance of additive effects was observed. For plant height and silking date results were intermediate. An important proportion of QTL detected were located close to the centromeres, suggesting that the lower recombination in these regions favors the detection of (i) linked QTL in repulsion phase, leading to apparent overdominance for heterotic traits and (ii) linked QTL in coupling phase, reinforcing apparent additive effects of linked QTL for the other traits.The second approach consisted in the fine mapping of regions implied in heterosis genetic architecture. This part of the thesis was based on a collection of 232 American and European historical lines, completed by a set of 60 inbred lines provided by the shareholder companies of Biogemma. These 292 lines were crossed with three testers belonging to the three elite sets and representing three complementary heterotic groups. The hybrid panel produced was evaluated in five locations in 2009 and 2010. The collection was genotyped at the genome scale with two Illumina arrays of respectively 16 000 and 50 000 SNPs. Genetic diversity and linkage disequilibrium were characterized. The effect of population structure and relatedness on the general and specific combining abilities of hybrids were evaluated. Finally, association mapping approach carried out with specifically developed models confirmed and refined some regions previously identified as implied in the genetic architecture of heterosis
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Interest of dense genotyping for selection in multi-parental designs. Comparison of two marker-assisted selection approaches : Genomewide selection and QTL-LDLA based selection. Application in maize (Zea mays L.)
Au cours de la dernière décennie, la disponibilité récente d'une haute densité de marqueurs a ouvert de nouvelles perspectives dans l'amélioration des plantes pour la sélection de caractères quantitatifs. Tout d'abord, la combinaison du déséquilibre de liaison et de l'information de liaison (LDLA) a été proposée pour augmenter la puissance et la résolution de la cartographie des QTL dans les populations multiparentales. Cette amélioration du processus de cartographie des QTL devrait accroître l'efficacité de la sélection assistée par marqueurs (MAS). Dans le même temps, il a été proposé d'éviter l'étape de détection des QTL en utilisant simultanément tous les marqueurs disponibles sur l'énome pour prédire les valeurs génétiques des candidats. En plante, plusieurs études principalement basées sur des approches de simulation ont déjà montré l'intérêt de cette approche de sélection génomique (SG). Cependant, des résultats empiriques sont encore nécessaires pour évaluer l'efficacité de la sélection par GS dans des modèles multiparentaux, en particulier sur plusieurs années et générations, et pour comparer son potentiel avec une sélection basée sur les résultats d'une approche QTL LDLA.L'objectif de cette thèse était d'étudier l'intérêt de ces nouvelles méthodes tout au long des cycles de sélection dans des populations multiparentales connectées, qui correspondent aux designs couramment utilisés par les sélectionneurs. Tout d'abord, nous avons comparé dans deux populations multiparentales de maïs la cartographie traditionnelle des QTL basée sur la liaison à deux modèles LDLA basés soit sur une approche de regroupement des allèles parentaux utilisant les similarités entre les haplotypes de marqueurs locaux obtenus avec un réseau SNP 50K, soit sur l'information d'un seul marqueur. Les résultats pour quatre caractères d'importance agronomique ont clairement mis en évidence que les deux modèles LDLA augmentaient la puissance et la précision de la cartographie des QTL. Ensuite, les capacités de prédiction basées soit sur les QTL détectés par l'analyse LDLA soit en utilisant la GS ont été évaluées sur plusieurs années dans la population de base et après un cycle de sélection. Les deux méthodes ont conduit à des précisions de prédiction plus élevées que la MAS traditionnelle quelle que soit la génération, et nous avons constaté en moyenne une supériorité de la GS sur la prédiction basée sur les QTL LDLA. Enfin, des simulations ont été réalisées comme étude complémentaire pour étudier différents paramètres. Nos résultats ont montré que la GS surpasse la MAS basée sur la détection de QTL, en particulier lorsque la taille de la population et l'héritabilité des traits sont faibles. A une taille de population donnée, nous avons constaté que l'efficacité de la GS diminue avec le nombre de lignées parentales, et qu'il y a un intérêt à considérer les allèles ancestraux surtout lorsque la densité de marqueurs est faible.Notre étude confirme clairement l'intérêt d'une information dense sur les marqueurs mais des travaux complémentaires sont encore nécessaires pour optimiser son utilisation dans les programmes de sélection végétale.In the past decade, the recent availability of high marker density has open new prospects in plant breeding for selection of quantitative traits. First, combining linkage disequilibrium and linkage information (LDLA) has been proposed to increase the power and resolution of QTL mapping in multiparental populations. This improvement of the QTL mapping process is expected to increase the efficiency of marker-assisted selection (MAS). In the same time, it has been proposed to avoid the QTL detection step by using simultaneously all markers available over the enome to predict genetic values of candidates. In plant, several studies mainly based on simulation approaches have already showed the interest of this genomic selection (GS) approach. However, empirical results are still required to assess the selection efficiency of GS in multiparental designs, especially over years and generations and tocompare its potential with a selection based on the results of a QTL LDLA approach.The objective of this thesis was to investigate the interest of these new methods along breeding cycles in multi-parental connected populations, that correspond to designs commonly used by plant breeders. First, we compared in two multi-parental maize populations traditional linkage based QTL mapping to two LDLA models either based on a clustering approach of parental alleles using similarities between local marker haplotypes obtained with a 50K SNP array or based on single marker information. Results for four traits of agronomical importance clearly highlighted that both LDLA models increased the power and accuracy of QTL mapping. Then, prediction abilities based either on the QTL detected through LDLA analysis or using GS were assessed over years in the base population and after one cycle of selection. Both methods led to higher prediction accuracies than traditional MAS whatever the generation, and we found on average a superiority of GS over LDLA QTL-based prediction. Finally, simulations were carried out as a complementary study to investigate different parameters. Our results showed that GS outperformed MAS based on QTL detection especially when population size and trait heritability were low. At a given population size, we found that GS efficiency decreases with the number of parental lines, and that there was an interest of considering ancestral alleles especially when marker density was sparse.Our study clearly confirms the interest of dense marker information but further work is still needed to optimize its use in plant breeding programs
Predicting and understanding the genotype by environment interactions using multi-omics integration in maize
Les programmes de sélection du maïs s'appuient sur des réseaux d'essais pour évaluer la performance phénotypique (P) des hybrides dans diverses conditions de culture. Dans ces essais, les interactions entre le génotype et l'environnement (IGE) ont un effet substantiel sur la variabilité phénotypique qui peut parfois dépasser l'effet génétique principal (G). Il est donc important de mieux modéliser ces IGE pour garantir l'amélioration génétique du maïs.Les modèles classiques de prédiction génomique, même ceux modélisant les IGE, ne tiennent pas compte de la complexité du génome et de la manière dont les régions génomiques réagissent aux stimuli environnementaux. En supposant un modèle infinitésimal, ils agissent comme des boîtes noires s'appuyant sur des relations statistiques plutôt que biologiques. Les chercheurs ont suggéré que les annotations fonctionnelles des gènes et les données multi-omiques pourraient permettre de mieux expliquer la relation entre génotype et phénotype. Des études ont montré que la hiérarchisation des marqueurs génomiques sur la base d'information biologique ou fonctionnelle peut contribuer à améliorer les capacités prédictives des modèles. Des résultats similaires ont été rapportés dans des études reposant sur des données multi-omiques, telles que les transcrits et les protéines. Toutefois, la plupart de ces études portent sur un seul essai ou sur des expériences réalisées en un seul lieu. Leur capacité à modéliser les IGE pour des caractères quantitatifs dans un réseau d'essais étendu doit être davantage étudiée. Par conséquent, cette thèse vise à (i) évaluer le potentiel des annotations fonctionnelles pour améliorer les prédictions en donnant la priorité à certaines régions génomiques, (ii) étudier le potentiel des données multi-omiques pour prendre en compte les IGE tout en améliorant la prédiction des caractères complexes, et (iii) identifier les gènes qui sont associés aux caractères de productivité et qui répondent aux conditions environnementales pour mieux comprendre la biologie derrière les IGE.Notre étude repose sur un panel de 244 hybrides de maïs évalués pour leur productivité dans des essais menés en Europe et au Chili sous des régimes hydriques contrastés. En outre, les annotations fonctionnelles des gènes ont été obtenues à partir de bases de données publiques. Les mêmes génotypes ont également été évalués pour leurs caractéristiques écophysiologiques, et les profils transcriptomiques et protéomiques ont été mesurés dans des conditions hydriques contrastées sur une plateforme.Dans le chapitre 1, nous avons montré que les marqueurs situés à proximité des gènes de certaines catégories fonctionnelles peuvent améliorer les prédictions de caractères de plein champ ou de plateforme.Dans le chapitre 2, nous avons pu montrer que les données omiques pouvaient accroître la capacité de prédiction par rapport à la sélection génomique, en particulier pour les caractères phénotypés dans les mêmes conditions que celles dans lesquelles les données omiques ont été acquises. Nous avons également intégré des covariables environnementales et les informations multi-omiques dans un même modèle, ce qui, à notre connaissance, n'a encore jamais été testé dans la littérature.Dans le chapitre 3, l'étude d'association transcriptomique (TWAS) a montré que les données omiques mesurées dans des conditions de plateforme contrôlées peuvent aider à disséquer l'architecture génétique du rendement mesuré dans des conditions de plein champ. Nous avons également constaté que certains des transcrits significativement associés ont déjà été identifiés dans la littérature comme étant associés à la réponse au stress. En outre, nous avons observé que la TWAS est complémentaire de la génétique d'association car elle peut améliorer la résolution et la puissance de détection.Pour conclure, cette thèse indique que les annotations fonctionnelles et les données multi-omiques sont utiles pour comprendre et prédire les IGE.Maize breeding programs heavily rely on multi-environmental trials (MET) to evaluate the phenotypic (P) performance of hybrids under diverse field conditions. Within these trials, genotype by environment (GxE) interactions has substantial effect on phenotypic variability, and can sometimes exceed the main genetic effect (G). Therefore, predicting and understanding GxE interactions is of utmost importance to ensure genetic improvement of maize.Classical genomic prediction models, even the ones accounting for GxE component separately from G, do not consider the complexity of maize genome and how genomic regions respond differently to environmental stimuli. By assuming an infinitisemal model, they act as black boxes relying on statistical rather than biological relationships. Researchers have suggested that genome functional annotations and multi-omics information have potential to better explain the genotype phenotype relationship. Studies have shown that prioritizing genomic markers, i.e., SNPs, based on a prior biological or functional information can help improve predictive abilities of models. Similar results have also been reported in the studies accounting for multi-omics information, such as transcripts, proteins, and metabolites, in genomic prediction. However, most of these studies are either performed for a single experiment or a set of experiments within a single location. Their potential in capturing GxE interactions for complex quantitative traits in a large MET setting needs further validation.Therefore, this thesis aims to (i) evaluate the potential of genomic functional annotations to improve maize predictions by prioritizing those genomic regions that respond to environmental stimuli for a given trait, (ii) investigate the potential of multi-omics data to account for GxE while improving prediction of complex traits, and (iii) identify genes that are found to be associated with productivity traits and respond to environmental conditions to offer insights into the biology beyond GxE interactions.Our study uses a set of 244 maize hybrids evaluated for productivity traits in field trials carried out across Europe and Chile under contrasted watering regimes. Environmental covariates related to key developmental stages of plants in field were also obtained. In addition, gene ontology (GO) functional annotations for maize genome was obtained from publicly available databases. The same genotypes were also evaluated for ecophysiological traits, and transcriptomic and proteomic profiles were measured for contrasting watering regimes in controlled conditions on a platform.In Chapter 1, we illustrated that when the right GO terms are considered, biologically relevant SNPs can account for variance separately from the rest of the SNPs, ultimately improving predictions of both field productivity and platform ecophysiological traits.In Chapter 2, we were able to show that the omics data could increase predictive ability in comparison to genomic selection, in particular for the traits phenotyped in the controlled experiment in which the omics were measured. We also integrated ECs and multi-omics information within the same model, that according to our knowledge this was the first example in literature.In Chapter 3, transcriptome wide association study (TWAS) showed that omics measured in controlled platform conditions can help dissect the genetic architecture of grain yield measured in field MET. We also found that some of the significantly associated transcripts have already been reported in the literature to be associated with response to stress. Importantly, we observed that TWAS complements GWAS as it can improve resolution and detection power of association analysis.Overall, this thesis indicates that functional annotations and multi-omics are useful in understanding and predicting GxE interactions
Optimization of association genetics and genomic selection strategies for populations of different diversity levels : Application in maize (Zea mays L.)
D'importants progrès ont été réalisés dans les domaines du génotypage et du séquençage, ce qui permet de mieux comprendre la relation génotype/phénotype. Il est possible d'analyser l'architecture génétique des caractères (génétique d'association, GA), ou de prédire la valeur génétique des candidats à la sélection (sélection génomique, SG). L'objectif de cette thèse était de développer des outils pour mener ces stratégies de manière optimale. Nous avons d'abord dérivé analytiquement la puissance du modèle mixte de GA, et montré que la puissance était plus faible pour les marqueurs présentant une faible diversité, une forte différentiation entre sous groupes et une forte corrélation avec les marqueurs utilisés pour estimer l'apparentement (K). Nous avons donc considéré deux estimateurs alternatifs de K. Des simulations ont montré qu'ils sont aussi efficaces que la méthode classique pour contrôler les faux positifs et augmentent la puissance. Ces résultats ont été confirmés sur les panels corné et denté du programme Cornfed, avec une augmentation de 40% du nombre de SNP détectés. Ces panels, génotypés avec une puce 50k SNP et phénotypés pour leur précocité et leur biomasse ont permis de décrire la diversité de ces groupes et de détecter des QTL. En SG, des études ont montré l'importance de la composition du jeu de calibration sur la fiabilité des prédictions. Nous avons proposé un algorithme d'échantillonnage dérivé de la théorie du G-BLUP permettant de maximiser la fiabilité des prédictions. Par rapport à un échantillon aléatoire, il permettrait de diminuer de moitié l'effort de phénotypage pour atteindre une même fiabilité de prédiction sur les panels Cornfed.Major progresses have been achieved in genotyping technologies, which makes it easier to decipher the relationship between genotype and phenotype. This contributed to the understanding of the genetic architecture of traits (Genome Wide Association Studies, GWAS), and to better predictions of genetic value to improve breeding efficiency (Genomic Selection, GS). The objective of this thesis was to define efficient ways of leading these approaches. We first derived analytically the power from classical GWAS mixed model and showed that it was lower for markers with a small minimum allele frequency, a strong differentiation among population subgroups and that are strongly correlated with markers used for estimating the kinship matrix K. We considered therefore two alternative estimators of K. Simulations showed that these were as efficient as classical estimators to control false positive and provided more power. We confirmed these results on true datasets collected on two maize panels, and could increase by up to 40% the number of detected associations. These panels, genotyped with a 50k SNP-array and phenotyped for flowering and biomass traits, were used to characterize the diversity of Dent and Flint groups and detect QTLs. In GS, studies highlighted the importance of relationship between the calibration set (CS) and the predicted set on the accuracy of predictions. Considering low present genotyping cost, we proposed a sampling algorithm of the CS based on the G-BLUP model, which resulted in higher accuracies than other sampling strategies for all the traits considered. It could reach the same accuracy than a randomly sampled CS with half of the phenotyping effort
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
- …
