1,721,126 research outputs found
Recherches de chemins dans le réseau métabolique et mesure de la distance métabolique entre enzymes
Doctorat en Sciencesinfo:eu-repo/semantics/nonPublishe
Développement de méthodes bioinformatiques pour l'analyse de collections massives de motifs de liaison pour des facteurs transcriptionnels : enrichissement local et clustering de motifs
Les facteurs transcriptionnels (TF) sont des protéines qui contrôlent l'expression des gènes. Leurs motifs de liaison (TFBM, également appelés motifs) sont généralement représentés sous forme de matrices de scores spécifiques de positions (PSSM). L'analyse de motifs est utilisée en routine afin de découvrir des facteurs candidats pour la régulation d'un jeu de séquences d'intérêt. L'avénement des méthodes à haut débit a permis de détecter des centaines de motifs, qui sont disponibles dans des bases de données. Durant ma thèse, j'ai développé deux nouvelles méthodes et implémenté des outils logiciels pour le traitement de collections massives de motifs: matrix-clustering regroupe les motifs par similarité; position-scan détecte les motifs présentant des préférences de position relativement à une coordonnée de référence. Les méthodes que j'ai développées ont été évaluées sur base de cas d'études, et utilisées pour extraire de l'information interprétable à partir de différents jeux de données de Drosophila melanogaster et Homo sapiens. Les résultats démontrent la pertinence de ces méthodes pour l'analyse de données à haut débit, et l'intérêt de les intégrer dans des pipelines d'analyse de motifs.Transcription Factors (TFs) are DNA-binding proteins that control gene expression. TF binding motifs (TFBMs, simply called “motifs”) are usually represented as Position Specific Scoring Matrices (PSSMs), which can be visualized as sequence logos. The advent of high-throughput methods has allowed the detection of thousands of motifs which are usually stored in databases. In this work I developed two novel methods and implemented software tools to handle large collection of motifs in order to extract interpretable information from high-throughput data: (i) matrix-clustering regroups motifs by similarity and offers a dynamic interface; (2) position-scan detects TFBMs with positional preferences relative to a given reference location (e.g. ChIP-seq peaks, transcription start sites). The methods I developed have been evaluated based on control cases, and applied to extract meaningful information from different datasets from Drosophila melanogaster and Homo sapiens. The results show that these methods enable to analyse motifs in high-throughput datasets, and can be integrated in motif analysis workflows
Analyse bioinformatique de la régulation transcriptionnelle des complexes protéiques chez la levure Saccharomyces cerevisiae
Doctorat en Sciencesinfo:eu-repo/semantics/nonPublishe
Predicting metabolic pathways by sub-network extraction.
Various methods result in groups of functionally related genes obtained from genomes (operons, regulons, syntheny groups, and phylogenetic profiles), transcriptomes (co-expression groups) and proteomes (modules of interacting proteins). When such groups contain two or more enzyme-coding genes, graph analysis methods can be applied to extract a metabolic pathway that interconnects them. We describe here the way to use the Pathway extraction tool available on the NeAT Web server ( http://rsat.ulb.ac.be/neat/ ) to piece together the metabolic pathway from a group of associated, enzyme-coding genes. The tool identifies the reactions that can be catalyzed by the products of the query genes (seed reactions), and applies sub-graph extraction algorithms to extract from a metabolic network a sub-network that connects the seed reactions. This sub-network represents the predicted metabolic pathway. We describe here the pathway prediction process in a step-by-step way, give hints about the main parametric choices, and illustrate how this tool can be used to extract metabolic pathways from bacterial genomes, on the basis of two study cases: the isoleucine-valine operon in Escherichia coli and a predicted operon in Cupriavidus (Ralstonia) metallidurans.Journal ArticleResearch Support, Non-U.S. Gov'tSCOPUS: ar.kinfo:eu-repo/semantics/publishe
Tirer parti des combinaisons d'éléments cis-régulateurs
A régulation cis-génomique chez l’homme est effectuée par des régulateurs de la chromatine, tels que les marques d’histones et les régulateurs de transcription (TR). Ils fonctionnent rarement seuls, mais plutôt en complexes. Le développement du séquençage NGS fournit des méthodes pour étudier cette régulation, incluant le ChIP-seq. Le but de cette thèse est de tirer parti de ces combinaisons avec des méthodes d’apprentissage automatique, efficaces pour apprendre les régularités dans les données. Nous représentons les régions d’intérêt sous forme de listes d’intervalles, converties en représentations matricielles et tensorielles. De fait, nos approches sont généralisables à toute liste d’intervalles. Le ChIP-seq peut souffrir d’erreurs et de faux positifs, d’un contrôle de qualité médiocre, etc. Ces biais sont difficiles à corriger, et les grands volumes de données augmentent la probabilité d’erreurs. Nous supposons que le bruit ne respectera pas les combinaisons usuelles entre les sources et proposons atyPeak, qui exploite les combinaisons de TR et d’expériences redondantes de ReMap. Nous utilisons un auto-encodeur convolutionnel multi-vues pour une compression "de juste milieu". Nous proposons des approches pour évaluer les auto-encodeurs. Enfin, l’enrichissement de combinaisons n-wise d’éléments (par rapport à ce qui est attendu au hasard) doit être quantifié avec précision. Nous proposons OLOGRAM- MODL, une méthode Monte Carlo ajustant un modèle binomial négatif sur le nombre de paires de bases où elle sont observées. Nous proposons un algorithme d’extraction d’itemsets pour identifier les combinaisons qui reconstruisent le mieux les données d’origine.Genetic cis-regulation in humans is effected through chromatin regulators, such as histone marks and Transcriptional Regulators (TRs). Those regulators seldom act alone, instead forming complexes. The development of NGS provides experimental methods to study this regulation, which includes ChIP-seq. The goal of this thesis is to leverage such combinations through the use of machine learning methods, which are effective at learning regularities in the data. We propose to represent the regions where regulators bind as lists of intervals, converted into matrix and tensor representations. ChIP-seq and other experimental assays can suffer from errors and false positives, poor quality control, and several other biases that are difficult to correct. Furthermore, the use of larger volumes of data increases the probability of errors. We assume that noise peaks will not respect the usual combinations between sources, and propose atyPeak which exploits combinations of TRs, and redundant experiments from the ReMap database. We propose to use a multi-view convolutional autoencoder to perform a “Goldilocks” compression. We developed approaches to evaluate autoencoders based on their respect of existing correlations. Finally, the enrichment of given n-wise combinations of elements (how often they are found compared to expected by chance) needs to be precisely quantified. We propose the OLOGRAM-MODL approach, demonstrating a Monte Carlo based method to fit a Negative Binomial model on the number of base pairs on which a given combination is observed. We also propose an itemset mining algorithm to based on which combinations best rebuild the original data
Study of the mechanisms controlling HOX gene expression and implications for the in vitro generation of human tissues
La formation du schéma corporel des vertébrés dépend, lors de l’embryogenèse, de l’organisation spatiale des différents types cellulaires le long de l’axe antéro-postérieur. Ce processus est orchestré par les facteurs de transcription HOX qui sont différentiellement exprimés le long de cet axe et confèrent leur identité positionnelle aux tissus en développement. Ces patrons d’expression sont initiés par l’activation séquentielle des gènes HOX dans les progéniteurs axiaux, une population de cellules souches nourrissant l’allongement progressif du corps des embryons en développement, notamment les somites et la moelle épinière. Parallèlement à l’induction progressive de cette famille de gènes, ces progéniteurs génèrent donc des structures de plus en plus caudales transformant la séquence temporelle d’activation en domaines d'expression spatiaux le long de l’axe antéro-postérieur. Néanmoins, les mécanismes qui rythment la temporalité de cette induction et sa transformation en domaines spatiaux restent mal connus, en particulier chez l’humain. Pour aborder ces questions, au cours de ma thèse, j’ai produit à partir de cellules souches pluripotentes humaines des progéniteurs arborant les caractéristiques moléculaires et fonctionnelles des progéniteurs axiaux. En effet, nous avons montré que ces progéniteurs activent séquentiellement les gènes HOX et peuvent donner naissance à des organoïdes récapitulant de multiples aspects de la génération et de l’organisation de l’axe antéro-postérieur comme la formation de somites entourant un tube neural le long duquel les patrons d’expression spatiaux de plusieurs HOX sont récapitulés. En utilisant ces progéniteurs axiaux produits in vitro, nous avons tout d’abord démontré que la vitesse d’induction des gènes HOX est dynamiquement modulée par l’activité graduelle de facteurs extrinsèques, FGFs et GDF11 qui sont séquentiellement exprimés dans la région caudale des embryons vertébrés au cours du développement. Puis, nous avons montré 1) que les gènes HOX activés sont des cibles directes des voies de signalisation en aval de ces facteurs et 2) que la vitesse d’activation des gènes exprimés de plus en plus tardivement est déterminée par la durée d‘activation des voies de signalisation dans les progéniteurs axiaux, une propriété des voies régulée par des mécanismes intrinsèques de rétrocontrôles négatifs. Dans l’ensemble, mes résultats permettent de proposer un nouveau modèle dans lequel le rythme d’activation des gènes HOX est une propriété émergente des dynamiques de voies de signalisation en aval de facteurs extrinsèques. Parallèlement, mes études ont permis d’améliorer l’ingénierie cellulaire et tissulaire des cellules du tronc à partir de cellules souches pluripotentes humains culminant en des protocoles de génération des différents sous-types de motoneurones présent le long de l’axe du corps et en un nouveau modèle d’organoïde mimant la morphogenèse et la formation de la diversité cellulaire le long de l’axe du corps humain.During embryogenesis, the formation of the vertebrate body plan depends on the spatial organization of different cell types along the anterior-posterior axis. This process is orchestrated by HOX transcription factors, which are differentially expressed along this axis, conferring positional identity on developing tissues. HOX patterns of expression are initiated by the sequential activation of HOX genes in axial progenitors, a population of stem cells fueling the progressive elongation of the body of developing embryos, forming notably the somites and the spinal cord. In parallel with the progressive induction of this gene family, these progenitors generate increasingly caudal structures, transforming the temporal sequence of activation into spatial domains of expression along the anterior-posterior axis. Nevertheless, the mechanisms that regulate the temporality of this induction and its transformation into spatial domains remain poorly understood, particularly in humans. To address these questions, during my thesis I generated progenitors from human pluripotent stem cells that display the molecular and functional characteristics of axial progenitors. Indeed, we have shown that these progenitors sequentially activate HOX genes and can give rise to organoids recapitulating multiple aspects of the generation and organization of the anterior-posterior axis, such as the formation of somites surrounding a neural tube along which the spatial expression patterns of several HOXs are recapitulated. Using these in vitro-produced axial progenitors, we first demonstrated that the tempo of induction of HOX genes is dynamically modulated by the graded activity of two extrinsic factors, FGFs and GDF11, which are sequentially expressed in the caudal region of vertebrate embryos during development. Then, we showed that 1) activated HOX genes are direct targets of signaling pathways downstream of these factors and 2) that the speed of activation of genes expressed later and later is determined by the duration of pathway activation in axial progenitors, a property of the pathways regulated by intrinsic negative feedback mechanisms. Overall, my results suggest a new model in which the timing of HOX gene activation is an emergent property of the dynamics of signaling pathways downstream of extrinsic factors. In parallel, my studies have led to improved cellular and tissue engineering of trunk cells from human pluripotent stem cells, culminating in protocols for generating the different motor neuron subtypes present along the body axis, and a new organoid model mimicking morphogenesis and the formation of cellular diversity along the human body axis
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
- …
