1,721,673 research outputs found
Assimilation of spatio-temporal dynamics of turbidity by combining satellite measurements of ocean color and hydrodynamic simulations
La caractérisation de la dynamique des sédiments en suspension dans l’océan fournit des informations essentielles pour les études scientifiques et les besoins opérationnels.En raison de l’interaction complexe entre les forçages naturels et anthropiques, la compréhension et la surveillance de la dynamique des sédiments en suspension restent très difficiles. Les schémas classiques d’analyse de données qu’ils soient in-situ, observés par satellites ou modélisés doivent jongler avec de nombreuses incertitudes et approximations.Cette thèse explore les capacités des méthodes de réseaux de neurones à combiner les approches et les types de données pour aboutir à de meilleures reconstructions.Dans cette thèse est mise en œuvre la méthode 4DVarNet, basée sur une formulation d’assimilation de données, mais dans une architecture de réseaux de neurones. Cette méthode est comparée et évaluée dans plusieurs cas de figures (interpolation et prévision) qui montrent des résultats très encourageants concernant sa capacité à produire des reconstructions pertinentes et de qualité supérieure aux méthodes classiques. Ces résultats permettent de discuter de l’importance des forçages océaniques et des mesures pour pouvoir améliorer la caractérisation des dynamiques de l’océan.Characterization of suspended sediment dynamics in the ocean provides essential information for scientific studies and operational challenges. Due to the complex interaction between natural and anthropogenic forcings, understanding and monitoring suspended sediment dynamics remains very challenging.Conventional data analysis schemes whether in-situ, satellite observed or modeled must juggle with many uncertainties and approximations.This thesis explores the capabilities of neural network methods to combine approaches and data types to achieve better reconstructions. In this thesis the 4DVar-Net method is implemented, based on a data assimilation formulation but in a neural network architecture. This method is compared and evaluated in several cases (interpolation and forecasting) which show very encouraging results regarding its ability to produce relevant reconstructions of higher quality than classical methods. These results allow us to discuss the importance of oceanic forcing and measurements to better characterize ocean dynamics
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Apprentissage statistique pour les géosciences : méthodes pour la génération d'extrêmes et l'assimilation de données
Le domaine des géosciences vise à comprendre de manière exhaustive le système terrestre. Il intervient dans la compréhension de problématiques majeures, notamment l'impact du changement climatique ou la gestion des risques liés à des événements extrêmes. Les géosciences bénéficient considérablement de la massification de données à grande échelle, ce qui les rend propices à l'utilisation d'algorithmes de Machine Learning (ML). Du fait de ses spécificités, l'analyse des données géoscientifiques nécessite des formulations et des méthodologies ML innovantes. Le travail effectué dans cette thèse apporte de nouveaux outils basés sur le ML adaptés aux défis des géosciences, avec un potentiel d'applications plus larges au-delà du domaine des géosciences.Dans la première partie de cette thèse, nous proposons une approche ML pour estimer la distribution de variables spatio-temporelles dynamiques à partir d'observations bruitées et irrégulières. En effet, nous introduisons un cadre d'apprentissage pour estimer à la fois l'état d'un système dynamique et les incertitudes sous forme d'une matrice de covariance. Cette méthode trouve des applications dans les problèmes d'assimilation de données, pour lesquels on dispose d'observations bruitées et éparses couplées à des connaissances sur la dynamique physique. Les modèles de prévision météorologique ou océanographique sont concernés.La deuxième partie de cette thèse présente un modèle génératif ML produisant de nouveaux échantillons d'une distribution multivariée inconnue à partir d'exemples. Notre simulateur fournit des échantillons en dehors des données d'entraînement et permet d'extrapoler. Cette approche a des applications directes dans l'étude des risques environnementaux puisqu'elle permet la simulation numérique d'échantillons extrêmes rares.The field of geosciences aims to comprehensively understand the Earth system. It addresses critical challenges, including the impact of climate change or management of risks from extreme events. Geosciences benefit significantly from the influx of large-scale data, making it conducive for machine learning (ML) applications. Because of its specific features, the analysis of geoscience data requires innovative ML formulations and methodologies. The work in this thesis contributes novel ML-based tools tailored for geoscience challenges, with the potential for broader applications beyond the geosciences domain.In the first part of this thesis, we propose a ML approach to estimate the distribution of dynamically driven spatio-temporal variables from noisy and irregular observations. Indeed, we introduce a learning framework to estimate both the state of a dynamical system with associated uncertainties as a covariance matrix. Such method can finds applications to data assimilation problems, in which noisy and sparse observations are available coupled with knowledge about the physical dynamics. Weather or oceanographic forecast models are concerned.The second part of this thesis presents a ML-based generative model which produce new samples of an unknown multivariate distribution given examples. Our simulator provides samples outside of the training data and allows to extrapolate. This approach has direct applications to the study of environmental hazards since it allows numerical simulation of rare extreme samples
The role of the ocean surface mesoscale and submesoscale in the transport of organic carbon at depth
La pompe à carbone biologique joue un rôle essentiel dans le système climatique. Sans elle, les concentrations de CO2 seraient environ deux fois supérieures à celles observées aujourd’hui. L’objectif principal de cette thèse est d’améliorer l’estimation du carbone organique exporté en Atlantique Nord en prenant en compte l’activité à mésoechelle et sous-mésoéchelle de la région. Nous avons dans un premier temps étudié l’impact des fronts de sous-mésoéchelle sur le transport de carbone. Nos résultats suggèrent que la subduction du carbone induit par les fronts est hautement saisonnière et que ce processus peut être estimé en utilisant uniquement des données de surface. D’autre part, nous avons cherché à identifier l’impact de la mésoéchelle sur la trajectoire des particules organiques plongeantes dans l’océan profond. Pour cela, nous avons entrainé un réseau de neurones artificiels afin d’estimer l’origine en surface des particules capturées par les pièges à particules profonds. Le réseau neuronal a été appliqué à des données satellitaires autours de la station Porcupine Abyssal Plain Sustained Observatory et les prédictions ont permis une corrélation renforcée entre les flux de carbone observés en profondeur et la chlorophylle en surface. En conclusion, les résultats présentés dans cette thèse facilitent l’identification des facteurs physiques sur l’export du carbone dans l’océan profond.The biological carbon pump plays an essential role in the climate system. Without it, CO2 concentrations would be around twice those observed today. The main objective of this thesis is to improve the estimation of organic carbon exported to the North Atlantic by taking into account mesoscale and submesoscale activity. We first studied the impact of submesoscale fronts on carbon transport. Our results suggest that carbon subduction by fronts is highly seasonal and that this process can be estimated using solely surface data. We also sought to identify the impact of the mesoscale on the sinking organic particles pathways in the deep ocean. To this end, we trained an artificial neural network to estimate the surface origin of particles captured by deep sediment traps. The neural network was applied to satellite data around the Porcupine Abyssal Plain Sustained Observatory station and the predictions led to a stronger correlation between observed deep carbon fluxes and surface chlorophyll. In conclusion, the results presented in this thesis facilitate the identification of the physical factors influencing carbon export to the deep ocean
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Une écologie du comportement des pêcheurs : histoires cachées à partir des données de trajectoires dans le système de Courant de Humboldt
Ce travail propose une contribution originale à la compréhension du comportement spatial des pêcheurs, basée sur les paradigmes de l'écologie comportementale et de l'écologie du mouvement. En s'appuyant sur des données du 'Vessel Monitoring System', nous étudions le comportement des pêcheurs d'anchois du Pérou à des échelles différentes: (1) les modes comportementaux au sein des voyages de pêche (i.e. recherche, pêche et trajet), (2) les patrons comportementaux parmi les voyages de pêche, (3) les patrons comportementaux par saison de pêche conditionnés par des scénarios écosystémiques et (4) les patrons spatiaux des positions de modes comportementaux, que nous utilisons pour la création de cartes de probabilité de présence d'anchois. Pour la première échelle, nous comparons plusieurs modèles Markoviens (modèles de Markov et semi-Markov cachés) et discriminatifs (forêts aléatoires, machines à vecteurs de support et réseaux de neurones artificiels) pour inférer les modes comportementaux associés aux trajectoires VMS. L'utilisation d'un ensemble de données pour lesquelles les modes comportementaux sont connus (grâce aux données collectées par des observateurs embarqués), nous permet d'entraîner les modèles dans un cadre supervisé et de les valider. Les modèles de semi-Markov cachés sont les plus performants, et sont retenus pour inférer les modes comportementaux sur l'ensemble de données VMS. Pour la deuxième échelle, nous caractérisons chaque voyage de pêche par plusieurs descripteurs, y compris le temps passé dans chaque mode comportemental. En utilisant une analyse de classification hiérarchique, les patrons des voyages de pêche sont classés en groupes associés à des zones de gestion, aux segments de la flottille et aux personnalités des capitaines. Pour la troisième échelle, nous analysons comment les conditions écologiques donnent forme au comportement des pêcheurs à l'échelle d'une saison de pêche. Via des analyses de co-inertie, nous trouvons des associations significatives entre les dynamiques spatiales des pêcheurs, des anchois et de l'environnement, et nous caractérisons la réponse comportementale des pêcheurs selon des scénarios environnementaux contrastés. Pour la quatrième échelle, nous étudions si le comportement spatial des pêcheurs reflète dans une certaine mesure la répartition spatiale de l'anchois. Nous construisons un indicateur de la présence d'anchois à l'aide des modes comportementaux géo-référencés inférés à partir des données VMS. Ce travail propose enfin une vision plus large du comportement de pêcheurs: les pêcheurs ne sont pas seulement des agents économiques, ils sont aussi des fourrageurs, conditionnés par la variabilité dans l'écosystème. Pour conclure, nous discutons de la façon dont ces résultats peuvent avoir de l'importance pour la gestion de la pêche, des analyses de comportement collectif et des modèles end-to-end.This work proposes an original contribution to the understanding of fishermen spatial behavior, based on the behavioral ecology and movement ecology paradigms. Through the analysis of Vessel Monitoring System (VMS) data, we characterized the spatial behavior of Peruvian anchovy fishermen at different scales: (1) the behavioral modes within fishing trips (i.e., searching, fishing and cruising); (2) the behavioral patterns among fishing trips; (3) the behavioral patterns by fishing season conditioned by ecosystem scenarios; and (4) the computation of maps of anchovy presence proxy from the spatial patterns of behavioral mode positions. At the first scale considered, we compared several Markovian (hidden Markov and semi-Markov models) and discriminative models (random forests, support vector machines and artificial neural networks) for inferring the behavioral modes associated with VMS tracks. The models were trained under a supervised setting and validated using tracks for which behavioral modes were known (from on-board observers records). Hidden semi-Markov models performed better, and were retained for inferring the behavioral modes on the entire VMS dataset. At the second scale considered, each fishing trip was characterized by several features, including the time spent within each behavioral mode. Using a clustering analysis, fishing trip patterns were classified into groups associated to management zones, fleet segments and skippers' personalities. At the third scale considered, we analyzed how ecological conditions shaped fishermen behavior. By means of co-inertia analyses, we found significant associations between fishermen, anchovy and environmental spatial dynamics, and fishermen behavioral responses were characterized according to contrasted environmental scenarios. At the fourth scale considered, we investigated whether the spatial behavior of fishermen reflected to some extent the spatial distribution of anchovy. Finally, this work provides a wider view of fishermen behavior: fishermen are not only economic agents, but they are also foragers, constrained by ecosystem variability. To conclude, we discuss how these findings may be of importance for fisheries management, collective behavior analyses and end-to-end models
4DVarNet: end-to-end learning of multimodal 4DVar models and solvers applied to sea surface dynamics.
International audienceMaking the most of observation and modeling capacities to forecast and reanalyse upper ocean dynamics is a key challenge. State-of-the-art data assimilation (DA) schemes generally blend prior knowledge on the underlying governing laws with available observation data. They however often show a limited ability to fully exploit the richness of observation datasets, especially when considering fine-scale processes. To address this challenge, we turn data assimilation into a physics-informed machine learning problem. The proposed method, referred to as 4DVarNet, relies on an end-to-end differentiable framework backed on a variational DA formulation. 4DVarNet can learn from data not only a DA solver but also jointly some representation of the inverse problem. Importantly, this end-to-end learning framework applies to irregularly-sampled and multimodal observation data. We apply 4DVarNet to the assimilation of sea surface dynamics from multimodal satellite-derived observations, especially satellite altimetry (including SWOT data) and sea surface temperature (SST). Within Observing System Simulation Experiments (OSSE) using realistic high-resolution ocean simulations, we first show that 4DVarNet may outperform state-of-the-art optimal interpolation and model-driven schemes for the space-time interpolation of the sea surface height. We also point out that it may reveal total sea surface currents from the synergistic analysis of altimetry and SST data. We will further demonstrate the scalability of 4DVarNet using native AI technologies and distributed multi-GPU systems to scale up to an ocean basin or the global scale. Besides, we will discuss how 4DVarNet could provide new means to revisit the design of ocean forecasting and assimilation models as well as sampling strategies of ocean observation systems. Especially, our experiments open new research avenues towards the design of objective-specific schemes for ocean modeling, forecasting and reanalyses
Dispelling the Myths Behind First-author Citation Counts
We conducted a full-scale evaluative citation analysis study of scholars in the XML research field to explore just how different from each other author rankings resulting from different citation counting methods actually are, and to demonstrate the capability of emerging data and tools on the Web in supporting more realistic citation counting methods. Our results contest some common arguments for the continued
use of first-author citation counts in the evaluation of scholars, such as high correlations between author rankings by first-author citation counts and other citation
counting methods, and high costs of using more realistic citation counting methods that are not well-supported by the ISI databases. It is argued that increasingly available digital full text research papers make it possible for citation analysis studies to go beyond what the ISI databases have directly supported and to employ more
sophisticated methods
- …
