1,721,118 research outputs found
Joint demosaicing and unmixing of multispectral images
Dans cette thèse, nous considérons des images captées par une caméra multispectrale (MS) miniaturisée « snapshot ». Contrairement aux caméras RVB classiques, l’imagerie MS permet d’observer une scène sur des dizaines de longueurs d’onde différentes, permettant une analyse beaucoup plus précise du contenu observé. Alors que la plupart des caméras MS nécessitent un scan pour générer une image, les caméras MS snapshot peuvent fournir instantanément des images, voire des vidéos. Lorsque la caméra est miniaturisée, au lieu d’un cube de données 3D, elle fournit une image 2D, chaque pixel étant associé à une version filtrée du spectre théorique sensé être acquis. Un post-traitement, appelé «dématriçage », est alors nécessaire pour reconstruire le cube de données. De plus, dans chaque pixel de l’image, le spectre observé peut être considéré comme un mélange de spectres de matériaux purs présents dans le pixel. L’estimation de ces spectres nommés endmembers ainsi que leur distribution spatiale (appelée abondances) est appelée « démélange ». Alors qu’un pipeline classique pour traiter les images MS snapshot consiste d’abord à dématricer puis à démélanger les données, les travaux présentés dans cette thèse explorent des stratégies alternatives dans lesquelles le dématriçage et le démélange sont effectués conjointement. En étendant les hypothèsesclassiques rencontrées dans l’analyse des composantes parcimonieuses et dans le démélange MS utilisé en télédétection, nous proposons deux cadres différents pour restaurer et démélanger la scène acquise, basés respectivement sur la complétion de matrice de faible rang et la déconvolution, cette dernière étant spécifiquement conçue pour les filtres Fabry-Pérot utilisés dans la caméra considérée. Les quatre méthodes proposées présentent une bien meilleure qualité de démélange que les variantes qu’elles étendent lorsque ces dernières sont appliquées à des données dématricées. Néanmoins, elles permettent des performances de dématriçage similaires à celles des méthodes de l’état de l’art. La dernière partie de cette thèse introduit une approche de déconvolution pour restaurer les spectres de telles caméras. Notre contribution réside dans les poids du terme de pénalisation qui sont automatiquement fixés en utilisant l’entropie des harmoniques de Fabry-Pérot. La méthode proposéeprésente une meilleure restauration spectrale que la stratégie proposée par le fabricant de la caméra et que la technique de déconvolution classique qu’elle étend.In this thesis, we consider images sensed by a miniaturized multispectral (MS) snapshot camera. Contrary to classical RGB cameras, MS imaging allows to observe a scene on tens of different wavelengths, allowing a much more precise analysis of the observed content. While most MS cameras require a scan to generate an image, snapshot MS cameras can instantaneouslyprovide images, or even videos. When the camera is miniaturized, instead of a 3D data cube, it gets a 2D image, each pixel being associated with a filtered version of the theoretical spectrum it should acquire. Post-processing, called “demosaicing”, is then necessary to reconstruct a data cube. Furthermore, in each pixel of the image, the observed spectrum can be considered as a mixture of spectra of pure materials present in the pixel. Estimating these spectra named endmembers as well as their spatial distribution (named abundances) is called “unmixing”. While a classical pipeline to process MS snapshot images is to first demosaice and then unmix the data, the work introduced in this thesis explores alternative strategies in which demosaicing and unmixing are jointly performed. Extending classical assumptions met in sparse component analysis and in remote sensing MS unmixing, we propose two different frameworks to restore and unmixing the acquired scene, based on low-rank matrix completion and deconvolution, respectively, the latter being specifically designed for Fabry-Perot filters used in the considered camera. The four proposed methods exhibit a far better unmixing enhancement than the variants they extend when the latter are applied to demosaiced data. Still, they allow a similar demosaicing performance as state-of-the-art methods. The last part of this thesis introduces a deconvolution approach to restore the spectra of such cameras. Our contribution lies in the weights of the penalization term which are automatically set using the entropy of the Fabry-Perot harmonics. The proposed method exhibits a better spectrum restoration than the strategy proposed by the camera manufacturer and than the classical deconvolution technique it extends
Compressive informed (semi-)non-negative matrix factorization methods for incomplete and large-scale data : with application to mobile crowd-sensing data
La pollution de l’air pose d’importants problèmes de santé avec plusieurs centaines de milliers de décès prématurés en Europe chaque année. Une surveillance efficace de la qualité de l’air est donc une tâche majeure pour les agences environnementales. Elle est généralement effectuée par des stations de surveillance très précises. Cependant, ces stations sont coûteuses et en nombre limité, offrant ainsi une faible résolution spatio-temporelle. Le déploiement de capteurs low-cost (LCS) promet une solution complémentaire à moindre coût et à plus haute résolution spatio-temporelle. Malheureusement, les LCS ont tendance à dériver avec le temps et leur nombre élevé empêche un étalonnage régulier en laboratoire. Des techniques basées sur les données nommées étalonnage in situ ont ainsi été proposées. En particulier, revisiter l’étalonnage des capteurs mobiles commeun problème de factorisation matricielle semble prometteur. Cependant, les approches existantes sont basées sur des méthodes lentes – elles ne sont pas adaptées aux problèmes à grande échelle impliquant des centaines de capteurs déployés sur une vaste zone – et sont conçues pour des déploiements à court terme. Pour résoudre ces deux problèmes, des factorisations matricielles non-négatives comprimées ont été proposées dans cette thèse, qui est divisée en deux parties. Dans la première partie, nous étudions l’amélioration apportée par les projections aléatoires pour la factorisation matricielle non-négative pondérée. Nous montrons que ces techniques peuvent accélérer considérablement les méthodes de factorisation matricielle à grande échelle et de faible rang, permettant ainsi l’estimation rapide des entrées manquantes dans les matrices de faible rang. Dans la deuxième partie, nous revisitons l’étalonnage de capteurs hétérogènes mobiles comme une factorisation informée de grandes matrices avec des entrées manquantes. Nous proposons ainsi des approches de factorisation matricielle informées rapides, et en particulier des extensions informées des méthodes comprimées proposées dans la première partie, qui s’avèrent bien adaptées au problème considéré.Air pollution poses substantial health issues with several hundred thousands of premature deaths in Europe each year. Effective air quality monitoring is thus an major task for environmental agencies. It is usually carried out by some highly accurate monitoring stations. However, these stations are expensive and limited in number, thus providing a low spatio-temporal resolution. The deployment of low-cost sensors (LCS) promises a complementary solution with lower cost and higher spatio-temporal resolution. Unfortunately, LCS tend to drift over time and their high number prevents regular in-lab calibration. Data-driven techniques named in-situ calibration have thus been proposed. In particular, revisiting mobile sensor calibration as a matrix factorization problem seems promising. However, existing approaches are based on slow methods-and are not suited forlarge-scale problems involving hundreds of sensors deployed over a large area-and are designed for short-term deployments. To solve both issues, compressive non-negative matrix factorization have been proposed in this thesis, which is divided into two parts. In the first part, we investigate the enhancement provided by random projections for weighted non-negative matrix factorization. We show that these techniques can significantly speed-up large-scale and low-rank matrix factorization methods, thus allowing the fast estimation of missing entries in low-rank matrices. In the second part, we revisit mobile heterogeneous sensor calibration as an informed factorization of large matrices with missing entries. We thus propose fast informed matrix factorization approaches, and in particular informed extensions of compressive methods proposed in the first part, which are found to be well-suited for the considered problem
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
De la rareté au tsunami de données : une histoire de la séparation aveugle de sources
National audienceNous revisitons l'histoire de la séparation de sources au regard des volumes de données disponibles : nous montrons comment ces derniers ont permis le développement de techniques d'apprentissage (profond). Nous présentons en conclusion quelques perspectives prenant en compte les contraintes environnementales, énergétiques et matérielles qui surviendront dans un futur plus ou moins proche
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Applications des modèles de rang faible en traitement du signal
1. Foreword2. Classical applications of low-rank models3. In-situ sensor calibration4. Joint multispectral image restoration and unmixing5. Low-rankness in the AI Era6. DiscussionDoctora
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Méthodes d'analyse en variables latentes fondées sur la parcimonie et/ou la faiblesse de rang. Application aux problèmes inverses multivariés
In many multivariate signal and image processing and/or statistical machine learning problems, we aim to decompose a data matrix—assumed globally or locally of low rank—in the form of a matrix product. Under the global low-rank assumption, when we further assume the non-negativity of the data to be processed and estimated, this problem is known as Nonnegative Matrix Factorization (NMF). On the contrary, when the data low rankness is local, it is intimately linked to the hypothesis of sparsity of the latent variables which explain the data. The latter assumes that each of these variables can be expressed as a linear combination of a small number of atoms from a dictionary and has allowed the development of Sparse Component Analysis (SCA) approaches.A first part of this thesis studies the enhancement provided by additionnal information provided into the NMF problem. Such an information is taken into account as both a specific parametrization and penalties. Both guide the method towards a realistic solution from the point of view of the application. This information can be provided by an expert, a physical model and/or the formalism of the problem to be solved. We are interested both in the aspects of robustness to outliers—by using for example parametric divergences as a cost function—and in the completion of missing data, solved for example by sparse approximation (according to a known dictionary) of each column of a matrix factor. These informed NMF approaches have been applied to source partitioning and in situ calibration of mobile sensors.In a second part, we were interested in the acceleration of the (weighted) NMF methods by using the formalism of compressed learning. Compressed learning is based on the idea of random projections, which reduces the size of the data while maintaining the level of information they contain. The reduction of the size of the data is thus allowing the acceleration of the processing. We first extended the compressed NMF principle to the case where uncertainty measures (or weights) are associated with the data. The proposed approach uses an Expectation-Maximization (EM) formalism and a bilateral compression that we have accelerated. We have also proposed a new random projection stream formalism which (i) is data-agnostic, (ii) allows a similar performance as data-dependent structured projections, and (iii) should be able to take full advantage of new calculators dedicated to compressed learning.Lastly, we address the problem of SCA for applications in audio processing and multi-spectral imaging. In particular, we consider the existence of “single-source” “analysis zones” in which a single latent variable can describe the data. In a single-source zone, the data is locally of rank 1—making it possible to propose numerous criteria for detecting these zones—whereas outside these zones, the number of latent variables can vary. When such assumptions are verified, SCA methods generally perform better than purely statistical approaches seeking to solve similar problems. We consider in the last part of this thesis several problems for which we propose new extensions of SCA approaches.— Firstly, we extend linear SCA techniques to the post-nonlinear source separation problem. In this case, the mixing parameters are no longer simple vectors of coefficients but functional data to be estimated and then inverted. We propose both new criteria for detecting single-source zones and new approaches for classifying and estimating functions associated with nonlinearities of mixtures.— Furthermore, we propose a real-time audio source counting and localization approach using a circular microphone array. The proposed approach consists of detecting single-source zones and estimating the location of the active source in each of these zones. The final estimation of the number of sources and their location is carried out by an ad hoc approach of unsupervised classification.— Finally, we propose weighted extensions of SCA to process data partially observed by a miniaturized multi-spectral camera. The estimation of endmembers and associated abundance maps allows the restoration (or demosaicing) of multispectral images.Dans de nombreux problèmes multivariés de traitement du signal et des images et/ou d’apprentissage statistique, nous cherchons à décomposer une matrice de données – supposée globalement ou localement de faible rang – sous la forme d’un produit matriciel. Sous l’hypothèse globale de faiblesse de rang, lorsque nous supposons de plus la non-négativité des données à traiter et à estimer, ce problème est connu sous le nom de factorisation en matrices non-négatives (NMF pour Nonnegative Matrix Factorization en anglais). Au contraire, lorsque la faiblesse de rang est locale, elle est intimement liée à l’hypothèse de parcimonie des variables latentes expliquant les données. Cette dernière suppose que chacune de ces variables peut s’exprimer comme une combinaison linéaire d’un petit nombre d’atomes d’un dictionnaire et a permis le développement d’approches d’analyse en composantes parcimonieuses (SCA pour Sparse Component Analysis en anglais). Un premier volet de ce mémoire étudie l’apport d’informations dans la NMF. Celles-ci sont prises en compte sous forme d’une paramétrisation et de pénalisations qui guident la méthode vers une solution réaliste du point de vue de l’application. Cette information peut être fournie par un expert, un modèle physique et/ou le formalisme du problème à résoudre. Nous nous sommes intéressés à la fois aux aspects de robustesse aux valeurs aberrantes – en faisant par exemple appel à des divergences paramétriques comme fonction de coût – et à la complétion de données manquantes, résolue par exemple par approximation parcimonieuse (selon un dictionnaire connu) de chaque colonne d’un facteur matriciel. Ces approches informées de NMF ont été appliquées au partitionnement de sources et à l’étalonnage in situ de capteurs mobiles.Dans un second temps, nous nous sommes intéressés à l’accélération des méthodes (pondérées) de NMF en faisant appel au formalisme d’apprentissage comprimé. L’apprentissage comprimé repose sur l’idée de projection aléatoire qui permet de réduire la taille des données tout en maintenant le niveau d’information qu’elles contiennent ; la réduction de la taille des données permettant de facto l’accélération des traitements. Nous avons d’abord étendu le principe de NMF comprimée au cas où des mesures d’incertitudes (ou pondérations) sont associées aux données. L’approche proposée fait appel à un formalise EM (pour Expectation-Maximization en anglais) et une compression bilatérale que nous avons accélérée. Nous avons par ailleurs proposé un nouveau formalisme de projection aléatoire en flux qui (i) est agnostique aux données, (ii) permet des performances similaires aux projections structurées dépendant des données et (iii) devrait pouvoir pleinement tirer partie de nouveaux calculateurs dédiés à l’apprentissage comprimé.Enfin, nous abordons le problème de SCA pour des applications en traitement audio et en imagerie multi-spectrale. En particulier, nous considérons l’existence de « zones d’analyse » dites « mono-sources » dans lesquelles une seule variable latente permet de décrire les données. Dans une zone mono-source, les données sont localement de rang 1 – permettant de proposer de nombreux critères de détection de ces zones – alors qu’en dehors de ces zones, le nombre de variables latentes peut varier. Lorsque de telles hypothèses sont vérifiées, les méthodes de SCA sont généralement plus performantes que des approches purement statistiques cherchant à résoudre des problèmes similaires. Nous considérons dans le dernier volet de ce mémoire plusieurs problèmes pour lesquels nous proposons de nouvelles extensions des approches de SCA. — Tout d’abord, nous étendons les techniques linéaires de SCA au problème post-non-linéaire de séparation de sources. Dans ce cas, les paramètres de mélange ne sont plus de simples vecteurs de coefficients mais des données fonctionnelles à estimer puis à inverser. Nous proposons à la fois de nouveaux critères pour détecter les zones mono-sources et de nouvelles approches pour classifier et estimer les fonctions associés aux non-linéarités des mélanges.— Par ailleurs, nous proposons une approche temps-réel qui compte et localise des sources audiophoniques à partir d’un réseau circulaire de microphones. L’approche proposée consiste à détecter les zones mono-sources et à estimer dans chacune de ces zones la localisation de la source active. L’estimation finale du nombre de sources et de leur localisation est réalisée par une approche ad hoc de classification non-supervisée.— Enfin, nous proposons des extensions pondérées de SCA pour traiter des données partiellement observées par une caméra multi-spectrale miniaturisée. L’estimation des endmembers et des cartes d’abondance associées permet la restauration (ou dématriçage) des images multispectrales
Méthodes d'analyse en variables latentes fondées sur la parcimonie et/ou la faiblesse de rang. Application aux problèmes inverses multivariés
In many multivariate signal and image processing and/or statistical machine learning problems, we aim to decompose a data matrix—assumed globally or locally of low rank—in the form of a matrix product. Under the global low-rank assumption, when we further assume the non-negativity of the data to be processed and estimated, this problem is known as Nonnegative Matrix Factorization (NMF). On the contrary, when the data low rankness is local, it is intimately linked to the hypothesis of sparsity of the latent variables which explain the data. The latter assumes that each of these variables can be expressed as a linear combination of a small number of atoms from a dictionary and has allowed the development of Sparse Component Analysis (SCA) approaches.A first part of this thesis studies the enhancement provided by additionnal information provided into the NMF problem. Such an information is taken into account as both a specific parametrization and penalties. Both guide the method towards a realistic solution from the point of view of the application. This information can be provided by an expert, a physical model and/or the formalism of the problem to be solved. We are interested both in the aspects of robustness to outliers—by using for example parametric divergences as a cost function—and in the completion of missing data, solved for example by sparse approximation (according to a known dictionary) of each column of a matrix factor. These informed NMF approaches have been applied to source partitioning and in situ calibration of mobile sensors.In a second part, we were interested in the acceleration of the (weighted) NMF methods by using the formalism of compressed learning. Compressed learning is based on the idea of random projections, which reduces the size of the data while maintaining the level of information they contain. The reduction of the size of the data is thus allowing the acceleration of the processing. We first extended the compressed NMF principle to the case where uncertainty measures (or weights) are associated with the data. The proposed approach uses an Expectation-Maximization (EM) formalism and a bilateral compression that we have accelerated. We have also proposed a new random projection stream formalism which (i) is data-agnostic, (ii) allows a similar performance as data-dependent structured projections, and (iii) should be able to take full advantage of new calculators dedicated to compressed learning.Lastly, we address the problem of SCA for applications in audio processing and multi-spectral imaging. In particular, we consider the existence of “single-source” “analysis zones” in which a single latent variable can describe the data. In a single-source zone, the data is locally of rank 1—making it possible to propose numerous criteria for detecting these zones—whereas outside these zones, the number of latent variables can vary. When such assumptions are verified, SCA methods generally perform better than purely statistical approaches seeking to solve similar problems. We consider in the last part of this thesis several problems for which we propose new extensions of SCA approaches.— Firstly, we extend linear SCA techniques to the post-nonlinear source separation problem. In this case, the mixing parameters are no longer simple vectors of coefficients but functional data to be estimated and then inverted. We propose both new criteria for detecting single-source zones and new approaches for classifying and estimating functions associated with nonlinearities of mixtures.— Furthermore, we propose a real-time audio source counting and localization approach using a circular microphone array. The proposed approach consists of detecting single-source zones and estimating the location of the active source in each of these zones. The final estimation of the number of sources and their location is carried out by an ad hoc approach of unsupervised classification.— Finally, we propose weighted extensions of SCA to process data partially observed by a miniaturized multi-spectral camera. The estimation of endmembers and associated abundance maps allows the restoration (or demosaicing) of multispectral images.Dans de nombreux problèmes multivariés de traitement du signal et des images et/ou d’apprentissage statistique, nous cherchons à décomposer une matrice de données – supposée globalement ou localement de faible rang – sous la forme d’un produit matriciel. Sous l’hypothèse globale de faiblesse de rang, lorsque nous supposons de plus la non-négativité des données à traiter et à estimer, ce problème est connu sous le nom de factorisation en matrices non-négatives (NMF pour Nonnegative Matrix Factorization en anglais). Au contraire, lorsque la faiblesse de rang est locale, elle est intimement liée à l’hypothèse de parcimonie des variables latentes expliquant les données. Cette dernière suppose que chacune de ces variables peut s’exprimer comme une combinaison linéaire d’un petit nombre d’atomes d’un dictionnaire et a permis le développement d’approches d’analyse en composantes parcimonieuses (SCA pour Sparse Component Analysis en anglais). Un premier volet de ce mémoire étudie l’apport d’informations dans la NMF. Celles-ci sont prises en compte sous forme d’une paramétrisation et de pénalisations qui guident la méthode vers une solution réaliste du point de vue de l’application. Cette information peut être fournie par un expert, un modèle physique et/ou le formalisme du problème à résoudre. Nous nous sommes intéressés à la fois aux aspects de robustesse aux valeurs aberrantes – en faisant par exemple appel à des divergences paramétriques comme fonction de coût – et à la complétion de données manquantes, résolue par exemple par approximation parcimonieuse (selon un dictionnaire connu) de chaque colonne d’un facteur matriciel. Ces approches informées de NMF ont été appliquées au partitionnement de sources et à l’étalonnage in situ de capteurs mobiles.Dans un second temps, nous nous sommes intéressés à l’accélération des méthodes (pondérées) de NMF en faisant appel au formalisme d’apprentissage comprimé. L’apprentissage comprimé repose sur l’idée de projection aléatoire qui permet de réduire la taille des données tout en maintenant le niveau d’information qu’elles contiennent ; la réduction de la taille des données permettant de facto l’accélération des traitements. Nous avons d’abord étendu le principe de NMF comprimée au cas où des mesures d’incertitudes (ou pondérations) sont associées aux données. L’approche proposée fait appel à un formalise EM (pour Expectation-Maximization en anglais) et une compression bilatérale que nous avons accélérée. Nous avons par ailleurs proposé un nouveau formalisme de projection aléatoire en flux qui (i) est agnostique aux données, (ii) permet des performances similaires aux projections structurées dépendant des données et (iii) devrait pouvoir pleinement tirer partie de nouveaux calculateurs dédiés à l’apprentissage comprimé.Enfin, nous abordons le problème de SCA pour des applications en traitement audio et en imagerie multi-spectrale. En particulier, nous considérons l’existence de « zones d’analyse » dites « mono-sources » dans lesquelles une seule variable latente permet de décrire les données. Dans une zone mono-source, les données sont localement de rang 1 – permettant de proposer de nombreux critères de détection de ces zones – alors qu’en dehors de ces zones, le nombre de variables latentes peut varier. Lorsque de telles hypothèses sont vérifiées, les méthodes de SCA sont généralement plus performantes que des approches purement statistiques cherchant à résoudre des problèmes similaires. Nous considérons dans le dernier volet de ce mémoire plusieurs problèmes pour lesquels nous proposons de nouvelles extensions des approches de SCA. — Tout d’abord, nous étendons les techniques linéaires de SCA au problème post-non-linéaire de séparation de sources. Dans ce cas, les paramètres de mélange ne sont plus de simples vecteurs de coefficients mais des données fonctionnelles à estimer puis à inverser. Nous proposons à la fois de nouveaux critères pour détecter les zones mono-sources et de nouvelles approches pour classifier et estimer les fonctions associés aux non-linéarités des mélanges.— Par ailleurs, nous proposons une approche temps-réel qui compte et localise des sources audiophoniques à partir d’un réseau circulaire de microphones. L’approche proposée consiste à détecter les zones mono-sources et à estimer dans chacune de ces zones la localisation de la source active. L’estimation finale du nombre de sources et de leur localisation est réalisée par une approche ad hoc de classification non-supervisée.— Enfin, nous proposons des extensions pondérées de SCA pour traiter des données partiellement observées par une caméra multi-spectrale miniaturisée. L’estimation des endmembers et des cartes d’abondance associées permet la restauration (ou dématriçage) des images multispectrales
- …
