1,721,394 research outputs found
Aide à la mobilité utilisant la localisation via l'empreinte du champ magnétique local
En raison de l'omniprésence du champ géomagnétique et la disponibilité de sa mesure sans besoin d'infrastructures onéreuses, le positionnement intérieur basé sur le champ magnétique a suscité un intérêt considérable de la part des universitaires et des industriels. Cependant, les applications de positionnement intérieur basées sur le champ magnétique sont difficiles en raison de sa faible discrimination spatiale, de l'hétérogénéités des dispositifs de mesure et de l'interférence des matériaux ferromagnétiques. Cette thèse contribue à démontrer la faisabilité du positionnement intérieur basé sur le champ magnétique en relevant les défis du positionnement par champ magnétique. Nos contributions sont les suivantes : D'abord, nous avons réalisé une étude de l'état de l'art du positionnement intérieur basé sur le champ magnétique. Les caractéristiques du champ géomagnétique et les avantages et défis de la localisation par champ magnétique sont présentés en détail. Les modèles de magnétomètres et les interférences ferromagnétiques sont décrits. Plusieurs systèmes de coordonnées pour la localisation par champ magnétique et leurs relations de transformation sont présentés. Les ensembles de données de référence sur le champ magnétique accessibles au public sont passés en revue.Les algorithmes de calibration des magnétomètres et la construction efficace des cartes de champ magnétique sont décrits.Les méthodes de localisation du champ magnétique les plus récentes (repères magnétiques, déformation temporelle dynamique, empreintes magnétiques, filtrage bayésien, localisation et cartographie simultanées et réseaux neuronaux) sont résumées dans cette étude bibliographique. La deuxième contribution est une analyse des défis et de la faisabilité de la localisation du champ magnétique à travers une série d'expériences. Des tests statiques, de trajectoire et de rotation montrent les caractéristiques magnétiques de smartphones hétérogènes. Les tests de calibration de smartphones hétérogènes démontrent que la calibration des smartphones est une tâche essentielle au problème de l'hétérogénéité des dispositifs de mesure de champs magnétiques. Les tests de classification avec des smartphones hétérogènes montrent la faisabilité de la localisation du champ magnétique ainsi que ses limites. La troisième contribution consiste en une méthode robuste basée sur ADMM (Alternating Direction Method of Multipliers) pour calibrer des magnétomètres à trois axes en présence de mesures aberrantes et parasites. Deux méthodes de prétraitement des valeurs aberrantes sont proposées, à savoir les méthodes de troncature et de compression. L'algorithme de calibration des magnétomètres basé sur ADMM est comparé à d'autres méthodes de pointe, et la robustesse ainsi que la précision de l'algorithme de calibration des magnétomètres basé sur ADMM sont démontrées avec des données synthétiques. En conclusion, notre recherche offre plusieurs nouvelles contributions au positionnement intérieur basé sur les mesures de champs magnétiques. Dans ce travail de recherche, nous avons aussi initié des études sur la localisation de zones par trajectoires ainsi que de nombreuses comparaisons de méthodes de classification et localisation via l'empreinte locale du champ magnétique. Cette étude des défis et solutions potentielles relatifs à l'utilisation des mesures de champ magnétique pour la localisation de mobile en fait un pas en avant prometteur pour les applications du monde réel.Due to the pervasiveness and infrastructure-free characteristics of the geomagnetic field, magnetic field-based indoor positioning has garnered significant interest from academics and industry. Magnetic field-based indoor positioning applications are challenging due to low spatial discrimination, heterogeneous devices, and ferromagnetic materials interference. This thesis contributes to the analysis of the feasibility of magnetic field-based indoor positioning by addressing some of its main challenges. Our contributions are as follows:At first, a state-of-the-art survey in magnetic field-based indoor positioning is provided. The characteristics of the geomagnetic field and the advantages and challenges of magnetic field localization are introduced in detail. Magnetometer models and ferromagnetic interference are described. Several coordinate systems for magnetic field localization and their transformation relationships are presented. Publicly available magnetic field benchmark datasets are surveyed.Magnetometer calibration algorithms and the efficient construction of magnetic field maps are described. State-of-the-art magnetic field localization methods (e.g., magnetic landmarks, dynamic time warping, magnetic fingerprinting, Bayesian filters, simultaneous localization and mapping, and neural networks) are summarised in this overview study.The second contribution is an analysis of the challenges and feasibility of magnetic field localization through a series of experiments.Static, trajectory and rotational tests show the magnetic characteristics of heterogeneous smartphones. Calibration tests of heterogeneous smartphones demonstrate that smartphone calibration is an essential solution to the problem of heterogeneous devices used for the measurements of magnetic fields. Classification tests of heterogeneous smartphones show the feasibility of magnetic field localization as well as its limits.The third contribution presents a robust method based on ADMM (Alternating Direction Method of Multipliers) for calibrating three-axis magnetometers in the presence of outliers and spurious measurements. Two pre-processing methods for outliers are proposed, namely truncation and compression methods. The ADMM-based magnetometer calibration algorithm is compared with other state-of-the-art methods, and the robustness and accuracy of the ADMM-based magnetometer calibration algorithm are demonstrated with synthetic data. In conclusion, our research offers several new contributions to indoor positioning based on magnetic fields.In addition, we have initiated certain studies related to trajectory-based zone localization and fingerprinting methods performance comparison. This work relative to the analysis of the challenges as well as the potential solutions for mobile localization based on magnetic field measurements represents a promising step forward for real-world applications
Contributions to fast matrix and tensor decompositions
De nos jours, les grandes masses de données se retrouvent dans de nombreux domaines relatifs aux applications multimédia, sociologiques, biomédicales, radio astronomiques, etc. On parle alors du phénomène ‘Big Data’ qui nécessite le développement d’outils appropriés pour la manipulation et l’analyse appropriée de telles masses de données. Ce travail de thèse est dédié au développement de méthodes efficaces pour la décomposition rapide et adaptative de tenseurs ou matrices de grandes tailles et ce pour l’analyse de données multidimensionnelles. Nous proposons en premier une méthode d’estimation de sous espaces qui s’appuie sur la technique dite ‘divide and conquer’ permettant une estimation distribuée ou parallèle des sous-espaces désirés. Après avoir démontré l’efficacité numérique de cette solution, nous introduisons différentes variantes de celle-ci pour la poursuite adaptative ou bloc des sous espaces principaux ou mineurs ainsi que des vecteurs propres de la matrice de covariance des données. Une application à la suppression d’interférences radiofréquences en radioastronomie a été traitée. La seconde partie du travail a été consacrée aux décompositions rapides de type PARAFAC ou Tucker de tenseurs multidimensionnels. Nous commençons par généraliser l’approche ‘divide and conquer’ précédente au contexte tensoriel et ce en vue de la décomposition PARAFAC parallélisable des tenseurs. Ensuite nous adaptons une technique d’optimisation de type ‘all-at-once’ pour la décomposition robuste (à la méconnaissance des ordres) de tenseurs parcimonieux et non négatifs. Finalement, nous considérons le cas de flux de données continu et proposons deux algorithmes adaptatifs pour la décomposition rapide (à complexité linéaire) de tenseurs en dimension 3. Malgré leurs faibles complexités, ces algorithmes ont des performances similaires (voire parfois supérieures) à celles des méthodes existantes de la littérature. Au final, ce travail aboutit à un ensemble d’outils algorithmiques et algébriques efficaces pour la manipulation et l’analyse de données multidimensionnelles de grandes tailles.Large volumes of data are being generated at any given time, especially from transactional databases, multimedia content, social media, and applications of sensor networks. When the size of datasets is beyond the ability of typical database software tools to capture, store, manage, and analyze, we face the phenomenon of big data for which new and smarter data analytic tools are required. Big data provides opportunities for new form of data analytics, resulting in substantial productivity. In this thesis, we will explore fast matrix and tensor decompositions as computational tools to process and analyze multidimensional massive-data. We first aim to study fast subspace estimation, a specific technique used in matrix decomposition. Traditional subspace estimation yields high performance but suffers from processing large-scale data. We thus propose distributed/parallel subspace estimation following a divide-and-conquer approach in both batch and adaptive settings. Based on this technique, we further consider its important variants such as principal component analysis, minor and principal subspace tracking and principal eigenvector tracking. We demonstrate the potential of our proposed algorithms by solving the challenging radio frequency interference (RFI) mitigation problem in radio astronomy. In the second part, we concentrate on fast tensor decomposition, a natural extension of the matrix one. We generalize the results for the matrix case to make PARAFAC tensor decomposition parallelizable in batch setting. Then we adapt all-at-once optimization approach to consider sparse non-negative PARAFAC and Tucker decomposition with unknown tensor rank. Finally, we propose two PARAFAC decomposition algorithms for a classof third-order tensors that have one dimension growing linearly with time. The proposed algorithms have linear complexity, good convergence rate and good estimation accuracy. The results in a standard setting show that the performance of our proposed algorithms is comparable or even superior to the state-of-the-art algorithms. We also introduce an adaptive nonnegative PARAFAC problem and refine the solution of adaptive PARAFAC to tackle it. The main contributions of this thesis, as new tools to allow fast handling large-scale multidimensional data, thus bring a step forward real-time applications
Contributions à la stéganographie audio : algorithmes et analyse de robustesse
La stéganographie numérique est une technique récente qui a émergé comme une source importante pour la sécurité des données. Elle consiste à envoyer secrètement et de manière fiable des informations dissimulées et non pas seulement à masquer leur présence. Elle exploite les caractéristiques des fichiers médias numériques anodins, tels que l’image, le son et la vidéo,et les utilise comme support pour véhiculer des informations secrète d’une façon inaperçue. Les techniques de cryptage et de tatouage sont déjà utilisées pour résoudre les problèmes liés à la sécurité des données. Toutefois,l’évolution des tentatives d’interception et de déchiffrement des données numériques nécessitent de nouvelles techniques pour enrayer les tentatives malveillantes et d’élargir le champ des applications y associées. L’objectif principal des systèmes stéganographiques consiste à fournir de nouveaux moyens sécurisés, indétectables et imperceptibles pour dissimuler des données.La stéganographie est utilisée sous l’hypothèse qu’elle ne sera pas détectée si personne n’essaye de la découvrir. Les techniques récentes destéganographie ont déjà été employées dans diverses applications. La majorité de ces applications ont pour objectif d’assurer la confidentialité des données.D’autres par contre sont utilisées malicieusement. L’utilisation de la stéganographie à des fins criminelles, de terrorisme, d’espionnage ou de piraterie constitue une menace réelle. Ces tentatives malveillantes de communiquer secrètement ont récemment conduit les chercheurs à inclure une nouvelle branche de recherche: la stéganalyse, pour contrer les techniques stéganographique. L’objectif principal de la stéganalyse est de détecter la résence potentielle d’un message dissimulé dans un support numérique et ne considère pas nécessairement son extraction. La parole numérique constitue un terrain de prédilection pour dissimuler des données numériques. En effet, elle est présente en abondance grâce aux technologies de télécommunications fixes ou mobiles et aussi à travers divers moyens de stockage de l’audio numérique. Cette thèse étudie la stéganographie et la stéganalyse utilisant la voix numérisée comme support et vise à (1) présenter un algorithme qui répond aux exigences des systèmes stéganographiques reliées à la capacité élevée, l’indétectabilité et l’imperceptibilité des données dissimulées, (2) le contrôle de la distorsion induite par le processus de dissimulation des données (3) définir un nouveau concept de zones spectrales dans le domaine de Fourier utilisant et l’amplitude et la phase (4) introduire un nouveau algorithme de stéganalyse basé sur les techniques de compression sans pertes d’information à la fois simple et efficace. La performance de l’algorithme stéganographique est mesurée par des méthodes d’évaluation perceptuelles et statistiques. D’autre part, la performance de l’algorithme de stéganalyse est mesurée par la capacité du système à distinguer entre un signal audio pur et un signal audio stéganographié. Les résultats sont très prometteurs et montrent des compromis de performance intéressants par rapport aux méthodes connexes. Les travaux futurs incluent essentiellement le renforcement de l’algorithme de stéganalyse pour qu’il soit en mesure de détecter une faible quantité de données dissimulées. Nous planifions également l’intégration de notre algorithme de stéganographie dans certaines plateformes émergentes telles que l’iPhone. D’autres perspectives consistent à améliorer l’algorithme stéganographique pour que les données dissimulées soit résistantes au codage de la parole, au bruit et à la distorsion induits parles canaux de transmission.Digital steganography is a young flourishing science emerged as a prominent source of data security. The primary goal of steganography is to reliably send hidden information secretly, not merely to obscure its presence. It exploits the characteristics of digital media files such as: image, audio, video, text by utilizing them as carriers to secretly communicate data. Encryption and watermarking techniques are already used to address concerns related to datasecurity. However, constantly-changing attacks on the integrity of digital data require new techniques to break the cycle of malicious attempts and expand the scope of involved applications. The main objective of steganographic systems is to provide secure, undetectable and imperceptible ways to conceal high-rate of data into digital medium. Steganography is used under the assumption that it will not be detected if no one is attempting to uncover it. Steganography techniques have found their way into various and versatile applications. Some of these applications are used for the benefit of people others are used maliciously. The threat posed by criminals, hackers, terrorists and spies using steganography is indeed real. To defeat malicious attempts when communicating secretly, researchers’ work has been lately extended toinclude a new and parallel research branch to countermeasure steganagraphy techniques called steganalysis. The main purpose of steganalysis technique is to detect the presence or not of hidden message and does not consider necessarily its successful extraction. Digital speech, in particular, constitutes a prominent source of data-hiding across novel telecommunication technologies such as covered voice-over-IP, audio conferencing, etc. This thesis investigatesdigital speech steganography and steganalysis and aims at: (1) presenting an algorithm that meets high data capacity, undetectability and imperceptibility requirements of steganographic systems, (2) controlling the distortion induced by the embedding process (3) presenting new concepts of spectral embedding areas in the Fourier domain which is applicable to magnitude and phase spectrums and (4) introducing a simple yet effective speech steganalysis algorithm based on lossless data compression techniques. The steganographic algorithm’s performance is measured by perceptual and statistical evaluation methods. On the other hand, the steganalysis algorithm’s performance is measured by how well the system can distinguish between stego- and cover-audio signals. The results are very promising and show interesting performance tradeoffs compared to related methods. Future work is based mainly on strengthening the proposed steganalysis algorithm to be able to detect small hiding capacity. As for our steganographic algorithm, we aim at integrating our steganographic in some emerging devices such as iPhone and further enhancing the capabilities of our steganographic algorithm to ensure hidden-data integrity under severe compression, noise and channel distortion
Design and performance bounds of future mobile receivers
Les systèmes de communications MIMO (Multiple Input Multiple Output) ainsi que leur récente version à grande-échelle, appelée MIMO massive, sont considérés comme des technologies potentielles pour les standards de communication sans fil actuels et futurs, grâce à leurs puissantes capacités d’amélioration des performances. Néanmoins, afin d’exploiter pleinement tous leurs potentiels, une grande attention doit être accordée aux opérations d’identification du système et d’égalisation des canaux de transmission, qui restent une préoccupation actuelle. Dans ce contexte, la principale contribution de cette thèse s’inscrit dans le cadre de l’identification des systèmes de communication, à travers l’estimation des canaux, ainsi que l’égalisation des canaux via les techniques de séparation de sources, et ce pour des modèles de communications linéaires et non linéaires. Ainsi, en adoptant des approches semi-aveugles, des analyses de performances ainsi que le développement d’algorithmes efficaces sont mis en avant en considérant différents contraintes/problèmes tels que la contamination des pilotes, rencontrés principalement dans les systèmes MIMO massifs, les effets des non-linéarités ainsi que les interférences inter-symboles et inter-utilisateurs .En plus, pour un meilleur gain en performance, l’accent est mise aussi sur l’exploitation des a priori sur les systèmes tels que les séquences d’entraînement (pilotes), la sparcité du canal et la structure de la matrice de données. Pour ce faire, une analyse des performances limites est réalisée à travers les bornes de Cramèr-Rao (CRB : Cramèr-Rao Bounds) ; et qui démontre l’efficacité des techniques semi-aveugles pour surmonter le problème de la contamination des pilotes dans les systèmes MIMO-OFDM (MIMO Orthogonal frequency-Division Multiplexing) massifs. Cette efficacité est démontrée pour le cas de cellules synchrones et non-synchrones dans un réseau cellulaire. Cette étude nous a motivé à adopter les approches semi-aveugles pour l’égalisation des canaux et la détection des données via des techniques de séparation de sources. Une solution basée sur les modules multiples (MM : Multi-Modulus) est proposée pour démixer des mélanges instantanés dans des systèmes MIMO massifs. En l’absence d’informations préalables sur le canal de communication, une optimisation d’une fonction coût semi-aveugle est effectuée de manière itérative avec un pas optimisé. Cette solution est ensuite étendue au cas des systèmes x de communication MIMO-OFDM massifs (modèle convolutif), où nous estimons une matrice de séparation indépendamment de la sous-porteuse. Les deux solutions présentent des performances intéressantes sous l’effet de la contamination des pilotes. Aussi, en considérant des a priori sur le système, tels que les pilotes; la parcimonie du canal et la structure de la matrice de données, nous mettons en avant l’estimation conjointe du canal de transmission parcimonial et des données sous forme d’un problème d’optimisation. La solution semi-aveugle proposée est basée sur l’approche d’approximation convexe successive (SCA : Successive Convex Approximation), où l’optimisation est effectuée sur un problème approximatif convexe, plutôt que sur le problème original non convexe, avec convergence garantie vers un point stationnaire...Multiple Input Multiple Output (MIMO) communications systems as well as their recent largescale version, called massive MIMO, are seen as potential technologies for current and future wireless communications standards, thanks to their powerful performance-enhancing capabilities. Nevertheless, in order to fully exploit all their potentials, great attention has to be given to the system identification and ommunications channel equalization tasks, which remain a current concern. In this context, the main contribution of this thesis falls into the scope of communicationssystem identification, through channel estimation, as well as channel equalization via source separation techniques, for linear and nonlinear system models. Thus, by adopting semi-blind approaches, performance analysis as well as efficient algorithms development are put forward by considering different constraints/issues such as pilot contamination, encountered mainly in massive MIMO systems, nonlinearities effects as well as inter-symbol and inter-user interference. Furthermore, for a better performance gain, emphasis is also put on the exploitation of priors on the systems such as training sequences (pilots), channel’s sparsity, and data matrix structure.To do so, a performance bounds analysis is carried out through the Cramèr-Rao Bounds (CRB); which demonstrates the effectiveness of semi-blind techniques to overcome the problem of pilot contamination in massive MIMO-OFDM (MIMO Orthogonal frequency-Division Multiplexing) systems. This effectiveness is demonstrated for the case of synchronous and non-synchronous cells in a cellular network. This study motivated us to adopt semi-blind approaches for channel equalization and data detection via source separation techniques. A Multi-Modulus based (MM) solution is proposed for demixing instantaneous mixtures in massive MIMO systems. With no priors on the communicationschannel, an optimization of a semi-blind cost function is performed iteratively with an optimized step size. This solution is then extended to the case of massive MIMO-OFDM communications systems (convolutive model), where we estimate a separating matrix independently of the sub-carrier. Both solutions exhibit interesting performance under pilot contamination effect. Also, by considering priors on the system, such as pilots; channel’s sparsity and data matrix xii structure, we put forward a joint sparse channel estimation and data recovery as an optimization problem. The proposed semi-blind solution is based on the Successive Convex Approximation (SCA) approach, where the optimization is performed on an approximate convex problem, rather than the original non-convex one, with guaranteed convergence to a stationary point. Then, by considering nonlinear multichannel communications systems, a Maximum Likelihood(ML)-based channel estimator is proposed. A blind version is proposed by combining a subspace technique and the Expectation-Maximization (EM) algorithm, with new ambiguity removal techniques. Also, a semi-blind version is proposed, which helps getting rid off the inherent ambiguity of blind processing and obtaining better communications channel estimation performance. Finally, we initiate a study related to the potential of the Deep Learning (DL) approach on the physical layer. Thus, data detection in nonlinear communications systems is treated as a DL-based classification problem. The obtained results show that DL offers promising potential for applications at the physical layer
Source separation for robot audition
Cette thèse propose des algorithmes de séparation aveugle de sources audio en utilisant un réseau de capteurs. L'application finale de ces algorithmes est l'audition des robots dans le cadre du projet ROMEO. Dans cette thèse, nous avons développé des algorithmes de séparation aveugle de sources audio basés sur des critères de parcimonie. Nous montrons que la minimisation de la norme l1 avec une technique d'optimisation du gradient naturel permet d’élaborer un algorithme se situant au niveau de l’état de l’art. Nous montrons qu’un critère basé sur la paramétrisation de la pseudo-norme lp, avec 0<p<1 en améliore les performances. Ceci revient à rendre la contrainte de parcimonie plus dure au fur et à mesure que l'algorithme avance dans ses itérations. Pour exploiter l'aspect multicapteurs de notre application (16 capteurs sont fixés autour de la tête de l'humanoïde), nous avons proposé des algorithmes de séparation avec une étape de prétraitement de formation de voies fixe. Dans le cas de l'audition des robots, les capteurs sont souvent placés sur la tête de l'humanoïde. Afin de tenir compte de l'influence de la tête sur le champ sonore proche, nous avons construit les filtres de formation en utilisant les fonctions de transfert de tête (HRTF) du robot. L'étape de formation de voies améliore les résultats de séparation par rapport à l'utilisation d'un algorithme de séparation seule de minimum 10dB. Cette thèse propose aussi les versions adaptatives de ces algorithmes. Dans le scénario réel où le nombre de sources présentes dans l'environnement du robot est inconnu et change au cours du temps, nous montrons comment détecter et suivre le nombre de sources.This thesis proposes blind audio source separation algorithms using a microphone array. The final application of these algorithms is robot audition through the ROMEO project. In this thesis, we developed blind source separation algorithms based on a sparcity criterion. We show that l1 minimization using the natural gradient optimization technique has the same performance that the state of the art. We show that a criterion based on the parametrization of the quazi-norm lp, with 0<p<1, improves the previous results: the sparsity criterion gets harder through the iterations of the algorithm. Then, we exploited the multisensor aspect of our application (16 sensors are fixed in the head of the humanoid) and we proposed a separation algorithms with a fixed beamforming preprocessing step. In the robot audition case, the sensors are often placed on the head of the humanoid. To take into account the influence of the head in the near sound manifold, we built the beamforming filters using the head related transfer functions (HRTF) of the robot. The beamforming step improves the separation results compared to the use of a blind source separation only. This thesis also proposes the adaptive versions of those algorithms. In the real scenario where the number of sources is unknown and changes, we show how to detect and follow the number of sources
Images restoration based on quality criteria
Cette thèse concerne la restauration aveugle d’images (formulée comme un problème inverse mal-posé et mal-conditionné), en considérant particulièrement les systèmes SIMO. Dans un premier temps une technique d’identification aveugle de ce système où l’ordre du canal est inconnu (surestimé) est introduite. Nous introduisons d’abord une version simplifiée à coût réduit SCR de la méthode des relations croisées (CR). Ensuite, une version robuste R-SCR basée sur la recherche d’une solution parcimonieuse minimisant la fonction de coût CR est proposée. La restauration d’image est ensuite assurée par une nouvelle approche inspirée des techniques de décodage des signaux 1D et étendue ici aux cas de la restauration d’images en se basant sur une recherche arborescente efficace (algorithme ‘Stack’). Plusieurs améliorations de la méthode ‘Stack’ ont été introduites afin de réduire sa complexité et d’améliorer la qualité de restauration lorsque les images sont fortement bruitées. Ceci en utilisant une technique de régularisation et une approche d’optimisation all-at-once basée sur la descente du gradient qui permet de raffiner l’image estimée et mieux converger vers la solution optimale. Ensuite, les mesures de la qualité d’images sont utilisées comme fonctions de coûts (intégrées dans le critère global) et ce afin d’étudier leur potentiel pour améliorer les performances de restauration. Dans le contexte où l’image d’intérêt est corrompue par d’autres images interférentes, sa restauration nécessite le recours aux techniques de séparation aveugle de sources. Pour cela, une étude comparative de certaines techniques de séparation basées sur la propriété de décorrélation au second ordre et la parcimonie est réalisée.This thesis concerns the blind restoration of images (formulated as an ill-posed and illconditioned inverse problem), considering a SIMO system. Thus, a blind system identification technique in which the order of the channel is unknown (overestimated) is introduced. Firstly, a simplified version at reduced cost SCR of the cross relation (CR) method is introduced. Secondly, a robust version R-SCR based on the search for a sparse solution minimizing the CR cost function is proposed. Image restoration is then achieved by a new approach (inspired from 1D signal decoding techniques and extended here to the case of 2D images) based on an efficient tree search (Stack algorithm). Several improvements to the ‘Stack’ method have been introduced in order to reduce its complexity and to improve the restoration quality when the images are noisy. This is done using a regularization technique and an all-at-once optimization approach based on the gradient descent which refines the estimated image and improves the algorithm’s convergence towards the optimal solution. Then, image quality measurements are used as cost functions (integrated in the global criterion), in order to study their potential for improving restoration performance. In the context where the image of interest is corrupted by other interfering images, its restoration requires the use of blind sources separation techniques. In this sense, a comparative study of some separation techniques based on the property of second-order decorrelation and sparsity is performed
Analyse des flux de données de signaux et d'images : du sous-espace au suivi tensoriel
Le traitement des flux a récemment attiré l'attention du monde universitaire et de l'industrie, car les flux de données massives ont été de plus en plus collectés au fil des ans. Cette thèse se concentre principalement sur l'étude de l'un des problèmes les plus fondamentaux du traitement des flux, l'approximation de rang inférieur (LRA) des flux de données en ligne. Lorsque les échantillons de données arrivant à chaque pas de temps sont unidimensionnels, le problème de LRA en ligne est techniquement appelé suivi de sous-espace. Il s'agit d'un suivi tensoriel lorsque le flux de données est multidimensionnel. Pour le suivi du sous-espace, nous avons proposé deux nouveaux algorithmes pour suivre le sous-espace sous-jacent des flux de données dans deux scénarios spécifiques. Pour traiter les valeurs aberrantes clairsemées et les données manquantes, un algorithme efficace de suivi de sous-espace en deux étapes a été développé, à savoir PETRELS-ADMM. L'algorithme proposé est basé sur la méthode de direction alternée des multiplicateurs et des techniques de filtrage récursif des moindres carrés. Le deuxième algorithme appelé OPIT a été spécifiquement conçu pour suivre le sous-espace principal clairsemé dans les grandes dimensions. Plus précisément, OPIT introduit une nouvelle variante adaptative d'itération de puissance et un nouvel opérateur de seuillage basé sur des colonnes. Les deux algorithmes proposés appartiennent à la classe des méthodes de suivi prouvables avec une garantie de convergence. Pour le suivi des tenseurs, nous avons développé plusieurs nouveaux algorithmes pour suivre le LRA en ligne des tenseurs de streaming au fil du temps. Sous le format CP/PARAFAC, nous exploitons les techniques alternatives de minimisation et d'esquisse aléatoire pour développer ACP et RACP qui sont capables de factoriser des tenseurs incomplets et des tenseurs corrompus, respectivement. Sous le format Tucker, nous avons proposé un autre algorithme en ligne appelé ATD. ATD suit d'abord les sous-espaces de faible dimension sous-jacents couvrant les facteurs tensoriels, puis estime le tenseur central à l'aide d'une approximation stochastique {a}. Une analyse de convergence unifiée a été présentée pour justifier leur performance. En parallèle, il est bien connu que le format tenseur-train offre une représentation économe en mémoire et peut briser la malédiction de la dimensionnalité. En conséquence, nous avons conçu trois nouveaux algorithmes pour la décomposition en continu des trains de tenseurs. Le premier algorithme appelé TT-FOA est capable de suivre avec une grande précision les composantes de rang inférieur des tenseurs d'ordre élevé à partir de données bruitées et de grande dimension, même lorsqu'elles proviennent d'observations dépendant du temps. Le deuxième algorithme appelé ATT est spécifiquement conçu pour gérer les tenseurs de flux incomplets. Enfin, pour traiter les valeurs aberrantes éparses, nous avons proposé le soi-disant ROBOT. Techniquement, ROBOT a la capacité de suivre les tenseurs de flux à partir de flux imparfaits (c'est-à-dire en raison du bruit, des valeurs aberrantes et des données manquantes) ainsi que d'estimer leur variation temporelle dans des environnements dynamiques. En conclusion, notre étude apporte plusieurs nouvelles contributions à l'analyse des flux de données massives en général et au problème des LRA en ligne. Il s'agit de nouveaux outils d'analyse permettant de suivre efficacement les flux de données de LRA en ligne, des observations unidimensionnelles aux observations multidimensionnelles dans différents contextes. Par conséquent, ils devraient faire un pas en avant dans les applications en ligne du monde réel.Stream processing has recently attracted much attention from both academia and industry since massive data streams have been increasingly collected over the years. This thesis focuses on investigating the problem of online low-rank approximation (LRA) of data streams over time. When data samples are one-dimensional, the online LRA problem is referred to as subspace tracking. It turns out to be tensor tracking when streaming data are multi-dimensional.For subspace tracking, we proposed two novel algorithms for tracking the underlying subspace of data streams under two specific scenarios. To deal with sparse outliers and missing data, an effective two-stage subspace tracking algorithm was developed, namely PETRELS-ADMM. The proposed algorithm is based on the alternating direction method of multipliers and recursive least-squares filtering techniques. The second algorithm called OPIT was specifically designed for tracking the sparse principal subspace in high dimensions. Specifically, OPIT introduces a new adaptive variant of power iteration and a new column-based thresholding operator. Both two proposed algorithms belong to the class of provable tracking methods with a convergence guarantee.For tensor tracking, we developed several new algorithms for tracking the online LRA of streaming tensors over time. Under the CP/PARAFAC format, we leverage the alternative minimization and randomized sketching techniques to develop ACP and RACP which are capable of factorizing incomplete tensors and corrupted tensors, respectively. Under the Tucker format, we proposed another online algorithm called ATD. ATD first tracks the underlying low-dimensional subspaces covering the tensor factors, and then estimates the core tensor using {a} stochastic approximation. A unified convergence analysis was presented to justify their performance. In parallel, it is well-known that the tensor-train format offers a memory-saving representation and can break the curse of dimensionality. Accordingly, we designed three new algorithms for streaming tensor-train decomposition. The first algorithm called TT-FOA is capable of tracking the low-rank components of high-order tensors from noisy and high-dimensional data with high accuracy, even when they come from time-dependent observations. The second algorithm called ATT is specifically designed for handling incomplete streaming tensors. Finally, to deal with sparse outliers, we proposed the so-called ROBOT. Technically, ROBOT has the ability to track streaming tensors from imperfect streams (i.e., due to noise, outliers, and missing data) as well as estimate their time variation in dynamic environments.In conclusion, our study provides several novel contributions to big data stream analytics in general and the online LRA problem in particular. They are new analysis tools allowing to effectively track the online LRA of data streams from one-dimensional to multi-dimensional observations in different settings, and thus, they are expected to take a step forward real-world online applications
Analysis of EMG signals and their application to the diagnosis of Parkinson's disease
L'objectif de cette thèse est l’analyse des signaux EMG de surface et leur application au diagnostic de la maladie de Parkinson (MP). Trois points ont été abordés dans cette thèse à savoir la segmentation des signaux EMG de surface, la classification ou diagnostic de la MP basé sur l'apprentissage machine et la décomposition du signal EMG de surface en TPAUM. Dans le premier point, nous avons développé, deux techniques originales. La première, ALED et ses variantes, est non supervisée alors que la seconde est supervisée et est basée sur l’utilisation des modèles HMM. Ces techniques ont été développées pour la détection des bouffées d’activités EMG et leur analyse. Dans le second point, nous avons proposé deux systèmes de diagnostic de la MP. Le premier est basé sur l’analyse des bouffées d’activité EMG en utilisant et comparant différents descripteurs et différentes techniques de classification existantes dans la littérature. Le deuxième système est basésur les HMM. Dans le dernier point, une méthode de décomposition du signal EMG de surface en TPAUM est proposée, basée sur la séparation de sources via leur parcimonie temporelle.The objective of this thesis is the study of surface EMG signal and its application for Parkinson's disease (PD) diagnosis. Three problems have been investigated, namely the segmentation of surface EMG signals, the classification or diagnosis of PD and the decomposition of the surface EMG signal into TPAUM. In the first problem, two techniques have been introduced for EMG signal segmentation. The first one is an unsupervised method called ALED and the second one is a supervised one based on the use of HMM models. These techniques are developed for the detection of the bursts EMGactivity and their monitoring.To deal with the second problem, we have proposed two diagnostic systems for PD detection.The first one is based on the analysis of the burst EMG activity using (and comparing) different features and different classification techniques from the literature and the second one is based on HMMs.For the last problem, we have developed a new technique for the EMGs signal decomposition into TPAUM based on sparce source separation
Contributions to source localization and separation
Les premières recherches en détection, localisation et séparation de signaux remontent au début du 20ème siècle. Ces recherches sont d’actualité encore aujourd’hui, notamment du fait de la croissance rapide des systèmes de communications constatée ces deux dernières décennies. Par ailleurs, la littérature du domaine consacre très peu d’études relatives à certains contextes jugés difficiles dont certains sont traités dans cette thèse. Ce travail porte sur la localisation de signaux par détection des temps d’arrivée ou estimation des directions d’arrivée et sur la séparation de sources dépendantes ou à module constant. L’idée principale est de tirer profit de certaines informations a priori disponibles sur les signaux sources telles que la parcimonie, la cyclostationarité, la non-circularité, le module constant, la structure autoregressive et les séquences pilote dans un contexte coopératif. Une première partie détaille trois contributions : (i) un nouveau détecteur pour l’estimation des temps d’arrivée basé sur la minimisation de la probabilité d’erreur ; (ii) une estimation améliorée de la puissance du bruit, basée sur les statistiques d’ordre ; (iii) une quantification de la précision et de la résolution de l’estimation des directions d’arrivée au regard de certains a priori considérés sur les sources. Une deuxième partie est consacrée à la séparation de sources exploitant différentes informations sur celles-ci : (i) la séparation de signaux de communication à module constant ; (ii) la séparation de sources dépendantes connaissant la nature de la dépendance et (iii) la séparation de sources autorégressives dépendantes connaissant la structure autorégressive.Signal detection, localization, and separation problems date back to the beginning of the twentieth century. Nowadays, this subject is still a hot topic receiving more and more attention, notably with the rapid growth of wireless communication systems that arose in the last two decades and it turns out that many challenging aspects remain poorly addressed by the available literature relative to this subject. This thesis deals with signal detection, localization using temporal or directional measurements, and separation of dependent source signals. The main objective is to make use of some available priors about the source signals such as sparsity, cyclo-stationarity, non-circularity, constant modulus, autoregressive structure or training sequences in a cooperative framework. The first part is devoted to the analysis of (i) signal’s time-of-arrival estimation using a new minimum error rate based detector, (ii) noise power estimation using an improved order-statistics estimator and (iii) side information impact on direction-of-arrival estimation accuracy and resolution. In the second part, the source separation problem is investigated at the light of different priors about the original sources. Three kinds of prior have been considered : (i) separation of constant modulus communication signals, (ii) separation of dependent source signals knowing their dependency structure and (iii) separation of dependent autoregressive sources knowing their autoregressive structure
- …
