1,721,065 research outputs found

    Counterfactual Interactive Learning: designing proactive artificial agents that learn from the mistakes of other decision makers

    No full text
    Modelling a reward able to convey the right incentive to the agent is fairly tedious in terms of engineering required. Imitation learning bypasses this time-consuming hurdle by enticing the agent to mimic an expert instead of trying to maximize a potentially ill-designed reward signal. We first build on the strengths of off-policy learning to design a novel adversarial imitation approach that addresses the high sample complexity suffered by Generative Adversarial Imitation Learning, the state-of-the-art imitation approach. Second, we show that forcing the adversarially learned reward function to be local Lipschitz-continuous is a sine qua non condition for the method to perform well. We complement this empirical evidence with several theoretical guarantees. Finally, we introduce the concept of dataset-grounded optimality inductive bias for offline agents. By carefully orchestrating such priors in our generalization of importance-weighted regression, we can achieve better results, while remaining agnostic with respect to the quality the dataset

    Improving the capabilities of Variational Autoencoder Models by exploring their latent space

    No full text
    A fundamental goal in developing of Machine Learning is to build systems that are able to mimic the capabilities of humans and animals. This drives the field towards the creation of algorithms and architectures capable of mastering a vast array of tasks, from basic pattern recognition to complex decision-making under and drug design uncertain conditions. Recent advancements in deep learning have shown that neural networks can make significant advances by using large amount of data and computing power. The last decade deep generative models, have achieve great achievements in fields like computer vision, natural language processing, that we could not even imagine two decades ago. These achievements highlight the potential of deep learning and underscore the ongoing effort to narrow the gap between human intelligence and machine intelligence. This thesis delves into the advancement of deep generative modeling, particularly focusing on Variational Autoencoders (VAEs), to tackle significant challenges such as out-ofdistribution (OOD) generation, catastrophic forgetting, and the learning of multi-modal probabilistic structures. Inspired by human cognitive abilities to learn from minimal observations and adapt to new environments, our work seeks to learn similar capabilities within machine learning models, thereby narrowing the gap between human intelligence and artificial intelligence. Through three main contributions, we address limitations of current generative modeling approaches and propose solutions to improve their performance. We explore first, the ability of VAEs to achieve OOD conditional generations. Although conditional generation is already a challenging task because the model might ignore these conditions, our research goes further into a more complex task. As humans’ brains are able to understand and produce new combinations of familiar elements, we develop a novel framework that is capable of generating data with desired property values combinations not included in the training data. Our method, leveraging conditional VAEs with a back-translation mechanism, can handle a diverse range of input–attribute pairs that may not be present in the training data, thus enhancing its capability to handle OOD data. Moreover, the back-translation procedure preserves the content of the input data while manipulating their attribute values, enabling style transfer. Then, we examine another challenging task for ML, namely, continual classification learning. In this thesis, we tackle this challenge by introducing a joint generative model approach, combining naturally a generative model with a classifier in the latent space, relying on the joint generative model to replicate the data distribution with the corresponding labels of the previously seen tasks. Finally, we study the limitations of VAEs, focusing on their inability to produce generations from the individual modalities of data originating from mixture distributions, reflecting humans’ ability to understand and process complex, heterogeneous information. To address this, we propose a 2-level hierarchical latent variable model, which introduces both continuous and categorical latent variables, thereby offering a richer representation of data. By integrating a more flexible variational posterior and an informative conditional prior, mirroring the same structure, our method substantially improves the model’s capacity for capturing and generating the complex probabilistic structures.</p

    Méthode pour le pré-traitement et l'extraction des biomarqueurs en spéctrométrie de masse

    No full text
    La spectrométrie de masse offre des outils pour analyser la composition moléculaire d'un échantillons. En protéomique clinique, les technologies SELDI-TOF et MALDI-TOF ont récemment reçus une attention particulière pour leur facultés à analyser des échantillons biologiques de patients (serum sanguin, urine, tissus,...). Malgré leur résolution faible, ces technologies offrent en effet la possibilité de dresser rapidement le profil d'expression de centaines de protéines pour des centaines d'échantillons, ce qui permet d'envisager leur utilisation pour le diagnostique de patients et la recherche de biomarqueurs de certaines maladies. Ces applications soulèvent néanmoins des interrogations quant à la fiabilité des résultats que l'on peut tirer de ces technologies. Cette thèse aborde différents aspects pour améliorer la fiabilité des résultats. Nous étudions principalement le problème de l'analyse bio-informatique des données mais aussi l'amélioration des protocoles de préparation des échantillons biologiques. Concernant l'analyse bio-informatique, les difficultés majeures résident dans la structuration des données, et dans leur forte dimension qui perturbent de nombreux algorithmes d'extraction de connaissances

    Sparse learning for variable selection with structures and nonlinearities

    No full text
    In this thesis we discuss machine learning methods performing automated variable selection for learning sparse predictive models. There are multiple reasons for promoting sparsity in the predictive models. By relying on a limited set of input variables the models naturally counteract the overfitting problem ubiquitous in learning from finite sets of training points. Sparse models are cheaper to use for predictions, they usually require lower computational resources and by relying on smaller sets of inputs can possibly reduce costs for data collection and storage. Sparse models can also contribute to better understanding of the investigated phenomenons as they are easier to interpret than full models

    Improved Distance Metric Learning for Nearest Neighbor Classification

    No full text
    L'apprentissage automatique concerne l'apprentissage de modèles prédictifs à partir de donnée. Pour bien generaliser, beaucoup d'algorithme d'apprentissage automatique suppose que les prédictions des points proches sont similaires. En conséquence, comment mesurer la proximitée des points de données devient donc un élement crucial d'algorithm d'apprentissage. L'apprentissage de métrique résout se défi en apprenant une métrique dépendantes des données. Pendant les dix dernière années, ceci a attiré beaucoup d'attention et est devenu une des approches principales pour adresser des problèmes d'apprentissage de distance/similarité. L'approche la plus étudiée est l'apprentissage de métrique individuel. Cela apprend une mesure de distance dans tout l'espace d'entrée des données. Cette approche est souvent efficace computationelement. Cependant, il peut ne pas etre suffisament flexible pour bien apprendre la distance dans different voisinage de donnée. Tel que, la distance dans different voisinage peut être bien approximée. L'apprentissage de métrique non linéaire suit une approche differente pour augmenter la complexitée du modèle. Il envoie d'abord les points de donnée dans un nouvel espace de donnée par une application non linéaire d'attribut puis une métrique individuel est apprise dans le nouvel espace de donnée. Malgré le succès de differents algorithmes d'apprentissage de métrique, chaque algorithme possède ses propres limitations. Dans cette thèse, nous nous concentrons dans leur limitations et developpons de nouveau algorithme d'apprenttisage de métrique. Quatre different types d'algorithme d'apprentissage de métrique ont ete contribue, incluant un algorithme d'apprentissage de métrique individuel, un algorithme d'apprentissage de métrique local et deux algorithmes d'apprentissages non linéaire. Les algorithmes d'apprentissage de métrique developpe sont meilleur que les méthodes de l'état de l'art en terme de performance predictive et de scalabilitées algorithmique

    Structural and functional regularization of deep learning models

    No full text
    In this thesis, we investigate various regularization approaches for deep learning models. As the deep learning models can learn very complex functions using enormous numbers of parameters, the need for appropriate regularization becomes even more crucial. In this work, we are particularly interested in the setting where we have access to some domain knowledge that can be used to design various constraints on the learned model to improve models generalization performance.Throughout the thesis, we consider two types of domain knowledge: information about features’ intrinsic properties, which we refer to as feature side-information, and a black-box software that can measure the properties of any instances sampled from the underlying domain.In the first half of the manuscript, we focus on regularizing the predictive models using the feature side-information. Feature side-information is most often ignored or used only for feature selection prior to model fitting. In this work, we propose to incorporate the feature side-information into the learning of the predictive models where we assume that similar features should have a similar effect on the learned model. We present a regularizer that forces the learned model to be invariant/symmetric to relative changes in the values of similar features where the feature similarity is defined based on the feature side information. In the second half of the thesis, we focus on tackling the inverse problem: generating discrete structures that exhibit a fixed set of properties in the presence of black-box software which can evaluate the property of any discrete structures from the underlying domain. Even though unconditional generation of discrete structures has been tackled very successfully, the conditional generation remains challenging due to the discrete nature of the data. Existing methods are mostly limited to conditioning on binary classes. When conditioning on continuous properties, it is formulated as property optimization where the algorithms look for discrete structures that have their properties enhanced.Dans cette thèse, nous étudions diverses approches de régularisation pour les modèles d’apprentissage profond. Comme les modèles d’apprentissage en profond peuvent apprendre des fonctions très complexes en utilisant un nombre énorme de paramètres, la nécessité d’une régularisation appropriée devient encore plus cruciale. Dans ce travail, nous nous intéressons particulièrement au cadre où nous avons accès à certaines connaissances du domaine qui peuvent être utilisées pour concevoir diverses contraintes sur le modèle appris afin d’améliorer la généralisation des modèles. Tout au long de la thèse, nous considérons deux types de connaissances de domaine: des informations sur les propriétés intrinsèques, que nous appelons des informations auxiliaire, et un logiciel consideré comme une boîte noire qui peut mesurer les propriétés de toutes les instances échantillonnées dans le domaine sous-jacent. Dans la première moitié du manuscrit, nous nous concentrons sur la régularisation des modèles prédictifs en utilisant les informations auxiliaires des attributs . Les informations auxiliaires des attributs sont le plus souvent ignorées ou utilisées uniquement pour la sélec- tion d’attribut avant l’ajustement du modèle. Dans ce travail, nous proposons d’incorporer les informations auxiliaires sur les attributs dans l’apprentissage des modèles prédictifs où nous supposons que des attributs similaires devraient avoir un effet similaire sur le modèle appris. Nous présentons un régulariseur qui force le modèle appris à être invariant/symétrique aux changements relatifs dans les valeurs d’entités similaires où la similitude d’entités est définie en fonction des informations auxiliaires. Nous donnons deux façons pour approximer la valeur du régulariseur. Un analytique qui se résume à l’imposition d’un régularisateur laplacien sur le jacobien du modèle par raport aux attributs d’entrée et une stochastique qui repose sur l’augmentation des données. Nous effectuons des expériences sur un certain nombre d’ensembles de données de référence qui montrent des gains de performance pré- dictifs significatifs sur un certain nombre de lignes de base, en raison de l’exploitation des informations auxiliaire. Dans la seconde moitié de la thèse, nous nous concentrons sur la résolution du problème inverse: générer des structures discrètes qui présentent un ensemble fixe de propriétés en présence d’un logiciel de boîte noire qui peut évaluer la propriété de toute structure discrète du domaine sous-jacent. Même si la génération inconditionnelle de structures discrètes a été abordée avec beaucoup de succès, la génération conditionnelle reste difficile en raison de la nature discrète des données. Les méthodes existantes sont principalement limitées au conditionnement sur des classes binaires. Lors du conditionnement sur des propriétés continues, il est formulé comme une optimisation de propriété où les algorithmes recherchent des structures discrètes dont les propriétés sont améliorées. Dans ce travail, nous étudions l’utilisation de modèles génératifs conditionnels qui attaquent directement ce problème inverse en modélisant la distribution de structures discrètes à propriétés interessante. </p

    Algorithm selection via meta-learning

    No full text
    The goal of this thesis is to provide support to the analyst in selecting the appropriate classification algorithm for a specific problem, taking into consideration the nature of the problem. We make no distinction between an algorithm and the representational model of the algorithm, we consider the learning algorithm as the entity to be selected [...
    corecore