1,720,970 research outputs found
Méthodes de prédiction conforme pour des données complexes : application à la gestion du patrimoine immobilier
Uncertainty quantification is not an easy task. Its difficulty depends on various factors related to the available data, the application domain, and also the learned task. Having multiple outputs to predict simultaneously can be even more demanding, principally when these outputs are correlated. This research work focuses on producing confidence regions for such complex problems, by using conformal prediction: a theoretically proven method that can beadded to any Machine Learning model to generate set predictions whose size and statistical guarantee depend on a user-defined error rate. Our first and main problem of interest consists of multi-target regression, where the objective is to predict many real-valued outputs at once. First, a simple extension of single-target regression conformal methods is proposed by following a naive approach that treats these targets as independent. Second, copulas are exploited to take into account the existing correlations between outputs when giving conformal regions. Third, ellipsoids are considered in order to produce more flexible conformal regions according to the possible relationships between targets while maintaining the desired error rate. Our second problem of interest is an applied research work that deals with debt prediction for tenants of rented social housing to control the errors of a particular class in a imbalanced binary classification context. In this case, Mondrian conformal prediction, which is a variant of conformal inference, is used to treat this problem with the guidance of real estate experts.La quantification de l'incertitude n'est pas une tâche facile. Sa difficulté dépend de divers facteurs liés aux données disponibles, au domaine d'application et aussi à la tâche apprise. Avoir plusieurs sorties à prédire simultanément peut être encore plus exigeant, principalement lorsque ces sorties sont corrélées. Ce travail de recherche se concentre sur la production de régions de confiance pour de tels problèmes complexes, en utilisant la prédiction conforme : une méthode théoriquement prouvée qui peut être ajoutée à n'importe quel modèle d'apprentissage automatique pour générer des prédictions d'ensemble dont la taille et la garantie statistique dépendent d'un taux d'erreur défini par l'utilisateur. Notre premier et principal problème d'intérêt consiste en une régression multi-cibles, où l'objectif est de prédire plusieurs sorties à valeur réelle en même temps. Premièrement, une extension simple des méthodes conformes à la régression à cible unique est proposée en suivant une approche naïve qui traite ces cibles comme indépendantes. Deuxièmement, les copules sont exploitées pour prendre en compte les corrélations existantes entre les sorties lors de l'attribution de régions conformes. Troisièmement, les ellipsoïdes sont considérés afin de produire des régions conformes plus flexibles en fonction des relations possibles entre les cibles tout en maintenant le taux d'erreur désiré. Notre deuxième problème d'intérêt est un travail de recherche appliquée qui traite de la prédiction de la dette des locataires de logements sociaux loués afin de contrôler les erreurs d'une classe particulière dans un contexte de classification binaire déséquilibrée. Dans ce cas, la prédiction conforme Mondrian, qui est une variante de l'inférence conforme est utilisée pour traiter ce problème avec les conseils d’experts immobiliers
Méthodes de prédiction conforme pour des données complexes : application à la gestion du patrimoine immobilier
La quantification de l'incertitude n'est pas une tâche facile. Sa difficulté dépend de divers facteurs liés aux données disponibles, au domaine d'application et aussi à la tâche apprise. Avoir plusieurs sorties à prédire simultanément peut être encore plus exigeant, principalement lorsque ces sorties sont corrélées. Ce travail de recherche se concentre sur la production de régions de confiance pour de tels problèmes complexes, en utilisant la prédiction conforme : une méthode théoriquement prouvée qui peut être ajoutée à n'importe quel modèle d'apprentissage automatique pour générer des prédictions d'ensemble dont la taille et la garantie statistique dépendent d'un taux d'erreur défini par l'utilisateur. Notre premier et principal problème d'intérêt consiste en une régression multi-cibles, où l'objectif est de prédire plusieurs sorties à valeur réelle en même temps. Premièrement, une extension simple des méthodes conformes à la régression à cible unique est proposée en suivant une approche naïve qui traite ces cibles comme indépendantes. Deuxièmement, les copules sont exploitées pour prendre en compte les corrélations existantes entre les sorties lors de l'attribution de régions conformes. Troisièmement, les ellipsoïdes sont considérés afin de produire des régions conformes plus flexibles en fonction des relations possibles entre les cibles tout en maintenant le taux d'erreur désiré. Notre deuxième problème d'intérêt est un travail de recherche appliquée qui traite de la prédiction de la dette des locataires de logements sociaux loués afin de contrôler les erreurs d'une classe particulière dans un contexte de classification binaire déséquilibrée. Dans ce cas, la prédiction conforme Mondrian, qui est une variante de l'inférence conforme est utilisée pour traiter ce problème avec les conseils d’experts immobiliers.Uncertainty quantification is not an easy task. Its difficulty depends on various factors related to the available data, the application domain, and also the learned task. Having multiple outputs to predict simultaneously can be even more demanding, principally when these outputs are correlated. This research work focuses on producing confidence regions for such complex problems, by using conformal prediction: a theoretically proven method that can beadded to any Machine Learning model to generate set predictions whose size and statistical guarantee depend on a user-defined error rate. Our first and main problem of interest consists of multi-target regression, where the objective is to predict many real-valued outputs at once. First, a simple extension of single-target regression conformal methods is proposed by following a naive approach that treats these targets as independent. Second, copulas are exploited to take into account the existing correlations between outputs when giving conformal regions. Third, ellipsoids are considered in order to produce more flexible conformal regions according to the possible relationships between targets while maintaining the desired error rate. Our second problem of interest is an applied research work that deals with debt prediction for tenants of rented social housing to control the errors of a particular class in a imbalanced binary classification context. In this case, Mondrian conformal prediction, which is a variant of conformal inference, is used to treat this problem with the guidance of real estate experts
Méthodes de prédiction conforme pour des données complexes : application à la gestion du patrimoine immobilier
Uncertainty quantification is not an easy task. Its difficulty depends on various factors related to the available data, the application domain, and also the learned task. Having multiple outputs to predict simultaneously can be even more demanding, principally when these outputs are correlated. This research work focuses on producing confidence regions for such complex problems, by using conformal prediction: a theoretically proven method that can beadded to any Machine Learning model to generate set predictions whose size and statistical guarantee depend on a user-defined error rate. Our first and main problem of interest consists of multi-target regression, where the objective is to predict many real-valued outputs at once. First, a simple extension of single-target regression conformal methods is proposed by following a naive approach that treats these targets as independent. Second, copulas are exploited to take into account the existing correlations between outputs when giving conformal regions. Third, ellipsoids are considered in order to produce more flexible conformal regions according to the possible relationships between targets while maintaining the desired error rate. Our second problem of interest is an applied research work that deals with debt prediction for tenants of rented social housing to control the errors of a particular class in a imbalanced binary classification context. In this case, Mondrian conformal prediction, which is a variant of conformal inference, is used to treat this problem with the guidance of real estate experts.La quantification de l'incertitude n'est pas une tâche facile. Sa difficulté dépend de divers facteurs liés aux données disponibles, au domaine d'application et aussi à la tâche apprise. Avoir plusieurs sorties à prédire simultanément peut être encore plus exigeant, principalement lorsque ces sorties sont corrélées. Ce travail de recherche se concentre sur la production de régions de confiance pour de tels problèmes complexes, en utilisant la prédiction conforme : une méthode théoriquement prouvée qui peut être ajoutée à n'importe quel modèle d'apprentissage automatique pour générer des prédictions d'ensemble dont la taille et la garantie statistique dépendent d'un taux d'erreur défini par l'utilisateur. Notre premier et principal problème d'intérêt consiste en une régression multi-cibles, où l'objectif est de prédire plusieurs sorties à valeur réelle en même temps. Premièrement, une extension simple des méthodes conformes à la régression à cible unique est proposée en suivant une approche naïve qui traite ces cibles comme indépendantes. Deuxièmement, les copules sont exploitées pour prendre en compte les corrélations existantes entre les sorties lors de l'attribution de régions conformes. Troisièmement, les ellipsoïdes sont considérés afin de produire des régions conformes plus flexibles en fonction des relations possibles entre les cibles tout en maintenant le taux d'erreur désiré. Notre deuxième problème d'intérêt est un travail de recherche appliquée qui traite de la prédiction de la dette des locataires de logements sociaux loués afin de contrôler les erreurs d'une classe particulière dans un contexte de classification binaire déséquilibrée. Dans ce cas, la prédiction conforme Mondrian, qui est une variante de l'inférence conforme est utilisée pour traiter ce problème avec les conseils d’experts immobiliers
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Conformal multi-target regression using neural networks
International audienceMulti-task learning is a domain that is still not fully studied in the conformal prediction framework, and this is particularly true for multi-target regression. Our work uses inductive conformal prediction along with deep neural networks to handle multi-target regression by exploring multiple extensions of existing single-target non-conformity measures and proposing new ones. This paper presents our approaches to work with conformal prediction in the multiple regression setting, as well as the results of our conducted experiments
Prédiction conformelle profonde pour des modèles robustes
International audienceLes réseaux profonds, comme d'autres modèles, peuvent associer une confiance élevée à des prédictions peu fiables. Rendre ces modèles robustes et fiables est donc essentiel, surtout pour les décisions critiques. Ce papier montre expérimentalement que la prédiction conformelle, et plus particulièrement l'ap-proche de [Hechtlinger et al. (2018)], apporte une solution convaincante à ce défi. La prédiction conformelle fournit un ensemble de classes couvrant la vraie classe avec avec une fréquence choisie au préalable par l'utilisateur. Dans le cas où l'exemple à prédire est atypique, la prédiction conformelle prédira l'en-semble vide. Les expériences menées montrent le bon comportement de l'ap-proche conformelle, en particulier lorsque les données sont bruitées
Copula-based conformal prediction for multi-target regression
International audienceThere are relatively few works dealing with conformal prediction for multi-task learning issues, and this is particularly true for multi-target regression. This paper focuses on the problem of providing valid (i.e., frequency calibrated) multi-variate predictions. To do so, we propose to use copula functions for inductive conformal prediction, and illustrate our proposal by applying it to deep neural networks and random forests. We show that the proposed method ensures efficiency and validity for multi-target regression problems on various data sets
- …
