1,721,171 research outputs found
WifiLeaks: Underestimated privacy implications of the access wifi state Android permission
Short Paper: WifiLeaks: Underestimated Privacy Implications of the Access_Wifi_State Android Permission
Données de santé : Exploration des mécanismes émergents de protection de la vie privée
Les données de santé représentent une grande quantité d'informations, générées quotidiennement et sensibles par nature. Cependant, leur partage est essentiel pour l'avancement de la recherche et, en fin de compte, l'amélioration des soins aux patients. L’utilisation des données médicales est confrontée à des limitations dues à leur sensibilité et à la nécessité de garantir la confidentialité, encadrée par les réglementations en vigueur. Cela nécessite une protection renforcée. L’intérêt pour des alternatives au partage de données brutes, telles que la pseudonymisation ou l’anonymisation, augmente avec les besoins d’accès à des données d’apprentissage pour l’utilisation de l’intelligence artificielle, qui requiert de grandes quantités de données pour fonctionner efficacement en tant qu’assistant médical. Dans cette thèse, nous examinons de nouveaux mécanismes respectant la vie privée, rendues possibles par les avancées rapides de l’intelligence artificielle. Plus spécifiquement, mon analyse porte sur l’amélioration d’alternatives à la centralisation de données sensibles : l’apprentissage fédéré, une méthode décentralisée d’entraînement des modèles d’Intelligence Artificielles qui ne nécessitent pas le partage de données, ainsi que de la génération de données synthétiques, qui crée des données artificielles avec des propriétés statistiques similaires aux données réelles. Considérant l’absence de consensus pour l’évaluation de la confidentialité de ces nouvelles approches, nous avons axé notre travail sur la mesure méthodique de la fuite de confidentialité ainsi que la balance avec l'utilité des données synthétiques ou du modèle d'apprentissage fédéré. Mes travaux incluent un mécanisme pour améliorer les propriétés de confidentialité de l'apprentissage fédéré ainsi qu'une nouvelle méthode de génération conditionnelle de données synthétiques. Cette thèse vise à contribuer au développement de cadres plus robustes pour le partage sécurisé des données de santé, en conformité avec les exigences réglementaires, facilitant ainsi des innovations en matière de santé.Health data represents a large volume of information, generated daily and sensitive by nature. However, sharing this data is essential for advancing research and, ultimately, improving patient care. The use of medical data faces limitations due to its sensitivity and the need to ensure confidentiality, which is governed by current regulations. This necessitates enhanced protection. Interest in alternatives to sharing raw data, such as pseudonymization or anonymization, is increasing alongside the growing need for access to training data for the use of artificial intelligence, which requires large amounts of data to function effectively as a medical assistant. In this thesis, we explore new privacy-preserving mechanism made possible by the rapid advancements in artificial intelligence. More specifically, my analysis focuses on improving alternatives to the centralization of sensitive data: federated learning, a decentralized method of training artificial intelligence models that do not need sensitive data sharing, as well as synthetic data generation, which creates artificial data similar statistical properties to real data. Given the lack of consensus on evaluating the privacy of these new approaches, our work focuses on the systematic measurement of privacy leakage and the balance with the utility of synthetic data or the federated learning model. My contributions include a mechanism to enhance the privacy properties of federated learning, as well as a new method for conditional synthetic data generation. This thesis aims to contribute to the development of more robust frameworks for the secure sharing of health data, in compliance with regulatory requirements, thereby facilitating innovations in healthcare
Going Beyond Counting First Authors in Author Co-citation Analysis
The present study examines one of the fundamental aspects of author co-citation analysis (ACA) - the way co-citation
counts are defined. Co-citation counting provides the data on which all subsequent statistical analyses and mappings
are based, and we compare ACA results based on two different types of co-citation counting - the traditional type that
only counts the first one among a cited work's authors on the one hand and a non-traditional type that takes into
account the first 5 authors of a cited work on the other hand. Results indicate that the picture produced through this non-traditional author co-citation counting contains more coherent author groups and is therefore considerably clearer. However, this picture represents fewer specialties in the research field being studied than that produced through the traditional first-author co-citation counting when the same number of top-ranked authors is selected and analyzed. Reasons for these effects are discussed
Communications préservant la confidentialité pour l'IoT
Les dernières décennies ont été témoins de l'émergence et de la prolifération d'objets connectés, communément appelés Internet des Objets (IdO). Cet écosystème divers correspond à une large gamme de dispositifs spécialisés, allant de la caméra IP aux capteurs détectant les fuites d'eau, chacun conçu pour répondre à des objectifs et des contraintes de consommation d'énergie, de puissance de calcul ou de coût. Le développement rapide de nombreuses technologies et leur connexion en réseau s'accompagne de la génération d'un important volume de données, soulevant des préoccupations en matière de vie privée, en particulier dans des domaines sensibles tels que la santé ou les maisons connectées. Dans cette thèse, nous exploitons les techniques d'apprentissage automatique (machine learning) pour explorer les problèmes liés à la vie privée des objets connectés via leurs protocoles réseau. Tout d'abord, nous étudions les attaques possibles contre LoRaWAN, un protocole longue distance et à faible coût d'énergie. Nous explorons la relation entre deux identifiants du protocole et montrons que leur séparation théorique peut être contrecarrée en utilisant les métadonnées produites lors de la connexion au réseau. En nous appuyant sur une approche multi-domaines (contenu, temps, radio), nous démontrons que ces métadonnées permettent à un attaquant d'identifier les objets connectés de manière unique malgré le chiffrement du trafic, ouvrant la voie au traçage ou à la ré-identification. Nous explorons ensuite les possibles contre-mesures, en analysant systématiquement les données utilisées lors de ces attaques et en proposant des techniques pour les obfusquer ou réduire leur pertinence. Nous démontrons que seule une approche combinée offre une réelle protection. Par ailleurs, nous proposons et évaluons diverses solutions de pseudonymes temporaires adaptées aux contraintes de LoRaWAN, en particulier la consommation énergétique. Enfin, nous adaptons notre méthodologie d'apprentissage automatique à DNS, un protocole largement déployé dans l'IdO grand public. À nouveau basées sur les métadonnées, notre attaque permet d'identifier les objets connectés, malgré le chiffrement du flux DNS-over-HTTPS. Explorant les contre-mesures potentielles, nous observons un non-respect des standards liés au padding, entraînant la compromission partielle de la vie privée des utilisateurs.During the past decades, we have witnessed the emergence of connected devices, commonly known as the Internet of Things (IoT). This diverse ecosystem encompasses a wide range of specialized devices, from IP cameras to water leak detectors, each designed to meet specific objectives and constraints regarding energy consumption, computing power, or cost. The rapid development of various technologies and their networking is accompanied by the generation of a significant volume of data, raising privacy concerns, particularly in sensitive areas such as healthcare or smart homes. In this thesis, we leverage machine learning techniques to explore privacy issues related to connected objects through their network protocols. First, we study potential attacks on LoRaWAN, a long-range, low-power protocol. We explore the relationship between two protocol identifiers and show that their theoretical separation can be undermined using metadata produced during network connection. By adopting a multi-domain approach (content, time, and radio), we demonstrate that this metadata allows an attacker to uniquely identify devices despite traffic encryption, paving the way for tracking or re-identification. Then, we explore possible countermeasures by systematically analyzing the data used in these attacks and proposing techniques to obfuscate or reduce their relevance. We show that only a combined approach offers real protection. Additionally, we propose and evaluate various temporary pseudonym solutions tailored to the constraints of LoRaWAN, particularly energy consumption. Finally, we adapt our machine learning methodology to DNS, a protocol widely deployed in consumer IoT. Our attack is again based on metadata and enables device identification despite the encryption of DNS-over-HTTPS traffic. Exploring potential countermeasures, we observe non-compliance with padding standards, leading to partial compromise of user privacy. More generally, our work highlights that the efforts made by IoT protocols such as LoRaWAN to protect privacy are insufficient. Potentially profound changes are necessary to adequately address these issues
Variations on the Author
“Variations on the Author” discusses two of Eduardo Coutinho’s recent films (Um Dia na Vida, from 2010, and Últimas Conversas, posthumously released in 2015) and their contribution to the general question of documentary authorship. The director’s filmography is characterized by a consistent yet self-effacing form of authorial self-inscription: Coutinho often features as an interviewer that rather than express opinions propels discourses; an interviewer that is good at listening. This mode of self-inscription characterizes him as an author who is not expressive but who is nonetheless markedly present on the screen. In Um Dia na Vida, however, Coutinho is completely absent form the image, while Últimas Conversas, on the contrary, includes a confessional prologue that moves the director from the margins to the center of his films. This article examines the ways in which these works stand out in the filmography of a director who offers new insights into the notion of cinematic authorship
Appropriate Similarity Measures for Author Cocitation Analysis
We provide a number of new insights into the methodological discussion about author cocitation analysis. We first argue that the use of the Pearson correlation for measuring the similarity between authors’ cocitation profiles is not very satisfactory. We then discuss what kind of similarity measures may be used as an alternative to the Pearson correlation. We consider three similarity measures in particular. One is the well-known cosine. The other two similarity measures have not been used before in the bibliometric literature. Finally, we show by means of an example that our findings have a high practical relevance.information science;Pearson correlation;cosine;similarity measure;author cocitation analysis
Problèmes de vie privée dans les réseaux sans-fil : Every frame you send, they’ll be watching you.
A growing number of devices carried by users are equipped with wireless technologies such as Bluetooth and Wi-Fi which allow the seamless exchange of information between devices and the network infrastructure. Because they routinely emit wireless messages carrying identifiers and other technical artifacts in cleartext, these technologies expose users to privacy issues. Focusing on the data included in advertising messages, we identify and analyze the leakage of personal data, and study potential and existing countermeasures. More specifically, we try to answer the following questions: what are the privacy threats associated with wireless networks? Which solutions can be deployed to protect users against these threats? How efficient are current privacy protection implementations?We start by an analysis of privacy features of the two major wireless network standards: Wi-Fi and Bluetooth-Low-Energy. We focus our study on address randomization mechanisms, a recently adopted anti-tracking measure, and identify several issues related to implementation as well as standard specifications. To illustrate the diversity and complexity of the issues affecting these technologies, we present two representative cases of personal data leakage in wireless networks. First, leveraging the reverse-engineering of Continuity, a BLE-based protocol developed by Apple, we uncover a collection of personal data leakages affecting billions of devices worldwide. Finally, we present an abuse of Android Wi-Fi permission that can be used to bypass permissions and to infer personal data such as the location of the device. When confronted with those privacy issues, it becomes necessary to increase user protection by developing privacy-preserving mechanisms but most importantly by correctly implementing existing ones. Furthermore, it appears that standard specifications are key elements of a better protection, and it is thus of utmost importance to promote the integration of privacy protection in these standards.Un nombre croissant d'équipements intègre une des technologies sans-fil, telles que le Wi-Fi et le Bluetooth, qui permettent des échanges d'informations entre les appareils et le réseau. La transmission de messages incluant des identifiants et des informations techniques en clair expose les utilisateurs de ces technologies à des problèmes de vie privée. En nous concentrant sur les informations exposées par les messages d'advertising, nous identifions et analysons la fuite de certaines données personnelles et nous étudions de potentielles contre-mesures. Plus spécifiquement, nous tâchons de répondre aux questions suivantes : quelles sont les menaces sur la vie privée dans les réseaux sans-fil ? Quelles solutions peuvent être mises en place pour protéger les utilisateurs ? Quelle est l'efficacité des protections actuellement déployées ? Nous commençons par l'analyse des mécanismes de protection de la vie privée dans deux technologies majeures : le Wi-Fi et le Bluetooth-Low-Energy (BLE). Notre étude centrée sur les mécanismes d'adresse aléatoire, une protection anti-traçage récemment adoptée par l'industrie, identifie plusieurs problèmes liés à l'implémentation ainsi qu'aux spécifications des standards. Afin d'illustrer la diversité et la complexité des problèmes affectant ces technologies, nous présentons deux cas représentatifs de fuite de données personnelles dans les réseaux sans-fil. Premièrement, en nous appuyant sur une rétro-ingénierie de Continuity, un protocole d'Apple basé sur le BLE, nous mettons à jour une collection de failles affectant des milliards d'appareils à l'échelle mondiale. Puis, nous présentons un détournement de la permission Wi-Fi d'Android qui permet de contourner les protections du système afin d'obtenir des données personnelles telles que la localisation. Face à ces problèmes de vie privée, il est nécessaire d'améliorer la protection des utilisateurs en développant des mécanismes de protection et, aussi et surtout, en s'assurant de l'implémentation correcte des mécanismes existants. De plus, il apparait que les spécifications des standards jouent un rôle clef dans la protection de la vie privée ; il est donc de la plus haute importance de promouvoir l'intégration de la protection des données personnelles au sein de ces standards
Quand les terminaux mobiles jouent les mouchards de poche
National audienceL'émergence des terminaux mobiles (smartphones, tablettes, ordinateurs portables, etc.) a profondément modifié nos modes de communication en nous permettant de nous connecter partout où nous allons. Mais quel est le prix à payer pour ce nomadisme exacerbé ? Des éléments de réponse avec le chercheur Mathieu Cunche dans cet épisode du podcast audio
- …
