Portail HAL Insee
Not a member yet
1187 research outputs found
Sort by
Zombie Firms and Productivity: An Analysis Based on Tax Data
This paper studies zombie firms in France, businesses whose profits are insufficient to cover interest payments, over 2009–2023, with particular attention to the COVID-19 period and its aftermath. Using exhaustive firm-level tax data (2009–2023) and Country-by-Country Reporting data (2016–2023), theanalysis adjusts profits for large multinationals using a recent methodology from the tax avoidance literature. Traditional approaches significantly overestimate zombie prevalence among these firms, with corrections reducing the employmentweighted share by up to 10 percentage points. Across the full economy, zombie firms account for 8% of employment and 3.7% of firms, with lower prevalence among SMEs. Following the pandemic, the zombie share rose temporarily, peaking at 9% in 2022. The bankruptcy penalty for zombies collapsed in 2020, then began a gradual recovery; as of the period ending in 2023 it had not fully normalized. The paper then examines how the presence of zombie firms affects the economy through misallocation channels—asking whether they impede reallocation among healthy firms and weaken creative destruction. We find that industries with a higher zombieshare are associated with reduced firm entry and weaker market selection (fewer exits of low-productivity firms), with limited direct crowding-out of healthy firms.Cet article étudie les entreprises zombies en France, c'est-à-dire celles dont les bénéfices sont insuffisants pour couvrir les paiements d'intérêts, sur la période 2009-2023, avec une attention particulière portée à la crise du COVID-19 et à ses conséquences. À partir de données fiscales exhaustives au niveau des entreprises (2009-2023) et de données issues du Country-by-Country Reporting (2016-2023), l'analyse corrige les bénéfices des grandes multinationales à l'aide d'une méthodologie récente issue de la littérature sur l'optimisation fiscale. Les approches traditionnelles surestiment largement la prévalence des zombies parmi ces groupes, la correction réduisant leur part pondérée par l'emploi jusqu'à 10 points de pourcentage. À l'échelle de l'économie, les entreprises zombies représentent 8 % de l'emploi et 3,7 % des entreprises, avec une prévalence plus faible parmi les PME. Après la pandémie, leur part a temporairement augmenté, culminant à 9 % en 2022. La probabilité de faillite des zombies s'est effondrée en 2020, avant de se redresser progressivement sans retrouver son niveau pré-crise en 2023. Enfin, l'article montre que les secteurs les plus exposés aux entreprises zombies connaissent une moindre entrée de nouvelles firmes et un affaiblissement de la sélection du marché (moins de sorties d'entreprises à faible productivité), avec un effet d'éviction direct limité sur les entreprises saines
Economies d'Agglomération et Rentabilité des PME françaises
This paper examines whether agglomeration economies – productivity gains arising from the spatial concentration of economic activity – translate into higher real profitability for French Small and Medium-Sized Enterprises. Relying on financial data from a panel of 675,000 French SMEs between 2017 and 2022 and on the characteristics of French employment areas, the analysis shows that while economic density increases value added, it raises labor costs to a similar extent, consistent with the literature on agglomeration effects on productivity. These two effects offset each other, so that real profitability, measured by gross operating surplus per worker, is no higher in economically denser areas. This result is supported by the analysis of sectoral heterogeneity, which shows that, within a given sector, both value added at factor cost and labor costs respond similarly to agglomeration variables, leading to at least partial compensation of the effects. The latter analysis nevertheless identifies a few sectors where this compensation is not complete.Cette étude examine si les économies d’agglomération – les gains de productivité liés à la concentration géographique de l’activité – se traduisent par une meilleure rentabilité réelle des Petites et Moyennes Entreprises françaises. En s’appuyant sur les données financières d’un panel de 675 000 PME françaises entre 2017 et 2022 ainsi que sur les caractéristiques des zones d’emploi, l’analyse montre que, si la densité économique accroît bien la richesse produite, elle augmente tout autant les charges de personnel, en cohérence avec les résultats établis par la littérature traitant des effets d’agglomération sur la productivité. Ces deux effets se compensent, de sorte que la rentabilité réelle, mesurée par l’Excédent Brut d’Exploitation par travailleur, n’est pas plus élevée dans les territoires économiquement denses. Ce résultat est conforté par l’analyse de l’hétérogénéité sectorielle de l’effet qui montre qu’à secteur donné, la valeur ajoutée au coût des facteurs et les charges de personnel sont affectées de manière similaire par les variables d’agglomération, aboutissant à une compensation au moins partielle des effets. Cette dernière analyse permet toutefois d’identifier quelques secteurs pour lesquels la compensation n’est pas totale
Le data editing. Définition et principes généraux
La traduction littérale de « data editing » donne « édition de données », expression peu parlante pour un statisticien français. Une traduction plus significative serait « vérification des données », mais elle resterait néanmoins imparfaite. En effet, le data editing correspond à l'ensemble des activités liées à la vérification des données individuelles qui visent à leur assurer la qualité requise en vue de leur exploitation en repérant et corrigeant les données individuelles tout au long du processus de production statistique. À vocation pédagogique, ce document de travail permet une première approche des principes généraux de mise en œuvre du data editing qui existent dans la littérature et qui reposent sur une succession de différents types de contrôles : les micro-contrôles et les macro-contrôles. Il est important de définir une stratégie globale de « nettoyage » des données qui commence dès la collecte avec l'utilisation mesurée de contrôles présents pendant le remplissage du questionnaire, puis se poursuit par des vérifications automatiques ou par des gestionnaires et se termine par des contrôles post-collecte. Cette stratégie à définir dépend de la qualité des données recueillies à la collecte et de la qualité des données attendue pour la diffusion en termes de précision, celle-ci devant idéalement être définie préalablement. Enfin, une fois le processus de production terminé, il est essentiel de conserver des informations détaillées sur la phase de data editing ainsi que sur le cycle de vie des donnéesdepuis les données brutes renseignées par le répondant jusqu'aux données finales destinées pour la diffusion -. Cela permet d'évaluer a posteriori l'impact de cette phase et d'optimiser le processus de production concerné. Dans ce document, les méthodes de correction des données ou d'imputation de masse pour corriger les erreurs ne sont pas abordées, car les techniques utilisées pour imputer une valeur plausible sont les mêmes pour une valeur renseignée détectée inexacte et donc à modifier ou pour une valeur manquante en cas de non-réponse. Les références citées en bibliographie permettront au lecteur d'approfondir ses connaissances sur le data editing
Les données de transactions par carte bancaire CB. Quels apports possibles aux analyses conjoncturelles et territoriales ?
International audienceSince the spring of 2020, INSEE has had access in a very short time-span to aggregates of bankcard payments, by sector of activity. This data is transmitted to the institute by the French domestic mobile and bankcard payment "CB" scheme (or network), the most prominent payment operator in the French territory. INSEE uses these aggregates to produce an early estimate of sales volume in the retail trade. The institute also mobilised them to quantify the impact on consumption of the lockdowns imposed during the health crisis. Supplemented by other sources, this data is therethore interesting for producing early estimates of consumption and activity in some sectors, as in retail trade. However, the coverage of consumption by CB bankcard payments fluctuates over time due to the existence of alternative means of payment (cash, cheques, cards issued by other payment networks such as Visa or Mastercard, etc.) and changes in behaviour. As a result, traditional sources are still essential for computing definitive estimates of these indicators. As part of the Finance Digitale chair, the authorised members of the CB/INSEE research programmes also mobilise, in a secure and anonymous way, disaggregated bankcard payment data. This is a promising source for shedding light, within the confines of the research projects, on issues such as connections between shops and areas.Depuis le printemps 2020, l'Insee dispose, dans des délais très courts, d'agrégats de paiement par carte bancaire par secteur d'activité. Ces derniers lui sont transmis par le schéma (ou réseau) domestique français de paiement par carte et mobile « CB », principal réseau utilisé sur le territoire. L'Insee utilise ces agrégats pour produire une estimation avancée du volume des ventes dans le commerce de détail. L'institut a également mobilisé ces agrégats pour mesurer l'impact sur la consommation des confinements imposés pendant la crise sanitaire. Complétées par d'autres sources, ces données sont ainsi intéressantes pour produire des premières estimations de la consommation et de l'activité dans certains secteurs tels que le commerce de détail. Cependant, la couverture de la consommation par les paiements par carte bancaire CB fluctue au cours du temps en raison de l'existence de moyens de paiement alternatifs (espèces, chèques, transactions par carte via un réseau de paiement international comme Visa ou Mastercard, etc.), mais aussi d'évolutions des comportements. De ce fait, les sources traditionnelles restent irremplaçables pour produire les estimations définitives. Dans le cadre de la chaire Finance digitale, les membres habilités des programmes de recherche CB-Insee mobilisent par ailleurs, de manière sécurisée et anonymisée, des données détaillées de paiement par carte bancaire CB. Ces dernières constituent une source prometteuse pour éclairer, dans le cadre de ces travaux de recherche, des problématiques telles que les connexions entre commerces et territoires
Introduction – L’évaluation des politiques publiques. Sélection d’articles présentés à la 9e conférence sur l’évaluation des politiques publiques organisée par l’AFSE et la Direction générale du Trésor
International audienc
Prophyl : de la parcelle à la statistique, un projet pour simplifi er la récolte de données agricoles
International audienceThe Prophyl project, led by the Statistics and Foresight Department (SSP) of the Ministry of Agriculture, Agri-food and Food Sovereignty (MASA), represents a promising advancement for the modernisation of agricultural statistics. Farmers equipped with a farm management information system can enter data in relation to plant protection treatments (pesticides) they have been using on their plantation. This data would allow statisticians to partially replace the traditional collection of similar data by an automated one, which would be less burdensome for farmers. The 2024 pilot involving over a hundred farms enabled the collection of information on approximately 5,000 phytosanitary treatments. Early results show strong consistency with traditional "cultivation practices" surveys, while providing increased precision regarding the timing and modalities of treatments. This new collection method relies on a secure technical infrastructure that ensures data quality and the confi dentiality of farmers.Prophyl thus paves the way for the 2026 Phyto survey, which will integrate this system on a larger scale. Beyond the scope of phytosanitary products, it could open the door to more "connected" agricultural statistics, more coherent with fi eld digital practices, and fulfi lling the need for public policies steering.Le projet Prophyl, porté par le service de la statistique et de la prospective (SSP) du ministère de l'Agriculture, de l'Agro-alimentaire et de la Souveraineté alimentaire, constitue une avancée prometteuse pour la modernisation de la statistique agricole. Pour les cultivateurs disposant d'un « logiciel de gestion parcellaire », l'idée est de mobiliser les informations qu'ils y saisissent sur les traitements phytosanitaires (pesticides) utilisés sur leurs cultures. Ainsi, il est aujourd'hui envisageable de remplacer partiellement la collecte classique de telles données, via des enquêteurs, par une collecte automatisée, moins contraignante pour les agriculteurs. L'expérimentation conduite en 2024 auprès d'une centaine d'exploitations a permis de recueillir des informations sur près de 5 000 traitements phytosanitaires. Les premiers résultats sont cohérents avec ceux des enquêtes « pratiques culturales » classiques, tout en étant plus précis sur le calendrier et les modalités des traitements. Ce nouveau mode de collecte repose sur une chaîne technique sécurisée, garantissant la qualité des données et le respect de la confidentialité pour les exploitants. Prophyl préfi gure ainsi l'enquête Phyto 2026, qui intégrera ce dispositif à grande échelle. Au-delà du seul thème des produits phytosanitaires, il pourrait ouvrir la voie à une statistique agricole plus « connectée », mieux articulée avec les pratiques numériques des acteurs agricoles, et répondant aux besoins de pilotage des politiques publiques
Permettre aux personnes qui vivent moins longtemps de partir plus tôt à la retraite : quel bilan des réformes depuis les années 1970 ?
International audienceThe reforms that have been implemented in France since the 1970s have greatlyincreased the options for retiring early with a full‑rate pension, the idea being that this wouldbenefit those individuals presumed to have the shortest life expectancies. These options wereinitially aimed at individuals who had been declared unfit for work, but they are now largelybased on having worked a full career, with this criterion intended to benefit persons who startedworking at a younger age, who are presumed to be in poorer health. However, although the lifeexpectancy at 60 years of age of this latter group is indeed lower, this trend is only observed forthose who started their careers before the age of 20 for men and 18 for women. In practice, nopositive relationship can be observed between life expectancy at 60 years of age and the age atwhich a person is entitled to retire with a full‑rate pension. Among women, the relationship evenappears to be negative.Les réformes mises en œuvre depuis les années 1970 ont fortement étendu lespossibilités de partir à la retraite au taux plein de façon anticipée, avec l’idée que cela béné‑ficierait aux assurés dont l’espérance de vie était supposée la plus courte. Ces possibilitésconcernaient initialement les assurés reconnus inaptes au travail, mais elles s’appuient mainte‑nant principalement sur le fait d’avoir eu une carrière complète, ce critère visant à avantager lespersonnes ayant commencé à travailler plus jeunes, supposées en moins bonne santé. Toutefois,si l’espérance de vie à 60 ans de ces dernières s’avère effectivement plus basse, cette relation nes’observe que pour les débuts de carrière avant 20 ans pour les hommes et avant 18 ans pour lesfemmes. En pratique, on n’observe pas de relation croissante entre l’espérance de vie à 60 ans etl’âge auquel le système de retraite permet de partir à la retraite à taux plein. Parmi les femmes,la relation semble même décroissante
Vers une meilleure prise en compte de l’hébergement via des plates-formes en ligne au sein des comptes nationaux
L’hébergement en meublés touristiques via des plateformes en ligne nécessite l’ajustement de nombreux flux en comptabilité nationale. Les enjeux ne sont pas négligeables, tant sur le PIB que sur la productivité de la branche de l’hébergement. La mise en évidence du circuit comptable transitant par les plateformes pour les meublés touristiques, et plus généralement pour l’économie des plateformes résulte d’une demande institutionnelle (G20 etc.) et sociale d’une meilleure appréhension de l’économie numérique. Cela conduira à l’intégration explicite de l’hébergement de courte durée via les plateformes dans le futur système de comptabilité nationale SCN 2025 et son adaptation européenne à mettre en oeuvre d’ici 2029. L’approche alternative proposée est cohérente avec les documents préparatoires déjà disponibles. Un exercice quantitatif exploratoire de ce schéma comptable alternatif aboutit à des valorisations qui suggèrent une dynamique significativement plus forte de la production dans la branche hébergement, une moindre production de la branche logement, pour un impact net positif sur le PIB. Toutefois l’estimation précise des flux à corriger nécessitera de nouvelles données. L’environnement institutionnel et réglementaire semble plutôt favorable pour enrichir les statistiques administratives
Sources de données privées : panorama et perspectives
International audienceSince the end of the 20th century, digital technology has transformed the economy, generating data at scale that can be exploited by businesses and now by the official statistical system. The latter is interested in this data to supplement traditional surveys, seeking greater spatiotemporal granularity, while taking into account the technological, legal and methodological issues associated with these new data sources. Initially referred to as 'big data', these data are now referred to as 'privately held data', marking a shift in the focus towards data access and quality. INSEE has integrated scanner data from supermarkets into its consumer price index, and has extended its exploratory work to mobile network operators data, payment bankcards transactions, bank accounts and short-term tourist accommodation. These new sources enrich our economic and social knowledge, but have their limitations: partial coverage, geographical or temporal inaccuracies, and the absence of socio-demographic variables. Their use requires stronger partnerships with private operators, secure infrastructures and a rigorous methodology. The European data strategy and the revision of Regulation No 223/2009 now provide a framework to facilitate access to these sources. Despite their potential, these sources are still often complementary to surveys, each with its own strengths and weaknesses, making it essential to combine them methodologically in order to enrich official statistics.Depuis la fin du XX e siècle, le numérique a transformé l'économie, générant massivement des traces numériques exploitables par les entreprises et désormais par le système statistique public. Ce dernier s'intéresse à ces données pour compléter les enquêtes traditionnelles, recherchant une plus grande granularité spatiotemporelle, tout en tenant compte des enjeux technologiques, juridiques et méthodologiques qui leur sont associés. Initialement appelées « big data », ces traces numériques sont aujourd'hui désignées comme des « données détenues par des opérateurs privés », marquant un déplacement d'enjeux vers les questions d'accès et de qualité. L'Insee a intégré les données de caisse des grandes surfaces alimentaires dans la production de l'indice des prix à la consommation et a étendu ses travaux exploratoires aux données de téléphonie mobile, de transactions par carte bancaire, de comptes bancaires ou encore de locations touristiques de courte durée. Ces nouvelles sources enrichissent la connaissance économique et sociale, mais présentent des limites : couverture partielle, imprécisions géographiques ou temporelles, et absence de variables sociodémographiques. Leur exploitation nécessite des partenariats renforcés avec des opérateurs privés, des infrastructures sécurisées, et une méthodologie rigoureuse. La stratégie européenne pour les données et la révision du règlement européen n o 223/2009 offrent désormais un cadre pour faciliter l'accès à ces sources. Malgré leur potentiel, ces dernières restent souvent complémentaires aux enquêtes, chacune ayant ses forces et faiblesses, rendant indispensable leur articulation méthodologique afin d'enrichir les statistiques publiques
L’espérance de vie par niveau de vie jusqu’en 2020-2024 - Méthode, Document de travail n°2025-24
In France, life expectancy disparities based on social class and education level have been analyzed for a long time, and more recently, the analysis has also been conducted by standard of living for the period 2012-2016 (see INSEE Première No. 1687 and Working Paper No. F1801). This new study aims to update the data with the recent period of 2020-2024, in order to analyze the evolution of life expectancy by standard of living between the two periods. A summary is published in INSEE Première (No. 2085) and mortality tables are available in INSEE Résultats (published in December 2025).The higher the income, the higher the life expectancy. Over the period 2020–2024, the gap in life expectancy at birth between the poorest 5% and the wealthiest 5% is 9 years for women and 13 years for men. Women in the wealthiest 5% live, on average, 17 years longer than men in the poorest 5%.At age 50, the risk of dying within the year is 7 times greater among the poorest than among the wealthiest. For women, this risk ratio peaks at 6 at age 55.Life expectancy increases less and less rapidly with the standard of living: at around €1,200 per month, an additional €100 in standard of living is associated with an extra 0.8 years of life expectancy for women and 1.0 years for men; the gain is only 0.1 years and 0.2 years at around €3,000 per month.Between the periods 2012–2016 and 2020–2024, the gap in life expectancy between low-income and high-income individuals widened. Life expectancy for the poorest 25% has declined, except for the 5% with the lowest standard of living; at the same time, life expectancy for higher-income individuals has increased.En France, les écarts d’espérance de vie selon la catégorie sociale et le diplôme sont analysés de longue date, et plus récemment, l’analyse a été aussi menée par niveau de vie pour la période 2012-2016. Dans cette nouvelle étude, il s’agit de mettre à jour les données avec la période récente 2020-2024, afin de pouvoir analyser l’évolution de l’espérance de vie par niveau de vie entre les deux périodes. Une synthèse est publiée dans l’Insee Première n° 2085 et les tables de mortalité sont disponibles dans un Insee Résultats (publié en décembre 2025).Plus on est aisé, plus l’espérance de vie est élevée. Sur la période 2020-2024, l’écart d’espérance de vie à la naissance entre les 5 % les plus modestes et les 5 % les plus aisés est de 9 ans chez les femmes et de 13 ans chez les hommes. Les femmes parmi les 5 % les plus aisées vivent en moyenne 17 ans de plus que les hommes parmi les 5 % les plus modestes. À 50 ans, le risque de décès dans l’année des hommes est 7 fois plus grand chez les plus modestes que chez les plus aisés. Chez les femmes, ce rapport de risque est de 6 à 55 ans, âge où il atteint son maximum.L’espérance de vie augmente de moins en moins rapidement avec le niveau de vie : aux alentours de 1 200 euros par mois, 100 euros de niveau de vie supplémentaires sont associés à 0,8 an en plus d’espérance de vie chez les femmes et 1,0 an chez les hommes ; le gain n’est plus que de 0,1 an et 0,2 an autour de 3 000 euros par mois.Entre les périodes 2012-2016 et 2020-2024, l’écart d’espérance de vie entre les personnes modestes et aisées s’est accru. L’espérance de vie des 25 % les plus modestes a diminué, sauf pour les 5 % aux plus faibles niveaux de vie ; dans le même temps, celle des personnes plus aisées a progressé