Données ouvertes des entreprises en France : sources officielles, API et droits de réutilisation
La France dispose d'un écosystème de données d'entreprises officiel et conséquent, mais il ne saurait se réduire à une simple liste d'entreprises. Pour bien l'appréhender, il convient de partir du registre officiel, puis d'y intégrer les données ouvertes, les statistiques, les marchés publics, la propriété intellectuelle et les données réglementaires.
La voie la plus fiable est constituée par les fichiers boursiers et l'API INSEE Sirene, l'accès aux données ouvertes/API INPI RNE et les communiqués légaux du BODACC. Cela fait de la France un pays phare en matière de données d'entreprise ouvertes, mais n'exempte pas des contrôles habituels de réutilisation : conditions d'utilisation des jeux de données, attribution, clause de non-approbation, respect de la vie privée, limites légales en matière de marketing et fraîcheur des sources.
Ce guide recense les principales sources officielles de données sur les entreprises en France, explique les possibilités et les limites de chaque source et montre en quoi un jeu de données normalisé de type CompaniesData apporte une valeur ajoutée.
Réponse rapide
La France est l'un des marchés européens les plus performants en matière de données ouvertes officielles sur les entreprises, car Sirene, RNE et BODACC couvrent des segments différents mais complémentaires de l'écosystème des données publiques sur les entreprises.
Pour les travaux pratiques, la pile de sources la plus utile est : la page d’accès INSEE Sirene, les données ouvertes de l’API Sirene, le jeu de données de base Sirene, l’API INPI RNE, la page officielle INPI RNE, le jeu de données RNE HVD sur data.gouv.fr.
La réponse éditoriale la plus prudente est la suivante : la France dispose de sources de données commerciales publiques et officielles solides, mais les données publiques ne sont pas automatiquement téléchargeables en masse, prêtes pour le marketing ou exemptes de contraintes relatives aux données personnelles.
Qu’est-ce qui est considéré comme donnée d’entreprise en France ?
| Couche | Exemples | Utilisation typique en entreprise |
|---|---|---|
| Identité du registre | Dénomination sociale, numéro d'immatriculation, statut, forme juridique, siège social | Appariement d'entités, déduplication et KYB |
| Inscrivez-vous aux événements | Constitution, modifications, dépôts, extraits, publications | Chronologie de l'entreprise et traçabilité juridique |
| Couche de données ouvertes/API | Jeux de données officiels, API, services CSV/JSON/XML lorsqu'ils sont disponibles | Ingestion et surveillance automatisées |
| Statistique | Démographie des entreprises, nombre d'entreprises, totaux par secteur/zone géographique | Évaluation de la taille du marché et critères de qualité des données |
| Approvisionnement | Appels d'offres, attributions, fournisseurs et autorités contractantes | Informations commerciales du secteur public |
| Propriété intellectuelle et organismes de réglementation | Marques de commerce, brevets, entités supervisées et décisions | Sélection des enrichissements et des conformités |
| Données de contact | Courriel, téléphone, rôles des contacts et segmentation | Marketing uniquement sur la base d'un fondement juridique distinct |
Droits de réutilisation et conformité
En Europe, le cadre d'information du secteur public et de données ouvertes encourage la réutilisation des données publiques, et la réglementation européenne relative aux jeux de données à haute valeur ajoutée inclut les données sur les entreprises et leur structure de propriété parmi les catégories importantes. En pratique, la situation réelle de la France en matière de réutilisation des données dépend encore de chaque source, point d'accès, licence et méthode d'accès.
- Citez les sources officielles et conservez les dates de mise à jour lorsque la source les indique.
- N’insinuez pas qu’un ensemble de données dérivées est approuvé par le registre ou l’autorité publique.
- Ne mélangez pas les données des registres publics avec les autorisations de contact marketing.
- Vérifiez si les termes API, téléchargement en masse, extraction payante et accès par recherche Web sont différents.
- Traiter les données des dirigeants, des bénéficiaires effectifs et des personnes physiques comme des données sensibles au sens du RGPD, le cas échéant.
La France peut devenir la deuxième implémentation de référence après l'Espagne car elle dispose de multiples voies officielles d'accès aux données ouvertes et d'une clarté des sources suffisante pour alimenter un guide long et de haute qualité.
Principales sources officielles
1. Page d'accès INSEE Sirène
Propriétaire : Source officielle/publique. Accès : https://www.insee.fr/fr/information/3591226.
- Ce qu'il offre : Recherche Sirène, API et fichiers de stock
- Valeur de réutilisation : Données ouvertes officielles robustes
- Principale limitation : Expliquer les restrictions de diffusion et le modèle de champ
2. Données ouvertes de l'API Sirene
Propriétaire : Source officielle/publique. Accès : https://dev.data.gouv.fr/dataservices/api-sirene-open-data.
- Ce qu'il offre : découverte d'API
- Valeur de réutilisation : Source API robuste
- Principale limitation : vérifiez les détails actuels d’autorisation et de limitation de débit avant de rédiger.
3. Ensemble de données de base sur les sirènes
Propriétaire : Source officielle / publique. Accès : https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/.
- Ce que cela donne : Fichiers d’entreprises et d’établissements en masse
- Valeur de réutilisation : Source en vrac importante
- Principale limitation : Modèle d’événement RNE/BODACC incomplet
4. API INPI RNE
Propriétaire : Source officielle / publique. Accès : https://www.inpi.fr/ressources/propriete-intellectuelle/acces-aux-api-et-ftp.
- Ce qu'il offre : API de données RNE/SFTP
- Valeur de réutilisation : Source de données ouvertes officielle et fiable
- Principale limitation : les mécanismes du compte et de l’API doivent être expliqués.
5. Page officielle de l'INPI RNE
Propriétaire : Source officielle / publique. Accès : https://www.inpi.fr/ressources/formalites-dentreprises/registre-national-entreprises.
- Ce qu'il offre : accès RNE et IP
- Valeur de réutilisation : Source officielle
- Principale limitation : Séparation du registre du commerce et des droits de propriété intellectuelle
6. Jeu de données RNE HVD sur data.gouv.fr
Propriétaire : Source officielle / publique. Accès : https://www.data.gouv.fr/fr/datasets/documents-et-comptes-des-entreprises/.
- Ce que cela fournit : métadonnées à forte valeur ajoutée de l’ensemble de données INPI/RNE
- Valeur de réutilisation : Preuves solides en matière de droits et de sources
- Principale limitation : les métadonnées du jeu de données indiquent un problème de fréquence de mise à jour ; il ne faut pas surestimer sa fraîcheur.
7. CONSEIL D'ADMINISTRATION
Propriétaire : Source officielle/publique. Accès : https://www.bodacc.fr/.
- Ce service propose : annonces légales et événements d'entreprise
- Valeur de réutilisation : Publication officielle
- Principale limitation : Source de l’événement, et non l’intégralité du système de gestion de l’entreprise
8. data.gouv.fr
Propriétaire : Source officielle/publique. Accès : https://www.data.gouv.fr/.
- Ce qu'il offre : Catalogue national de données ouvertes
- Valeur de réutilisation : licences spécifiques à l’ensemble de données
- Principale limitation : le catalogue ne contient pas les données elles-mêmes.
Options pratiques
Route officielle des données ouvertes ou API
Utilisez Sirene pour l'établissement et l'identité de l'entreprise, RNE/INPI pour les fichiers et documents du registre du commerce et des sociétés, et BODACC pour les annonces légales et les événements d'entreprise.
Route des données de contact et des listes de marketing
Pour la prospection commerciale, les données d'identité de l'entreprise ne constituent que la première étape. Les adresses e-mail professionnelles, les numéros de téléphone, les rôles des contacts, les règles d'exclusion et la segmentation nécessitent un processus de gestion des données de contact distinct et conforme. Cette étape doit être documentée séparément de la réutilisation dans les registres officiels.
Rapports privés et produits de gestion des risques
Les fournisseurs privés de rapports sur les entreprises peuvent s'avérer utiles pour les vérifications préalables manuelles en France, mais l'objectif éditorial de cet ouvrage n'est pas de dresser un répertoire des concurrents. L'intérêt stratégique réside dans la capacité à identifier les sources officielles existantes et à déterminer les cas où une normalisation est nécessaire.
Que manque-t-il aux données ouvertes officielles ?
- Sirene, RNE et BODACC sont complémentaires, et non un registre universel identique.
- Certains champs et statuts de diffusion nécessitent un filtrage minutieux avant réutilisation.
- Les données d'identité officielles publiques ne constituent pas une couche d'autorisation pour les courriels de vente ou les démarchages téléphoniques.
C’est pourquoi les produits de données d’entreprise apportent souvent une valeur ajoutée même lorsque les sources publiques sous-jacentes sont solides : les données officielles sont fréquemment réparties entre différentes autorités, formats, langues, identifiants et modèles d’accès.
Comment CompaniesData apporte de la valeur
Pour la France, le rôle de CompaniesData est de transformer des données sources fragmentées en un ensemble de données commerciales exploitables : noms d’entreprises normalisés, entités dédupliquées, champs pays et activité cohérents, provenance des sources, suivi des mises à jour et points d’enrichissement.
- Normaliser les identifiants d'enregistrement et les noms légaux.
- Faire correspondre les registres officiels de l'entreprise avec les signaux relatifs aux achats, à la propriété intellectuelle, aux LEI et aux organismes de réglementation.
- Indiquer la provenance de la source afin que chaque profil dérivé puisse être audité.
- Séparer l'identité de l'entreprise des couches de données de contact et d'autorisation marketing.
- Regroupez les données pour l'analyse, l'enrichissement du CRM et les études de marché au lieu d'obliger les utilisateurs à analyser manuellement les portails.
Demander un échantillon de CompaniesData pour la France si vous avez besoin d'un jeu de données pratique plutôt que d'une liste de portails sources.
Matrice source
| Matériau | Propriétaire | Ce que cela donne | Valeur de réutilisation | Limites |
|---|---|---|---|---|
| Page d'accès à INSEE Sirène | Source officielle/publique | Recherche Sirène, API et fichiers de stock | Données ouvertes officielles solides | Expliquez les restrictions de diffusion et le modèle de champ. |
| API Sirene données ouvertes | Source officielle/publique | Découverte d'API | Source API robuste | Veuillez vérifier les paramètres d'autorisation et de limitation de débit actuels avant de rédiger le document. |
| Ensemble de données de base Sirène | Source officielle/publique | Fichiers de sociétés et d'établissements en vrac | Source de vrac solide | Modèle d'événement RNE/BODACC non complet |
| API INPI RNE | Source officielle/publique | API de données RNE/SFTP | Source de données ouvertes officielle et solide | Le fonctionnement du compte et de l'API doit être expliqué. |
| page officielle INPI RNE | Source officielle/publique | RNE et accès IP | Source officielle | Registre du commerce distinct des droits de propriété intellectuelle |
| Jeu de données RNE HVD sur data.gouv.fr | Source officielle/publique | Métadonnées de l'ensemble de données à haute valeur INPI/RNE | Preuves solides en matière de droits/sources | Les métadonnées du jeu de données indiquent un problème de fréquence de mise à jour ; ne surestimez pas sa fraîcheur. |
| CONSEIL D'ADMINISTRATION | Source officielle/publique | Annonces juridiques et événements d'entreprise | publication officielle | Source de l'événement, pas document complet de l'entreprise |
| data.gouv.fr | Source officielle/publique | Catalogue national de données ouvertes | licences spécifiques aux ensembles de données | Le catalogue n'est pas la donnée elle-même. |
| BOAMP | Source officielle/publique | avis de marchés publics | Signal d'approvisionnement | Achats uniquement |
| AMF | Source officielle/publique | Sociétés cotées/réglementées | Source du régulateur | Spécifique au secteur |
| REGAFI | Source officielle/publique | entreprises financières réglementées | Enrichissement de la conformité | Spécifique au secteur |
Position de rédaction : Indiquez que « la France dispose d’importantes bases de données officielles ouvertes sur les entreprises » ; n’affirmez pas qu’« une seule base de données ouverte et complète pour chaque signal économique » ; incluez une section importante comparant Sirene, RNE, BODACC et l’Annuaire des Entreprises.
QFP
Existe-t-il une base de données officielle et gratuite unique pour les entreprises françaises spécialisées dans le commerce de gros ?
Pas toujours. La France dispose de sources officielles de données d'entreprises, mais l'accès en masse, l'accès par API, les extraits payants et la recherche web peuvent faire l'objet de services distincts. Ne présumez pas qu'un fichier complet et gratuit est disponible, sauf si la source spécifique le prouve.
Quelle est la meilleure source initiale de données sur les entreprises françaises ?
Les meilleures sources initiales sont les fichiers boursiers et l'API INSEE Sirene, l'accès aux données ouvertes/API INPI RNE et les annonces légales du BODACC. Il convient ensuite de les compléter par des statistiques, des données relatives aux marchés publics, à la propriété intellectuelle et aux autorités de régulation.
Les données des entreprises cotées en bourse peuvent-elles être réutilisées à des fins commerciales ?
Souvent oui, mais uniquement sous réserve des conditions propres à la source. L’attribution, la conservation de la date de mise à jour, la mention de non-approbation et les contrôles du RGPD peuvent s’appliquer.
Puis-je utiliser les données du registre pour du marketing par e-mail à froid ?
L'accès aux registres publics ne permet pas de tirer automatiquement des conclusions. Le marketing requiert un fondement juridique distinct, une gestion des demandes d'opposition et un contrôle de conformité des données de contact.
Pourquoi utiliser CompaniesData au lieu de collecter manuellement des sources françaises ?
La collecte manuelle est lente car les identifiants, les formats, les langues et la couverture varient selon la source. CompaniesData y ajoute la normalisation, la mise en correspondance, la déduplication, la traçabilité et des formats de livraison pratiques.
Références
- Page d'accès à INSEE Sirène – Source officielle / publique
- API Sirene données ouvertes – Source officielle / publique
- Ensemble de données de base Sirène – Source officielle / publique
- API INPI RNE – Source officielle / publique
- page officielle INPI RNE – Source officielle / publique
- Jeu de données RNE HVD sur data.gouv.fr – Source officielle / publique
- CONSEIL D'ADMINISTRATION – Source officielle / publique
- data.gouv.fr – Source officielle / publique
- BOAMP – Source officielle / publique
- AMF – Source officielle / publique
- REGAFI – Source officielle / publique
Laissez un commentaire
Vous voulez participer à la discussion?N'hésitez pas à contribuer!