Collecte des données CSRD : industrialiser le scope 3
Pourquoi la collecte des données CSRD est le vrai goulot d’étranglement
Quand une direction lance son projet CSRD, l’attention se porte spontanément sur le rapport final : le format, les indicateurs ESRS, l’auditeur. Pourtant, l’expérience montre que 80 à 90 % de la charge réelle se concentre en amont, dans la collecte des données CSRD — en particulier les émissions du scope 3, réparties chez des centaines de fournisseurs et de partenaires. C’est là que les projets dérapent, pas dans la mise en page du rapport de durabilité.
Le scope 3 regroupe toutes les émissions indirectes de la chaîne de valeur : achats de biens et services, transport, usage des produits vendus, fin de vie. Pour la plupart des entreprises industrielles ou de négoce, il représente la grande majorité de l’empreinte carbone. Or ces données ne sont pas dans vos systèmes : elles sont chez vos fournisseurs, dans des formats hétérogènes, avec une fiabilité très variable.
Cet article s’adresse aux directeurs financiers, DSI, directeurs data et responsables RSE qui doivent décider comment industrialiser cette collecte sans transformer leur équipe en armée de saisie Excel. Vous saurez à la fin arbitrer entre les approches, dimensionner l’effort et lancer les bons chantiers data.
Cartographier les sources avant de collecter quoi que ce soit
L’erreur la plus coûteuse consiste à demander tout, à tout le monde, tout de suite. La directive CSRD, telle que révisée par l’Omnibus I (UE 2026/470), a d’ailleurs introduit un value chain cap qui limite ce que vous pouvez exiger des plus petits fournisseurs. La logique réglementaire rejoint le bon sens opérationnel : concentrez l’effort là où il compte.
La première étape n’est donc pas technique mais cartographique. Il s’agit d’inventorier vos sources de données de durabilité et de les hiérarchiser :
- Données internes : consommations énergétiques, flottes, RH, achats — déjà dans vos ERP et systèmes de gestion.
- Données fournisseurs primaires : les émissions réelles communiquées par vos partenaires les plus contributifs au chiffre d’affaires et au bilan carbone.
- Données par approximation (proxies) : facteurs d’émission moyens appliqués aux catégories d’achats pour lesquelles la donnée primaire n’est pas accessible.
Selon le GHG Protocol, le scope 3 se découpe en 15 catégories : inutile de les traiter toutes avec la même granularité. Une analyse de matérialité bien menée permet souvent de couvrir l’essentiel de l’empreinte avec trois ou quatre catégories prioritaires. Cette discipline de cadrage rejoint les principes d’une bonne architecture data, qui consiste d’abord à structurer ses données pour grandir plutôt qu’à tout stocker sans logique.
Concrètement, ce travail de cartographie produit un livrable simple mais structurant : une matrice « catégorie ESRS × source × maturité de la donnée ». Pour chaque case, vous savez si la donnée est disponible en interne, attendue d’un fournisseur ou calculée par proxy, et avec quelle fiabilité. Cette matrice devient le plan de charge de votre projet : elle révèle où mettre l’effort humain (les fournisseurs stratégiques), où automatiser (les flux internes récurrents) et où accepter une approximation documentée. C’est aussi le document que votre auditeur réclamera en premier, car il matérialise le périmètre et la logique de votre collecte.
Le mythe de la collecte par e-mail et tableur
Beaucoup d’organisations démarrent leur collecte CSRD par campagne d’e-mails et fichiers Excel envoyés aux fournisseurs. Cela fonctionne pour un pilote sur dix partenaires. Cela s’effondre dès qu’il faut gérer trois cents fournisseurs, deux exercices de reporting et une piste d’audit traçable.
Les symptômes sont toujours les mêmes : versions multiples des fichiers, formats incompatibles, taux de réponse faible, impossibilité de prouver l’origine d’un chiffre face à l’auditeur. L’étude PwC Global Sustainability Reporting Survey 2025 souligne que la pression sur la fiabilité et la comparabilité des données extra-financières augmente, y compris pour les entreprises qui reportent volontairement. Un processus artisanal ne tiendra pas cette exigence d’assurance.
La donnée de durabilité est par nature hétérogène et partiellement non structurée : attestations PDF, certificats, déclarations libres. La traiter suppose les mêmes réflexes que pour croiser données structurées et non structurées en BI, et de valoriser les métadonnées des données non structurées pour retracer chaque indicateur jusqu’à sa source. Sans cette couche, aucun reporting CSRD n’est auditable.
Arbitrer entre les trois approches de collecte
Trois grandes options s’offrent au décideur pour industrialiser la collecte des données CSRD. Le bon choix dépend de votre maturité data, du nombre de fournisseurs et du niveau d’assurance visé.
| Approche | Coût | Délai de mise en œuvre | Niveau de risque | Cas d’usage cible |
|---|---|---|---|---|
| Tableurs + e-mails (artisanal) | Faible (apparent) | Immédiat | Élevé (non auditable, non scalable) | Pilote < 20 fournisseurs, première année |
| Plateforme ESG SaaS (buy) | Abonnement 20-80 k€/an | 3 à 6 mois | Moyen (dépendance éditeur, données silotées) | Collecte standardisée, peu d’intégration SI |
| Pipeline data sur mesure (build/hybride) | 80-200 k€ projet initial | 4 à 9 mois | Faible à terme (maîtrise, traçabilité) | ETI multi-sites, fort enjeu d’audit et de pilotage |
L’approche artisanale n’est tenable qu’en amorçage. Le vrai arbitrage de fond oppose le build vs buy : acheter une plateforme ESG clé en main, ou construire un pipeline data interne qui collecte, nettoie et consolide la donnée dans votre socle existant. L’option hybride — une plateforme pour la collecte fournisseurs, un pipeline interne pour la consolidation et la piste d’audit — est souvent la plus rationnelle pour une ETI. C’est la même logique de calcul que celle qui structure une démarche entreprise data-centered, où la donnée devient un actif stratégique plutôt qu’une corvée annuelle.
Pour trancher, trois questions suffisent. Quel est mon horizon d’audit ? Si vous visez une assurance raisonnable à court terme, la traçabilité native d’un pipeline maîtrisé prime sur la rapidité d’un SaaS générique. Combien de fois la donnée va-t-elle resservir ? Une donnée scope 3 qui alimente aussi le pilotage achats, le bilan carbone et la finance verte justifie un investissement de consolidation interne ; une donnée mono-usage non. Quelle est ma dépendance acceptable à un éditeur ? Un coût d’abonnement apparemment modeste peut masquer un verrouillage des données et des coûts de sortie élevés. En pratique, beaucoup d’ETI commencent par une plateforme pour amorcer la collecte, puis rapatrient progressivement la consolidation en interne à mesure que les enjeux d’audit et de pilotage montent en exigence.
Industrialiser le pipeline de données scope 3
Une fois l’approche choisie, l’industrialisation repose sur une chaîne de traitement claire. Le BCG, dans son enquête 2024 sur les émissions carbone, montre que les entreprises les plus avancées s’appuient sur des outils automatisés pour collecter et fiabiliser la donnée fournisseur — et que l’écart se creuse avec celles restées au tableur.
Un pipeline de collecte CSRD industrialisé enchaîne cinq étapes :
- Ingestion : portail de saisie fournisseur, connecteurs API, import de fichiers structurés et extraction des attestations PDF.
- Normalisation : conversion vers un référentiel commun (unités, périmètres, facteurs d’émission GHG Protocol).
- Contrôle qualité : détection des valeurs aberrantes, des trous de données et des doublons, avec scoring de fiabilité par source.
- Consolidation : agrégation par catégorie ESRS, calcul des proxies pour les données manquantes, versionnage par exercice.
- Restitution : tableaux de bord de pilotage et export auditable vers le rapport de durabilité.
Les étapes 3 et 4 sont décisives pour l’assurance : un commissaire aux comptes attendra une piste d’audit complète. La qualité de la donnée ESG n’est pas un détail technique — c’est, comme nous l’avons développé, le nerf de la guerre pour fiabiliser tout projet IA et reporting. L’IA générative aide d’ailleurs à extraire les chiffres noyés dans les documents fournisseurs, à condition de poser les garde-fous décrits dans notre analyse des audits ESG automatisés par l’IA pour la transparence et l’assurance.
Gouverner la collecte dans la durée
Un pipeline technique ne suffit pas : la collecte des données CSRD est avant tout un sujet de gouvernance des données. Qui est propriétaire de la donnée fournisseur ? Qui valide les facteurs d’émission ? Comment tracer une correction d’un exercice à l’autre ? Sans réponses claires, la deuxième campagne de reporting repart de zéro.
Les bonnes pratiques de gouvernance à instaurer dès le départ :
- Rôles définis : un data owner côté RSE, un référent par direction (achats, logistique, RH), un responsable technique du pipeline.
- Référentiel partagé : un catalogue des indicateurs ESRS, leur définition, leur source et leur fréquence de mise à jour.
- Boucle d’amélioration : chaque exercice augmente le taux de données primaires et réduit la part de proxies, en suivant un indicateur de couverture.
Cette structuration relève directement de l’expertise gouvernance des données, et son aboutissement naturel est le pilotage par tableaux de bord, comme nous l’avons décrit pour le reporting durabilité CSRD post-Omnibus avec la BI. Collecte fiable en amont, pilotage clair en aval : les deux chantiers sont indissociables et reposent sur la même colonne vertébrale de business intelligence.
Selon les travaux de Bpifrance Le Lab, les PME et ETI qui abordent la durabilité comme une démarche data structurée — et non comme une contrainte déclarative — en tirent un bénéfice de pilotage qui dépasse la seule conformité : maîtrise des coûts, dialogue fournisseurs, anticipation des risques.
Conclusion
La collecte des données CSRD se gagne ou se perd en amont, dans le scope 3 et la chaîne de valeur. Les points de décision sont clairs : cartographiez et hiérarchisez vos sources avant de collecter, abandonnez le tableur dès que le périmètre dépasse le pilote, arbitrez build vs buy selon votre maturité et votre enjeu d’audit, puis industrialisez un pipeline gouverné capable de prouver l’origine de chaque chiffre. C’est cette colonne vertébrale data qui transforme une obligation réglementaire en avantage de pilotage durable.
Vous devez structurer votre collecte de données de durabilité ou fiabiliser votre reporting extra-financier ? Faites le point avec nos experts en gouvernance des données.
Un projet Data & IA ? -> Parlons-en
Expertises liées