Data marketplace interne : 6 critères pour décider de lancer le vôtre
Vos équipes data passent plus de temps à chercher les bonnes données qu’à les analyser. Vos cas d’usage IA s’accumulent dans le pipeline, mais chacun repart de zéro sur la même question : où sont les données fiables, qui en est responsable, et puis-je les réutiliser ? Le data marketplace interne s’invite désormais dans les COMEX comme la réponse organisationnelle à ce frottement.
Mais lancer un marketplace de données dans son entreprise n’est pas une décision anodine : 200 à 800 k€ d’investissement plateforme, 18 mois de mise en place, et un changement profond de l’opérating model data. Ce guide donne 6 critères concrets pour décider — ou pour s’orienter vers des alternatives plus légères, mieux adaptées aux ETI qui ne sont pas prêtes.
Pourquoi le data marketplace s’invite au COMEX en 2026
Trois évolutions ont fait remonter le sujet du data marketplace au niveau direction générale ces 18 derniers mois.
D’abord, la pression sur le time-to-data des cas d’usage IA. Selon McKinsey (2025), les organisations qui traitent leurs données comme des produits gérés livrent leurs nouveaux cas d’usage jusqu’à 90 % plus vite et réduisent le TCO data de 30 %. Pour un comité de direction qui veut déployer 10 à 20 cas d’usage IA par an, c’est la différence entre une roadmap réaliste et un effet d’annonce.
Ensuite, la maturité technologique a comblé l’écart. Snowflake (Internal Marketplace), Google Cloud (BigQuery data products en preview), Databricks (Unity Catalog), Microsoft (Purview Data Marketplace) proposent désormais des briques natives. Là où il fallait il y a deux ans assembler 6 ou 7 outils, on peut aujourd’hui activer un marketplace embarqué dans la plateforme data principale.
Enfin, la conformité change la donne. Avec l’AI Act (article 10 sur la qualité des jeux de données d’entraînement) et la pression CSRD, les entreprises doivent tracer l’usage des données, leur provenance et leur consentement de bout en bout. Un marketplace bien gouverné est, mécaniquement, un facteur de conformité.
Data marketplace interne : de quoi parle-t-on exactement ?
Il faut clarifier le vocabulaire, car le terme est utilisé à tort pour désigner trois choses très différentes.
Un data marketplace public (Snowflake Marketplace, AWS Data Exchange) est une plateforme externe où des tiers monétisent leurs jeux de données — pas le sujet ici.
Un data catalog (Alation, Collibra, DataGalaxy) est un inventaire annoté des données disponibles — un GPS pour vos données, sans logique de produit ni de souscription.
Un data marketplace interne, lui, est une plateforme qui combine 3 fonctions : un catalogue navigable, une logique de data products versionnés avec SLA et propriétaire, et un mécanisme de demande d’accès gouverné qui automatise le grant/revoke. C’est l’équivalent d’un App Store interne pour les données.
L’analogie commerciale est utile : un consommateur (analyste, data scientist, équipe métier) navigue dans un catalogue, lit la fiche produit (fraîcheur, qualité, propriétaire, conditions d’usage), souscrit en un clic, et utilise les données dans son outil de prédilection (Power BI, notebook, application). Le producteur (équipe data domain) publie, maintient et fait évoluer ses produits.
Cette approche s’inscrit dans la lignée du data product thinking que nous avons décrit dans notre article Data Product Thinking : organiser vos données comme des produits — c’est l’incarnation opérationnelle de cette philosophie.
Les 6 critères de décision pour un DSI ou directeur data
Avant d’investir, six critères doivent être validés. Si vous en cochez moins de 4, vous n’êtes probablement pas prêt — et c’est très bien : il existe des alternatives plus légères.
Critère 1 — Vous avez plus de 50 cas d’usage data réutilisables en flux. Un marketplace devient rentable quand la même donnée sert 5 à 10 cas différents. En dessous d’un seuil critique d’usage croisé, le surcoût plateforme ne se justifie pas. Comptez vos pipelines actifs et vos demandes data des 12 derniers mois pour calibrer.
Critère 2 — Votre patrimoine data dépasse 3 silos majeurs sans interopérabilité. Si toutes vos données vivent déjà dans un même data warehouse cohérent, vous n’avez pas besoin de marketplace — un bon catalogue suffit. Le marketplace prend tout son sens quand vous avez 3, 5, 10 systèmes sources qui produisent de la donnée et qu’il faut industrialiser leur exposition.
Critère 3 — Vous êtes prêt à industrialiser une démarche data product. Le marketplace est le réceptacle, pas la cause. Sans une équipe formée au data product thinking — product owners data, équipes domaines responsables de leurs produits, SLA contractualisés — vous lancez un outil dans le vide. Notre démarche d’architecture data structurante détaille les prérequis organisationnels.
Critère 4 — Votre gouvernance et votre catalogue tournent déjà. Un marketplace sans gouvernance amont est un catalogue désordonné avec un bouton de souscription. Les organisations qui réussissent ont déjà : un catalogue actif (même rudimentaire), des rôles RACI sur les domaines de données, et des contrats de données stabilisés. Voir notre article sur les contrats de données pour fiabiliser l’IA.
Critère 5 — Vous avez budgété un investissement plateforme de 200 à 800 k€. Selon la taille (ETI vs ETI étendue, on-prem vs cloud) et la solution retenue, comptez 200 k€ pour un déploiement Snowflake/BigQuery natif, 400-600 k€ pour une plateforme combinée avec Collibra/Atlan, jusqu’à 800 k€+ pour un déploiement multi-cloud avec gouvernance fine. Sans ce budget, le projet sera vampirisé par les compromis.
Critère 6 — Vous mesurez déjà du time-to-data sur vos cas d’usage. Un marketplace se justifie par un KPI mesurable : passer de 6-12 semaines (recherche, négociation d’accès, contractualisation interne, ETL ad hoc) à 1-2 semaines pour livrer un cas d’usage. Si vous ne mesurez pas ce délai aujourd’hui, vous ne saurez pas démontrer le ROI demain. Notre approche Entreprise data-centered intègre cette mesure dès le diagnostic.
Tableau d’arbitrage : marketplace vs catalogue vs data hub vs statu quo
Voici la grille d’arbitrage que nous utilisons en mission avec les DSI et directeurs data Flowt.
| Option | Investissement | Délai | Niveau de risque | Cas d’usage cible |
|---|---|---|---|---|
| Statu quo (ETL ad hoc + Excel) | < 50 k€/an | Immédiat | Faible court terme, élevé à 3 ans | < 20 cas d’usage data récurrents, 1-2 silos |
| Data catalog (Alation, Collibra, DataGalaxy) | 80-150 k€ + 30-60 k€/an | 4-6 mois | Faible | 20-50 cas d’usage, gouvernance à renforcer |
| Data hub centralisé (DWH unique + Power BI) | 150-300 k€ | 9-12 mois | Moyen | < 5 silos sources, équipe data centrale |
| Data marketplace interne | 200-800 k€ | 12-18 mois | Élevé sans prérequis | 50+ cas d’usage croisés, démarche data product en place |
| Data mesh complet | 500 k€ - 2 M€ | 18-36 mois | Très élevé | Grande organisation multi-BU, autonomie domaines forte |
Cet arbitrage doit être posé avant tout choix d’outil. Beaucoup de DSI se laissent piéger en démarrant l’analyse par la solution éditeur (« choisissons Snowflake/Databricks/Atlan ») plutôt que par le besoin réel de l’organisation. C’est l’erreur classique du débat data fabric vs data mesh où le pattern architectural est tranché avant l’enjeu business.
Architecture cible : 4 composants à dimensionner
Un data marketplace interne mature s’appuie sur 4 composants techniques, qui peuvent être natifs à la plateforme data ou assemblés.
1. La couche de stockage et compute. Snowflake, BigQuery, Databricks ou un data lakehouse open source. C’est le socle où vivent les data products. La règle : ne pas en avoir deux. Multi-cloud OK, multi-plateforme = chaos garanti.
2. Le catalogue et la sémantique. Collibra, Alation, DataGalaxy, Atlan, ou les catalogues natifs (Unity Catalog côté Databricks, Horizon côté Snowflake, Dataplex côté Google). C’est ce qui rend les data products trouvables et compréhensibles — métadonnées techniques, business glossary, ownership.
3. La couche de gouvernance et accès. Politiques d’accès, masking dynamique, audit trail, conformité RGPD/AI Act. Cette couche est souvent sous-estimée : c’est elle qui transforme un catalogue en marketplace, en automatisant le grant/revoke et la traçabilité. Notre expertise sur la gouvernance des données intervient typiquement à cette étape.
4. La couche d’observabilité et qualité. Monte Carlo, Soda, Anomalo, ou solutions natives. Sans monitoring des SLA et de la fraîcheur, les data products perdent la confiance de leurs consommateurs en 6 mois. Voir notre article sur data observability et data downtime.
Le piège classique consiste à empiler 4 éditeurs différents en croyant cocher chaque case. Résultat : un coût d’intégration qui dépasse celui des licences, et une expérience utilisateur incohérente. La règle décideur : maximum 2 éditeurs pour ces 4 composants, en privilégiant les briques natives quand elles existent.
Pièges classiques et alternatives plus légères
Cinq pièges récurrents dans les retours d’expérience documentés ces 24 derniers mois.
Lancer le marketplace avant les data products. L’outil ne crée pas la culture produit. Si vos équipes data n’ont pas internalisé l’idée d’un product owner data, d’un SLA contractuel, d’une fiche produit, vous aurez un catalogue mort. Préalable obligatoire : pilote sur 3 data products incarnés par 3 équipes domain volontaires, pendant 6 mois minimum.
Sous-estimer la conduite du changement. Le marketplace impose aux équipes métier de demander l’accès aux données plutôt que de les copier. Pour beaucoup, c’est une perte d’autonomie ressentie. L’adoption se joue sur l’accompagnement, pas sur la qualité du produit.
Confondre marketplace public et interne. Plusieurs DSI rêvent de monétiser leurs données auprès de tiers en s’inspirant d’un marketplace public. C’est un autre projet, avec ses propres enjeux juridiques, commerciaux et de pricing. Une organisation qui n’a pas encore son marketplace interne sous contrôle ne réussira jamais un marketplace externe.
Vouloir tout migrer d’un coup. Un marketplace réussi commence par 5 à 10 data products à forte valeur (ventes, finance, opérations), pas par tout le patrimoine. Le mode bigbang est statistiquement perdant — selon Gartner, 60 % des projets data ambitieux échouent à passer le cap des 18 mois.
Ignorer le coût récurrent. Au-delà du build, comptez 25 à 35 % de l’investissement initial chaque année en run : maintenance plateforme, évolutions, équipe centrale (1-2 ETP), formation continue des data product owners.
Alternatives plus légères pour les organisations non prêtes
Si vous cochez moins de 4 critères, voici les chemins recommandés.
Le data catalog seul — pour une ETI avec 20-50 cas d’usage data : c’est la marche la plus rentable, à un quart du coût. Une mise en place de 4-6 mois apporte 70 % de la valeur d’un marketplace, pour 20 % du budget.
Le pilote data product sans plateforme dédiée — choisir 3 data products à forte valeur, les industrialiser dans votre data warehouse existant avec une discipline produit (versioning, SLA, fiche descriptive partagée sur Notion ou Confluence). C’est ainsi qu’on apprend la grammaire produit avant d’investir dans l’outil.
Le marketplace embarqué de votre plateforme cloud — si vous êtes déjà sur Snowflake ou BigQuery, activez l’Internal Marketplace ou les data products natifs. L’investissement est marginal (configuration + formation), et vous éprouvez la mécanique sur quelques cas d’usage avant d’investir dans une couche tierce.
Conclusion — Le marketplace est un palier, pas un point de départ
Lancer un data marketplace interne dans son entreprise n’est ni une question d’outil, ni une question de mode. C’est un palier de maturité data qui suppose une démarche produit installée, une gouvernance opérationnelle, et un volume de cas d’usage qui justifie l’investissement.
Les 6 critères présentés ici permettent de poser la décision en COMEX avec des chiffres clairs : coût, délai, prérequis organisationnels. Pour les organisations qui cochent l’ensemble, le ROI est documenté — accélération de 90 % du time-to-data selon McKinsey, baisse de 30 % du TCO data. Pour les autres, mieux vaut commencer par un data catalog ou un pilote data product, et préparer le terrain pour une décision marketplace 12 à 18 mois plus tard, sur des bases solides.
L’arbitrage final tient en une question : avez-vous déjà une culture data product, ou cherchez-vous à la créer par un outil ? Si la réponse est la seconde, repoussez le marketplace et investissez dans la culture d’abord. C’est précisément le cadre de travail que nous mobilisons dans nos missions de conseil et accompagnement data & IA pour les ETI françaises.
Un projet Data & IA ? → Parlons-en
Expertises liées