Lead scoring B2B : HubSpot vs Salesforce Einstein vs ML custom — guide build vs buy avec TCO
Mai 2026. Vous êtes CRO d’une scale-up B2B SaaS, 80 commerciaux, pipeline qui a doublé en 18 mois. Votre VP Sales vient vous voir : « les SDR perdent un temps fou sur des leads pourris, et on rate des deals chauds parce qu’ils ne remontent pas assez vite. » Votre VP Marketing pousse pour activer le scoring prédictif HubSpot. Votre Head of RevOps, lui, veut un POC Salesforce Einstein. Et votre Lead Data, qui a recruté deux data scientists l’an dernier, vous propose de bâtir un modèle ML custom calibré sur vos 4 ans d’historique CRM.
Trois options, trois philosophies, trois enveloppes budgétaires. Et une décision qui va engager 3 à 5 ans de pipeline commercial. Cet article est le guide d’arbitrage économique que nous aurions voulu lire à votre place : comparaison fonctionnelle, TCO sur 3 ans pour trois profils d’entreprise, courbe d’apprentissage, plafond de précision, et un plan de projet par scénario. Pas de bullshit, juste les chiffres et les questions à se poser avant de signer un bon de commande.
Pourquoi le lead scoring B2B redevient un débat d’arbitrage en 2026
Le scoring n’est pas neuf — la plupart des CRM proposent un scoring manuel par règles depuis dix ans. Ce qui change en 2026, c’est la triple convergence : la donnée comportementale anonyme (intent data, visiteurs identifiés via reverse-IP, signaux LinkedIn) est devenue accessible à des prix raisonnables ; les modèles ML sont commoditisés (un AutoML produit aujourd’hui un classifieur acceptable en quelques heures) ; et la régulation — RGPD, AI Act — impose une explicabilité que les boîtes noires natives gèrent mal.
Selon le rapport McKinsey « The multiplier effect: How B2B winners grow », les leaders B2B qui combinent ciblage data-driven, automatisation commerciale et personnalisation à grande échelle croissent deux fois plus vite que la médiane de leur marché. Le scoring est l’une des briques techniques qui rendent cette personnalisation opérable. Mais entre payer une licence native, intégrer une plateforme intent, ou construire un modèle propriétaire, le delta de TCO sur trois ans peut atteindre un facteur 5.
Trois options s’affrontent en 2026 :
- HubSpot Predictive Lead Scoring — natif, plug & play, plafonné à la donnée CRM
- Salesforce Einstein Lead Scoring — natif, robuste, écosystème Sales Cloud
- ML custom — modèle propriétaire (data team interne ou agence), multi-source, explicable
Examinons chacune avec un angle CRO/RevOps : ce que ça coûte vraiment, ce que ça apporte, et où sont les plafonds.
Option 1 : HubSpot Predictive Scoring — le pragmatique
HubSpot Predictive Lead Scoring s’active dans les éditions premium de Marketing Hub. Selon la documentation HubSpot, l’outil combine deux modèles : un fit score (taille d’entreprise, secteur, persona) et un engagement score (interactions email, formulaires, pages vues). L’IA s’ajoute par-dessus pour pondérer automatiquement les signaux les plus prédictifs sur la base des conversions passées.
Forces. Mise en place très rapide (2 à 4 semaines si le CRM est propre), zéro infrastructure à maintenir, intégration native avec workflows et séquences SDR. Pour une PME B2B avec un funnel inbound classique, c’est l’option la plus rentable la première année.
Limites. Le modèle ne voit que ce qui est dans HubSpot. Pas d’intent data tierce, pas de signaux comités d’achat (multi-personas sur même compte), pas d’événements off-CRM (visites de pages prix anonymes, signaux LinkedIn). La logique reste largement boîte noire — vous savez qu’un lead est à 78, vous ne savez pas toujours pourquoi.
Coût indicatif. Le scoring prédictif est inclus dans les paliers Pro et Enterprise de Marketing Hub. Comptez 800 à 3 600 € HT/mois selon le nombre de contacts et le palier, sans coût d’implémentation lourd.
Quand le choisir. PME B2B 20-50 commerciaux, pipeline majoritairement inbound, stack 100 % HubSpot, équipe RevOps légère. Pour aller plus loin sur les usages, voir notre article Stratégie inbound marketing : personnalisation IA et data.
Option 2 : Salesforce Einstein Lead Scoring — l’industriel
Salesforce Einstein Lead Scoring est l’offre native de Sales Cloud. Selon la documentation Salesforce, elle s’appuie sur trois familles d’algorithmes — Naive Bayes, Random Forests, Logistic Regression — entraînés sur l’historique de conversion de l’organisation. Le système choisit automatiquement la combinaison la plus performante et expose un score de 0 à 99 sur chaque lead.
Forces. Écosystème Sales Cloud profond : intégration avec Pardot/MCAE, Sales Engagement, Agentforce, terrain accessible aux admins via Lightning Builder. Salesforce annonce des gains de +30 % de taux de conversion vs scoring manuel sur sa base installée. Sur des cas mid-size B2B SaaS, nous avons constaté des passages de 15 % à 28 % de taux de conversion MQL → SQL en six mois.
Limites. Même angle mort que HubSpot : pas d’intent data 3rd party native, pas de signaux comités d’achat avancés sans compléter avec Sales Intelligence ou un éditeur tiers. L’explicabilité reste limitée — vous voyez les top features, pas la logique fine. Et la dépendance Salesforce est totale : changer de CRM signifie repartir à zéro.
Coût indicatif. Le tier Advanced d’Einstein Sales démarre autour de 4 000 USD/mois sur les déploiements ETI, sans compter les licences Sales Cloud sous-jacentes. Implémentation : 4 à 8 semaines avec admin certifié.
Vidéo — la promesse Einstein expliquée par Salesforce
Quand le choisir. ETI 100+ commerciaux déjà équipés Sales Cloud, pipeline outbound + inbound, RevOps mature, budget licences confortable. Voir aussi Agentforce : intégrer l’IA au CRM pour l’écosystème agents IA Salesforce.
Option 3 : ML custom avec data team ou agence — le sur-mesure
La troisième voie consiste à construire un modèle ML propriétaire, soit avec une data team interne, soit avec une agence data spécialisée. Concrètement : un classifieur (XGBoost, LightGBM ou modèle séquentiel selon le cas) entraîné sur la donnée CRM, enrichi par des signaux externes (intent data via 6sense/Bombora, données firmographiques via ZoomInfo/Cognism, comportement web via reverse-IP), avec une couche d’explicabilité (SHAP values) pour justifier chaque score.
Forces. Multi-source par design : vous combinez CRM + intent + comportemental + signaux comités d’achat. Plafond de précision plus élevé sur des niches métier (les modèles natifs sont entraînés en moyenne ; un modèle custom calibré sur votre ICP fait mieux à terme). Explicabilité totale (essentielle pour la conformité CNIL et le futur AI Act). Ownership : le modèle, les features, les données — tout vous appartient. Aucun lock-in CRM.
Limites. Délai de mise en place : 3 à 6 mois pour un v1 industrialisé, là où HubSpot tourne en 3 semaines. Nécessite une équipe data (1 data scientist + 1 data engineer minimum, ou une agence) et une stack MLOps légère pour le réentraînement. La phase d’apprentissage métier (qu’est-ce qu’un bon lead chez vous ?) est plus longue parce que c’est vous qui codez la définition.
Coût indicatif. Build initial : 40 000 à 90 000 € HT avec une agence, ou 6-9 mois de salaire de data team. Run annuel : 20 000 à 40 000 € HT (data engineering, réentraînement, monitoring drift). Outils intent (ZoomInfo, 6sense, Demandbase) : tier intermédiaire 50-150 USD/user/mois, plateformes enterprise >3 000 USD/mois.
Quand le choisir. ETI 100+ commerciaux avec ICP différencié, pipeline outbound significatif, besoin d’explicabilité (régulé, finance, santé, public), volonté d’ownership data. Voir notre solution Analyse prédictive & scoring et notre approche Data Science.
Tableau d’arbitrage : les 3 options vues par un CRO
Le tableau ci-dessous synthétise l’arbitrage. À garder sous le coude pour le prochain comité de direction.
| Critère | HubSpot Predictive | Salesforce Einstein | ML custom (data team / agence) |
|---|---|---|---|
| Délai mise en place | 2-4 semaines | 4-8 semaines | 3-6 mois |
| Coût année 1 (ordre de grandeur) | 10-45 k€ | 50-90 k€ | 60-120 k€ |
| Plafond de précision (AUC typique) | 0,72-0,80 | 0,75-0,82 | 0,82-0,90 sur niche |
| Données traitées | CRM HubSpot uniquement | CRM Salesforce uniquement | CRM + intent + comportemental + 3rd party |
| Explicabilité | Faible (top features) | Moyenne (top features + tendances) | Forte (SHAP, feature importance, audit trail) |
| Dépendance éditeur | Totale (HubSpot) | Totale (Salesforce) | Aucune (modèle propriétaire) |
| Conformité CNIL/AI Act | Documentée mais limitée | Documentée mais limitée | Maîtrisée si bien construite |
| Cas d’usage cible | PME inbound 20-50 commerciaux | ETI 100+ Sales Cloud | ETI 100+ multi-canal, ICP complexe |
TCO 3 ans pour 3 profils d’entreprise
Le coût d’achat n’est pas le coût total. Voici une projection sur trois ans pour trois profils représentatifs. Chiffres en k€ HT, ordres de grandeur, à pondérer par votre volumétrie réelle.
Profil A : PME B2B SaaS, 30 commerciaux, 50 k contacts CRM
| Option | Année 1 | Année 2 | Année 3 | TCO 3 ans |
|---|---|---|---|---|
| HubSpot Predictive | 18 | 20 | 22 | 60 |
| Salesforce Einstein | 65 | 55 | 60 | 180 |
| ML custom (agence) | 70 | 35 | 35 | 140 |
Verdict. HubSpot l’emporte largement sur ce profil. Le ROI d’un ML custom n’est pas atteignable avec ce volume.
Profil B : ETI industrie B2B, 100 commerciaux, 200 k contacts, outbound + inbound
| Option | Année 1 | Année 2 | Année 3 | TCO 3 ans |
|---|---|---|---|---|
| HubSpot Predictive | 45 | 50 | 55 | 150 |
| Salesforce Einstein | 95 | 85 | 90 | 270 |
| ML custom (agence + intent) | 110 | 70 | 70 | 250 |
Verdict. Match serré entre Einstein et ML custom. Le custom prend l’avantage si vous valorisez l’explicabilité et l’intégration intent data. Einstein gagne si vous êtes déjà 100 % Salesforce et que vos commerciaux y vivent.
Profil C : ETI 300+ commerciaux, multi-pays, ICP complexe, comités d’achat
| Option | Année 1 | Année 2 | Année 3 | TCO 3 ans |
|---|---|---|---|---|
| HubSpot Predictive | 75 | 80 | 90 | 245 |
| Salesforce Einstein | 160 | 150 | 160 | 470 |
| ML custom (data team + intent) | 180 | 120 | 130 | 430 |
Verdict. À cette échelle, la question n’est plus le coût mais le plafond de précision et la couverture de signaux. ML custom + intent data devient l’option qui paye le mieux à l’horizon 3-5 ans, surtout si la donnée est un avantage concurrentiel revendiqué.
7 questions à vous poser avant de choisir
- Volume. Combien de leads MQL générez-vous par mois ? En dessous de 500/mois, le ML custom peine à apprendre — restez sur du natif.
- Sources de données. Vos signaux d’achat les plus prédictifs sont-ils dans le CRM, ou ailleurs (intent topics, visites anonymes, événements produit) ?
- Stack CRM. HubSpot 100 % ? Salesforce 100 % ? Stack hybride ? Le natif n’a de sens que si vous êtes mono-CRM.
- Maturité RevOps. Avez-vous une définition stable du MQL/SQL ? Sinon aucun modèle ne marchera, quelle que soit la techno.
- Équipe data. Une data team interne disponible ou une agence ? Sans ressource ML, le custom est un piège.
- Conformité. Secteur régulé (banque, assurance, santé, public) ? L’explicabilité du custom devient un argument décisif vis-à-vis de la CNIL et de l’AI Act.
- Horizon. Engagement 1-2 ans (testez le natif) ou stratégie 3-5 ans avec data comme avantage concurrentiel (le custom amortit) ?
Pour cadrer ces questions, notre article Indicateurs clés pour piloter la performance data en PME donne un cadre de mesure utile.
Pièges classiques à éviter
Data quality d’entrée. Un scoring est une fonction de la donnée d’entrée. Si vos commerciaux ne renseignent pas les closed lost reason, aucun modèle (natif ou custom) ne pourra apprendre. Le scoring met en lumière la dette CRM avant tout.
Sur-fit aux gros deals. Beaucoup de modèles sur-pondèrent les comptes Enterprise au détriment des deals mid-market plus volumineux. Vérifiez la performance segment par segment.
Biais d’historique. Si vos SDR ont historiquement priorisé les leads d’un secteur, le modèle apprendra ce biais et exclura des opportunités. La CNIL et l’AI Act (article 22 RGPD, articles AI Act sur la décision automatisée) imposent un suivi de ces biais.
Attribution. Un bon scoring ne remplace pas une attribution propre. Ne demandez pas au modèle de prédire ce que votre stack ne sait pas mesurer.
Cas d’usage trop large. Scorer « tous les leads » est rarement utile. Scorer pour répondre à une question précise (« qui appeler aujourd’hui ? », « qui transmettre à l’AE ? ») donne 80 % de la valeur. Pour aller plus loin sur ce sujet : Sales intelligence : armer vos commerciaux avec la bonne data et Scoring prédictif : comment l’IA améliore la qualification des leads.
Recommandation par profil et plan de projet
Profil A (PME, 20-50 commerciaux, inbound dominant). Activez HubSpot Predictive Scoring sur 6 mois, mesurez le delta de taux de conversion MQL → SQL. Si le plafond est atteint, basculez vers un module custom léger en année 2.
Profil B (ETI, 100 commerciaux, mixte). Faites un POC en parallèle : 8 semaines Einstein vs 12 semaines ML custom sur un sous-segment. Comparez AUC + adoption SDR. Choisissez sur la base de ces deux métriques, pas sur la fiche produit.
Profil C (ETI 300+, ICP complexe). Investissez d’emblée dans un ML custom multi-source. Le natif sera insuffisant à l’échelle. Voir notre approche scorer, segmenter, personnaliser : l’IA au service de la demand generation B2B et notre méthode MVP en 2 semaines pour cadrer rapidement.
Plan de projet type pour un ML custom (12 semaines) : (1) cadrage métier et définition des cibles (2 sem.), (2) collecte et préparation data (3 sem.), (3) feature engineering et premier modèle (3 sem.), (4) industrialisation et intégration CRM (2 sem.), (5) tests A/B et activation SDR (2 sem.). Au-delà, un comité mensuel de revue de drift et de fairness suffit à maintenir la qualité.
Le mot de la fin
Le lead scoring n’est plus un débat technologique : c’est un arbitrage économique et stratégique. HubSpot, Salesforce Einstein et ML custom ne se concurrencent pas sur les mêmes terrains. Le bon choix dépend de votre volume, de votre stack, de votre maturité RevOps et de votre horizon. Et dans 60 % des cas que nous voyons en mission, la bonne réponse n’est pas celle que le DSI ou le CRO avait en tête au départ — c’est celle qui ressort de l’analyse TCO honnête sur trois ans.
Score 60-80 = lead prêt pour le SDR. Score 90+ = alerte AE en automation. Mais avant d’arbitrer ces seuils, choisissez d’abord la bonne brique de scoring. C’est l’arbitrage qui paye le plus longtemps.
Un projet Data & IA ? -> Parlons-en
Expertises liées