Tech

CV Data Scientist : Guide pour le Marché Français

Prestance10 min de lecture

La France compte 80 000 professionnels de la data et plus de 27 000 offres de data scientist actives sur LinkedIn. L'écosystème IA français est le troisième d'Europe : 780 startups IA, 36 000 emplois, 13 milliards d'euros levés. Mistral AI (valorisé à 14 milliards), Hugging Face (2 millions de modèles hébergés), et Owkin sont nés à Paris. Le terrain de jeu est vaste, mais le marché a changé : les LLM ont redéfini les compétences attendues, et un CV data scientist sans mention de GenAI est en retard sur 2026.

Un cv data scientist efficace montre des modèles déployés en production (pas des notebooks Jupyter), quantifie l'impact business de chaque projet, et organise les compétences techniques par catégorie avec un niveau de maîtrise. Le recruteur scanne en 7 secondes : Python, le framework ML principal, le cloud, et le lien GitHub. Si ces quatre signaux sont absents ou mal présentés, le CV est écarté.

Ce guide couvre les compétences techniques par niveau, le stack GenAI/LLM 2026, la distinction entre les rôles data, les écoles et parcours valorisés, et les erreurs qui éliminent.

Data Scientist, Data Analyst, ML Engineer : clarifiez votre profil

En France, les titres data sont souvent confondus. Dans une startup de 30 personnes, le "data scientist" fait tout. Dans un groupe CAC 40 (BNP Paribas, AXA, Société Générale), les rôles sont strictement séparés. Votre CV doit clarifier ce que vous faites réellement.

RôleMissionCompétences distinctives
Data AnalystReporting, dashboards, expliquer le passéSQL, Tableau/Power BI, Excel, pas de modélisation prédictive
Data ScientistModélisation prédictive, inférence statistique, expérimentationPython, frameworks ML, statistiques, A/B testing
ML EngineerDéployer et maintenir les modèles en productionMLOps, Docker, Kubernetes, CI/CD, monitoring
Data EngineerConstruire les pipelines et l'infrastructure de donnéesSpark, Airflow, Databricks, Snowflake, dbt
GenAI ScientistDéploiement de LLM, RAG, fine-tuningHugging Face, LangChain, vector databases, RLHF

Sur le CV : si votre titre officiel est "Data Scientist" mais que vous faites du ML Engineering (déploiement, MLOps), mentionnez les deux compétences. Le recruteur d'une scale-up cherche un profil polyvalent. Le recruteur d'un grand groupe cherche un spécialiste.

Quelles compétences techniques mentionner en 2026 ?

86% des data scientists utilisent Python comme langage principal. 85% des offres exigent SQL. Mais lister "Python, SQL, R" sans contexte est du bruit. Organisez vos compétences par catégorie et indiquez un niveau.

Le stack par niveau

Junior DS (0-2 ans) :

CatégorieCompétences attendues
LangagesPython (scikit-learn, pandas, NumPy), SQL
MLRégression, classification, clustering, feature engineering
OutilsJupyter, Git, un cloud (AWS/GCP/Azure)
VisualisationMatplotlib, Seaborn, Plotly
DonnéesNettoyage, EDA, manipulation de datasets de moins de 10 Go

Senior DS (5+ ans) :

CatégorieCompétences attendues
LangagesPython (expert), SQL (avancé), R ou Scala (optionnel)
ML/DLPyTorch ou TensorFlow, XGBoost/LightGBM, architectures deep learning
GenAI/LLMHugging Face, LangChain, RAG, fine-tuning (LoRA/QLoRA), vector databases
MLOpsMLflow, Docker, Airflow, un pipeline cloud (SageMaker/Vertex AI/Azure ML)
Data EngineeringSpark/PySpark, Databricks ou Snowflake, dbt
CloudAu moins une plateforme maîtrisée (AWS, GCP, ou Azure)

GenAI/LLM : le différenciateur 2026

La demande de compétences NLP dans les offres est passée de 5% à 19% en un an. En 2026, ne pas mentionner de compétences LLM sur un CV data scientist senior est un signal de retard.

Ce qu'il faut mentionner :

  • Hugging Face : modèles, datasets, inference endpoints
  • LangChain / LlamaIndex : construction de pipelines RAG
  • Fine-tuning : LoRA, QLoRA, RLHF, DPO
  • Vector databases : Pinecone, Weaviate, Chroma, pgvector
  • API : OpenAI, Anthropic, Mistral

Comment le montrer : "Déployé un pipeline RAG (LangChain + Pinecone + GPT-4) pour l'automatisation du support client. Réduction de 45% du volume de tickets L1 sur 3 mois."

Modèles déployés vs notebooks : ce qui fait la différence

La faute la plus courante sur un CV data scientist : montrer des expérimentations sans déploiement. Les notebooks Jupyter et les compétitions Kaggle ne suffisent plus en 2026.

Ce que le recruteur veut voir

Éliminatoire :

  • "Développé un modèle de prédiction de churn."
  • "Participation à 12 compétitions Kaggle."

Efficace :

  • "Déployé un modèle de prédiction de churn (XGBoost, API Flask) servant 50 000 requêtes/jour. Réduction du churn de 18% sur 6 mois, impact estimé à 2,3M EUR ARR."
  • "Top 8%, médaille d'or, compétition Jane Street Market Prediction (Kaggle 2024). Modèle ensemblé XGBoost + neural net, feature engineering sur 200+ variables."

Le principe : impact business, pas prouesse technique

Chaque projet sur votre CV doit répondre à trois questions :

  1. Quel problème business ? (pas quel algorithme)
  2. Quelle solution technique ? (modèle, stack, architecture)
  3. Quel résultat mesurable ? (réduction de coût, augmentation de revenu, gain de temps)

La prouesse technique seule n'intéresse que les rôles de recherche pure. Pour tous les autres, c'est l'impact business qui différencie.

GitHub, Kaggle, publications : quoi montrer ?

GitHub (obligatoire pour les postes techniques)

Un GitHub propre avec des repos documentés est un signal fort. Un GitHub vide ou désorganisé est pire que pas de GitHub. Le lien apparaît dans l'en-tête du CV, à côté de l'email et du LinkedIn.

Ce qui compte : repos avec un README clair, du code commenté, des projets end-to-end (pas des snippets). Les contributions à des projets open source (Hugging Face, scikit-learn) sont un signal d'excellence.

Kaggle (conditionnel)

Mentionnez uniquement si vous êtes dans le top 10% ou avez une médaille. La participation seule n'ajoute rien. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production.

Publications académiques (conditionnel)

Pour les postes de recherche (Mistral AI, Owkin, Capital Fund Management) : incluez 2-3 publications clés. Pour les postes en entreprise : une seule publication pertinente suffit, avec l'application pratique mise en avant. Dix publications et cinq chapitres de thèse signalent un profil qui ne comprend pas le contexte industriel.

Qui recrute des data scientists en France ?

L'écosystème IA français

Startups IA (signal prestige) : Mistral AI (LLM, valorisation 14Md EUR), Hugging Face (origine Paris, 2M+ modèles), Owkin (federated learning santé, 300M+ levés), LightOn (IA enterprise), Dust (assistants IA).

Scale-ups tech : Doctolib (santé), Contentsquare (analytics), Back Market (e-commerce), Alan (assurance), Ledger (fintech/crypto), Believe (music data).

CAC 40 / grandes entreprises : BNP Paribas, Société Générale, Crédit Agricole (les plus gros recruteurs data en France), AXA, L'Oréal, Sanofi, SNCF, Orange.

Consulting / ESN : Capgemini, Accenture, Sopra Steria, CGI, EY, Sia Partners, Wavestone. Volume important de postes DS, souvent en mission chez des clients grands comptes.

Startup IA vs grand groupe vs consulting

CritèreStartup IAGrand groupeConsulting/ESN
ProfilPhD ou grande école top, recherche + productionGrande école ou Master, process structuréPolyvalent, missions variées
StackCutting-edge (LLM, RAG, MLOps avancé)Legacy + modernisation progressiveVariable selon le client
AutonomieTrès forteEncadréeMission-dépendante
SalaireCompétitif + equity (BSPCE)Grille structurée, avantages sociauxMoyen, progression lente
CV signalPublications, GitHub, compétitionsPérimètre de données, impact businessDiversité sectorielle

Les écoles et parcours valorisés

Tier 1 : accès direct aux meilleurs postes

Polytechnique + ENSAE (Institut Polytechnique de Paris) : le signal académique le plus fort pour un data scientist en France. La combinaison X + ENSAE est l'équivalent du Master El Karoui pour la finance de marché.

ENS (mathématiques), Centrale, Mines ParisTech, Télécom Paris : signal de rigueur quantitative reconnue par tous les recruteurs.

ENSAI : classée 4e européenne en Big Data/Data Science (Eduniversal 2026). Spécialisée en statistiques, forte en actuariat et data.

Tier 2 : accès conditionné par le portfolio

Masters universitaires : Dauphine, Sorbonne Data Analytics, Paris-Saclay. Reconnus, surtout pour les parcours statistiques et actuariels.

Autres écoles d'ingénieurs : INSA, ENSIMAG, EPITA. Valorisés mais nécessitent un portfolio technique solide pour se distinguer.

Bootcamps : accès junior en startup/PME

Le Wagon : forte notoriété dans l'écosystème startup français. Jedha : 93% de taux d'emploi déclaré, certification RNCP. DataScientest : certifié RNCP, connu pour le financement CPF.

Les diplômés de bootcamp accèdent aux postes juniors en startups et PME. Pour les grandes entreprises (banques, consulting) et les rôles élite, un bootcamp seul passe rarement le filtre RH. Les bootcamp graduates qui réussissent combinent le certificat avec un GitHub solide et des projets déployés.

Pour les principes de compatibilité ATS de votre CV technique, consultez le guide du CV compatible ATS. Pour la liste des mots-clés par secteur, consultez le guide des mots-clés CV. Si votre profil hésite entre data et produit en tech, le guide du CV product manager couvre les attendus côté product sur le marché français.

Les erreurs qui éliminent un CV data scientist

ErreurPourquoi c'est éliminatoire
Liste d'outils sans projets"Python, TensorFlow, SQL, R, Spark" sans contexte est du bruit. Chaque outil doit être lié à un projet et un résultat.
Pas d'impact business"Développé un modèle de churn" est incomplet. Quel impact sur le churn rate ? Combien d'euros sauvés ? Combien de requêtes en production ?
Notebooks sans déploiementLes Jupyter notebooks signalent un candidat qui n'a pas mis en production. Montrez des API, des pipelines, des apps Streamlit.
Kaggle sans classementLa participation seule est du bruit. Top 10% ou médaille, sinon ne mentionnez pas.
Trop académique pour l'industrie10 publications et 5 chapitres de thèse pour un poste en startup. 1-2 publications clés avec application pratique suffisent.
Pas de compétences GenAI en 2026Un CV DS sans mention de LLM, RAG, ou Hugging Face est en retard. La demande NLP a triplé en un an.
GitHub vide ou absentPour les postes techniques, pas de GitHub = pas de preuve. Un GitHub désorganisé est pire qu'aucun GitHub.
Compétences en liste plate40 outils sans catégorie ni niveau sont illisibles. Groupez par catégorie (Langages / ML / MLOps / Cloud / Data) et indiquez le niveau.

Questions fréquentes

Faut-il un PhD pour être data scientist en France ?

Non, mais cela dépend du poste. 46% des data scientists dans le monde détiennent un PhD. En France, les rôles de recherche (Mistral AI, Owkin, Capital Fund Management) exigent un PhD. Les rôles en entreprise (banques, scale-ups, consulting) privilégient les grandes écoles d'ingénieurs (Polytechnique, ENSAE, Centrale, Mines). Les bootcamps (Le Wagon, Jedha) ouvrent l'accès aux postes juniors en startups et PME.

Quel salaire pour un data scientist en France en 2026 ?

Un junior (0-2 ans) gagne entre 37 000 et 50 000 EUR (46 000-67 000 EUR à Paris). Un confirmé (2-4 ans) atteint 46 000 à 65 000 EUR. Un senior (5-7 ans) se situe entre 56 000 et 78 000 EUR (65 000-90 000 EUR à Paris). Un Lead DS gagne 75 000 à 100 000 EUR. Un CDO dépasse les 90 000 EUR et peut atteindre 210 000 EUR. Les spécialistes santé et fintech gagnent 15-20% de plus.

Les compétences GenAI/LLM sont-elles obligatoires sur un CV data scientist en 2026 ?

Oui pour les postes senior et pour tout poste en NLP ou IA générative. La demande de compétences NLP dans les offres est passée de 5% à 19% en un an. Mentionner Hugging Face, LangChain, RAG, fine-tuning (LoRA/QLoRA), et les vector databases est désormais un signal attendu. Pour les postes en ML classique (prédiction, scoring, clustering), les LLM sont un bonus, pas un prérequis.

GitHub est-il obligatoire sur un CV data scientist ?

Oui pour les postes techniques. Un GitHub avec des repos propres, documentés, et montrant du code déployé est un signal fort. Un GitHub vide ou désorganisé est pire que pas de GitHub. Pour les profils seniors en management (Lead DS, Head of Data), le GitHub est moins critique, remplacé par les résultats business et le track record de déploiement.

Kaggle est-il valorisé sur un CV data scientist en France ?

Uniquement si vous êtes classé dans le top 10% ou si vous avez une médaille. "Participation à 12 compétitions Kaggle" est du bruit. "Top 8%, médaille d'or sur la compétition Jane Street Market Prediction (2024)" est un signal. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production. Les modèles déployés valent davantage.

En résumé

Un cv data scientist se différencie par trois signaux : des modèles déployés en production (pas des notebooks), un impact business quantifié (pas une prouesse technique isolée), et un stack technique organisé par catégorie avec niveaux de maîtrise. En 2026, les compétences GenAI/LLM (Hugging Face, LangChain, RAG, fine-tuning) sont attendues sur tout CV senior.

Le marché français de la data emploie 80 000 professionnels, avec un écosystème IA parmi les plus dynamiques d'Europe (Mistral AI, Hugging Face, Owkin). Python et SQL sont des prérequis universels. Le GitHub est obligatoire pour les postes techniques. Les grandes écoles d'ingénieurs (Polytechnique, ENSAE, Centrale) restent le signal académique dominant, mais les bootcamps ouvrent l'accès aux postes juniors en startup.

Votre CV data scientist passe-t-il le filtre des recruteurs tech ? Analysez-le gratuitement. Score détaillé en 30 secondes.

Questions fréquentes

Faut-il un PhD pour être data scientist en France ?

Non, mais cela dépend du poste. 46% des data scientists dans le monde détiennent un PhD. En France, les rôles de recherche (Mistral AI, Owkin, Capital Fund Management) exigent un PhD. Les rôles en entreprise (banques, scale-ups, consulting) privilégient les grandes écoles d'ingénieurs (Polytechnique, ENSAE, Centrale, Mines). Les bootcamps (Le Wagon, Jedha) ouvrent l'accès aux postes juniors en startups et PME.

Quel salaire pour un data scientist en France en 2026 ?

Un junior (0-2 ans) gagne entre 37 000 et 50 000 EUR (46 000-67 000 EUR à Paris). Un confirmé (2-4 ans) atteint 46 000 à 65 000 EUR. Un senior (5-7 ans) se situe entre 56 000 et 78 000 EUR (65 000-90 000 EUR à Paris). Un Lead DS gagne 75 000 à 100 000 EUR. Un CDO dépasse les 90 000 EUR et peut atteindre 210 000 EUR. Les spécialistes santé et fintech gagnent 15-20% de plus.

Les compétences GenAI/LLM sont-elles obligatoires sur un CV data scientist en 2026 ?

Oui pour les postes senior et pour tout poste en NLP ou IA générative. La demande de compétences NLP dans les offres est passée de 5% à 19% en un an. Mentionner Hugging Face, LangChain, RAG, fine-tuning (LoRA/QLoRA), et les vector databases est désormais un signal attendu. Pour les postes en ML classique (prédiction, scoring, clustering), les LLM sont un bonus, pas un prérequis.

GitHub est-il obligatoire sur un CV data scientist ?

Oui pour les postes techniques. Un GitHub avec des repos propres, documentés, et montrant du code déployé est un signal fort. Un GitHub vide ou désorganisé est pire que pas de GitHub. Pour les profils seniors en management (Lead DS, Head of Data), le GitHub est moins critique, remplacé par les résultats business et le track record de déploiement.

Kaggle est-il valorisé sur un CV data scientist en France ?

Uniquement si vous êtes classé dans le top 10% ou si vous avez une médaille. 'Participation à 12 compétitions Kaggle' est du bruit. 'Top 8%, médaille d'or sur la compétition Jane Street Market Prediction (2024)' est un signal. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production. Les modèles déployés valent davantage.

Prestance

Outil d'analyse de CV sectoriel par IA. Score sur 100, mots-clés manquants, recommandations par section.