Tech

CV Data Scientist : Guide pour le Marché Français

Prestance9 avril 202611 min de lecture

La France compte 80 000 professionnels de la data et plus de 27 000 offres de data scientist actives sur LinkedIn. L'écosystème IA français est le troisième d'Europe : 780 startups IA, 36 000 emplois, 13 milliards d'euros levés. Mistral AI (valorisé à 14 milliards), Hugging Face (2 millions de modèles hébergés), et Owkin sont nés à Paris. Le terrain de jeu est vaste, mais le marché a changé : les LLM ont redéfini les compétences attendues, et un CV data scientist sans mention de GenAI est en retard sur 2026.

Un cv data scientist efficace montre des modèles déployés en production (pas des notebooks Jupyter), quantifie l'impact business de chaque projet, et organise les compétences techniques par catégorie avec un niveau de maîtrise. Le recruteur scanne en 7 secondes : Python, le framework ML principal, le cloud, et le lien GitHub. Si ces quatre signaux sont absents ou mal présentés, le CV est écarté.

Ce guide couvre les compétences techniques par niveau, le stack GenAI/LLM 2026, la distinction entre les rôles data, les écoles et parcours valorisés, et les erreurs qui éliminent. Si vous candidatez à un poste data scientist maintenant, analyser mon CV data scientist prend 30 secondes et identifie les écarts avant l'envoi.

Data Scientist, Data Analyst, ML Engineer : clarifiez votre profil

En France, les titres data sont souvent confondus. Dans une startup de 30 personnes, le "data scientist" fait tout. Dans un groupe CAC 40 (BNP Paribas, AXA, Société Générale), les rôles sont strictement séparés. Votre CV doit clarifier ce que vous faites réellement.

Rôle	Mission	Compétences distinctives
Data Analyst	Reporting, dashboards, expliquer le passé	SQL, Tableau/Power BI, Excel, pas de modélisation prédictive
Data Scientist	Modélisation prédictive, inférence statistique, expérimentation	Python, frameworks ML, statistiques, A/B testing
ML Engineer	Déployer et maintenir les modèles en production	MLOps, Docker, Kubernetes, CI/CD, monitoring
Data Engineer	Construire les pipelines et l'infrastructure de données	Spark, Airflow, Databricks, Snowflake, dbt
GenAI Scientist	Déploiement de LLM, RAG, fine-tuning	Hugging Face, LangChain, vector databases, RLHF

Sur le CV : si votre titre officiel est "Data Scientist" mais que vous faites du ML Engineering (déploiement, MLOps), mentionnez les deux compétences. Le recruteur d'une scale-up cherche un profil polyvalent. Le recruteur d'un grand groupe cherche un spécialiste.

Quelles compétences techniques mentionner en 2026 ?

86% des data scientists utilisent Python comme langage principal. 85% des offres exigent SQL. Mais lister "Python, SQL, R" sans contexte est du bruit. Organisez vos compétences par catégorie et indiquez un niveau.

Le stack par niveau

Junior DS (0-2 ans) :

Catégorie	Compétences attendues
Langages	Python (scikit-learn, pandas, NumPy), SQL
ML	Régression, classification, clustering, feature engineering
Outils	Jupyter, Git, un cloud (AWS/GCP/Azure)
Visualisation	Matplotlib, Seaborn, Plotly
Données	Nettoyage, EDA, manipulation de datasets de moins de 10 Go

Senior DS (5+ ans) :

Catégorie	Compétences attendues
Langages	Python (expert), SQL (avancé), R ou Scala (optionnel)
ML/DL	PyTorch ou TensorFlow, XGBoost/LightGBM, architectures deep learning
GenAI/LLM	Hugging Face, LangChain, RAG, fine-tuning (LoRA/QLoRA), vector databases
MLOps	MLflow, Docker, Airflow, un pipeline cloud (SageMaker/Vertex AI/Azure ML)
Data Engineering	Spark/PySpark, Databricks ou Snowflake, dbt
Cloud	Au moins une plateforme maîtrisée (AWS, GCP, ou Azure)

GenAI/LLM : le différenciateur 2026

La demande de compétences NLP dans les offres est passée de 5% à 19% en un an. En 2026, ne pas mentionner de compétences LLM sur un CV data scientist senior est un signal de retard.

Ce qu'il faut mentionner :

Hugging Face : modèles, datasets, inference endpoints
LangChain / LlamaIndex : construction de pipelines RAG
Fine-tuning : LoRA, QLoRA, RLHF, DPO
Vector databases : Pinecone, Weaviate, Chroma, pgvector
API : OpenAI, Anthropic, Mistral

Comment le montrer : "Déployé un pipeline RAG (LangChain + Pinecone + GPT-4) pour l'automatisation du support client. Réduction de 45% du volume de tickets L1 sur 3 mois."

Modèles déployés vs notebooks : ce qui fait la différence

La faute la plus courante sur un CV data scientist : montrer des expérimentations sans déploiement. Les notebooks Jupyter et les compétitions Kaggle ne suffisent plus en 2026.

Ce que le recruteur veut voir

Éliminatoire :

"Développé un modèle de prédiction de churn."
"Participation à 12 compétitions Kaggle."

Efficace :

"Déployé un modèle de prédiction de churn (XGBoost, API Flask) servant 50 000 requêtes/jour. Réduction du churn de 18% sur 6 mois, impact estimé à 2,3M EUR ARR."
"Top 8%, médaille d'or, compétition Jane Street Market Prediction (Kaggle 2024). Modèle ensemblé XGBoost + neural net, feature engineering sur 200+ variables."

Le principe : impact business, pas prouesse technique

Chaque projet sur votre CV doit répondre à trois questions :

Quel problème business ? (pas quel algorithme)
Quelle solution technique ? (modèle, stack, architecture)
Quel résultat mesurable ? (réduction de coût, augmentation de revenu, gain de temps)

La prouesse technique seule n'intéresse que les rôles de recherche pure. Pour tous les autres, c'est l'impact business qui différencie.

GitHub, Kaggle, publications : quoi montrer ?

GitHub (obligatoire pour les postes techniques)

Un GitHub propre avec des repos documentés est un signal fort. Un GitHub vide ou désorganisé est pire que pas de GitHub. Le lien apparaît dans l'en-tête du CV, à côté de l'email et du LinkedIn.

Ce qui compte : repos avec un README clair, du code commenté, des projets end-to-end (pas des snippets). Les contributions à des projets open source (Hugging Face, scikit-learn) sont un signal d'excellence.

Kaggle (conditionnel)

Mentionnez uniquement si vous êtes dans le top 10% ou avez une médaille. La participation seule n'ajoute rien. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production.

Publications académiques (conditionnel)

Pour les postes de recherche (Mistral AI, Owkin, Capital Fund Management) : incluez 2-3 publications clés. Pour les postes en entreprise : une seule publication pertinente suffit, avec l'application pratique mise en avant. Dix publications et cinq chapitres de thèse signalent un profil qui ne comprend pas le contexte industriel.

Qui recrute des data scientists en France ?

L'écosystème IA français

Startups IA (signal prestige) : Mistral AI (LLM, valorisation 14Md EUR), Hugging Face (origine Paris, 2M+ modèles), Owkin (federated learning santé, 300M+ levés), LightOn (IA enterprise), Dust (assistants IA).

Scale-ups tech : Doctolib (santé), Contentsquare (analytics), Back Market (e-commerce), Alan (assurance), Ledger (fintech/crypto), Believe (music data).

CAC 40 / grandes entreprises : BNP Paribas, Société Générale, Crédit Agricole (les plus gros recruteurs data en France), AXA, L'Oréal, Sanofi, SNCF, Orange.

Consulting / ESN : Capgemini, Accenture, Sopra Steria, CGI, EY, Sia Partners, Wavestone. Volume important de postes DS, souvent en mission chez des clients grands comptes.

Startup IA vs grand groupe vs consulting

Critère	Startup IA	Grand groupe	Consulting/ESN
Profil	PhD ou grande école top, recherche + production	Grande école ou Master, process structuré	Polyvalent, missions variées
Stack	Cutting-edge (LLM, RAG, MLOps avancé)	Legacy + modernisation progressive	Variable selon le client
Autonomie	Très forte	Encadrée	Mission-dépendante
Salaire	Compétitif + equity (BSPCE)	Grille structurée, avantages sociaux	Moyen, progression lente
CV signal	Publications, GitHub, compétitions	Périmètre de données, impact business	Diversité sectorielle

Les écoles et parcours valorisés

Tier 1 : accès direct aux meilleurs postes

Polytechnique + ENSAE (Institut Polytechnique de Paris) : le signal académique le plus fort pour un data scientist en France. La combinaison X + ENSAE est l'équivalent du Master El Karoui pour la finance de marché.

ENS (mathématiques), Centrale, Mines ParisTech, Télécom Paris : signal de rigueur quantitative reconnue par tous les recruteurs.

ENSAI : classée 4e européenne en Big Data/Data Science (Eduniversal 2026). Spécialisée en statistiques, forte en actuariat et data.

Tier 2 : accès conditionné par le portfolio

Masters universitaires : Dauphine, Sorbonne Data Analytics, Paris-Saclay. Reconnus, surtout pour les parcours statistiques et actuariels.

Autres écoles d'ingénieurs : INSA, ENSIMAG, EPITA. Valorisés mais nécessitent un portfolio technique solide pour se distinguer.

Bootcamps : accès junior en startup/PME

Le Wagon : forte notoriété dans l'écosystème startup français. Jedha : 93% de taux d'emploi déclaré, certification RNCP. DataScientest : certifié RNCP, connu pour le financement CPF.

Les diplômés de bootcamp accèdent aux postes juniors en startups et PME. Pour les grandes entreprises (banques, consulting) et les rôles élite, un bootcamp seul passe rarement le filtre RH. Les bootcamp graduates qui réussissent combinent le certificat avec un GitHub solide et des projets déployés.

Pour les principes de compatibilité ATS de votre CV technique, consultez le guide du CV compatible ATS. Pour la liste des mots-clés par secteur, consultez le guide des mots-clés CV. Si votre profil hésite entre data et produit en tech, le guide du CV product manager couvre les attendus côté product sur le marché français.

Les erreurs qui éliminent un CV data scientist

Erreur	Pourquoi c'est éliminatoire
Liste d'outils sans projets	"Python, TensorFlow, SQL, R, Spark" sans contexte est du bruit. Chaque outil doit être lié à un projet et un résultat.
Pas d'impact business	"Développé un modèle de churn" est incomplet. Quel impact sur le churn rate ? Combien d'euros sauvés ? Combien de requêtes en production ?
Notebooks sans déploiement	Les Jupyter notebooks signalent un candidat qui n'a pas mis en production. Montrez des API, des pipelines, des apps Streamlit.
Kaggle sans classement	La participation seule est du bruit. Top 10% ou médaille, sinon ne mentionnez pas.
Trop académique pour l'industrie	10 publications et 5 chapitres de thèse pour un poste en startup. 1-2 publications clés avec application pratique suffisent.
Pas de compétences GenAI en 2026	Un CV DS sans mention de LLM, RAG, ou Hugging Face est en retard. La demande NLP a triplé en un an.
GitHub vide ou absent	Pour les postes techniques, pas de GitHub = pas de preuve. Un GitHub désorganisé est pire qu'aucun GitHub.
Compétences en liste plate	40 outils sans catégorie ni niveau sont illisibles. Groupez par catégorie (Langages / ML / MLOps / Cloud / Data) et indiquez le niveau.

Les huit erreurs ci-dessus (liste d'outils sans projets, notebooks sans déploiement, GitHub vide, GenAI absent en 2026) sont détectées par les recruteurs tech en moins de 7 secondes. Si votre CV en contient une seule, il est écarté avant lecture en profondeur. Pour identifier les écarts avant l'envoi : analyser mon CV data scientist (gratuit, instantané).

Questions fréquentes

Faut-il un PhD pour être data scientist en France ?

Non, mais cela dépend du poste. 46% des data scientists dans le monde détiennent un PhD. En France, les rôles de recherche (Mistral AI, Owkin, Capital Fund Management) exigent un PhD. Les rôles en entreprise (banques, scale-ups, consulting) privilégient les grandes écoles d'ingénieurs (Polytechnique, ENSAE, Centrale, Mines). Les bootcamps (Le Wagon, Jedha) ouvrent l'accès aux postes juniors en startups et PME.

Quel salaire pour un data scientist en France en 2026 ?

Un junior (0-2 ans) gagne entre 37 000 et 50 000 EUR (46 000-67 000 EUR à Paris). Un confirmé (2-4 ans) atteint 46 000 à 65 000 EUR. Un senior (5-7 ans) se situe entre 56 000 et 78 000 EUR (65 000-90 000 EUR à Paris). Un Lead DS gagne 75 000 à 100 000 EUR. Un CDO dépasse les 90 000 EUR et peut atteindre 210 000 EUR. Les spécialistes santé et fintech gagnent 15-20% de plus.

Les compétences GenAI/LLM sont-elles obligatoires sur un CV data scientist en 2026 ?

Oui pour les postes senior et pour tout poste en NLP ou IA générative. La demande de compétences NLP dans les offres est passée de 5% à 19% en un an. Mentionner Hugging Face, LangChain, RAG, fine-tuning (LoRA/QLoRA), et les vector databases est désormais un signal attendu. Pour les postes en ML classique (prédiction, scoring, clustering), les LLM sont un bonus, pas un prérequis.

GitHub est-il obligatoire sur un CV data scientist ?

Oui pour les postes techniques. Un GitHub avec des repos propres, documentés, et montrant du code déployé est un signal fort. Un GitHub vide ou désorganisé est pire que pas de GitHub. Pour les profils seniors en management (Lead DS, Head of Data), le GitHub est moins critique, remplacé par les résultats business et le track record de déploiement.

Kaggle est-il valorisé sur un CV data scientist en France ?

Uniquement si vous êtes classé dans le top 10% ou si vous avez une médaille. "Participation à 12 compétitions Kaggle" est du bruit. "Top 8%, médaille d'or sur la compétition Jane Street Market Prediction (2024)" est un signal. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production. Les modèles déployés valent davantage.

En résumé

Un cv data scientist se différencie par trois signaux : des modèles déployés en production (pas des notebooks), un impact business quantifié (pas une prouesse technique isolée), et un stack technique organisé par catégorie avec niveaux de maîtrise. En 2026, les compétences GenAI/LLM (Hugging Face, LangChain, RAG, fine-tuning) sont attendues sur tout CV senior.

Le marché français de la data emploie 80 000 professionnels, avec un écosystème IA parmi les plus dynamiques d'Europe (Mistral AI, Hugging Face, Owkin). Python et SQL sont des prérequis universels. Le GitHub est obligatoire pour les postes techniques. Les grandes écoles d'ingénieurs (Polytechnique, ENSAE, Centrale) restent le signal académique dominant, mais les bootcamps ouvrent l'accès aux postes juniors en startup. Pour la lettre qui accompagne ce CV, le guide de la lettre de motivation pour les data scientists détaille le projet end-to-end à mettre en avant.

Si vous voulez voir comment votre CV data scientist se positionne face aux trois piliers (modèles déployés, impact business chiffré, stack technique catégorisé), analyser mon CV data scientist prend 30 secondes et fournit un score détaillé section par section.

Questions fréquentes

Faut-il un PhD pour être data scientist en France ?

Quel salaire pour un data scientist en France en 2026 ?

Les compétences GenAI/LLM sont-elles obligatoires sur un CV data scientist en 2026 ?

GitHub est-il obligatoire sur un CV data scientist ?

Kaggle est-il valorisé sur un CV data scientist en France ?

Uniquement si vous êtes classé dans le top 10% ou si vous avez une médaille. 'Participation à 12 compétitions Kaggle' est du bruit. 'Top 8%, médaille d'or sur la compétition Jane Street Market Prediction (2024)' est un signal. Les compétences Kaggle représentent 5-10% de ce qui fait un data scientist utile en production. Les modèles déployés valent davantage.

Prestance

Outil d'analyse de CV sectoriel par IA. Score sur 100, mots-clés manquants, recommandations par section.

Articles associés

Tech

CV Product Manager : Guide pour le Marché Français

CV product manager : métriques à inclure, outils attendus, erreurs éliminatoires et positionnement PM vs PO. Guide calibré pour le marché tech français en 2026.

3 avr. 202611 min