Profil recherché :
Lead Data Scientist Deep Learning NLP
Contexte de la mission :
Renforcer le Centre de Compétences Data Science de notre client final sur la partie NLP
Tâches à réaliser :
•Aider le commanditaire à cadrer le projet en étant force de proposition
•Accompagner techniquement des data scientists
•Requêter les bases de données du client
•Recenser et agréger les données de différentes sources
•Analyser et explorer les données
•Modéliser en s’appuyant sur des techniques de Machine Learning, Deep Learning
•Automatiser et optimiser les traitements
•Analyser les résultats produits pour s’assurer de la qualité des livrables
•Produire des data visualisations si nécessaire et en minimisant les actions de maintenance que cela impliquerait par la suite
•Restituer les résultats des travaux à l’écrit mais également à l’oral devant des commanditaires et en équipe, en apportant une plus-value dans l’analyse
•Accompagner les commanditaires dans la prise en main des livrables
•Documenter les travaux réalisés sur les aspects techniques et fonctionnels
•Capitaliser et travailler en équipe dans une démarche de boucle d’amélioration
•Utiliser les données en veillant au respect du RGPD
Compétences recherchées Obligatoires :
•Capacité à accompagner techniquement des data scientists
•Maîtrise de Python
•Maîtrise des tâches de pré-traitement des données textuelles (parsing, expressions régulières, enrichissement (POS Tagging, dependency parsing), normalisation via lemmatisation ou stemming, correction orthographique)
•Compétences en apprentissage automatique sur des données textuelles via au moins l’un des domaines ci-dessous :
oMaîtrise des fondamentaux du Machine Learning : compréhension des concepts clés, des algorithmes et des méthodes d’évaluation
oExpertise en Deep Learning : connaissance approfondie des architectures de réseaux de neurones, notamment les RNN, LSTM, GRU, et Transformers
oMaîtrise des Frameworks de Deep Learning : expérience avec TensorFlow, PyTorch ou Keras
oConnaissance des techniques « Transfer Learning » : expérience avec des modèles LLMs pré entraînés comme CamemBERT, GPT ou Mistral et leur fine-tuning pour des tâches spécifiques
oPrompt engineering
•Capacité à restituer et communiquer efficacement les résultats des travaux menés en data science
•Appétence à l’innovation et à la veille technologique : capacité à rester à jour avec les dernières avancées en NLP
•Proactivité et dynamisme pour piloter un projet de NLP avec des acteurs de profils variés
•Encadrement d’analystes (délai, accompagnement technique, qualité)
Expérience sur l’un ou plusieurs de ces cas d’usage :
oClassification multi-class / multi-label
oAnalyse de sentiment, opinion mining
oExtraction d’entités nommées
oSegmentation de texte
oSimilarité sur les données textuelles
oGénération de texte : expérience d’utilisation de LLMs notamment dans des tâches de résumé automatique, synthèse, chatbot, etc
•GitLab : connaissances de versionning et de partage de code (add, commit, push, pull, etc)
•Gestion de la donnée dans un contexte réglementaire RGPD/AI Act
•MLOps : expérience avec des outils et des pratiques pour automatiser le cycle de vie du ML y compris l’intégration continue, le déploiement continu et la surveillance des modèles
•Intégration et déploiement : capacité à intégrer ou packager des modèles entraînés pour les déployer à grande échelle
•Aisance et rigueur rédactionnelle
Optionnelles :
•Expérience avec les librairies comme NLKT, Spacy, etc
•Connaissance des interactions homme/machine
•Expérience sur le traitement d’images, de vidéos ou d’audios
•Expérience nécessaire : 5 années sur la fonction
•Méthodologie : Agile
•Langues : Français
•Localisation/En télétravail: 2 jours sur site et 3 jours en télétravail (IDF)
Functional skills: data scientist, machine learning, deep learning
Technical skills: NLP, Python, GitLAb
Il n'y a pas d'offres.
All rights reserved © FreelanceDay 2025
FeelanceDay, date création entreprise 12-05-2017 - Il y a 8 ans, forme juridique : SARL unipersonnelle, noms commerciaux REESK DIGITAL SOLUTION, adresse postale 28 RUE DE LONDRES 75009 PARIS, numéro SIREN : 829739622, numéro SIRET (siège) : 2973962200019, numéro TVA Intracommunautaire : FR28829739622, numéro RCS Paris B 829 739 622, activité (Code NAF ou APE), edition de logiciels applicatifs (5829C)