Ingénieur diplômé (IMT Atlantique), expert en Industrialisation de l’IA (MLOps) et en Data Engineering Distribué. Je garantis la mise en production de solutions Data & ML robustes, testées et scalables.
Expertise Technique complète :
Industrialisation : Automatisation (CI/CD, GitHub Actions), Conteneurisation (Docker), Déploiement d’APIs (Flask/Streamlit).
Qualité du Code : Application des bonnes pratiques (pre-commit, Makefile pour l’automatisation des tâches) et Documentation automatique (pdoc).
Data Stack : Architectures de données (PySpark, dbt, PostgreSQL, SQL).
Cloud : Forte appétence pour les environnements Cloud et connaissance des 12 services fondamentaux AWS (certifié).
Mon engagement : Transformer les données en valeur métier mesurable par l’excellence logicielle et l’automatisation. Autonome et rigoureux pour des missions complexes en CDI ou Freelance.
Ajouter une formation professionnelle à votre profil. (optionnelle)
Ajouter une expérience à votre profil. (optionnelle)
Chatbot SQL (Streamlit + Vanna LLM):
Contexte : Conception d’un chatbot de générateur automatique de requêtes SQL à partir du langage naturel, livré sur Streamlit interface moderne.
– Développement d’un chatbot SQL basé sur Vanna LLM, capable de traduire des requêtes en langage naturel en SQL exécutable.
– Constitution d’un jeu de données supervisé (pairs question → réponse SQL) pour améliorer la précision et la pertinence des requêtes générées.
– Rédaction d’un README et documentation technique pour faciliter la prise en main et la reproductibilité.
Environnement : Streamlit, Python, Vanna (LLM), SQL.
J’ai conçu un pipeline de traitement de données sinistres en Python et
PySpark, avec une approche orientée industrialisation et qualité. L’objectif était de transformer des données brutes de sinistres (assurance) en informations exploitables, tout en garantissant la robustesse, la traçabilité et la reproductibilité du processus.
– Nettoyage des données , détection fraude, agrégation, sauvegarde en parquet
– Tests unitaires incluant des tests métiers et techniques
– CI/CD avec GitHub actions : intégration continue avec GitHub Actions, exécution automatique des tests et du linting à chaque commit.
– Documentation automatisée (pdoc), linting avec pre-commit
– Simplification des commandes avec Makefile(ex. make test, make lint,
make docs).
Environnement : PySpark, Python, Makefile, GitHub Actions, Pytest (fixtures), pdoc, pre-commit.
FeelanceDay, date création entreprise 12-05-2017 - Il y a 8 ans, forme juridique : SARL unipersonnelle, noms commerciaux REESK DIGITAL SOLUTION, adresse postale 28 RUE DE LONDRES 75009 PARIS, numéro SIREN : 829739622, numéro SIRET (siège) : 2973962200019, numéro TVA Intracommunautaire : FR28829739622, numéro RCS Paris B 829 739 622, activité (Code NAF ou APE), edition de logiciels applicatifs (5829C)
Nous passerons en revue les rapports du Freelance et du client afin de rendre la meilleure décision. Il faudra 3-5 jours ouvrables pour l’examen après avoir reçu les deux rapports.