Profil de S Sw

S Sw
450.00€ /j
Data Engineer | ML Engineer | Python | PySpark| SQL| Docker| DBT
Disponible le : 09/12/2025
Localisation : France
Mobilité : Mobilité nationale
3 années d'expérience
0 missions réalisées
Agile ScrumDockerGITGithubMachine LearningpandasPython/SQLScikit-learnSpark Analytical SkillsAPIArtificial IntelligenceBase de donnéesConteneurisationData Engineerdata scienceDatavizETLGestion d’équipe

S Sw en quelques mots

Ingénieur diplômé (IMT Atlantique), expert en Industrialisation de l’IA (MLOps) et en Data Engineering Distribué. Je garantis la mise en production de solutions Data & ML robustes, testées et scalables.

Expertise Technique complète :

Industrialisation : Automatisation (CI/CD, GitHub Actions), Conteneurisation (Docker), Déploiement d’APIs (Flask/Streamlit).

Qualité du Code : Application des bonnes pratiques (pre-commit, Makefile pour l’automatisation des tâches) et Documentation automatique (pdoc).

Data Stack : Architectures de données (PySpark, dbt, PostgreSQL, SQL).

Cloud : Forte appétence pour les environnements Cloud et connaissance des 12 services fondamentaux AWS (certifié).

Mon engagement : Transformer les données en valeur métier mesurable par l’excellence logicielle et l’automatisation. Autonome et rigoureux pour des missions complexes en CDI ou Freelance.

Langues

French
bilingue
English
moyen

Formation

  • Licence 3 en Mathématiques

    Pierre et Marie Curie (Paris 6)

    septembre 2015 - juin 2016

  • Mastrer 1 Mathématiques

    Université de Bretagne Occidentale (UBO)

    septembre 2017 - juin 2018

  • INGENIEUR GENERALISTE

    IMT-ATLANTIQUE

    septembre 2016 - novembre 2019

    Portfolio

  • logo_sct

    SS CONSULTING DATA

    Data Engineer - Projet Open Source

    mars 2024 - avril 2024

    https://souleymanesow.github.io/Build-Chatbot-For-SqlDatabase/

    Chatbot SQL (Streamlit + Vanna LLM):
    Contexte : Conception d’un chatbot de générateur automatique de requêtes SQL à partir du langage naturel, livré sur Streamlit interface moderne.
    – Développement d’un chatbot SQL basé sur Vanna LLM, capable de traduire des requêtes en langage naturel en SQL exécutable.
    – Constitution d’un jeu de données supervisé (pairs question → réponse SQL) pour améliorer la précision et la pertinence des requêtes générées.
    – Rédaction d’un README et documentation technique pour faciliter la prise en main et la reproductibilité.

    Environnement : Streamlit, Python, Vanna (LLM), SQL.

  • logo_sct

    SS CONSULTING DATA

    Data Engineer - Projet Open Source

    octobre 2025 - novembre 2025

    Portfolio : https://souleymanesow.github.io/sinistre-pipeline-python-pyspark/

    J’ai conçu un pipeline de traitement de données sinistres en Python et
    PySpark, avec une approche orientée industrialisation et qualité. L’objectif était de transformer des données brutes de sinistres (assurance) en informations exploitables, tout en garantissant la robustesse, la traçabilité et la reproductibilité du processus.
    – Nettoyage des données , détection fraude, agrégation, sauvegarde en parquet
    – Tests unitaires incluant des tests métiers et techniques
    – CI/CD avec GitHub actions : intégration continue avec GitHub Actions, exécution automatique des tests et du linting à chaque commit.
    – Documentation automatisée (pdoc), linting avec pre-commit
    – Simplification des commandes avec Makefile(ex. make test, make lint,
    make docs).

    Environnement : PySpark, Python, Makefile, GitHub Actions, Pytest (fixtures), pdoc, pre-commit.

    Historiques (0)

    • Il n'y a aucune activité.