DOMAINE DE COMPETENCES
COMPETENCES TECHNIQUES
Construction de modèles prédictifs
Systèmes de recommandation
Résolution de problèmes d’aide à la décision
Algorithmiques, Machine learning et statistiques
Programmation en Python, R, SQL, Impala, SAS
Très bonne maitrise des technologies de datavisualisation Power BI et Tableau software
Bonne connaissance des architectures big data
Technologies Big Data : HDFS, Spark, Pyspark
Bonne connaissance des outils Talend, ElasticSearch, Hive, Impala, Sqoop Marketing: analytics, relationnel, mobile, street, web
Capacités d’adaptation rapides à de nouveaux outils informatiques
Méthode Agile : Kanban, Scrum. FORMATION
Mame, +5 ans d’expérience PPO Data / Data Scientist
2019 2015
2013
LANGUE
Français : courant Anglais : moyen
Mastère Spécialisé Management et Marketing Digital
ESSEC Executive Education, Paris
Licence Professionnelle Décision et traitement de l’information Datamining
Université de Marne La Vallée, Paris
DUT Statistique et Informatique Décisionnelle STID
IUT de Nice Sophia Antipolis, Menton
mamebousso.gueye@bayetechnologies.com 07 51 44 86 94
EXPERIENCE PROFESSIONNELLE
Mame, +5 ans d’expérience PPO Data / Data Scientist
Baye Consulting, Rouen Depuis janvier 2019
Data Scientiste & Business Manager
Contexte : Baye Consulting est une jeune entreprise de service numérique. Missions :
Participer à la mise en place de la stratégie de croissance de l’entreprise
Mise en place de projet data science au Sénégal
Business Management : prospection, négociation, sourcing, recrutement des
collaborateurs
Environnements Techniques : R, Talend, MySQL
Saagie, Rouen Décembre 2015 – Décembre 2018
Data Scientist
Contexte : Saagie est une startup éditeur d’une plateforme big data nommée Data Fabric. Je faisais partie de l’équipe en charge de l’accompagnement des clients dans l’utilisation de la plateforme, par la réalisation de projet big data en régie et la formation des utilisateurs.
Missions :
Réalisation de projet BI et data science :
1. Cartographie de zones inondables Matmut : géolocalisation des adresses, création des zones et vérification de l’appartenance d’un point dans une zone :
Création d’un webservice de géolocalisation utilisant les bases des adresses open data BAN et BANO.
Création des zones à risque d’inondation optimisées en fonction de l’historique des sinistres.
Création d’un container Docker déployé sur la plateforme Saagie. Ce docker embarque les différents programmes ainsi qu’une application Shiny pour la visualisation.
Scrum master de l’équipe de 5 personnes :
Remplir le backlog sur Jira
Planifier les sprints : poker planning, gestion du delivery Animer les rétrospectives, les daily meeting
Technologies: Saagie Data Fabric, HDFS, Spark, pyhton, ElasticSearch, Shiny, Docker, Sqoop, Jira.
mamebousso.gueye@bayetechnologies.com 07 51 44 86 94
2. Détection de churn santé Ociane :
Identification des profils à risque de résiliation
Détermination les évènements déclencheurs afin de limiter / anticiper les résiliations
Recommandation d’actions permettant de favoriser la rétention Technologies : Plateforme Data Fabric de Saagie, HDFS, Impala, R, H2O
3. Détection de fraude automobile
Automatisation du processus de détection manuel pour augmenter le taux de détection.
Mise en place d’un modèle prédictif permettant d’établir un score correspondant à la probabilité qu’un sinistre soit frauduleux
Mise à disposition du métier d’un dashboard interactif permettant de suivre les différents scénarios de fraude.
Technologies : Plateforme Data Fabric de Saagie, HDFS, Impala, R, Power BI
4. Sirénisation des bases de données
Utilisation de la base open Data des numéros de Siren, pour enrichir les données interne des contrats professionnels.
Détermination de l’ensemble des contrats possédés par une même entreprise à partir de ce numéro.
Technologies : Plateforme Data Fabric de Saagie, HDFS, Impala, ElasticSearch, Python.
5. Connaissance client : vision 360
Identification et mises en commun des différentes sources d’information
Création d’une application Shiny permettant de visualiser toutes les informations importantes pour un sociétaire
Technologies : Plateforme Data Fabric de Saagie, HDFS, Impala, R, Shiny, Docker
6. Divers projets de reporting
Etude Opt-in/Opt-out
Mise en place d’un Dashboard permettant de suivre
automatiquement inscription et désinscription à la newsletter. Power BI, Impala, HDFS.
Pilotage Outil de chiffrage
Suivi de l’utilisation par des gestionnaires de l’outil de chiffrage
automatique des sinistres. Power BI, Impala, HDFS.
7. Textmining sur les factures EDF
Conversion des factures en texte via l’OCR Tesseract
Automatisation de la détection des révisions de prix sur les factures grâce au calcul de similarités sur les mots
Technologies : Plateforme Data Fabric de Saagie, HDFS, Python Tesseract Onboarding, formation et accompagnement à l’appropriation de technologie big data.
mamebousso.gueye@bayetechnologies.com 07 51 44 86 94
Mame, +5 ans d’expérience PPO Data / Data Scientist
Environnements Techniques : Saagie Data Fabric incluant : R, Python, HDFS, Impala, MongoDB, Spark, Sqoop, Talend, méthode agile.
AXA France, Paris Septembre 2014 – Septembre 2015 Alternante chargée d’études statistiques
Contexte : Au sein de l’entité de l’actuariat produit, je travaille avec l’équipe du Bureau d’Etude Technique (BET) de la région Ile de France dont les missions sont :
Assurer l’équilibre entre le développement du business et les résultats techniques de la région Ile de France pour le marché des particuliers (IARD et Santé).
Participer au développement commercial en faisant émerger des solutions régionales
(indexations globales ou locales, crédit et actions commerciales, communication sur
les garanties,…).
Être support technique pour prise de décision et visibilité sur l’activité de la région.
Missions :
1. Automatisation des explications des anomalies du terme à blanc.
Tous les mois, le terme à blanc ou contrôle IFC permet de s’assurer que les quittances émises correspondent aux mesures tarifaires et d’éviter des décalages entre les prévisions et l’émission réelle. Il est nécessaire de pouvoir expliquer les écarts qu’il peut y avoir manière automatique, pour cela :
Mise en place d’un outil permettant
Trouver les explications des anomalies
Normaliser les libellés de ces anomalies.
Pré remplir le fichier pour les services de productions Hiérarchiser et uniformiser les explications.
2. Optimisation déploiement des experts sinistres salariés Cartographie des sinistres non auto sur la région
Calcul d’indicateurs
Proposition d’un nouveau zonier pour chaque expert.
Environnements Techniques : SAS, VBA, EXCEL, Mainframe
mamebousso.gueye@bayetechnologies.com 07 51 44 86 94
Mame, +5 ans d’expérience PPO Data / Data Scientist
Mame, +5 ans d’expérience PPO Data / Data Scientist
Initiative Menton Riviera, Menton Avril 2012 – Juin 2012 Stagiaire chargée d’études statistiques
Contexte : Initiative Menton Riviera est une entité d’Initiative France. Il s’agit d’une plateforme d’accompagnement et de financement à la création ou reprise d’entreprise. Missions :
Etablir le profil des créateurs d’entreprise qui font appel à Initiative Menton Riviera
Evaluation de l’impact d’Initiative Menton Riviera sur l’économie mentonnaise. Environnements Techniques : R, Excel
FeelanceDay, date création entreprise 12-05-2017 - Il y a 7 ans, forme juridique : SARL unipersonnelle, noms commerciaux REESK DIGITAL SOLUTION, adresse postale 28 RUE DE LONDRES 75009 PARIS, numéro SIREN : 829739622, numéro SIRET (siège) : 2973962200019, numéro TVA Intracommunautaire : FR28829739622, numéro RCS Paris B 829 739 622, activité (Code NAF ou APE), edition de logiciels applicatifs (5829C)
Nous passerons en revue les rapports du Freelance et du client afin de rendre la meilleure décision. Il faudra 3-5 jours ouvrables pour l’examen après avoir reçu les deux rapports.