Mes compétences :
R
Data mining
MapReduce
Séries temporelles
Analyse de données
SQL
Statistiques
Machine Learning
Python
Scala
Spark
Hadoop
Entreprises
StarClay Groupe Partenor
- Data Scientist
2014 - maintenantEntreprise dans le secteur des services postaux
Utilisation d’algorithmes de machine learning afin de modéliser et prédire un indicateur de satisfaction client. Volonté de dans la nouvelle architecture réactive.
- Réalisation de la phase preprocessing des données avec contrainte de mémoire
- Construction de modèles de machine learning incrémental
• Environnement technique : Python, Scala MLlib, Spark
Entreprise dans le secteur de la finance
Mise en place d’algorithmes de machine learning afin de construire un moteur de recherche intelligent basé sur la similarité entre les mots/entités dans le cadre d’un POC Big Data/Analytics
- Construction d’un modèle (word2vec) de similarité à partir des rapports internes (données non structurées)
- Construction d’un modèle (word2vec) de similarité à partir de la base Dbpedia. Dbpedia différencie les entités des autres types de mots
- Construction d’un graph « force layout »
• Environnement technique : Python, Elastic Search, neo4j, d3js
Entreprise dans le secteur de l’énergie
Mise en place d’algorithmes de machine learning afin d’améliorer la compréhension de la consommation des clients et de les aider dans la gestion de leur énergie
- Réalisation de la phase pre-processing (homogénéisation et préparation des données)
- Construction de profils « client »
- Prédiction de leur consommation
- Création d’alertes intelligentes
• Environnement technique : R, Python, Impala
Entreprise dans le secteur de l’énergie
Mise en place d’algorithmes de machine learning afin d’améliorer la connaissance client et d’aider à la décision dans le cadre d’un POC Big Data/Analytics
- Calculs de scores pour différents indicateurs (taux d’appétence, taux de risque mauvais payeur, taux de fidélité et la puissance estimée)
- Visualisation des résultats sous la forme de graphiques et de cartes
• Environnement technique : R, Hadoop, RImpala, Impala, R H2O, Tableau Software
Entreprise dans le secteur de la construction
Mise en place d’algorithmes de Text Mining dans le but de détecter des clients frauduleux dans le cadre d’un POC Big Data/Analytics
- Implémentation d’algorithmes de machine learning détecter les documents frauduleux
- Détection d’informations sur les localisations à l’aide de l’étiquetage des mots
• Environnement technique : R, Python, Impala, MySQL
Orange Applications for Business
- Data Scientist
Paris2014 - 2014Algorithm implementation with MapReduce concept
Algorithm parallelization on a computer cluster
- Logistic Regression
- K Nearest Neighbors
- K means
software used : R & Hadoop
Massive data management and analysis
software used : Impala, Hive & Qlikview
Groupe Beaumanoir
- Project manager
Saint-Malo2013 - 2013In charge of time modeling on products sales with R
Creating a management tool for calculating products’ life curve with VBA
Creating a management tool for searching life curve with VBA
Crédit agricole
- Project manager
Montrouge2012 - 2012Création d'un référentiel commun d'harmonisation du traitement des réclamations
- logiciel utilisé : Excel