-
Brainum
- Senior AI Expert
Informatique | Paris (75000)
2024 - maintenant
IA Generative Senior Data Scientist
Malakoff Humanis · Indirect Contract
Sep 2024 - Present · 1 yr 8 mos
Paris, Île-de-France, France · Hybrid
• Développement du projet recherche documentaire RAG pour la documentation technique.
- Dev des modules d'ingestion structurer pour une documentation complexe.
- Dev des modules de gestion de base de données vectoriel (open search).
- Dev des techniques RAG avancées de tag, contextualisation, préfiltrage….
• Développement du projet de dédoublement des tickets d’incidents
• Développement de nouvelle modules et fonctionnalité sur Dataiku
• Développement de la plateforme IA Générative sur AWS avec l’équipe DE.
- LLM Gateway, Opensearch, Observability, Evaluation
Stack Technique : Python, API, SQL, Flask, Docker, Bitbucket,Dataiku, Jankins, AWS (Sagemaker, Bedrock, Jumpstart..) , LiteLLM, Opik comet, MLflow, Streamlit, Linux,,OpenAI, HuggingFace, Langchain, Llamaindex, Docling, Embedding, Ragas.
-
Yele consulting
- Data Scientist
Informatique | Paris (75000)
2022 - 2024
Data Scientist
Yélé Consulting · Permanent
Jul 2022 - Sep 2024 · 2 yrs 3 mos
Paris, Île-de-France, France · Hybrid
• 𝗠𝗶𝘀𝘀𝗶𝗼𝗻 𝗜𝗔 𝗚é𝗻é𝗿𝗮𝘁𝗶𝘃𝗲
− Développement d’une suite d’outils d’IA Générative (Chatbot, RAG, summarize, transcribe).
o Design de l’architecture de l’outil (Données, DB, Framework, Modèle OS, application).
o Intégration de la solution RAG (Injection données, embedding, retriever, génération, évaluation).
o Développer des couches supplémentaires, pour autres besoins utilisateurs (chat, résumé, AO).
• 𝗠𝗶𝘀𝘀𝗶𝗼𝗻 𝗖𝗼𝗻𝗱𝘂𝗶𝘁𝗲 𝗿é𝘀𝗲𝗮𝘂𝘅
− Optimisation de la conduite de réseaux électriques via l’IA (Autant ou meilleur que l’humain).
o Solution technique qui combine entre GNN et RL pour une meilleure scalabilité.
o Développement d’une application Django et Django-Ninja api.
o Participation à l’avant-vente.
• 𝗠𝗶𝘀𝘀𝗶𝗼𝗻 𝗽𝗶𝗹𝗼𝘁𝗮𝗴𝗲 𝗲𝘁 𝗗𝗲𝘃𝗢𝗽𝘀 (10%)
− Développement d’une application de gestion financière de parc de borne de recharges.
o Assurer le rôle de l’AMOA sur ce projet.
o Assurer la partie architecture MySQL et DevOps.
• 𝗔𝘂𝘁𝗿𝗲𝘀 𝘀𝘂𝗷𝗲𝘁𝘀 (10%)
− Réponse aux appels d’offre IA et énergie.
− Accompagnement des consultants juniors en data dans leur mission.
− Création de POC et prototypage de solution
− Proposition de sujets d’IA en interne.
− Mécénat : Assurer l’animation des ateliers de sensibilisation aux technologies.
-
Informatique |
2018 - 2022
Data Scientist Analyst Chez Digiposte
Permanent
Jan 2021 - Jul 2022 · 1 yr 7 mos
Paris, Île-de-France, France
- Gestion et exploitation de données issue de différentes sources.
- Création et mise en production des rapports et des indicateurs.
- Création de modèles ML et DL pour différente taches et services
- Répondre aux questions business et contribution à la connaissance interne.
Data Scientist chez Groupama
Permanent
Sep 2020 - Jan 2021 · 5 mos
Île-de-France, France
Travailler sur différents projets, mes travaux vont du cadrage des sujets, préparation des bases de données, Traitements et structuration de données, choix, développement et amélioration des modèles ML, préparation à l’industrialisation et suivie de l’industrialisation.
Environment technique:
• ML, Intelligence artificielle, modèles supervisés et non supervisés
• R, Rstudio, Python Anaconda, SQL SAS Informatica, JSON, Dataiku, qlikview
Research & Innovation Data Scientist Engineer : Altran Research Center
Permanent
Mar 2020 - Sep 2020 · 7 mos
Paris, Île-de-France, France · On-site
Développement d’un outil expérimental basé sur l’utilisation des méthodes d'apprentissage automatique ou Machine Learning en imagerie médicale dans le but de fournir un outil d’Aide au diagnostic:
Réalisation(s) :
• Segmentation des lésions effectuée à l'aide du modèle U-net et de l'extraction de caractéristiques radiomiques sur les données IRM.
• Développement et comparaison de plusieurs modèles d'apprentissage automatique pour la classification des tumeurs lipomateuses des tissus mous, y compris les modèles de régression logistique (LR), de machine à vecteurs de support (SVM), de forêt aléatoire (RF), de gradient boosting (GB) et d'apprentissage en profondeur (CNN).
• Évalué et comparé les performances du modèle à l'aide de la validation croisée k-fold, du test de DeLong et de diverses mesures de performance, obtenant finalement les meilleurs résultats avec un modèle GB de données radiomiques corrigé par lots.
Environnement(s) technique(s) :
• Python, Jupyter, Library : Tensorflow, Scikit-Learn, Numpy, Keras, Theano, Pandas, Scipy, tkinder
• Nvidia DGX Linux, Docker, Shell ,slurm
Research & Innovation Data Scientist Chez Continental
Contract
Oct 2018 - Mar 2020 · 1 yr 6 mos
Île-de-France, France · Hybrid
Création des applications de service contextuel au sein du véhicule.
Réalisations:
• Développement des applications de collecte et synchronisation de données depuis le véhicule.
• Collecte et pré-traitement des données (filtrage, data wrangling…)
• Application des techniques de traitement de signal et d’extraction des caractéristiques
• Recherche, Evaluation et choix du modèle d’apprentissage
• Développement des algorithmes de choix des meilleurs features
• Analyse, test et validation des performances des modèles
• Mise en application et validation des POC réalisés
• Utiliser les techniques de ML et Deep Learning pour optimiser les processus, trouver de nouvelles solutions et acquérir de nouvelles connaissances.
• Explorez l'utilisation des techniques d'intelligence artificielle, d'assistants numériques, de robots intelligents, de reconnaissance faciale, de reconnaissance de la parole et de traitement de la parole, de traduction et de transcription automatiques, d'analyse de texte et de vidéos et de conduite autonome.
Les domaines touchés :
• Prévisions météorologiques géospatiales
• Détection des anomalies par NLP
• Traffic routière
• Comportement du conducteur
• Contexte dynamique véhicule
Environnement technique:
Python (Scikit-Learn, Numpy, Keras, Theano, TensorFlow, NLTK, Pandas, Scipy, tkinder, Cantool, multiprocessing), Apache Spark, R, Jupyter, AWS (EC2, S3, CLI, EMR), Linux, NVIDA, CAN bus, JSON, CSV, geopandas, OpenStreetMap Overpass API (osmnx)
-
Groupe PSA
- Ingénieur Data Scientist
Technique | Paris (75000)
2018 - 2018
Mission Big Data : Reconnaissance de style de conducteur de véhicule
Réalisations :
- installation et configuration des outils d’accès au Big Data
- Développement de fonctions d’extraction de données brute (Vitesse, Accélération;)
- Prétraitement de données extrait (regroupement de données...)
- Sélection de population d’études
- Extraction de caractéristiques de roulages (coefficients caractéristiques)
- Évaluation des algorithmes de classifications non supervisée
Résultats :
- travailler sur un projet industriel concret, élaboration de guide d’installation et configuration, création des fonctions élémentaires de base d’extraction de données;
Visualisation de données, élaboration des statistiques sur les données, prise en main de l’outil spark, développement du savoir-faire en python et traitement de données, partage et capitalisation de savoir-faire au sein de l’équipe ACG.
- Classification de style des conducteurs candidate en 3 classes (sportive, Calme et normale)
Environnement technique :
- package de traitement de données (Pandas, NumPy, SciPy, Matplotlib, scikit-learn, TensorFlow)
- Outils (Spark, Hbase, HDFS, Power BI, PySpark, Python, Jupyter, Linux)
Mission d'optimisation : Optimisation de compromis Nox Particules
- Évaluation des algorithmes d'optimisation
- Acquisition de données résultantes d'optimisation
- Application des algorithmes d'apprentissage de prédiction de série de temps
- Prédiction de signaux optimaux pour la commande du moteur qui optimise le compromis Nox ParticulesMission Big Data : Reconnaissance de style de conducteur de véhicule Réalisations : - installation et configuration des outils d’accès au Big Data - Développement de fonctions d’extraction de données brute (Vitesse, Accélération;) - Prétraitement de données extrait (regroupement de données...) - Sélection de population d’études - Extraction de caractéristiques de roulages (coefficients caractéristiques) - Évaluation des algorithmes de classifications non supervisée Résultats : - travailler sur un projet industriel concret, élaboration de guide d’installation et configuration, création des fonctions élémentaires de base d’extraction de données; Visualisation de données, élaboration des statistiques sur les données, prise en main de l’outil spark, développement du savoir-faire en python et traitement de données, partage et capitalisation de savoir-faire au sein de l’équipe ACG. - Classification de style des conducteurs candidate en 3 classes (sportive, Calme et normale) Environnement technique : - package de traitement de données (Pandas, NumPy, SciPy, Matplotlib, scikit-learn, TensorFlow) - Outils (Spark, Hbase, HDFS, Power BI, PySpark, Python, Jupyter, Linux) Mission d'optimisation : Optimisation de compromis Nox Particules - Évaluation des algorithmes d'optimisation - Acquisition de données résultantes d'optimisation - Application des algorithmes d'apprentissage de prédiction de série de temps - Prédiction de signaux optimaux pour la commande du moteur qui optimise le compromis Nox Particules
Skills: Data Science · Machine Learning · Artificial Intelligence · Big Data · Matlab · Python · Microsoft Power BI · Big Data Analytics · Data Analytics
-
Delphi
- Responsable de projet ingénierie et process
Informatique | Tanger
2014 - 2017
Travailler sur différente problématique technique d'automatisation et d'optimisation.
- Automatisation des processus de production.
- Prédiction des meilleur paramètres optimal pour la machine à souder par des NNs
- Trouver l'alternative du matière première des terminaux la mieux adaptée en cas de pénurie de RM
- Contrôle qualité automatisé et détection d'anomalies : vérification d'épissage en utilisant la vision par ordinateur pour la détection d'anomalies
- Prédiction des prévisions de commandes pour l'approvisionnement et le budget de la MR, l'allocation de l'espace et de l'équipement.
Outils: Python, C++, C, MATLAB, SAP, Microsoft Office.Travailler sur différente problématique technique d'automatisation et d'optimisation. - Automatisation des processus de production. - Prédiction des meilleur paramètres optimal pour la machine à souder par des NNs - Trouver l'alternative du matière première des terminaux la mieux adaptée en cas de pénurie de RM - Contrôle qualité automatisé et détection d'anomalies : vérification d'épissage en utilisant la vision par ordinateur pour la détection d'anomalies - Prédiction des prévisions de commandes pour l'approvisionnement et le budget de la MR, l'allocation de l'espace et de l'équipement. Outils: Python, C++, C, MATLAB, SAP, Microsoft Office.
Skills: Six Sigma · Process Improvement · Anomaly Detection · Data Science · Machine Learning · Artificial Intelligence · Deep Learning · Product Management · Lean Manufacturing · Python · Transversal management · Data Analytics
-
NDJ Automation
- Stagiaire Ingénieur Automaticien
2013 - 2013
- Etudes dimensionnel et quantification du matériel ainsi que le chiffrage du cout et des temps
- Installation électrique et configuration des Automates et des Entrée/Sortie
- Elaboration des programmes d’automatisation et de supervision SCADA des unités de production
- Maintenance et Réparation des matériels Industriels et d'Automatisme
-
Bureau d'études automatisme
- Stagiaire Ingénieur Automaticien
2013 - 2013
Sujet : Etude, configuration et mise en œuvre d’un système numérique de contrôle commande (ICS, avec la solution de Yokogawa) pour le projet « ODI » à l’OCP Jorf Lasfar.
- Analyse de cahier des charges et l’étude de dimensionnement des équipements pour l’unité à automatisé
- Élaboration des plans, schémas des armoires et de l'architecture de Système de Contrôle Distribué (DCS)
- Élaboration de la base de données et configuration des standard Software et la supervision des procédés
- Mise en œuvre, simulation et test du programme fonctionnelle
-
Cim D'equipement
- Stagiaire Ingénieur Automaticien
2013 - 2013
Sujet : Etude, configuration et mise en œuvre d’un système numérique de contrôle commande (ICS, avec la solution de Yokogawa) pour le projet « ODI » à l’OCP Jorf Lasfar.
- Analyse de cahier des charges et l’étude de dimensionnement des équipements pour l’unité à automatisé
- Élaboration des plans, schémas des armoires et de l'architecture de Système de Contrôle Distribué (DCS)
- Élaboration de la base de données et configuration des standard Software et la supervision des procédés
- Mise en œuvre, simulation et test du programme fonctionnelle
-
Centrale Laitière
- Technicien Maintenance
Casablanca
2012 - 2012
Sujet : Mise en place de la méthode AMDEC Machine sur une conditionneuse (Forme-Fill-Seal) en vue d’augmenter son efficience et sa disponibilité.
- Analyse fonctionnelle (FAST) et l’dentification des modes de défaillance, leur cause et leur effets (5P, Ishikawa)
- Évaluation des critères de cotation (Fréquence, gravité, Indécidabilité) et la proposition d'actions Correctives
-
Onep
- Stagiaire Technicien Maintenance
RABAT
2012 - 2012
Sujet : Mise en place de la méthode AMDEC Machine sur une conditionneuse (Forme-Fill-Seal) en vue d’augmenter son efficience et sa disponibilité.
- Analyse fonctionnelle (FAST) et l’dentification des modes de défaillance, leur cause et leur effets (5P, Ishikawa)
- Évaluation des critères de cotation (Fréquence, gravité, Indécidabilité) et la proposition d'actions Correctives