Provenant d'une formation physique-chimie avec une spécialisation en Optimisation des Protocoles EXpérimentaux, je suis passionné de faire parler les données par leur analyse et leur interprétation. Lors de mes années d'expérience professionnelle, j'ai mené à bien plusieurs projets d'analyse de données massives où j'ai pu transmettre mes connaissances ainsi que de m’enrichir de nouvelles.
Mon projet professionnel est d'occuper un poste de data scientist dans le domaine du vivant si possible.
Méthodes
*Statistiques: ANOVA, régression linéaire, régression logistique
*Data Mining: ACP, analyse factorielle, classification non supervisée (CAH, KMEANS)
*Machine learning/Chimiométrie : Deep learning, Partial Least Square Regression (PLSR), Principal Component Regression (PCR), Random Forest, Least-Square Support Vector Machine (LS-SVM) Régression, régression locale, réseaux de neurones, classification supervisée (FDA, PLS-DA, SVM,SIMCA), développement de nouvelle méthode de régression (LW-FFT)
*Sélection de variables: CovSel, VIP, Stepwise
Données traitées:
*Spectrales (Raman, Visible et proche infrarouge)
*Hyperspectrales
*Microbiologiques (ARISA)
*Temporelles (flux de sève, biomasse, phénotypages)
*Spatio-temporelles (physico-chimiques)
Informatique: Linux/Windows
*Maîtrise des logiciels de traitement de données : Matlab, R, Scilab, Python, Spark
*Maîtrise des logiciels de gestion de données (SGBD): PostGreSQL, MySQL, PostGIS
*Maîtrise des logiciels de SIG: Qgis, ArcGis
*Maîtrise des outils de visualisation de données: Shiny, Google Visualisation, ggplot2, Dygraphs
Langue: Anglais, lu et écrit, parlé, bonnes connaissances
Veille scientifique:
*Recherche bibliographique
*Participation à des congrès
*Collaborations
*Formations (SQL, ArcGis)
Mes compétences :
Statistiques
Data mining
Chimiométrie
Cartographie SIG
MATLAB
SQL
R
Machine Learning