Mes compétences :
Agronomie
Analyse factorielle
Classification
Analyse textuelle
R-shiny
R
Bases en HTML
Bases en SQL
Implémentation package R
Modélisation
Python
Entreprises
Edf R&d
- Consultante data scientist
CLAMART2019 - maintenantConsultante en Data Science
Arvalis
- Data scientist
2017 - maintenant-Modèle prédictif du risque mycotoxines sur maïs et mise au point de grilles de risques.
-Screening des variables agro-climatiques impliquées dans l’apparition des mycotoxines réglementées utilisant des méthodes d’analyses multidimensionnelles et de data mining (ACP, ACF, AFDM, CART)
-Estimation de l’importance des variables agro-climatiques dans la toxicogénèse par l’utilisation de diverse méthodes statistiques (modèle linéaire mixte, régression logistique, Random Forest, GBM, Partial Least Square…)
-Intégration de différentes techniques de modélisation (ridge, lasso, random forest, GBM, xgboost...) dans un package avec inclusion d'une optimisation des paramètres et d'une sélection de variables pour certaines techniques. Création d'une application shiny faisant appel au package pour l'utilisateur.
Arvalis
- Stagiaire data scientist
2017 - maintenantModélisation statistique pour la prévision du rendement du blé tendre.
L'objectif est d'effectuer une recherche bibliographique et de mettre en oeuvre différentes méthodes de modélisation prédictives sous R, dont plusieurs techniques de machine learning :
-régression pénalisée (ridge, lasso, elastic net)
-régression PLS
- GAM
- GBM
- Xgboost
-SVM
-Random Forest
-Deep Learning
Une fiche descriptives de chacune de ces méthodes comprenant son principe, son fonctionnement, points forts, points faibles... sera réalisée. Ces méthodes sont toutes mises en oeuvre avec différentes librairies telles que h2o, glmnet, xgboost, e1071, random forest...
Un package regroupant l'implémentation de toutes ces méthodes a été réalisé.
Une méthode d'agrégation sera également documentée et mise en place.
Rennes2016 - maintenantMaster 2 Statistique pour les sciences agronomiques et agroalimentaires
Cette spécialité a pour objectif de développer des compétences statistiques dans un contexte de biologie appliquée, d’agronomie ou en lien avec les problématiques de l’agro-industrie.
Elle apporte une double compétence :
- dans le domaine des sciences agronomiques et agroalimentaires,
- dans le domaine du traitement de l'information et de son exploitation (apprendre à recueillir l'information, la