-
Danone Nutricia Research
- Statisticien
2015 - maintenant
-Analyse de données génomiques, plus particulièrement de la flore intestinale, provenant de différentes méthodes de séquençage: Pyroséquençage, métagénomique, qPCR
Objectif principal étant de caractériser différents groupes et trouver les "signatures" bactériennes de groupes de sujets.
Objectif secondaire étant de trouver les intéractions entre bactéries pour mieux comprendre leur fonctionnement avec l'hôte
-Analyse de données nutritionnelles
"Diet pattern": L"objectif principal étant de regrouper les sujets ayant des habitudes alimentaires semblables grâce à des méthodes statistiques de clustering et ensuite de relier ces groupes de sujets à des caractéristiques spécifiques en terme de nutriments, gènes, bactéries.
- Validation de méthode analytique
Evaluation de reproductibilité, répétabilité, incertitude de mesure de nouvelles méthodes analytiques pour validation et utilisation en routine par la suite
-Méthodes statistiques utilisées:
-Méthodes multivariées standard:ACP, AFC, AFM, PLS, CCA
-Méthodes sparse, qui permettent de sélectionner les variables importantes concernant le phénomène étudié: sPLS, sPLS-DA, s-ACP
-Méthodes de clustering: Kmeans, CAH, PAM,
-Méthodes d'arbre de décision: CART, Boosting, Bagging, Random Forest
-Régression linéaire, logistique, analyse de variance
-Notions en plan d'expérience
-Méthode algorithmiques a priori
Logiciels utilisés:
R
SAS
Jmp
BayesiaLab
-
IT&M Stats
- Statisticien
2014 - 2014
En mission chez Danone Research
-Analyse de données génomiques, plus particulièrement de la flore intestinale, provenant de différentes méthodes de séquençage: Pyroséquençage, métagénomique, qPCR
Objectif principal étant de caractériser différents groupes et trouver les "signatures" bactériennes de groupes de sujets.
Objectif secondaire étant de trouver les intéractions entre bactéries pour mieux comprendre leur fonctionnement avec l'hôte
-Analyse de données nutritionnelles
"Diet pattern": L"objectif principal étant de regrouper les sujets ayant des habitudes alimentaires semblables grâce à des méthodes statistiques de clustering et ensuite de relier ces groupes de sujets à des caractéristiques spécifiques en terme de nutriments, gènes, bactéries.
- Validation de méthode analytique
Evaluation de reproductibilité, répétabilité, incertitude de mesure de nouvelles méthodes analytiques pour validation et utilisation en routine par la suite
-Méthodes statistiques utilisées:
-Méthodes multivariées standard:ACP, AFC, AFM, PLS, CCA
-Méthodes sparse, qui permettent de sélectionner les variables importantes concernant le phénomène étudié: sPLS, sPLS-DA, s-ACP
-Méthodes de clustering: Kmeans, CAH, PAM,
-Méthodes d'arbre de décision: CART, Boosting, Bagging, Random Forest
-Régression linéaire, logistique, analyse de variance
-Notions en plan d'expérience
-Méthode algorithmiques a priori
Travail effectué sous R.
-
C2R
- Statisticien
PARIS
2011 - 2014
En mission chez Danone Research
-Analyse de données génomiques, plus particulièrement de la flore intestinale, provenant de différentes méthodes de séquençage: Pyroséquençage, métagénomique, qPCR
Objectif principal étant de caractériser différents groupes et trouver les "signatures" bactériennes de groupes de sujets.
Objectif secondaire étant de trouver les intéractions entre bactéries pour mieux comprendre leur fonctionnement avec l'hôte
-Analyse de données nutritionnelles
"Diet pattern": L"objectif principal étant de regrouper les sujets ayant des habitudes alimentaires semblables grâce à des méthodes statistiques de clustering et ensuite de relier ces groupes de sujets à des caractéristiques spécifiques en terme de nutriments, gènes, bactéries.
- Validation de méthode analytique
Evaluation de reproductibilité, répétabilité, incertitude de mesure de nouvelles méthodes analytiques pour validation et utilisation en routine par la suite
-Méthodes statistiques utilisées:
-Méthodes multivariées standard:ACP, AFC, AFM, PLS, CCA
-Méthodes sparse, qui permettent de sélectionner les variables importantes concernant le phénomène étudié: sPLS, sPLS-DA, s-ACP
-Méthodes de clustering: Kmeans, CAH, PAM,
-Méthodes d'arbre de décision: CART, Boosting, Bagging, Random Forest
-Régression linéaire, logistique, analyse de variance
-Notions en plan d'expérience
-Méthode algorithmiques a priori
Travail effectué sous R.
-
Danone Research
- Stagiaire
Paris
2011 - 2011
Détermination d'un protocole d'études de données génomiques:
-Bibliographie sur la sparse PLS.
-Bibliographie sur les méthodes de "clustering".
-Application de la méthode sur des jeux de données génomiques.
-Présentation de la méthode lors d'une conférence
Ce stage m'as permis de développer mes compétences scientifiques en approfondissant de nouvelles méthodes, comme la sparse PLS ainsi que les différentes méthodes de clustering, ainsi que mes compétences sur le logiciel statistique R sur lequel j'ai effectué toutes les analyses
-
Ecole nationale Météorologique
- Projet
2010 - 2010
Analyse de données météorologiques dans le cadre d'un projet tutoré entre l'INSA Toulouse et l’École nationale de la météorologie.
-Régression logistique
-Techniques de data mining
-Sélection de modèles
l'objectif était de tester différentes méthodes sur des données météorologiques pour obtenir le meilleur modèle prédictif afin d'aider à la décision de goudronner une route ou non. Ce projet a été effectué sous le logiciel statistique R