Mes compétences :
R Statistical Software
SAS
Data mining
SQL
Statistiques
SEM
Machine learning
Modélisation
R
Python
Entreprises
Covéa
- Data Scientist
2015 - maintenant
Keyrus
- Data Scientist
Levallois-Perret 2014 - 2015
Viadeo
- Senior Data Analyst
Paris2012 - 2014
Multiposting
- Chargée d'études et de recherche
Paris2009 - 2012Pendant 3 ans, j’ai côtoyé le milieu de la recherche universitaire en parallèle de mon activité professionnelle chez Multiposting. Cette expérience riche m’a permis de :
- Rencontrer de nombreux chercheurs du milieu universitaire ou privé et échanger sur nos travaux respectifs
- Présenter mes travaux dans des conférences nationales et internationales (liste de mes publications : http://cedric.cnam.fr/index.php/labo/membre/view?id=260)
- Faire de l’enseignement dirigé à des auditeurs du CNAM dans le cadre de cours du soir (Calcul des Probabilités, pendant 2 semestres)
Multiposting
- Ingénieur R&D Statistique et Data Mining
Paris2009 - 2012Multiposting est la première solution de multidiffusion d’annonces d’emploi et de stage en France. La société propose d’autres solutions de e-recrutement comme la publication d’annonces d’emploi sur les moteurs de recherche ou la recherche de profils à l’aide d’une Multi-CVthèque.
Ma mission était de concevoir des méthodes et algorithmes pour le développement d’outils d’aide à la décision en interne ou destinés aux utilisateurs de la solution Multiposting.
Mon projet principal était l’objet d’une thèse CIFRE que j’ai soutenue en mai 2012 : développement d’un algorithme prédictif de la performance des offres d’emploi diffusées sur Internet et recommandation de sites adaptés. Cet algorithme a été intégré dans un module complémentaire de la solution classique de multidiffusion.
En parallèle, j’assurais également les missions suivantes :
- Suivi et amélioration de la qualité de la donnée (spécification et amélioration du tracking en place, enrichissement de la base de données)
- Spécifications des fonctionnalités de l’interface utilisateur (partie analyse de la performance)
- Mise en place d’un système d’alerte pour la détection de pannes de robot diffuseur
- Modélisation du potentiel CA des prospects et de la proba de renew
- Préparation de reportings destinés aux recruteurs leur permettant d’analyser les résultats de leurs campagnes de recrutement
- Travail sur une méthodologie pour rapprocher les offres d’emploi et les profils de candidats potentiels
- Détection de la catégorie d’une offre d’emploi à partir de son contenu textuel
Dans le cadre de ces missions, j’ai mis en œuvre des techniques issues de la Statistique ou du Datamining :
- Classification supervisée et non supervisée (SVM, k-means, CAH)
- Analyse des correspondances / Analyse sémantique latente
- Text mining
- Régression PLS
- Système de recommandation hybride (en combinant une méthode basée sur le contenu à une méthode collaborative)
- Modèle linéaire général
- CART
ELLIPSA
- Chargée d'études statistiques
2008 - 2009Au sein du pôle Géomarketing de la société, j'étais en charge de la modélisation des données et des études socio-démographiques pour aider les entreprises à améliorer leur connaissance du territoire et des caractéristiques de leur clientèle.
Quelques-unes des missions qui m'ont été confiées :
- Etudes de potentiel de point de vente
- Modélisation de données socio-démographiques à différents niveaux géographiques (commune, iris, îlot)
- Estimation de la répartition des ménages par cycle de vie au niveau iris
- Projections de population des communes de France à quatre ans
- Typologie des communes touristiques de France
Groupe ESC Toulouse
- Stage en Statistique
2007 - 2007Ce stage réalisé au sein du pôle Management de l'Information s'inscrivait dans le cadre de recherches sur l'impact de l'information sur le prix des titres. Plus précisément, ce stage avait pour objectif l'étude de l'impact des recommandations d'analystes diffusées dans les médias sur les rendements anormaux des titres.
Centre Inter-universitaire de Calcul de Toulouse
- Stage en Informatique
2006 - 2006L'objectif de ce stage était l'étude d'un logiciel libre (PSPP) interprétant les commandes du logiciel d'analyse statistique/Data Mining SPSS. Il a donné lieu à la rédaction d'une documentation disponible en ligne (http://cict.fr/~stpierre/doc-pspp.pdf).
Paris2009 - 2012Je faisais partie de l’équipe MSDMA (Méthodes Statistiques de Data Mining et Apprentissage) au sein du laboratoire CEDRIC du CNAM, et j’étais rattachée à l’EDITE (Ecole Doctorale Informatique, Télécommunication et Electronique) de Paris. J’étais sous la direction de Gilbert Saporta, spécialiste de l’analyse des données, et j’ai soutenu ma thèse en mai 2012.