Exploitation des données à des fins décisionnelles : revenue assurance, contrôle des processus de gestion, reporting, détection de la fraude, anti attrition, segmentation, prévisions, qualité de la donnée ( valeurs aberrantes, recoupements,... ), panier de la ménagère,...
Nouveauté : grosse appétence pour le ML (Machine Learning) et plus généralement pour l'univers du Big Data .
> R : OK
> Python : en cours d'acquisition
> Lectures du moment :
- Practical Statistics for Data Scientists (Peter & Andrex BRUCE - O'Reilly)
- Doing Data Science (Rachel Schutt & Cathy O'Neil - O'Reilly)
- Mining the social web (Mathew A.Russel - O'Reilly)
Champs d'application :
> Lutte anti fraude (ML : KNN, K-Means, GLM, analyse textuelle sur journaux gestionnaires sinistre... packages R : CARET, DMwR (voir algorithme SMOTE pour données déséquilibrées, ...)
> Qualité des données DTW (levée d'alerte si contenu non conforme i.e. tel qu'appris par la machine, aide au diagnostic d'anomalie : variables les plus contributives sur un Random Forest)...
Mes compétences :
SAS Base
SAS Enterprise Guide
SQL ORACLE
Data profiling
Statistiques
Business Intelligence
Reporting
Base de données
Data mining
Recette d'une application décisionnelle