Menu

Antoine ANTOINE BIDOYEN (BIDOYEN)

AIX EN PROVENCE

En résumé

Hey, bienvenu à toi qui t'es laissé intriguer par mon profil.
Si tu veux en savoir plus sur moi et mes projets, voici une courte description.

Amoureux des maths, j'ai orienté mon parcours universitaire dans ce domaine et afin de diversifier mes compétences, j'ai effectué un second Master 2 en Data Science.

C'est lors de celui ci que je suis tombé accro au Machine Learning, au Deep Learning mais surtout au NLP (Natural Language Processing, pour celles et ceux qui ne connaissent pas encore ce merveilleux domaine).

Au cours de mes expériences professionnelles, j'ai eu la chance de travailler sur des missions faisant appel à ces branches de la Data Science, entre autre, lors de projets de recherche pour faire, de la détection de nouveauté dans des flux textuels (DL ML,NLP), la réalisation d'un package R orienté traitement de textes (NLP), de la classification de courbes de charge (DL, ML), de la prédiction de temps de production (ML) et pleins d'autres choses plus détaillées dans la partie "Expérience" de mon profil.

J'ai également eu la chance de m'amuser avec des Langages/ Outils comme Python et ses libraires de Data Science (numpy, pandas, matplotlib, keras, sklearn, nltk, ...), R (tidyverse, stringr, ...), du SQL sur des bases de données de type MariaDB, MySQL, Oracle, Postgre, Teradata. Mais aussi Git pour collaborer et mettre tous ces beaux scripts à l'abri. N'oublions pas de citer Tableau et Qlikview pour la réalisation de magnifiques visualisations statistiques.

Supportaire de l'OL à mi-temps, j'aime aussi me dépenser autrement qu'en grognant après cette équipe, c'est à dire en faisant du vélo et du fitness à mes heures perdues.

Si après avoir lu tout ça tu ne t'es pas encore assoupi, je t'invite à regarder mes expériences pro et mon CV, sinon bonne sieste :-)

Entreprises

  • maison.fr - Data scientist

    AIX EN PROVENCE 2021 - 2021 Nettoyage et organisation de la donnée pour un stockage en base. Travail sur un projet de
    siretisation et participation à l’enrichissement du site web. Participation à un POC sur
    Elasticsearch. Création et automatisation de rapports statistiques. Visualisation de la data sous Tableau. Mise en place de traitements pour récupérer des données en libre accès d’organismes comme l’Ademe,
    l’Insee, l’Inpi, via des API. Crawl de certains sites.

    Environnement technique : Python, SQL, Mariadb, Tableau
  • Agixis - Data scientist

    Lyon 2019 - 2020 Classification de séries temporelles, réalisation d'un package R, review de code.

    Consultant en data science. J'avais pour mission de mettre à jour un référentiel d'infrastructures pour la charge de véhicules électriques (IRVE).

    Mission réalisée : Nettoyage et création de datasets adaptés. Tests et comparaisons d'algorithmes de Deep Learning comme des Bi-LSTM, FCN-LSTM et de Machine Learning (Xgboost, RandomForest) pour la classification de séries temporelles. Du features engineering à la main mais aussi à l'aide de la librairie tsfresh. Réalisation d'un package R orienté NLP. Mise à niveau d'anciens traitements pour la réalisation d'un référentiel d'IRVE.

    Domaines : Deep Learning, Machine Learning, NLP.

    Environnement technique : Python, R, Git, SQL, Teradata, Oracle, Postgre.
  • Edf / Eric - Data scientist (stage)

    Lyon (69000) 2018 - 2018 Detection de nouveauté dans des flux textuel
    Détection de nouveauté(s), d'anomalie(s), maintenance prédictive :

    Objectif industriel :
    EDF reçoit des réclamations de clients sur divers problèmes (par exemple suite à la pose du nouveau compteur linky), l'entreprise a ainsi pu former une base de données et souhaite pouvoir détecter parmi les nouvelles réclamations celles qui sont porteuses de nouveauté(s) afin de pouvoir réagir le plus rapidement et efficacement possible pour empêcher qu'un problème émergeant ne prenne de l'ampleur.

    Mission réalisée :
    Travail de recherche afin de trouver les meilleurs modèles de word embedding (Skip-gram, CBOW, Glove, Doc2vec, Sent2vec, InferSent ...) pour représenter des documents vectoriellement, utilisation de modèles de classification linéaires, de clustering et de réduction de la dimension (t-SNE) afin d'évaluer la pertinence des espaces de représentations obtenus. Mise au point de mesures (versions modifiées de la similarité cosinus par exemple), modèles dans le but de détecter les documents porteurs de nouveauté(s).
    Utilisation de librairies de Deep Learning, langage Python.

    Domaines : Machine learning, Deep learning, NLP.

    Environnement technique : Python, R, Git
    (Stage)
  • Ikea Industry - Data scientist/ Analyst (stage)

    Lure (70200) 2017 - 2017 Etudes et modélisations des données de production
    Modélisation statistique, business intelligence :

    Objectif industriel : Optimisation du processus de production, c'est à dire diminution des anomalies/ défauts et maximisation de la capacité de production. Gagner en compréhension sur le processus.

    Réalisations : Extraction de données, réalisation de traitements, statistiques descriptives, mise en place de modèles prédictifs. Utilisation de QlikView, SQL Developer. Programmation avec R et le langage SQL.

    Domaines : Machines Learning, Base de données, Data visualisation.

    Environnement technique : R, SQL, Qlikview
    (Stage)

Formations

  • Université Lyon 2 Lumiere

    Bron 2017 - 2018 Master 2 Data science

    Machine Learning
    Projet associé : "Prédiction de la classe minoritaire de le cas de jeux de données déséquilibrés"

    Deep Learning
    Projet associé : "Étude d'un article scientifique sur les Réseaux convolutifs"

    Big Data
    Projets associés : "Mise en place d'un système de calcul distribué dans le cas d'un problème big data", "Réalisation d'ETL et Data visualisation dans le cas d'un problème big
  • Université Lyon 1 Claude Bernard

    Villeurbanne 2016 - 2017 Master 2 SITN



    Master 2 S.I.T.N (statistiques, informatique et techniques numériques)

    Machine Learning
    Modèles de régression
    Analyse factorielle
    Développement informatique (Python)
    Plans d'expérience
    Analyses des valeurs extrêmes
    Statistique inférentielle
    Statistique non paramétrique
    Modèles probabilistes
    Outils mathématiques pour la modélisation
    Analyse appliquées des EDP

Réseau

Annuaire des membres :