Depuis 2003, la problématique générale mes recherches s'inscrit dans les domaines du traitement automatique des langues (TAL), de l'ingénierie des connaissances et de l'apprentissage artificiel. J'oriente actuellement ces travaux autour de la thématique du Big Data.
Depuis avril 2013, je suis chargé du développement d'outils d'analyse statistique de l'ensemble des requêtes saisies sur pagesjaunes.fr. Il s'agit d'étudier le comportement (web analyse) et le lexique (text mining) adoptés par ses utilisateurs en ayant l'objectif d'améliorer la pertinence du moteur de recherche.
Mes travaux sont détaillés sur mon site Web :
http://thomas.girault.fr
http://thomas.girault.free.fr/cv_thomas_girault.pdf
Compétences en informatique
- Programmation orientée objet : C++, Java, Python
- Big Data : Hadoop, Hive, Pig, Spark, Elastic Search
- Parallélisme et multithreading : Java et C Posix
- Web : Php, XML, HTML5/CSS, JavaScript, Node.js, Flex/ActionScript
- Bases de données : PostgreSQL, PL/PGSQL, PostGIS, MySQL
- Autres langages : Scala, Perl, Prolog, Haskell, Scheme, Lisp, Shell, Pure Data
- Divers : Programmation et visualisation scientifique (Numpy, Pandas, Scikit-learn, notions en Matlab et R)
- Creative coding : OpenFrameworks, Processing, Kinect, Blender, Arduino
- Administration et programmation système (Linux, Windows, Hackintosh)
Langues
- Anglais : bonne compréhension et communication à l'oral, expérience de l'écriture académique
- Notions élémentaires en allemand, japonais et indonésien
- Plus d’une quinzaine de séjours à l’étranger dont une année universitaire au Royaume Uni
Mes compétences :
Processing
JAVA
Python
C++
Postgresql
PHP
Text mining
Machine Learning
Traitement automatique des langues
Bases de données
Apprentissage automatique
Pig
Hive
Hadoop
OpenFrameworks
Elasticsearch
Apache Spark
Scala