Laurent Candillier
Data Scientist
Français né en 1978
lcandillier@hotmail.com

         

Présentation rapide

Cursus général

Travaux de recherche

La problématique générale de l'ensemble des travaux de recherche que j'ai menés s'inscrit dans le cadre de l'Apprentissage Automatique, ou Machine Learning, qui constitue la thématique centrale du laboratoire GRAppA de l'Université de Lille dans lequel j'ai démarré en stage de Master 2. Le sujet connexe de la Fouille de Données, ou Data Mining, a été au centre des recherches menées au cours de ma thèse de doctorat en collaboration avec la société Pertinence à Paris. Je me suis ensuite expertisé dans le domaine des Systèmes de Recommandations au sein de l'équipe Profiling and Data Mining en post-doctorat à Orange Labs. Puis mes intérêts de recherche se sont élargis aux domaines de la Recherche d'Information et du Traitement Automatique des Langues en tant que responsable de l'équipe R&D de Nomao à Toulouse. En tant qu'expert scientifique et technique dans ces différents domaines de recherche, j'accompagne maintenant les Jeunes Entreprises Innovantes dans l'élaboration de leurs projets de R&D et l'étude et développement de leurs algorithmes intelligents.

Le rapport n°25 présente mes premiers travaux de recherche en stage de Master, portant sur l'apprentissage automatique de profils de lecteurs et relevant principalement du domaine du Filtrage Collaboratif. Nous avons démontré l'intérêt d'une telle approche dans le cadre du ciblage de contenus sur des sites d'informations en ligne. Cette étude a ensuite été poursuivie en thèse, et nous avons alors constaté l'intérêt de combiner le Filtrage Collaboratif avec la méthode complémentaire du profilage basé sur le contenu. Malheureusement, suite à un problème interne à la société Rosebud, cette recherche a été interrompue.

Mes travaux se sont alors dirigés vers le domaine du Clustering. Au sein de la société Pertinence, nous avons cherché une méthode de regroupement des données qui soit compréhensible par les utilisateurs. Notre première contribution, nommée Tuareg et publiée sous le n°23, s'est pour cela inspirée des arbres de décision en apprentissage supervisé, en les adaptant au cas du non supervisé. Cependant, comme fractionner l'ensemble des données en considérant les attributs indépendamment les uns des autres n'est parfois pas suffisant, nous avons proposé une autre méthode appelée SSC, basée sur l'utilisation de modèles statistiques et publiée sous les n°9 et 22. Puis celle-ci a été adaptée au cas des données présentées sous forme d'arbres, des expérimentations à grande échelle, présentées dans les publications n°4 et 12, ayant démontré sa robustesse face aux données bruitées, et l'efficacité de notre méthode de présentation compréhensible des résultats. Enfin, nous avons étendu la méthode, alors appelée SuSE et présentée dans l'article n°20, pour ajouter une phase de sélection rigide des attributs les plus pertinents pendant l'apprentissage. Finalement, nous nous sommes attaqué à la problématique ouverte importante de l'évaluation des algorithmes de Clustering. La nouvelle méthode que nous avons proposée, appelée évaluation en cascade (publications n°8, 11 et 21), permet d'établir l'intérêt du Clustering de manière plus objective que les méthodes existantes. Ces travaux ont donné lieu à une thèse intitulée Contextualisation, Visualisation et Évaluation en Apprentissage Non Supervisé, soutenue le 15 septembre 2006 à l'Université de Lille, et publiée sous le rapport technique n°24.

J'ai ensuite effectué un post-doctorat à Orange Labs sur les Systèmes de Recommandations. Nos travaux initiaux ont porté sur l'étude de l'état de l'art et l'expérimentation des méthodes principales de Filtrage Collaboratif, et ont mené à la publication n°7. La publication suivante n°6 met quant à elle en avant l'intérêt de développer des mesures de similarité spécifiques pour le cadre de données creuses comme celles qui sont gérées en Filtrage Collaboratif. Enfin la publication n°3 offre un tour d'horizon large du sujet, abordant également l'importante problématique des interactions des systèmes avec les utilisateurs (publication n°19). Ces travaux ont débouché sur la livraison d'un moteur générique très performant.

Nommé ensuite responsable de la Recherche & Développement chez Nomao, mes centres d'intérêt se sont élargis aux thématiques de la Recherche d'Information et du Traitement Automatique des Langues. La publication n°18 fournit un tour d'horizon des problématiques scientifiques qui régissent le développement de Nomao. Les publications n°1, 15 et 16 abordent ensuite plus précisément nos travaux menés en Recommandation et Recherche d'Information, Apprentissage Automatique et Traitement Automatique des Langues. D'importants travaux ont été menés en extraction automatique de tonalité des commentaires récupérés sur le web. En collaboration avec l'Institut de Recherche en Informatique de Toulouse, nous avons mené une recherche de thèse sur le thème du Learning-to-rank dans le cadre de la géolocalisation et de la personnalisation (publication n°17), et une autre sur le thème de la Détection des Mouvements d'Information. Cette deuxième étude, menée avec Overblog, nous a conduit à nous pencher sur la problématique complexe de la recherche de diversité dans les Systèmes de Recommandations (publications n°2, 5 et 14). En collaboration avec Orange Labs, nous avons également organisé un atelier et un challenge au sein de la conférence internationale ECML-PKDD 2012: ALRA: Active Learning in Real-world Applications (publication n°10).

En tant qu'expert scientifique et technique agréé par le Ministère de l'Enseignement Supérieur et de la Recherche au titre du Crédit Impôt Recherche (CIR), j'accompagne maintenant des Jeunes Entreprises Innovantes (JEI) comme TokTokTok, France Consultants, Target2Sell, Charly.io, SonetIN, Refactor, Overblog ou Ebuzzing - Teads dans l'élaboration de leurs projets de R&D et l'étude et développement de leurs algorithmes intelligents. Dans le cadre de nos travaux avec TokTokTok, nous avons publié l'article n°13 qui traite de l'interaction entre les systèmes de Recherche d'Information et le Traitement Automatique des Langues.

Publications

    Journaux: 4

  1. [2014] Systèmes de recommandation et Recherche d'Information
    Laurent Candillier, Étienne Chai, Estelle Delpech
    In Ghislaine Chartron, Imad Saleh, Gérald Kembellec, éditeurs
    Les systèmes de recommandation -- Hermès Sciences, collection information, hypermédias et communication
    [ PDF ] [ BibTeX ]

  2. [2012] Multiple similarities for diversity in recommender systems
    Laurent Candillier, Max Chevalier, Damien Dudognon, Josiane Mothe
    In International Journal on Advances in Intelligent Systems, Volume 5, Number 3 & 4
    [ PDF ] [ BibTeX ]

  3. [2009] State-of-the-Art Recommender Systems
    Laurent Candillier, Kris Jack, Françoise Fessant, Frank Meyer
    In Collaborative and Social Information Retrieval and Access: Techniques for Improved User Modeling, Chapter 1
    [ PDF ] [ BibTeX ]

  4. [2007] Mining XML Documents
    L. Candillier, L. Denoyer, P. Gallinari, M.C. Rousset, A. Termier, A.M. Vercoustre
    In Data Mining Patterns: new Methods and Applications, Chapter 8
    [ PDF ] [ BibTeX ]

    Conférences internationales: 5

  5. [2011] Diversity in Recommender Systems: Bridging the gap between users and systems
    Laurent Candillier, Max Chevalier, Damien Dudognon, Josiane Mothe
    4th International Conference on Advances in Human-oriented and Personalized Mechanisms, Technologies and Services
    CENTRIC'2011, Barcelona, Spain, 23-29 october 2011
    [ PDF ] [ BibTeX ] [ Best Paper ]

  6. [2008] Designing Specific Weighted Similarity Measures to Improve Collaborative Filtering Systems
    Laurent Candillier, Frank Meyer, Françoise Fessant
    In Petra Perner, editor
    8th Industrial Conference on Data Mining
    ICDM'2008, Leipzig, Germany, 16-18 july 2008
    Lecture Notes in Computer Science, LNAI 5077, pages 242-255
    [ PDF ] [ Slides ] [ BibTeX ]

  7. [2007] Comparing state-of-the-art collaborative filtering systems
    Laurent Candillier, Frank Meyer, Marc Boullé
    In Petra Perner, editor
    5th International Conference on Machine Learning and Data Mining in Pattern Recognition
    MLDM'2007, Leipzig, Germany, 18-20 july 2007
    Lecture Notes in Computer Science, LNAI 4571, pages 548-562
    [ PDF ] [ Slides ] [ BibTeX ]

  8. [2006] Cascade Evaluation of Clustering Algorithms
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    In Johannes Furnkranz, Tobias Scheffer and Myra Spiliopoulou, editors
    17th European Conference on Machine Learning
    ECML'2006, Berlin, Germany, 18-22 september 2006
    Lecture Notes in Computer Science, LNAI 4212, pages 574-581
    [ PDF ] [ Poster ] [ BibTex ]

  9. [2005] SSC: Statistical Subspace Clustering
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    In Petra Perner and Atsushi Imiya, editors
    4th International Conference on Machine Learning and Data Mining in Pattern Recognition
    MLDM'2005, Leipzig, Germany, 9-11 july 2005
    Lecture Notes in Computer Science, LNAI 3587, pages 100-109
    [ PDF ] [ Slides ] [ BibTeX ]

    Ateliers internationaux: 3

  10. [2012] Design and Analysis of the Nomao Challenge - Active Learning in the Real-World
    Laurent Candillier, Vincent Lemaire
    Workshop on Active Learning in Real-world Applications
    ECML-PKDD'2012, Bristol, UK, 28 september 2012
    [ PDF ] [ Slides ] [ BibTeX ]

  11. [2005] Cascade Evaluation of Clustering Algorithms
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    Workshop on Theoretical Foundations of Clustering
    NIPS'2005, Vancouver, Canada, 5-10 december 2005
    [ PDF ] [ Slides ] [ BibTeX ]

  12. [2005] Transforming XML trees for efficient classification and clustering
    Laurent Candillier, Isabelle Tellier, Fabien Torre
    Workshop on Mining XML documents
    INEX'2005, Schloss Dagstuhl, Wadern, Germany, 28-30 november 2005
    [ PDF ] [ Slides ] [ BibTeX ] [ Results ]

    Conférences françaises: 11

  13. [2016] RI-TAL: le TAL au service de la RI
    Laurent Candillier, Julien Hénot
    13ème Conférence en Recherche d'Information et Applications
    CORIA'2016, Toulouse, 9-11 march 2016
    [ PDF ] [ Slides ] [ BibTex ]

  14. [2013] Diversité de recommandations: application à une plateforme de blogs et évaluation
    Laurent Candillier, Max Chevalier, Damien Dudognon, Josiane Mothe
    10ème Conférence en Recherche d'Information et Applications
    CORIA'2013, Neuchâtel, 3-5 avril 2013
    [ PDF ] [ BibTex ]

  15. [2013] Identification de compatibilités entre descripteurs de lieux et apprentissage automatique
    Estelle Delpech, Laurent Candillier, Léa Laporte, Samuel Phan
    13ème Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances
    EGC'2013, Toulouse, 29-31 janvier 2013
    Revue des Nouvelles Technologies de l'Information (RNTI), pages 311-316
    [ PDF ] [ BibTex ]

  16. [2012] Nomao: un moteur de recherche géolocalisé spécialisé dans la recommandation de lieux et l'e-réputation
    Estelle Delpech, Laurent Candillier
    19ème conférence sur le Traitement Automatique des Langues Naturelles
    TALN'2012, Grenoble, 4-8 juin 2012
    [ PDF ] [ BibTeX ]

  17. [2012] Évaluation de la pertinence dans les moteurs de recherche géoréférencés
    Léa Laporte, Laurent Candillier, Sébastien Déjean, Josiane Mothe
    Informatique des Organisations et Systèmes d'Information et de Décision
    INFORSID'2012, Montpellier, 29-31 mai 2012
    [ PDF ] [ BibTeX ]

  18. [2011] Nomao: la recherche géolocalisée personnalisée
    Laurent Candillier
    In Djamel A. Zighed and Gilles Venturini, editors
    11ème Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances
    EGC'2011, Brest, 25-28 janvier 2011
    Revue des Nouvelles Technologies de l'Information (RNTI), volume 1, pages 259-261
    [ PDF ] [ Slides ] [ BibTeX ]

  19. [2008] Investigating the Effects of The Types of Feedback in Recommendation Systems
    Kris Jack, Liv Lefebvre, ACK. Laurent Candillier, Frank Meyer
    Conférence sur l'Interaction Homme-Machine
    IHM'2008, Metz, 2-5 septembre 2008
    [ PDF ]

  20. [2006] SuSE: Subspace Selection embedded in an EM algorithm
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    In Laurent Miclet, editor, pages 331-345
    8ème Conférence francophone sur l'Apprentissage automatique
    CAp'2006, Trégastel, 22-24 mai 2006
    [ PDF ] [ Slides ] [ BibTeX ]

  21. [2006] Évaluation en cascade d'algorithmes de clustering
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    In Laurent Miclet, editor, pages 109-124
    8ème Conférence francophone sur l'Apprentissage automatique
    CAp'2006, Trégastel, 22-24 mai 2006
    [ PDF ] [ Slides ] [ BibTeX ]

  22. [2005] SSC: Statistical Subspace Clustering
    Laurent Candillier, Isabelle Tellier, Fabien Torre, Olivier Bousquet
    In Suzanne Pinson and Nicole Vincent, editors
    5èmes journées francophones d'Extraction et Gestion des Connaissances
    EGC'2005, Paris, 19-21 janvier 2005
    Revue des Nouvelles Technologies de l'Information (RNTI), volume 1, pages 177-182
    [ PDF ] [ Slides ] [ BibTeX ]

  23. [2004] Tuareg: Classification non supervisée contextualisée
    Laurent Candillier, Isabelle Tellier, Fabien Torre
    In Michel Liquière and Marc Sebban, editors, pages 159-174
    6ème Conférence francophone sur l'Apprentissage automatique
    CAp'2004, Montpellier, 14-16 juin 2004
    [ PDF.fr ] [ PDF.eng ] [ Slides ] [ BibTeX ]

    Rapports Techniques: 2

  24. [2006] Contextualisation, Visualisation et Évaluation en Apprentissage Non Supervisé
    Laurent Candillier
    PhD thesis, Université Charles de Gaulle de Lille 3, September 2006
    [ PDF ] [ Slides ] [ BibTeX ] [ Rapports ]

  25. [2001] Apprentissage Automatique de Profils de Lecteurs
    Laurent Candillier, Isabelle Tellier, Fabien Torre
    Rapport technique GRAppA 2001
    [ PDF ] [ BibTeX ]

Enseignement universitaire

Compétences en informatique

Langues parlées

Autre expérience professionnelle

Vie associative

Loisirs

Référencements

- -