Nicolas DUMINY soutient sa thèse de doctorat

Titre : Découverte et exploitation de la hiérarchie des tâches pour apprendre des séquences de politiques motrices par un robot stratégique et interactif

Mots-clés : Apprentissage robotique, intelligence artificielle, apprentissage par renforcement, curiosité artificielle, motivation intrinsèque, apprentissage multi-tâches, apprentissage interactif

Composition du jury :
Rapporteurs :

  •  Manuel LOPEZ, Enseignant-Chercheur, Institute for Systems and Robotics, Portugal
  •  François CHARPILLET, Directeur de Recherche, Inria Nancy

Examinateurs :

  •  Pierre DE LOOR, Professeur, ENIB, Centre Européen de Réalité Virtuelle, Brest
  •  Sylvie PESTY, Professeure, Université de Grenoble, IMAG

Encadrants de thèse :

  •  Dominique DUHAUT, Professeur, Université Bretagne Sud, Lab-STICC, directeur de thèse
  •  Sao Mai Nguyen, maîtresse de conférence, IMT Atlantique, co-encadrante


Résumé :
Il y a actuellement des efforts pour faire opérer des robots dans des environnements complexes, non bornées, évoluant en permanence, au milieu ou même en coopération avec des humains. Leurs tâches peuvent être de types variés, hiérarchiques, et peuvent subir des changements radicaux ou même être créées après le déploiement du robot. Ainsi, ces robots doivent être capable d'apprendre en continu de nouvelles compétences, dans un espace non-borné, stochastique et à haute dimensionnalité. Ce type d'environnement ne peut pas être explorer en totalité, le robot va devoir organiser son exploration et de décider ce qui est le plus important à apprendre ainsi que la méthode d'apprentissage. Ceci devient encore plus difficile lorsque le robot est face à des tâches à complexités variables, demandant soit une action simple ou une séquence d'actions pour être réalisées.
Nous avons développé une infrastructure algorithmique d'apprentissage stratégique intrinsèquement motivé, appelée Socially Guided Intrinsic Motivation for Sequences of Actions through Hierarchical Tasks (SGIM-SAHT), apprenant la relation entre ses actions et leurs conséquences sur l'environnement. Elle organise son apprentissage, en décidant activement sur quelle tâche se concentrer, et quelle stratégie employer entre autonomes et interactives. Afin d'apprendre des tâches hiérarchiques, une architecture algorithmique appelée procédures fur développée pour découvrir et exploiter la hiérarchie des tâches, afin de combiner des compétences en fonction des tâches. L'utilisation de séquences d'actions a permis à cette architecture d'apprentissage d'adapter la complexité de ses actions à celle de la tâche étudiée.

Soutenance le Mardi 18 décembre 2018 à 14 h En Grand Amphi de  IMT Atlantique, campus de Brest 655 avenue du technopole, 29280 plouzané

Publié le 18.12.2018

par Pascale MÉNARD

Témoignages associés
Energy Efficiency Manager chez STX France
Data Scientist chez Micropole
Doctorant en robotique au CEA
Département automatique, productique et informatiq…
Responsable R&D et innovation HENGEL Industrie
Responsable du département systèmes énergétiques e…
Responsable du département automatique, productiqu…