Adresse :
Monsieur Mohamed Khalil Jabri, du département informatique (INFO) et du laboratoire LabSTICC, présentera ses travaux de recherche sur le sujet :
"Vers une Meilleure Efficacité et Généralisation en Apprentissage par Imitation : une Perspective Causale"
Résumé : L'apprentissage par imitation, ou apprentissage à partir de démonstrations, est devenu une alternative pratique à l'apprentissage par renforcement en contournant les défis liés à la conception des fonctions de récompense, mais il reste limité par des problèmes d'efficacité en termes d'échantillons et de généralisation. La reconnaissance croissante du rôle de la causalité dans l'amélioration des approches d'apprentissage a conduit à des avancées récentes dans ce domaine. Cette thèse explore des méthodes inspirées par la causalité pour surmonter ces obstacles. D'abord, elle propose un cadre utilisant des modèles causaux structurels (SCMs) et des données contrefactuelles pour améliorer l'estimation des fonctions de récompense dans l'apprentissage par imitation conditionné sur des objectifs, avec moins de données. Ensuite, elle présente une méthode pour identifier des caractéristiques causales invariantes à travers divers environnements sans supervision de domaine, améliorant ainsi la capacité du modèle à être généralisé. Les résultats empiriques valident l'efficacité de ces approches basées sur la causalité, tout en offrant des perspectives plus larges sur l'intégration de ce concept dans les approches de prise de décision.
Organisateur(s)
Dans le cadre de la co-accréditation de thèse d’IMT Atlantique au sein de l'école doctorale SPIN en cotutelle avec The University of Adelaide
Mots-clés: Apprentissage par renforcement, Apprentissage par imitation, Causalité, Raisonnement contre-factuel, Apprentissage de représentation, Généralisation