PFIA 2024

JIAF

Apprentissage par renforcement épistémique

Geoffrey Laforest, Olivier Buffet, Alexandre Niveau, Bruno Zanuttini

le  jeu, 11:30 ! En direct dans  A101 pendant  30min pour  JIAF-JFPDA - MAFTEC 2

Nous présentons une approche pour la planification (mono-agent) en environnement partiellement observable, dans laquelle les croyances courantes de l’agent sont représentées par les valeurs de “features épistémiques”, c’est-à-dire des atomes prenant leur valeur dans un ensemble d’états possibles, ou une distribution de probabilités. Notre objectif est de reformuler ainsi des problèmes partiellement observables (sur l’environnement) en des problèmes totalement observables (sur les croyances), tout en réduisant la dimensionnalité de l’espace des croyances. Ceci permet ainsi d’utiliser des algorithmes d’apprentissage par renforcement développés pour le cas totalement observable, mais permet aussi d’obtenir des politiques d’actions plus compactes et plus interprétables.

 Aperçu  Programme

Types de présentations
Invitation Présentation Ateliers Tutoriels Organisation Démonstration Poster Table ronde
Légende
Invitation Prix Article long Article court Positionnement Prospection Déjà publié Communication orale Poster Démonstration Partenaire Information Table ronde Multiple Repas Apéritif Café Promenade