PFIA 2024

CNIA RJCIA

Adaptation de Yolov8 pour la détection d’objets avec peu d’exemples

Guillaume Fourret, Christophe Fiorio, Gérard Subsol, Marc Chaumont

le  jeu, 10:20 ! En direct dans  Amphi Rivero pendant  15min pour  CNIA - Session 4

Les méthodes récentes d’apprentissage profond pour la détection d’objets obtiennent d’excellentes performances quand elles sont entrainées sur de grandes bases de données. Cependant, pour beaucoup d’objets spécifiques, aucun exemple n’est disponible sur les bases open-source d’Internet, et la constitution d’une base de données peut être compliquée. Les réseaux de neurones classiques ont encore beaucoup de mal à apprendre un nouvel objet avec peu d’exemples, et des méthodes sont donc apparues pour atténuer ce problème, ce qui a conduit au domaine du « Few-Shot Object Detection » (FSOD), divisé en deux paradigmes, le « meta-learning » et le « transfer learning ». Ils différent dans leurs stratégies de pré-entrainement où le meta-learning simule des apprentissages de nouveaux objets avec peu d’exemples, tandis que le transfer learning cherche à apprendre des représentations de bonne qualité sur beaucoup de données afin de pouvoir les transférer avec peu d’exemples. Ce dernier paradigme a démontré de meilleurs résultats ces dernières années, mais les architectures utilisées restent assez lourdes et ne sont pas aussi facilement utilisables pour du temps réel que des détecteurs de la famille des YOLO. Dans cet article, nous avons décidé d’adapter dans Yolov8 les deux modules présentés dans la méthode de transfer learning appelée DeFRCN. Premièrement, nous montrons comment nous avons intégré le « Gradient Decoupling Layer » (GDL) qui a pour but de découpler la localisation et la classification et ayant été conçu pour l’architecture en deux étapes du Faster R-CNN, dans l’architecture en une étape de Yolov8 en modifiant ses têtes de détection. Cette intégration est notamment possible grâce au changement d’architecture amené par Yolov8 étant un détecteur n’utilisant pas d’ancres précalculées. Deuxièmement, nous montrons comment le module « Prototypical Calibration Block » (PCB) peut être utilisé pour modifier les scores de classification pendant l’inférence de Yolov8. Nous analysons ensuite les gains que ces modules apportent comparé à la version vanilla de Yolov8 sur la base MSCOCO adaptée à l’évaluation des méthodes de FSOD. Enfin, nous parlons des biais que nous pensons qu’il existe dans les méthodes utilisant des extracteurs de caractéristiques pré-entrainés (comme les méthodes utilisant des prototypes en « few-shot classification »). De plus, nous parlons des biais qu’il existe dans la façon dont les méthodes sont actuellement évaluées (problème arrière-plan/premier-plan, et sur le suivi des performances du détecteur sur l’ensemble de validation).

Informations à venir.

 Aperçu  Programme

Types de présentations
Invitation Présentation Ateliers Tutoriels Organisation Démonstration Poster Table ronde
Légende
Invitation Prix Article long Article court Positionnement Prospection Déjà publié Communication orale Poster Démonstration Partenaire Information Table ronde Multiple Repas Apéritif Café Promenade