PFIA 2024
Approche incrémentale pour la détection des textes de légendes dans des cartes numériques
Arthur Marzinkowski, Salem Benferhat, Anastasia Paparrizou, Cédric Piette
Cet article concerne la détection automatique des textes de légende dans les cartes. Après avoir extrait les textes des images, avec des outils OCR, nous utiliserons un processus itératif de regroupement (“clustering”) des textes extraits. Cinq critères principaux, avec différents niveaux d’importance, sont utilisés : l’alignement des textes, la distance entre les zones de texte, la couleur de fond des textes, la couleur des textes et la taille des caractères. Pour chacun des critères, des mesures de similarité appropriées sont définies. Nous proposons une méthode qui combinerait de manière hiérarchique les regroupements obtenus à partir de chaque critère. L’étude expérimentale révèle deux résultats important. Premièrement, l’utilisation de plusieurs critères donne des résultats supérieurs à ceux d’une simple distance (e.g., euclidienne) entre les zones de texte. Deuxièmement, cela confirme l’efficacité globale de la relation de priorité que nous avons intuitivement définie entre les critères pour détecter avec les textes de légende.