PFIA 2024
Généralisation et réseaux de neurones profonds - le cas du TAL et de la RI (conférence invitée)
Les réseaux de neurones profonds, comme les modèles de langue pré-entraînés sur de grandes collections textuelles, représentent à l’heure actuelle le paradigme dominant en traitement automatique des langues (TAL) et en recherche d’information (RI). Ceci étant, il y a toujours de nombreuses questions quant à leur performance et à leur fonctionnement. En particulier, s’ils ont conduit à des améliorations significatives dans presque toutes les tâches de TAL et de RI, plusieurs études ont mis en avant leurs limites en termes de généralisation, liées à leur difficulté à traiter correctement de nouvelles collections ou de nouvelles tâches. Nous étudierons ces limites dans notre présentation et discuterons les pistes envisagées pour les dépasser.