Désambiguïsation de mots en contexte basée sur le PageRank

02/09/2022

Dans le cadre de mon M2 de recherche, je fais un stage de recherche autour de la désambiguïsation de sens de mots.

L’idée derrière mes travaux, c’est de s’affranchir des gros modèles de langues qui occupent les premières places dans les tâches de désambiguïsation en contexte (Word-in-context, SemEval 2021 – tâche 2) et d’utiliser une méthode faiblement supervisée. En l’occurrence, ma méthode repose sur l’algorithme de PageRank (personnalisé), initialement conçu par Google pour le classement des résultats à des requêtes dans les moteurs de recherche. L’algorithme de PageRank est utilisé pour quantifier la proximité entre deux mots, qui sera par la suite exploitée dans le contexte d’un mot pour désambiguïser ce dernier. Dans ce séminaire, je décris ma méthode, les résultats et les limitations.