Stratégies pour l'exploration de très grands ensembles d'images

Depuis plusieurs années, nous développons des méthodes d'analyse automatique d'images. En classification, étant donné un ensemble d'images triées par des experts, le but est de construire (par apprentissage automatique) un modèle qui permettra de prédire le type de nouvelles images. De manière générale, plus on dispose d'exemples d'images bien triées, plus il y a de chances que les modèles produisent de bonnes prédictions.

Avec l'avènement des technologies d'acquisition d'images (des appareils photos numériques aux microscopes à haut-débit) et du web, de très grands ensembles d'images sont disponibles mais la tâche préliminaire de tri manuel peut être infructueuse si elle n'est pas guidée et elle est fastidieuse car elle implique de regarder et trier des milliers d'images et/ou de très grandes images contenant des centaines de milliers d'objets.

Le but de ce travail est d'étudier, implémenter et évaluer différents algorithmes (p.ex. faisant appel à l'apprentissage non-supervisé et/ou à l'apprentissage actif) permettant de faciliter et accélerer le processus d'annotation manuelle partant de grands ensembles d'images non triées. L'étudiant pourra évaluer ses approches sur des dizaines de milliers d'images (notamment biomédicales) mises à sa disposition.

Profil:

Étudiant(e) ingénieur/(bio)informaticien(e) intéressé(e) par l'apprentissage automatique (voir le cours du Prof. Wehenkel), la vision par ordinateur, le développement de nouveaux algorithmes, le traitement de grands volumes de données, les applications biomédicales.

Bibliographie:
Renseignements: