Tâche 2 – Incrémentalité et interactions

Concevoir des mécanismes efficaces pour intégrer de façon incrémentale des contraintes d’expert tout en limitant les perturbations consécutives et en prenant en compte les incohérences potentielles entre elles (T2.1). Concevoir une méthode d’interaction active en proposant des mécanismes de sélection des informations/questions à soumettre à l’expert et d’optimisation des retours de celui-ci (T2.2).

Tâche 2.1 – Incrémentalité et contraintes

Les expériences ont montré que demander à l’expert de fournir a priori
toutes les contraintes nécessaires au processus de traitement des données n’est pas réaliste. Rendre incrémentales les méthodes de clustering sous contraintes permettrait à l’utilisateur d’injecter de nouvelles informations en fonction de l’avancée du processus. L’idée n’est pas de permettre d’alimenter le processus avec des nouvelles données mais lui permettre de prendre en compte de nouvelles contraintes fournies par l’expert. Cependant trouver les objets à labelliser ou des couples à contraindre n’est pas suffisant. Il est indispensable de tirer parti de toute nouvelle information, car si l’expert ne voit pas rapidement l’amélioration de la solution grâce à son aide, il perdra rapidement confiance dans le système. Enfin, il est préférable que tout nouveau résultat ne nécessite pas un effort cognitif important de la part de l’expert, du fait de la perturbation consécutive à cette information (le nouveau résultat ne devra pas trop s’éloigner du précédent) au risque de dérouter l’expert.

Tâche 2.2 – Apprentissage actif

Collecter des informations pertinentes, c’est-à-dire apportant un maximum
d’information cohérente avec un minimum d’implication chronophage de l’expert, est un problème crucial.
Sans mécanisme efficace, la méthode multiparadigme ne pourra séduire les utilisateurs potentiels. Nous proposerons une méthode qui, à l’instar de l’apprentissage actif supervisé, consistera à proposer à la validation de l’expert des informations potentiellement pertinentes générées à partir du résultat courant.