Une équipe de recherche de l’École Gina-Cody dévoile une nouvelle approche de l’IA pour repérer des tendances cachées

La recherche sur des ensembles de données complexes, comme des dossiers médicaux ou des capteurs pour voiture autonome, pourrait révéler une foule de renseignements cachés dans des tendances dont on ne soupçonnerait jamais l’existence. Pour nombre de spécialistes de l’IA, il est difficile de parvenir à cette « illumination », car la plupart des outils d’agrégation reposent sur des configurations rigides ou des hypothèses.
Une équipe de l’École de génie et d’informatique Gina-Cody de l’Université Concordia vise à résoudre ce problème avec une méthode simplifiée nommée Gauging-δ, maintenant publiée dans la revue IEEE Transactions on Pattern Analysis and Machine Intelligence, une publication de premier plan dans le domaine de l’intelligence artificielle.
Plutôt que de forcer les données à entrer dans des catégories prédéfinies, la méthode les invite à guider elles-mêmes le processus de regroupement dès le départ. Chaque point de données constitue d’abord son propre groupe; l’algorithme vérifie ensuite systématiquement si deux groupes sont véritablement compatibles avant de les fusionner. Cette technique évite de supposer le nombre de groupes susceptibles d’apparaître, tout en s’adaptant naturellement aux données qui sont soit nettement séparées ou confusément entrelacées.
Il s’agit d’une approche défendue par une étudiante au doctorat, Jinli Yao, qui a collaboré avec Jie Pan – boursier postdoctoral à l’Université Concordia pendant l’étude et maintenant à l’Université de Calgary – et le chercheur principal, Yong Zeng. L’équipe a testé sa nouvelle méthode sur plus d’une centaine d’ensembles de données pour la première fois, couvrant à la fois des situations artificielles et des exemples du monde réel.
« Nous voulions que l’algorithme s’adapte aux données, explique M. Zeng, responsable du Centre de design et d’entrepreneuriat de Concordia. Lorsque l’on impose trop de règles dès le départ, on risque de passer à côté de liens subtils. Notre méthode aide à trouver ces relations cachées qu’on ne savait même pas qu’il fallait chercher. »
Comme elle ne nécessite pas d’ajustement poussé ou d’hypothèses strictes, la méthode pourrait offrir aux équipes d’IA très occupées une voie plus directe vers des découvertes précieuses. Outre les applications dans le domaine des soins de santé et des voitures autonomes, la méthode pourrait bien repousser les limites de la recherche de nouveaux concepts dans tout domaine caractérisé par des ensembles de données vastes et variés, révélant des schémas que les techniques habituelles tendent à ne pas repérer.