Skip to main content

Décoder les sons : de nouvelles technologies permettent d’« écouter » les pensées des machines

24 juillet 2024
|

Trois hommes, Francesco Paissan, Cem Subakan et Mirco Ravanelli, sont représentés côte à côte dans une image combinée. Francesco Paissan, Cem Subakan et Mirco Ravanelli

Chaque fois que vous parlez à votre téléphone intelligent ou qu’un assistant vocal reconnaît correctement une commande, une technologie complexe est à l’œuvre. Comprendre cette technologie n’est pas seulement une question de commodité, mais aussi de confiance et de transparence.

Pour relever le défi que représente l’interprétation de la manière dont les machines traitent les sons, des chercheurs ont mis au point une nouvelle méthode appelée Listenable Maps for Audio Classifiers (L-MAC), qui simplifie les décisions des machines en nous permettant de les écouter.

La méthode L-MAC recourt à une technique spéciale qui met en évidence les éléments sonores cruciaux influant sur le processus de prise de décision des machines. Elle permet à tout un chacun de comprendre par l’écoute pourquoi une machine effectue un choix particulier, ce qui favorise une transparence et une confiance accrues dans les systèmes automatisés.

La méthode est le fruit d’une équipe comprenant :

  • Francesco Paissan, auteur principal, chercheur à la Fondazione Bruno Kessler et chercheur invité à l’institut Mila;
  • Cem Subakan, de l’Université Laval et de l’institut Mila, également professeur adjoint affilié au Département d’informatique et de génie logiciel de l’École de génie et d’informatique Gina-Cody de l’Université Concordia;
  • Mirco Ravanelli, professeur adjoint au Département d’informatique et de génie logiciel de l’École de génie et d’informatique Gina-Cody de l’Université Concordia.

« L-MAC nous aide à comprendre les décisions prises par des réseaux neuronaux complexes et “à boîte noire” en fournissant un signal explicatif que tout le monde peut saisir simplement en écoutant », explique le Pr Ravanelli.

Des comparaisons avec des techniques antérieures montrent que la méthode L-MAC fournit des explications plus claires sur les décisions des machines, ce qui démontre son efficacité dans le cadre d’une analyse détaillée côte à côte.

Une étude portant sur des utilisateurs réels interagissant avec le système pour en évaluer le rendement et la convivialité a par ailleurs montré que les personnes participantes trouvaient les explications audio de L-MAC plus intuitives et accessibles que celles des méthodes classiques.

Le travail des chercheurs a été présenté à Vienne, en Autriche, lors d’une séance tenue à la 41e International Conference on Machine Learning (ICML), un prestigieux événement où seulement 1,5 % des soumissions sont sélectionnées aux fins de présentation orale.

Pour en savoir plus et entendre les sons qui influent sur les décisions des machines, lisez l’article complet dans Proceedings of the 41st International Conference on Machine Learning et consultez le site web de Francesco Paissan. Le code de la technique proposée a également été mis à la disposition du public dans la boîte à outils d’intelligence artificielle conversationnelle SpeechBrain, offerte en libre accès.

Apprenez-en davantage sur le Département d’informatique et de génie logiciel de l’École de génie et d’informatique Gina-Cody.



Retour en haut de page

© Université Concordia