Skip to main content

Amélioration des images sous-marines : des chercheurs de l’École de génie et d’informatique Gina-Cody mettent au point une technique d’IA avancée

29 mai 2024
|

Comparaison côte à côte de deux images de poissons : l'image de gauche montre un poisson avec des teintes ternes bleu-vert, tandis que l'image de droite montre le même poisson avec des couleurs vives restaurées en jaune et noir, démontrant la capacité de l'IA à améliorer la clarté et la couleur des images sous-marines. La nouvelle IA restaure des couleurs vives aux images sous-marines, transformant l'originale à gauche en l'image à droite. (Source : IEEE Transactions on Broadcasting)
M. Omair Ahmad

Imaginez plonger dans l’océan et prendre des photographies de la vie marine d’une clarté stupéfiante, ou diffuser des explorations sous-marines assorties d’images vives et de haute qualité.

Une nouvelle étude, parue dans IEEE Transactions on Broadcasting, présente une approche novatrice pour améliorer les images sous-marines.

L’étude a été menée par le doctorant Alireza Esmaeilzehi (aujourd’hui boursier postdoctoral à l’Université de Toronto) et le chercheur invité Yang Ou (actuellement à l’Université de Chengdu), sous la supervision des professeurs M. Omair Ahmad et M.N.S. Swamy, tous deux du Département de génie électrique et informatique de l’École de génie et d’informatique Gina-Cody.

La méthode de l’équipe s’appuie sur l’apprentissage profond, un type d’intelligence artificielle (IA) qui recourt à des réseaux neuronaux pour imiter la capacité du cerveau humain d’apprendre à partir de données.

La méthode intègre des informations provenant de diverses sources, notamment des cartes de transmission sous-marine, qui permettent de comprendre comment la lumière se propage dans l’eau, et des techniques d’estimation de la lumière atmosphérique, qui permettent d’évaluer les conditions de luminosité. Cette combinaison crée un riche ensemble de caractéristiques qui renforce la capacité de l’IA d’améliorer la qualité des images.

M.N.S. Swamy

Les chercheurs ont utilisé un processus de formation en trois étapes pour leur modèle d’apprentissage profond :

  1. Apprentissage supervisé – l’IA est entraînée à l’aide de données étiquetées, où chaque image est associée à une référence de haute qualité, ce qui apprend au modèle à reconnaître et à améliorer les images de mauvaise qualité;
  2. Apprentissage antagoniste – à ce stade, l’IA est affinée à l’aide d’une technique appelée « réseaux antagonistes génératifs ». Le modèle apprend à faire la distinction entre les images réelles et les images truquées, ce qui améliore sa capacité de générer des textures et des structures réalistes;
  3. Formation combinée – enfin, le modèle combine les connaissances acquises au cours des deux premières étapes, en optimisant son rendement pour produire les meilleures images améliorées possibles.

En testant leur méthode sur différents ensembles de données de référence, les chercheurs ont obtenu des résultats remarquables. Non seulement la nouvelle technique a-t-elle permis d’améliorer considérablement la qualité des images, mais elle l’a fait avec un nombre relativement faible de paramètres (2,98 millions), ce qui la rend plus efficace et moins exigeante en ressources que d’autres méthodes de pointe qui nécessitent souvent des dizaines, voire des centaines de millions de paramètres.

Cette recherche pourrait avoir des applications pratiques dans des domaines tels que la biologie marine, où des images claires sont essentielles pour étudier la vie marine, et la radiodiffusion, où des séquences sous-marines de haute qualité peuvent enrichir les documentaires.

Apprenez-en davantage sur le Département de génie électrique et informatique de l’École de génie et d’informatique Gina-Cody.



Retour en haut de page

© Université Concordia