Les programmes de reconnaissance des images présents actuellement sur le marché sont susceptibles d’identifier, nommer et catégoriser les objets figurant dans une image, mais ne peuvent pas aller plus loin.
Dans ce contexte, les développeurs de Google ont pu mettre au point en collaboration avec l’université de Stanford un algorithme auto-apprenant qui serait en mesure de transformer les images en mots moyennant des descriptions et des légendes.
Cette intelligence artificielle se base sur deux réseaux neuronaux complémentaires ; le premier est chargé d’analyser et identifier les objets sur la photo pendant que le second construit le contexte et inscrit une description de celle-ci.
Bien que cet algorithme soit très intéressant aussi bien pour les personnes malvoyantes que pour le référencement des médias indexés par Google, il n’en demeure pas moins sans failles. En effet il a besoin de certains perfectionnements lui permettant d’affiner l’interprétation des images et vidéos.