Comment mesurer l'intelligence de l'IA ?

Comment mesurer l'intelligence de l'IA ?

Le test de Turing

L'un des tests les plus tristement célèbres de l'intelligence artificielle reste le test de Turing, développé par Alan Turing, le père de l'informatique moderne, joué par Benedict Cumberbatch dans le film 'The Imitation Game' paru en 2014.

Ce test consiste à mettre un humain en confrontation verbale à l’aveugle avec un ordinateur et un autre humain.

Si la personne qui engage les conversations n’est pas capable de dire lequel de ses interlocuteurs est un ordinateur, on peut considérer que le logiciel de l’ordinateur a passé avec succès le test. Cela sous-entend que l’ordinateur et l’humain essaieront d’avoir une apparence sémantique humaine. ( Source Wikipedia)

L'année de la sortie du film, le test de Turing a été passé par un chatbot nommé Eugene Goostman, qui s'est fait passer pour un adolescent ukrainien conversant dans un anglais brouillon. La foule s'est déchaînée pendant une heure avant de se rendre compte que le robot, loin d'atteindre une intelligence humaine, était en fait assez bête.

La méthodologie de Turing a été critiquée pour avoir réduit l'IA au niveau d'un tour de magie - et pour avoir été beaucoup trop simpliste. Mais n'oublions pas que le test est un produit de son temps (créé en 1950).

Le test de Lovelace

Le test de Lovelace doit son nom à une femme représentant l'intersection entre la créativité et l'informatique. Ada Lovelace était la fille du poète romantique Lord Byron et a travaillé aux côtés de Charles Babbage sur son projet de moteur d'analyse, un projet condamné à l'échec au milieu du XIXe siècle.

Ada Lovelace a fait valoir qu'un robot devait transcender ses instructions préprogrammées, ou sortir du script, afin d'être considéré comme intelligent.

“Le moteur d'analyse n'a pas la prétention d'être à l'origine de quoi que ce soit. Il ne peut faire que ce qu'on lui ordonne de faire.”
Ada Lovelace

Le test Lovelace a été conçu en 2002 par une équipe d’informaticiens composée de David Ferucci, qui a ensuite développé la machine Watson d'IBM, lauréat du Jeopardy.

Ce test ne peut être passé que si la machine est capable de générer une idée originale sans que son créateur humain soit capable d'expliquer comment il l'a fait. Cela prouverait qu'il est capable de penser par lui-même, d'aller au-delà de son propre code.

Même s’il est utile, le test ne reconnaît pas que la création originale de l’intelligence artificielle n’était peut-être rien de plus qu’un coup de chance.

Une modification récente proposée par Mark Riedl, professeur à Georgia Tech - Lovelace 2.0 - introduit des contraintes aléatoires, telles que “créer une histoire dans laquelle un garçon tombe amoureux d'une fille, des extraterrestres enlèvent le garçon et la jeune fille sauve le monde avec l'aide d'un chat qui parle”. Dans ce test le "juge" est une personne qui ne participe pas à la programmation de l'IA.

L'intelligence artificielle doit créer par dessein, et non par hasard.

Sans surprise, Lovelace 2.0 est beaucoup plus délicat car il exige une compréhension de ce qui est demandé, et de la sémantique des données qui en sont tirées.

L'intelligence artificielle peut-elle correspondre à la réalité?

Un nombre croissant de chercheurs et d'universitaires travaillant dans le domaine de l'IA utilisent la créativité - la capacité de penser latéralement, d'établir des liens inhabituels et de produire un résultat original - comme indicateur d'intelligence. Il est intéressant de ne plus mesurer le succès d’une IA par ses compétences en calcul ou en mécanique.

Dans les industries créatives, l’utilisation de l’intelligence artificielle est de plus en plus omniprésente: l’IA peut créer des bandes-annonces, inventer des recettes originales ou encore peindre comme Rembrandt.

L'IA peut jouer un rôle de créatif ou, dans un contexte commercial, celui de bras droit du responsable marketing. Par exemple, chez Bynder nous utilisons l'intelligence artificielle pour améliorer notre fonctionnalité de recherche et s'occuper de l'étiquetage des images pour nos clients.

Bien que tout cela soit très impressionnant, il est difficile d'imaginer comment une IA pourrait réussir le test Lovelace 2.0 avec brio.

À ce jour, l'un des piliers de l'apprentissage automatique et de l'IA est le Réseau de neurone artificiel (ANN) de Google, qui est aujourd’hui imbattables dans certaines disciplines tels que le jeu de go ou encore le jeu de stratégie Starcraft

Même si ces progrès technique sont impressionnants nous sommes encore bien loin de faire correspondre un réseau de neurones artificiel à l'intelligence humaine.

L'ANN ne peut effectuer que des tâches qui sont d'abord "mathématisées" et codées. Des traits humains fondamentaux comme l'humour, l'empathie et la cognition sociale - se sont révélés résistants à la formalisation mathématique.

C'est pourquoi il est difficile d'enseigner à une machine la subjectivité culturelle et la sensibilité nécessaires pour écrire un article de journal de base.

Tester l'intelligence naturelle est déjà assez complexe ; l'IA étant une apparition récente, il nous faudra encore du temps pour en comprendre tous les fondements.

De tels tests peuvent ne pas être utiles pour les résultats qu'ils donnent mais ils servent à mettre le développement de l'IA en perspective et nous incitent à repenser les normes auxquelles nous tenons en matière d'intelligence artificielle.

Si le libre arbitre et l'individualité font partie intégrante de l'intelligence ou de la créativité, il est difficile de penser que des machines programmées par l'homme parviendront à faire la jonction.

Peut-être devrions-nous nous concentrer sur les applications plus concrètes de l'intelligence artificielle (comme Google Duplex), plutôt que sur la poursuite existentielle d'une machine aussi intelligente que nous, ou qui réplique notre façon de penser, de ressentir et de créer.

Le Digital Asset Management pour les nuls