Les Intelligences artificielles artistiques

De nos jours, les intelligences artificielles (IA) pullulent ! Il devient de plus en plus fréquent d’en croiser dans un grand nombre de secteurs d’activités. Alors qu’elles étaient réservées à une niche, aujourd’hui tout le monde peut se servir d’IA. Que ce soit dans un jeu vidéo pour incarner un ennemi, dans les échecs pour disposer d’un entraîneur virtuel ou sur Paint 3D pour détourer un objet en quelques secondes.

Aujourd’hui nous avons franchi un cap, puisque les IA de dessin sont enfin disponibles au grand public !

Qu’est-ce qu’une intelligence artificielle ?

Pour définir le concept (très large), citons le site internet de IBM :

« L’intelligence artificielle exploite les ordinateurs et les machines pour imiter les fonctions de résolution de problèmes et de prise de décision du cerveau humain. »

– IBM, entreprise spécialisée en informatique.

Pour simplifier, cela « consiste à apprendre à un programme à réagir à plusieurs situation ».

Pour illustrer cela, prenons l’exemple d’un flowchart (ou logigramme) :

Un flowchart, logigramme ou encore organigramme de programmation, représente un programme sur le papier. Le programme analyse la situation et réagit en fonction. En mathématiques, c’est ce qu’on appelle l’algorithmique : c’est ce qui prend en compte toutes les situations possibles, et donne pour chaque situation une réaction. En informatique, on appelle ça un programme. Prenons un exemple d’application : « mon tiroir est coincé ».
Le schéma suivi sera le suivant : Est-ce que ça bouge ? > non > ça devrait ? > Oui > Utilisez du WD-40 (huile pour charnières)

Les IA et plus généralement les programmes fonctionnent de la même manière. Si j’appuie sur la touche « a » en maintenant la majuscule, mon ordinateur écrira « A » en majuscule, car il réagit à une situation selon un programme.

Pour les IA artistiques, ça fonctionne toujours de la même manière. Pour faire un dessin, il suffit de donner une phrase, une consigne (un « prompt » en terme technique) à l’IA qui s’efforcera de dessiner ce que vous lui demandez. Pour ce faire, on a appris à l’IA ce qu’était un lapin et une chaise, on a lui a appris à détecter les mots dans une phrase et à les interpréter, mais aussi à associer des représentations graphiques de chaises et de lapins avec les mots « chaise » et « lapin ». La particularité de l’intelligence artificielle, c’est qu’elle apprend du résultat donné pour ensuite modifier son programme, et ainsi être de plus en plus performante.

Donc si on lui demande un lapin sur une chaise réaliste, le programme commencera par identifier les mots « lapin » « chaise » « réaliste » et interprétera le tout pour en composer une image  :

Quelles sont les Intelligences Artificielles Artistiques disponibles ?

Il y en a plusieurs, commençons par Midjourney.

C’est une IA complète utilisable via un robot ou « bot » sur l’application Discord. Vous invitez le bot sur Discord et vous disposez d’une vingtaine d’images gratuites (au delà, c’est sur abonnement). Si certains critiquent les résultats inégaux de cette IA, il est en réalité possible de progresser assez vite, pour le peu que l’on s’intéresse à son langage et à son fonctionnement. De plus, une fois que l’on a pris un abonnement (même le moins cher) on a accès à la bibliothèque commune « Community Showcase » qui permet de voire les images des autres et les mots qu’ils ont utilisés pour obtenir ces résultats. Ce qui, avouons-le, permet de progresser très rapidement.

Midjourney est une IA simple d’utilisation qui permet de tester gratuitement le service avant de prendre un abonnement de 10$ pour 200 images ce qui est conséquent pour un usage non professionnel. C’est un abonnement mensuel.

Le premier chat que j’ai fait

La bibliothèque

Un chat que j’ai fait récemment

« Dépression »

« Un village d’Halloween »

« Un alien fou en feu » fait par un ami

Voyons maintenant DALLE 2.

DALLE 2 est l’une des intelligences artificielles les plus poussées. En théorie, c’est l’IA la plus performante du marché. Elle a été longtemps en « bêta fermée » mais depuis très récemment elle est ouverte au public. Pour l’utiliser il suffit de se rendre sur leur site, de créer un compte « open AI » et vous disposerez, comme pour Midjourney, d’un nombre limité d’essais gratuits (une cinquantaine). L’autre avantage de DALLE 2 est son éditeur d’image qui vous permet de modifier vos images grâce à l’IA ! Mais il faut dire aussi que si Midjourney est fortement basé sur l’art, DALLE 2 est d’avantage basé sur le photo-réalisme.

Notons quand même que DALLE 2 m’a fait traverser « la vallée dérangeante », ce qui n’est jamais arrivé avec Midjourney, mais c’est généralement l’un des inconvénients de l’hyper réalisme.

💡 Note : La notion de « vallée de l’étrange » (Uncanny Valley), théorisée dans les années 1970 par le roboticien Masahiro Mori, désigne la sensation d’angoisse et de malaise atteinte quand un objet est trop ressemblant à l’Homme, sans l’être parfaitement ; que ce soit un robot, une prothèse ou une marionnette. Pour Frédérique de Vignemont, philosophe des sciences cognitives, « une des hypothèses est que le cerveau n’aime pas du tout l’incertitude. Ce robot qui vous ressemble un peu mais pas totalement envoie des informations contradictoires : vous percevez à la fois un humain et un non-humain. On sait que le cerveau […] cherche à trouver une solution à tout prix face à des informations contradictoires ». Un malaise naît alors de l’interprétation du cerveau : qui cherche à fuir devant l’incapacité à traiter l’information.
– « Petit détour par la vallée de l’étrange », Lydia Ben Ytzhak

Terminons avec Stable Diffusion, l’IA open-source.
Stable diffusion est performante, gratuite et sans aucun filtre de contenu (contrairement aux deux précédentes qui interdisent les contenus violents et/ou pornographique). Pourquoi tout le monde n’utilise pas stable diffusion, si elle est open-source ? Il y a plusieurs raisons à cela. Bien que l’IA soit disponible au public, elle s’adresse plutôt aux professionnels et nécessite d’être installée sur votre ordinateur. Non seulement vous aurez besoin d’une très bonne machine pour la faire tourner mais en plus il faut en partie la coder soit même (en PYTON). Nous n’avons malheureusement pas pu faire de test de cette IA. Mais pour vous consoler, sachez que Stable Diffusion étant libre de droit, elle a été intégrée au moins en partie à Midjourney. Si vous souhaitez l’essayer sur votre machine, il y a des tutoriels sur youtube pour vous apprendre à l’installer et à l’utiliser.

Après avoir exploré les solutions, faisons un test. Nous avons utilisé la même description pour deux IA : Dall E et Midjourney. Cette dernière reposant sur différentes commandes spécifiques pour fonctionner correctement, un premier test a été fait sans commande et un deuxième avec des commandes spécifiques.

La description est : « Un chat blanc et gris renifle un pissenlit dans une prairie verte. »
Traduit en anglais : « A white and grey cat sniffs a dandelion in a green meadow »

Midjourney sans commande

DALL E 2

Midjourney avec une commande supplémentaire

Le test permet de constater les différences de production des intelligences artificielles : Midjourney propose plutôt des représentations graphiques quand DALLE 2 oriente vers du photoréalisme. Il est possible d’exploiter encore plus les possibilités de chacune : nous vous invitons à faire vos propres essais pour expérimenter !

Les IA sont de plus en plus performantes et les premiers problèmes éthiques commencent déjà à se révéler dans la presse, notamment au niveau du droit d’utilisation des images créées.

Vous trouverez ci-dessous quelques liens très intéressants si vous souhaitez aller un peu plus loin sur le sujet.