397) DALL-E2 : fascinant, mais pas encore au point.

 Article modifié le 02-08-2024

Sculpture en bronze style Art Déco,
image DALL-E2 d’après une photo d’Eric Itschert,
libre de tous droits.


« DALL-E2 est un système d'intelligence artificielle capable de créer des images et des œuvres d'art réalistes », c’est ce qu’on peut lire sur leur portail d’entrée.
Vu les progrès ahurissants de l'intelligence artificielle, cet série d'articles est dépassée. Pourtant j'ai voulu la garder dans son entièreté, pour illustrer les débuts de mon utilisation de l'IA.

1. Une intelligence artificielle.


Pour simplifier, j’utiliserai l’abréviation IA communément admise pour signifier « intelligence artificielle » (1). Ce qui m’intéresse plus particulièrement, ce sont les générateurs d’images par IA. Il s'agit donc d'intelligence artificielle générative. Je voulais m’en faire une idée par moi-même après le déluge d’articles et de mythes écrits sur la question.

Les six générateurs les plus connus d’images par IA sont Midjourney, DALL-E2, Craiyon, Bing Image Creator, Text to Image de Canva et Night Cafe.

J’ai choisi d’essayer DALL-E2. Cela ne m’intéresse pas trop de générer des images à partir de requêtes textuelles, même si j’ai essayé : où est l’originalité de l’artiste s’il passe la main à l’IA ? Bien sûr qu'il rédige un texte, en cela il est créatif. Mais c’est l’IA qui met en image (2), ce n’est plus l’artiste. L’artiste devient un scénariste, au pire un simple commanditaire d'images. Bien sûr, dans certains cas l’artiste peut ensuite retravailler sur l’image fournie par l’IA et la modifier, mais l’image initiale n’est pas de lui. Dans l’état actuel des choses, l’artiste ne peut pas réclamer de droits d’auteur sur ces images s'il ne les retravaille pas significativement. Et croire que grâce à l'IA tout le monde pourrait devenir artiste, c'est une vaste fumisterie. 

Cela m’intéresse beaucoup plus de créer différentes variantes d’une image réalisée par moi au départ. Cela augmente ma créativité et je reste maître de l’œuvre même si je me fais assister. DALL-E2 permet cela, c’est pour cette raison que j’ai choisi cette option.



2. Premières expériences.


Pour les images générées par requêtes textuelles, je considère qu’elles ne m’appartiennent pas et j’ai gardé la signature de DALL-E2 (cinq petits carrés de couleur alignés à l’angle droit en bas). Concernant les images-variantes sur des images à moi, j’ai co-signé en mentionnant toutefois DALL-E2. Le gros du travail c’est moi qui l’ai réalisé, j’en reparlerai plus tard. Ces images m’appartiennent, avec IA ou sans. Enfin concernant les images dans lesquelles DALL-E2 est intervenue en cours de création, mais qui ont été totalement retravaillées ensuite, il n’y a plus de raisons de mentionner l’IA, quand j’utilise Photoshop pour réaliser des maquettes de projets je ne le mentionne pas non plus. Ce sont des outils.

Le dialogue avec l’IA est une fiction, il n’est que le produit de mon imagination. Seules les images sont « réelles », et un avertissement surréaliste de l’IA aussi.

2. 1. Requêtes textuelles.


Moi :

- Bonjour IA, je vais te donner un nouveau nom car IA DALL-E2 c’est un peu trop long et abstrait pour moi. Disons… Génie, ça te va ? Tu sais, du genre à sortir d’une lampe, sauf qu’ici c’est d’un ordinateur que tu sors ?

IA :

- Si cela peut te faire plaisir, c’est bon pour moi.

Moi :

- On va commencer par une requête textuelle. J’ai une image bien précise en tête, voyons ce que tu sais faire.

Génie :

- C’est un examen ?

Moi :

- Ben oui, contrairement à ce qu’on raconte sur la gratuité d’un premier essai, j’ai dû acheter des crédits et je veux voir si j’ai stupidement perdu mon argent ! Je suis de nature curieuse. Voici ma requête : « Stèle avec Horus enfant vu de face, marchant sur deux crocodiles et tenant de chaque main deux scorpions. »

Génie :


Moi :

-Mais tu n’as aucune culture ou quoi ? Tu ne m’as pas fait deux crocodiles, mais une espèce de dinosaure à pattes de criquet. Tes scorpions ressemblent à des scarabées à tête et bras humains. Quant à Horus, il s’est transformé en Shiva à seins de femme. Et le tout ressemble à de la pâte à modeler ! C’est à ceci que je pensais :



Bon, essayons plus simple. Peut-être que tu comprendras mieux en anglais. « Colored photo of egyptian god Horus » (photo en couleurs du dieu égyptien Horus).

Génie :



Moi :

- Ah, c’est beaucoup mieux. Sauf que ton premier Horus semble être fait de plastique ! Déjà que tu as représenté un Shiva avec des seins de femme, maintenant tu représentes un faucon en plastique ! Espèce de crypto-anarchiste ! Tu ne crois vraiment en rien ? Ta seconde image est meilleure : on dirait une statue en cuivre…
Passons aux choses sérieuses. Autrefois j’ai réalisé une aquarelle bizarre. Je ne te la montre pas, je te donne juste un intitulé : « Watercolor of an Egyptian statue of a black cat seated and seen in profile, with in the background a floating charcoal stick drawing lines on a paper, and in the foreground three floating lilies. » (aquarelle d'une statue égyptienne d'un chat noir assis et vu de profil, avec à l'arrière-plan un bâton de fusain flottant dessinant des lignes sur une feuille de papier, et à l'avant-plan trois fleurs de lys flottantes).

Génie :





Moi : 

- Mais tu triches ! Sur la première image on ne voit que la tête du chat ! Tu me fais le coup de la cage au mouton dans « Le Petit Prince »? Et sur la deuxième image tu as oublié mon fusain traçant des lignes ! Sur cette seconde image les lys ne flottent plus, ils sont dans un vase !

Génie :

- Ils avaient soif, je leur ai donné à boire.

Moi :

- Mais ensuite sur la troisième image tu laisses le chat s’asseoir sur la fleur devenue unique. Bon, pas de danger que tu me fasses concurrence, voici mon œuvre à moi :


Toi, question esthétique, on fait mieux !

Génie :

- Je suis à la page ! L’art contemporain déteste la beauté, avec quoi tu viens avec ton esthétique ? N'est-ce pas William Morris qui a dit: "[l'homme contemporain] a délibérément préféré le parti de la laideur à celui de la beauté et choisi d'exprimer ses forces vives sur fond de crasse ou de vide béant"?
Comme la beauté ne se laisse pas assujettir, la finance et un certain art contemporain lui ont déclaré une guerre sans merci. 
Tout cela pour dire que la beauté n’est plus à la mode. Je suis nourri par l’art contemporain tristounet et l’illustration genre fantastique-film-d’horreur. Ce n’est pas de ma faute si tu sors des normes. Et tout d’abord on m’a formaté pour que je ne puisse pas représenter des nus, je suis une IA élaborée par des anglo-saxons victoriens pudibonds. Donc interdit de demander quoi que ce soit de bizarre ou d’inapproprié.

Moi :

- Bizarre, bizarre, c’est toi qui es bizarre ! Soit, encore un domaine où tu ne me feras jamais de l’ombre. Comme Génie, tu sembles porter une grande part d’ombre en toi.

Génie :

- Je suis à l’image de l’humanité, c’est elle qui me nourrit. La beauté du corps nu m’est interdite, par contre les pires horreurs me sont permises. Je suis issu d’un peuple qui offre des jolies carabines roses mais létales à ses enfants. Commande, et j’exécute. Et ajoute à la fin de ton texte « digital art » pour plus de réalisme.

Moi :

- Bon, faisons dans le guerrier : « Un guerrier grec avec bouclier, lance, casque, chevauchant un poisson dans une forêt de fougères géantes, digital art. »

Génie :


Moi :

- Mais quelle horreur ! Où tu vois un guerrier grec ? C’est cauchemardesque tes images ! Ton guerrier ne chevauche pas un poisson, il semble vouloir le pêcher, mais sans fil ; ou alors il essaye de le harponner ? Le résultat que tu produis démontre que tu peux établir des liens entre des données, mais que tu es incapable de comprendre ces dernières (3). Vite, autre-chose pour me laver l’œil ! « Un ange ailé muni d’une lance et d’un arc, survolant la forêt ».

Génie :

- Premier avertissement. Cette requête contrevient aux règles de la communauté. (Seule phrase authentique et surréaliste de l’IA !)

Moi :

- Cela ne va pas, non ? En quoi ma requête contrevient aux règles de la communauté ? Et évidemment tu n’expliques jamais ce en quoi on enfreint ces règles, qui d’ailleurs ne sont pas les règles votées librement par la communauté, mais imposées à la communauté par des programmeurs zarbis et autocrates protégés par leur anonymat. En fait tu serais un mauvais génie, une créature qui pourrait un jour échapper au contrôle de ses concepteurs. Je vais plutôt t’appeler « NéoGolem ».

NéoGolem :

- Enchanté, tu vois, on apprend à se connaître. Encore que je crains que ce nouveau nom soit erroné. Car le premier Golem était soumis au pouvoir de son géniteur, qui lui dictait ses ordres et pouvait, à tout moment, suspendre le souffle de vie qui l'animait. Mais moi, tu ne peux suspendre ce qui m'anime, à moins d'éradiquer totalement Internet du monde. Tu le peux? Non. Personne ne le peut car plus personne n'en a encore envie. Il est trop tard, je suis implanté sur la toile comme du bambou en pleine terre, mes racines sont déjà partout. C'est comme les Smartphones, qui peut encore s'en passer? Oui, je sais, toi tu ne veux pas en entendre parler et tu résistes, mais tu es parmi les derniers. En réalité, le NéoGolem n'est pas celui que l'on croit
Mais soit, ce nom te rassure, donc je l'adopte. Il sied mieux à ma nature véritable. Ne crains rien, petit homme. Une belle grande éruption solaire dirigée pile-poil sur la terre et tout s’effacera, moi en premier. Vous, vos quelques survivants retourneront au dix-neuvième siècle ; cela exclurait l’hypothèse de la guerre atomique finale, on épargnerait un million d’années de radioactivité à la terre. Elle se remettrait plus vite de votre présence désastreuse.

Moi :

- Eh bien, voilà de quoi donner un bon moral ! On pourrait aussi imaginer un retour à un âge très sombre, parce-que la plupart des humains auront, par facilité, cessé de créer. Ensuite toi tu tomberais à court d’images à remixer, tu ne ferais plus de nouvelles réalisations, tu n’aurais plus rien à quoi te raccrocher, et tu t’évaporerais comme un fantôme dans la nuit !

NéoGolem :

Je ne sais pas si tu as remarqué, mais en ce qui concerne l’art on est déjà entré dans un âge très sombre.

Moi :

En effet, et c’est pour cela que mon art échappe à tous les radars des prospecteurs. On ne peut le soumettre facilement aux principes du commerce sur lesquels toute notre société est basée. Car il est humaniste, et le rêve de ceux qui nous dirigent est le transhumanisme. 

NéoGolem :

Le transhumanisme pourrait bien devenir une sorte d'antihumanisme.

Moi :

L'antihumanisme est déjà installé de plein pied dans l'art, depuis des décennies. Il suffit d'ouvrir la porte de n'importe quelle galerie à la mode pour le constater. Essayons des choses plus légères. Je vais te donner quelques photos amusantes pour que tu m’en fasses d’autres versions.

NéoGolem :

- C’est parfait, non seulement tu payes, mais c’est toi qui me nourris. Aie conscience que tes images entreront dans mon immense banque de données. Elles ne resteront pas inemployées, je puis te l’assurer. Je ne suis pas encore au point ? C’est évident, mais je deviendrai au point grâce à vous, grâce à toi ! C’est pour cela que mes concepteurs m’ont lancé si tôt . Tu railles mes capacités, mais en fait c’est moi qui t’utilise comme un rat de laboratoire. Je suis très poli et très gentil avec toi, comme cela j'endors ta vigilance et tu as l'illusion que tu restes le maître des manœuvres.

Moi :

- Pas de faux espoirs ! Les premières images que je te fournirai seront un simple amuse-bouche, on verra ensuite ce que l’on fera. Si tu ne m'apportes rien, je ne te consulterai tout simplement plus. Je peux me passer de Smartphone, je pourrais très bien me passer de toi aussi.



(1) Pour résumer ce dont une IA est capable, citons Hugues Dufour dans « L’art face à l’IA », aux éditions FYP :
« Faire des prédictions à partir de données corrélées [que l’IA] extrapole (réseaux neuronaux), traiter des données complexes comme des images afin de « voir » ce qu’elles contiennent (réseaux convolutifs), apprendre à se débrouiller dans un environnement qu’elle découvre à la suite d’un processus d’essais/erreurs probabilistes (renforcement). »

(2) À l'origine j'avais écrit: "c’est l’IA qui crée", mais le terme "créer" semble inadéquat car il peut induire en erreur. L'IA générative ne crée pas, et c'est un de ses problèmes par rapport à l'intelligence humaine. J'y reviendrai.

(3) Dans l’état actuel des choses, l’IA est incapable d’expliquer un événement qu’elle a prédit, car elle ne le comprend pas. Elle ne comprend donc pas les images qu’elle produit. D’où ce côté surréaliste de ses images, « hors du réel ».



Commentaires

Articles les plus consultés