The Ned Ludd Ballad – Un éditeur indépendant face à Midjourney et à la génération d’images automatisée

Dé-générez moi !

And he bashed and he hammered
and he smashed and he smote
When he turned to his workmates
said: ‘Death to Machines’
If that is unreason
I see what it means
Ned Ludd left no blood

« La ballade de Ned Ludd »

Cette tribune ne prétend pas être la première à traiter de la génération procédurale d’images. De tels articles ont presque autant inondé la toile que les productions de Midjourney et de Stable Diffusion. Cela étant, dans notre petit monde du jeu, vous avez été surtout confronté aux points de vue d’illustrateurs, menacés dans leur existence même. J’entends proposer un angle différent, celui d’un créateur de jeux, auteur et éditeur de scénarios, tantôt mercenaire, tantôt indépendant, tantôt bénévole.

Génération procédurale ?

Entendons-nous d’abord sur les mots. La génération d’images est plus communément appelée « Intelligence Artificielle ». Ce terme pose problème dans la mesure où il suppose que la machine comprend les données qu’elle manipule et les résultats, ce qui n’est pas le cas. C’est la raison pour laquelle, à l’imitation de spécialistes du domaine bien plus compétents que moi, je parlerai ici de « génération procédurale ». Il s’agit de la production d’une nouvelle image à partir d’une banque de données. Ces données sont indexées à l’aide de tags et convoquées par l’utilisateur à l’aide de mots-clés dans une phrase appelée « prompt ». Elles sont ensuite agrégées à l’aide d’un algorithme, que l’utilisateur ne paramètre que partiellement. L’aléatoire joue un rôle important dans le processus, aussi l’utilisateur a-t-il le choix parmi des variantes qu’il peut ensuite affiner. Il n’a en revanche aucune idée des images sources, sauf à entraîner le programme lui-même.

Publier à moindre coût

Partons des besoins, et plus exactement de mes besoins. Dans ma position, l’illustration représente un coût incompressible. En tant qu’auteur et éditeur, je sais avoir besoin des services d’un bon illustrateur pour attirer l’œil. Sans cette première impression, l’attention que je porte à soigner des mécaniques de jeu ou un univers risque de ne jamais atteindre le lecteur. Très prosaïquement, il s’agit de frais à avancer. Alors que l’auteur est rémunéré au pourcentage, l’illustrateur est presque toujours payé dès la livraison des images, avant la vente. Même si les financements participatifs permettent de minimiser les risques, c’est toujours un point critique.

Dans le cas des productions bénévoles, celles qui occupent le plus clair de mon temps, l’illustration est aussi une denrée précieuse. Quand j’ai coordonné le recueil des Quarante ans du jeu de rôle, il n’a pas été difficile de trouver des auteurs talentueux désireux partager leurs créations. Refuser les textes plus faibles ou demander une réécriture en profondeur n’a pas posé problème. En revanche, il a fallu déployer des trésors de diplomatie et de séduction, ainsi qu’essuyer des dizaines de refus pour constituer un réseau d’illustrateurs volontaires. Les imprévus de dernière minute ont toujours conduit à combler les derniers trous du recueil avec quelques montages et vectorisations d’images du domaine public. Khelren, homme-orchestre et maquettiste, et moi avons fini par développer quelques compétences en la matière. Nous ne pouvons pas en faire notre métier car nous sommes, à rendu inférieur, plus lents qu’un illustrateur, mais nous pouvons remplir une page sans gâcher le papier sur lequel elle est imprimée.

Au regard ce bref aperçu, il est peu de dire que j’ai des besoins en illustrations, un budget contraint et une disponibilité limité. J’ai un travail qui remplit le frigo, quelques ambitions académiques et mon temps n’est donc pas extensible à l’infini. Les applications proposant de combler instantanément mes désirs par une série de mots-clés ont donc naturellement éveillé mon intérêt.

Des circonstances particulières m’ont amené, au mois d’août dernier, à mettre les mains dans le cambouis de Midjourney, dont la v3 venait d’être livrée. L’illustrateur du scénario Château Falkenstein du recueil venait de m’annoncer que des impondérables très lourds l’empêchaient de produire les illustrations dont nous avions convenu, et la période rendait difficile le démarchage d’un remplaçant. La sortie du troisième tome du recueil était annoncée et planifiée, aussi sautai-je le pas.

J’abordai l’outil avec la même exigence de rendu que j’applique aux textes que j’édite et aux illustrations que je reçois. Elle est élevée. Une production, bénévole ou payante, ne doit pas gâcher le papier sur lequel elle est imprimée, ni le temps du lecteur.

Devenir un rouage dans la machine à différences…

La grammaire de Midjourney n’est pas difficile. Il faut apprendre à placer correctement ses virgules et ses barres verticales, à introduire des modulations et des formats comme –wallpaper. C’est l’affaire de deux heures. Il faut ensuite préciser un style pour obtenir un résultat satisfaisant, du moins à première vue.

Pour le scénario Château Falkenstein, « Steampunk » et « detailed blueprint » (plan technique) ont été mes deux étiquettes de prédilection, et j’ai obtenu un portrait d’Ada Lovelace coiffée d’un casque de réalité virtuelle un peu trop moderne d’apparence à mon goût – il manque d’arabesques et de rouages –, ainsi que des plans de machines biscornues ultra-détaillées. Tout cela fera l’affaire.

Ada Lovelace, plus ou moins peinte à l’huile, a le menton en pointe, comme quasiment tous les portraits féminins produits par l’IA, mais baste. Heureusement, grâce au casque et au format choisi, je n’ai ni les yeux ni les mains à corriger. J’étais d’abord très enthousiaste, mais à y regarder de près, rien ne va. La naissance des cheveux déforme le front, le casque s’enfonce cruellement dans la chair ou disparaissait, la commissure des lèvres s’ourle avec peu de naturel. Il m’a fallu plus de quatre heures pour venir à bout de ces problèmes, finissant mes corrections au pixel près.

C’est peut-être des détails pour vous, mais moi, le nez défoncé, le petit bec de lièvre et le front déformé, ça m’abîme les yeux, alors je corrige (et je vois encore des problèmes).

Du côté des véhicules, Khelren a corrigé les roues ovoïdes et déformées en tenant compte de la perspective. Les véhicules restaient totalement improbables, les textures un peu sales, mais avec un peu d’inventivité, en empilant les différentes variantes comme autant de plans d’une machine en élaboration et ajoutant à la main des personnages, il a obtenu des images satisfaisantes à défaut d’être tout à fait propre.

J’aimerais bien vous montrer la différence entre l’original et le retouché, mais j’ai effacé les originaux, dont je n’avais plus besoin. Retenez que ce travail de post-production était minutieux, peu intéressant et long, du moins subjectivement. Surtout, le renversement des rôles dans le processus de création est saisissant. Avec la génération procédurale, l’humain devient un auxiliaire de la machine, comme l’ouvrier assigné à la chaîne. Il ne choisit pas vraiment la composition de l’image, laquelle est souvent très convenue, et se trouve cantonné au rôle de contrôle et de correction. Pour le dire plus crûment, je déteste m’emmerder, surtout quand je bosse à l’œil. Or, au final, passé le premier émerveillement face au caractère presque magique des apparitions d’images, il a fallu bosser comme petite main et je me suis emmerdé ferme.

Il est bien sûr possible d’ignorer cette phase, insultant dans un même mouvement le consommateur et les artistes, en livrant une image brute, sans retouches, aux yeux fêlés ou aux multiples doigts retournés. N’est-ce pas John ?

Composition convenue, yeux de travers, vêtements patchwork, le tiercé gagnant d’une image générée de manière procédurale qu’on a omis de retoucher.

Pour un éditeur qui n’adopterait pas cette position, le gain de temps et/ou d’argent est réel, mais il reste à nuancer tant le traitement de l’image est nécessaire pour obtenir un résultat qui ne soit pas un affront au sens esthétique et à l’intelligence du regardeur. Il faut encore avoir quelques compétences de retouche.

En outre, au regard de cette expérience, la plus-value par rapport à la recherche d’une image dans une base de données s’avère très mince. Même avec un travail méticuleux de correction, on obtient un produit médian, convenable mais sans personnalité… je fais aussi bien, voire mieux, avec des vectorisations d’images du domaine public que j’assemble. L’exercice s’approche, en dépit de la modestie de mes moyens, d’une forme de création.

En outre, il y a un réel plaisir à travailler avec un illustrateur, qu’il soit expérimenté ou débutant. On discute du scénario, des parti-pris graphiques, de tout un univers visuel. L’éditeur n’est pas un simple commanditaire. Il donne des repères et contribue aux recherches. Les premières études arrivent, et le jeu prend vie. Je garde ainsi d’excellents souvenirs des longues conversations sur l’univers graphique de Magistrats & Manigances avec Monsieur Le Chien, une riche correspondance sur les costumes, les postures et l’architecture d’époque Tang, mais aussi sur l’esthétique du noir et blanc.

De la même manière, pour le Recueil des Quarante Ans, j’ai eu la chance de travailler avec des illustrateurs d’une grande diversité de style et d’approche, des grandes pointures comme des amateurs, et le plaisir que j’ai tiré de cette découverte et de ces échanges dépasse, infiniment, celui que procure le caractère magique de la génération d’images. L’expérience de la génération d’images me laisse donc un goût amer : au vu du temps de travail que la production d’images passables a demandé, il aurait mieux valu profiter du plaisir de la création ou du contact.

… ou devenir un faussaire ?

Avant d’écarter la génération procédurale d’images et de suspendre à jamais mon abonnement à Midjourney, j’ai poursuivi l’expérience jusqu’au bout.

Je me suis vite rendu compte qu’il y existe un moyen simple d’obtenir de meilleurs images. Il suffit d’introduire les mots : « in the style of » dans son prompt. Le Discord de Midjourney en est plein et montre l’exemple, souvent avec les mêmes artistes, dont les sous-produits tournent en boucle : « in the style of Mike Mignola », « in the style of John Howe » ou, pour les moins imaginatifs, « trending on Artstation ». Dans ces bases plus restreintes, nourrie par des données cohérentes et de qualité, la génération procédurale est tout de suite plus convaincante.

Fin août, il me reste beaucoup de scénarios qui attendent des illustrations pour le tome 4 et du crédit de génération d’images sur mon abonnement à 10 euros. Pourquoi ne pas essayer ?

Je publie en noir et blanc. Je commence par quelques essais avec « dessin au trait » et « line art ». Ils ne sont pas fructueux. J’essaye alors de produire avec quelques grands maîtres du noir et blanc. Je commence par les morts : « in the style of Gustave Doré ». Cela aurait dû produire de jolies gravures pour un scénario Lames du Cardinal, mais n’a rendu que de la bouillie.

Je me tourne alors vers les contemporains, mieux référencés, et j’opte pour des maîtres du noir et blanc, parmi lesquels Sebastião Salgado, le photographe de l’Amazonie, et Apollonia Saint-Clair, dont l’œuvre au trait oscille entre violence et érotisme.

Les images produites gagnent aussitôt une patte et une composition un peu plus hardie. Banco ! Il reste bien sûr des problèmes, un bras replié en lui-même, des lunettes qui s’estompent, un œil étréci, et donc de la post-production, mais le résultat final est beaucoup plus satisfaisant.

Ce n’est qu’après avoir fini les retouches des premières images que je m’aperçois de l’étendue du problème. Certaines images sont assez loin de ce que je connais de leur œuvre, mais dans d’autres, un air de famille troublant apparaît avec des originaux. Ainsi, en créant une image « in the style of » à partir d’illustrations de l’auteur, le plagiat apparaît dans toute son évidence. Les productions de Midjourney et de ses amies sont des œuvres dérivées produites sans le consentement des auteurs, à partir d’une base de données qui utilise leurs œuvres sans rien leur reverser.

Pour se dédouaner, il est possible de convoquer l’argument suivant lequel l’art recourt au détournement et à la citation, mais il ne fonctionne pas puisque ces deux opérations supposent une réinvention et une transformation du sens dont est incapable le logiciel. Il a au contraire tendance à les affadir : ne vous attendez pas à retrouver la lumière divine des photographies de Salgado ou l’étrangeté provocante des dessins d’Apollonia Saint-Clair. Tout au plus retrouvera-t-on une copie des traitements des volumes et des matières, appliquée sans discernement. Jugez plutôt :

Du faux Saint-Clair, pour Le Docteur Who

Le lanceur jaloux (Ink is my blood, volume 4), par Apollonia Saint-Clair

 

Du faux Salgado, pour Vermine (après correction des yeux)
Sebastião Salgado photographe - Polka Magazine
Une authentique photographie de Sebastião Salgado (et oui, ce n’est pas vraiment pas du même niveau)

Midjourney n’est donc rien d’autre qu’une bonne blanchisseuse : vous entrez les œuvres d’un artiste que vous ne pouvez ou ne voulez payer, vous les mixez et vous obtenez une image qui leur ressemble vaguement, assez jolie et dépourvue d’aspérités. Vous contournez ainsi le droit moral de l’artiste sur son œuvre et vous obtenez de quoi boucher un trou dans un livre. Et si vous êtes vraiment malin, vous combinez deux styles proches, de telle sorte que le plagiat devient moins évident et que personne ne pourra vous poursuivre. L’algorithme, qui puise de manière aveugle dans les bases de données, agit comme un voile opaque sur les sources et vous protège de l’accusation, au prix de la platitude.

Ayant du respect pour ces artistes et encore un peu de décence, je ne peux pas publier ces illustrations. Très bien. On retire la mention « in the style of » et tout va bien alors ?

J’ai bien peur que non : dans le cas des prompt « in the style of », le plagiat est conscient, mais il convient de prendre en considération que toutes les images des générateurs sont produites en recourant aux données d’artistes qui n’ont pas explicitement donné leur accord. Le plagiat se dissimule aux yeux de l’utilisateur dans l’obscurité de la base de données. L’utilisateur peut certes se donner bonne conscience, mais c’est exactement la même opération. Ni plus, ni moins.

L’internationale des fauchés chante la ballade de Ned Ludd

Il reste un dernier point. En tant qu’auteur, je suis habitué à n’être que la dernière roue du carrosse dans le budget d’un éditeur et à me voir proposer des tarifs indigents, comme 20 euros la tranche de 10k signes, que je refuse systématiquement. Je pourrais accepter : je dispose d’autres sources de revenus, mais je ne veux pas faire de concurrence déloyale aux auteurs qui en ont besoin pour manger et mérite bien de bosser pour au moins 50 euros la tranche.

J’applique la même logique de solidarité aux illustrateurs, qui sont presque tous des travailleurs précaires. Or, la surabondance de produits bon marché de médiocre qualité fait d’ores et déjà pression sur les tarifs des camarades, ce que je ne saurais cautionner. Bien sûr, mon choix ne changera rien à ce mouvement de masse, mais je préfère ne pas participer à la curée. Les illustrateurs expérimentés continueront de s’offrir un pas de côté chez moi, et les débutants trouveront un premier travail.

À l’heure des comptes, la séduction première exercée par les générateurs d’image est indéniable, mais s’évanouit au regard des coûts cachés.

Ils invitent à se souvenir de ces ouvriers qualifiés qui, aux débuts de l’industrialisation, entreprirent de briser les machines. Ils avaient bien compris que les « voleuses de bras » allaient leur faire perdre le contrôle du processus de production et changer radicalement la nature du travail de l’ouvrier, laissant une masse de personnel non qualifié, aisément remplaçable et donc à la merci du patron, aliénée à une tâche répétitive. Ils ont perdu leur combat, dans le sang. Ils laissent le souvenir du « général Ludd », ouvrier mythique destructeur de machines.

Il est peut-être temps de le raviver.

Benjamin Kouppi

5 pensées sur “The Ned Ludd Ballad – Un éditeur indépendant face à Midjourney et à la génération d’images automatisée

  • 7 février 2023 à 18:17
    Permalink

    Selon votre propre logique, l’illustration de Apollonia Saint-Clair mise en évidence dans votre article est un plagiat de Manara

    • 7 février 2023 à 20:17
      Permalink

      Apollonia Saint-Clair a des hommages à Manara beaucoup plus appuyés que celui-là, mais il y a une différence fondamentale entre ce qu’on appelle de façon savante l’innutrition ou les circulations artistiques, et la génération procédurale à partir d’un algorithme recombinant des originaux puisés dans une banque d’images. Je crois le montrer dans l’article, quand j’écris : « Pour se dédouaner, il est possible de convoquer l’argument suivant lequel l’art recourt au détournement et à la citation, mais il ne fonctionne pas puisque ces deux opérations supposent une réinvention et une transformation du sens dont est incapable le logiciel. » Si on ouvre un Ink is my Blood, il est clair qu’Apollonia Saint-Clair ne copie pas Manara, mais convoque certains des personnages ou des traitements dans des situations très différentes qui dialoguent avec son propre imaginaire (beaucoup plus trash et plus étrange). Midjourney ne fait pas cette opération de nature artistique, et ce c’est pas – du moins je crois – le bon outil pour le faire tant il lisse la production.

  • 8 février 2023 à 18:20
    Permalink

    c’est un peu chaud de ne pas voir la différence de technique pure (notamment rien que le trait et son usage) entre Apollonia Saint-Clair et Manara, qui suffit à elle seule à ne pas parler de plagiat…
    tout comme c’est chaud de ne retenir que ce point précis sur tout l’article, bien plus complet sur le sujet que tout ce que j’ai pu voir dans la sphère jdr

  • 12 février 2023 à 12:18
    Permalink

    Merci pour cette analyse d’une grande finesse qui tranche avec l’inanité habituelle des échanges sur le sujet. Votre comparaison avec les luddites est d’une grande pertinence, mon fils, développeur, fait le même constat avec ChatGPT qui est déjà capable de « pondre du code » et qui risque de mettre les humains informaticiens dans la même position que les ouvriers, ils devront « simplement » ajuster le code produit comme les ouvriers de la fin du XIXe et le début du XXe siècle. Cette violence structurelle opposée par les possédants, les patrons — cautionnée par les systèmes, souvent — en appelle une, illégale celle-là, mais inéluctable, plus matérielle fondée sur la destruction des outils qui nous aliènent.

  • 23 février 2023 à 00:25
    Permalink

    Que voilà un témoignage de qualité, et pas seulement parce qu’il fait la critique de ces outils.
    En tant qu’artiste moi-même, je trouve absolument vertigineuse les conséquences de ces outils et, de la même manière qu’on pouvait voir venir ces évolutions depuis de nombreuses années à partir d’applications encore balbutiantes, il ne fait aucun doute que les défauts des programmes actuels ne feront que se résorber à l’avenir, au point de réduire la dimension encore aléatoire de leur production.
    J’ai pu voir le résultat d’images « dans le style de » et, s’il est peu convaincant avec certaines écritures, il est absolument déprimant (entendez: bluffant) avec d’autres.
    On peut gloser tant qu’on veut sur l’aide apportée par les AI à certains créatifs eux-mêmes, et sur le fait que des secteurs artistiques (arts plastiques libres, illustrations d’actualités, images de standing) ne sauront se satisfaire de l’à-peu-près dans le fond comme dans la forme, il est des pans entiers de création visuelle standardisée ou décorative où ces ersatz feront parfaitement l’affaire.
    En outre, face à des commandes où la sémantique compte souvent moins que la séduction graphique, le style des artistes, c’est la corde de survie de ces derniers. C’est une compétence pétrie sur des années voire des décennies par la personnalité, le parcours de vie, et le travail bien évidemment. Que cette force d’un artiste vivant, cette extension de lui-même, puisse être pompée et recrachée en quelques secondes par une machine n’est pas qu’une atteinte aux droits d’auteur, ce n’est pas qu’une dégradation des processus de travail, c’est selon moi une vraie violence faite à l’artiste, une dépossession de ce qui fait qu’il est lui, cela touche au psychanalytique.
    On vit un remake de Dark Crystal, mais avec les artistes dans le rôle des gelflings, à se faire pomper leur essence. Et dans le monde économique, ce ne sont jamais les skekses qui manquent.

Commentaires fermés.