Microsoft a annoncé récemment qu’il intégrerait DALL-E 2 dans sa suite Office (baptisée maintenant Microsoft 365), mettant potentiellement l’outil entre les mains de millions d’utilisateurs. Malgré les limitations sur la création de contenus extrêmes ou choquants, on peut s’attendre à une augmentation des images potentiellement fausses circulant en ligne.
Toutes les images illustrant cet article ont été générées par la technologie text-to-image
Stability.AI, l’équipe derrière Stable Diffusion, a déclaré dans un communiqué qu’elle « espère que tout le monde l’utilisera de manière éthique, morale et légale », mais a précisé se dégager de la responsabilité de l’utilisation qui incomberait exclusivement à l’utilisateur. La prudence s’impose et plus particulièrement du côté des médias qui doivent se prémunir contre la diffusion de fausses informations et images et redoubler de vigilance sur ce qui vient de Twitter ou des réseaux sociaux mais le poids de la concurrence est un risque. La respectabilité et la confiance, dans les organes de presse, déjà bien entamée, en sont l’enjeu.
Signalons, à ce propos, le très intéressant travail de Geoffrey Dorne qui a demandé à différentes IA de créer un visuel correspondant à un titre de presse à partir de dépêches AFP.
« Évidemment, mon idée n’est pas de dire que l’illustration ou la photo de presse est morte (certains le pensent mais je trouve que toutes ces formes d’expression se superposent, se complètent, s’entraident aussi parfois…), et sur ce projet, mon idée est de voir comment une IA interprète des sujets d’actualité avec des titres souvent basés sur des jeux de mot, des figures de style, parfois des interrogations, etc. Parfois le résultat est très réaliste, parfois très futuriste,parfois un peu raté aussi. C’est le jeu, mais cela propose un reflet différent sur l’actualité qui me donne à penser que l’image générée en dit parfois beaucoup plus sur l’imaginaire que nous avons autour des différents sujets politiques, économiques, sociaux, etc. que l’article en lui-même. »
En juin dernier, deux magazines, The Economist et Cosmopolitan ont d’ores et déjà tenté l’expérience pour réaliser leurs couvertures, le premier allant jusqu’au bout de la parution. Plus récemment, la couverture de l’édition française du livre Poster girl de Patricia Roth a été illustrée de la même manière. Cela a provoqué la colère de plusieurs illustrateurs, l’un d’entre eux déclarant :
« Ca y est @michellafon a pris position, et a décidé de mépriser toute une profession en faisant appel à l’IA pour la réalisation de ses couvertures de roman. C’est honteux qu’une telle maison d’édition fasse des économies sur le dos des illustrateur⸱ices. ».
Résultats créatif peu remarquables mais une brèche est créé et, à terme, d’autres éditeurs s’engageront dans cette voie, si ce n’est déjà le cas de manière plus discrète. Si les illustrateurs peuvent s’inquiéter, du côté de la presse, rien n’indique que la tentation n’est pas présente sans que l’on puisse pour l’instant en mesurer précisément les conséquences.
« La technologie permettant de manipuler les médias a toujours existé. Ce qui a changé, c’est la facilité, la rapidité et la nature convaincante de la falsification. Cela fait partie d’un continuum que nous avons observé au cours des 20 dernières années dans la technologie numérique (…) Que se passerait-il s’il y avait maintenant une photo ou une vidéo de Vladimir Poutine tirant sur un civil ou un enregistrement audio de Joe Biden disant quelque chose d’offensant ? Ce n’est qu’une question de temps avant que cela n’arrive, et c’est en partie dû à la démocratisation de l’accès à des technologies sophistiquées pour créer de fausses images. » (Hany Farid, professeur d’informatique à l’université de Californie)
Entretien avec Thierry Meneau chef du service photo
et
Vincent Truffy chef d’édition au journal Les Echos
La technologie text-to-image permet de créer des images qui ont atteint un niveau de photo-réalisme assez troublant. En tant que service photo d’un media êtes-vous directement concernés?
Thierry Meneau : C’est très intéressant de voir que ça existe et un peu flippant de voir que ça apprend très vite et peut être rapidement opérationnel, en tout cas pour certaines utilisations. Ici, au journal, la barrière est claire et nette, c’est la déontologie. On ne montre que ce qui existe par le photojournalisme. Donc, il est exclu d’utiliser une image générée à partir de rien. Si ça n’existe pas, on ne le montre pas. Mais il faut bien admettre qu’il y a aussi certains sujets où on va faire de l’illustration, avec des images de stock, pour les sujets conceptuels comme l’épargne. Mais la ressource des photothèques montre des choses tellement aseptisées, que finalement on pourrait se dire pourquoi pas utiliser une IA qui va nous faire exactement ce qu’on veut. Si on a un outil plus efficace et plus rapide, dans certains cas, on ne verra pas la différence et la finalité sera la même.
Vincent Truffy : Le truc pas clair, c’est avec quelles images l’IA a été nourrie, parce que une question importante, c’est aussi la question des droits et de propriété intellectuelle. Si c’est nourri par quelque chose qui appartient à une banque d’images, on peut dire que c’est légitime du point de vue des droits. Mais si c’est avec l’ensemble des images qui sont disponibles ici ou là, là, il y a un souci. L’intérêt pour un utilisateur de s’adresser plutôt à une banque d’images au lieu d’avoir recours directement à l’IA, c’est la sécurité juridique, technique et financière. Si il y a un problème ce sera celui du fournisseur pas de l’utilisateur. Il serait intéressant que se constituent des stocks d’images pour éduquer l’IA avec certains corpus permettant d’obtenir tel type d’images. C’est d’ailleurs le principe du moodboard que l’on donne au photographe pour sa prise de vue. Constituer ces corpus sous contrôle de directeurs artistiques ou de la photo, ce serait donner une identité photographique à leur publication.
Peut-on encore parler de photographie avec son a priori de restitution de la réalité ? Et ne faudrait-il pas que ce soit signalé avec par exemple un logo ?
TM : Oui ça peut être une solution, le danger étant avec ces images qu’elles se diffusent comme étant de vraies images. Pas dans la presse où on montre ce qui se passe vraiment, mais peut-être pour la pub ou les illustrations. Mais c’est comme pour les fake news et ce qui se passe sur les réseaux sociaux, est ce qu’on accepte que toute opinion ait le même poids ? Qu’à la télé quelqu’un qui raconte n’importe quoi s’oppose à un grand scientifique, avec une équivalence de parole ? Pour l’image c’est pareil, on accepterait que ces images aient le même poids que les autres, c’est quand même difficile d’aller dans ce sens. Donc oui, il faudrait le signaler.
Et les conséquences que peut avoir cette technologie sur les métiers de l’image si tout un chacun peut s’en servir ? Par exemple un rédacteur pour son article. Est-ce que l’iconographie a encore un avenir dans ce cas là ?
TM : On peut même imaginer que l’IA aille directement chercher dans l’article les mots clés et crée l’image sur mesure. Mais je pense que si le text-to-image se développe, les meilleurs ce seront celles et ceux qui sauront parler à la machine et les iconographes, c’est ce qu’ils font toute la journée. Ils font des prompts, il envoie des mots clés et ils essayent de faire que ces mots débouchent exactement sur l’image qu’ils ont en tête. Et puis, elles et ils conceptualisent beaucoup les sujets pour les traduire en images. C’est peut être un des développements du métier, savoir parler à l’IA et pas juste trouver des images et avoir une culture de l’image Parce que quand on fait une recherche textuelle dans une banque d’images, c’est une sorte de prompt. Si ça marche bien et fait remonter la photo parfaite, c’est un rêve d’icono évidemment, mais je le répète, on fera jamais ça ici pour montrer la réalité.
VT : Le geste de création, si on peut créer facilement des images, c’est la définition, l’invite et le choix proposé par la technologie. Ce travail de faire une recherche, de mettre la bonne phrase avec les bons mots clés pour trouver la bonne photo, de faire ensuite le tri, c’est ça le travail de l’iconographe.
Le prompt, ce texte descriptif que l’on entre dans le formulaire pour générer une image, c’est ce qui va, plus ou moins bien selon sa subtilité textuelle et le bon enchainement de mots clés bien choisis, déterminer finalement la qualité et la pertinence du résultat. Nerf de la guerre, sa maitrise est donc déterminante et fera la différence entre banalité et pertinence créative ou informative. Alors, plutôt que parler d’appeler iconographes celles et ceux qui écrivent avec des images devrons nous parler de « graphiconistes » qui crée des images à partir de texte ? Ou bien de d’artistes du prompt ?
Nous voilà arrivés au bout de cette enquête. Des réponses ont été apportées, des points de vue énoncés mais, quand vous lirez certaines de ces informations, celles ci risquent d’être devenues obsolètes tant les choses changent vite dans ce domaine
En savoir plus
- Un article de Democraty Reporting International, groupe international d’experts sur la gouvernance démocratique et les élections : What a Pixel Can Tell: Text-to-Image Generation and its Disinformation Potential (Ce qu’un pixel peut dire : la génération text-to-image et son potentiel de désinformation) https://democracy-reporting.org/en/office/global/publications/what-a-pixel-can-tell-text-to-image-generation-and-its-disinformation-potential
- Une série en cinq épisodes de l’INA (Institut National de l’Audiovisuel) sur l’IA et les médias : https://larevuedesmedias.ina.fr/series/lia-dans-les-medias-y-est-deja
- Le site du journal Les Echos : https://www.lesechos.fr/
Tous les épisodes
Dessine-moi un Doisneau (1/7)
Paroles d’experts (2/7)
Un nouvel outil pour la création? (3/7)
Et les photographes dans tout ça ? (4/7)
Banques d’images et questions de droits (5/7)
Prudence et opportunité pour la presse (6/7)
Qu’en pense l’IA ChatGPT ? (7/7)
Dernière révision le 9 octobre 2024 à 10:21 am GMT+0100 par
- Hassan Ragab
Pour un aggiornamento architectural grâce à l’IA - 20 décembre 2024 - Hayahisa Tomiyasu
Le renard et la table de ping-pong - 13 décembre 2024 - Yang Shun-Fa
La beauté submergée de Taïwan - 6 décembre 2024