

Cela faisait longtemps que les réseaux sociaux ne s'étaient pas autant emballés autour d'un outil d'intelligence artificielle. Il y a généralement un peu d'agitation lorsque quelque chose attire trop l'attention, mais ce qui s'est passé avec la génération d'images basée sur GPT-4o de ChatGPT n'a aucun sens. L'IA générative a réussi quelque chose qu'elle n'avait pas réussi à faire depuis longtemps : surprendre l'utilisateur moyen. Et elle l'a fait en faisant fi de l'une des plus grandes critiques de cette technologie : la violation du droit d'auteur.
Ces dernières heures, les réseaux sociaux ont été remplis de mèmes, d'images et d'avatars édités par ChatGPT pour ressembler aux dessins du Studio Ghibli. Les images sont vraiment spectaculaires, il faut rendre à César ce qui appartient à César, mais il ne faut pas oublier qu'une IA sait générer une image d'un cheval parce que, entre autres, elle a été entraînée sur des millions et des millions d'images de chevaux.

Autrement dit, si une IA comme ChatGPT-4o est capable de convertir ou de générer une image dans le style d'un auteur spécifique, c'est parce qu'elle sait à quoi ressemble le style de cet auteur spécifique. Autrement dit, ChatGPT-4o doit avoir été formé avec du contenu lié, basé sur ou généré par le studio fondé par Hayao Miyazaki. Et qu'en est-il de ce contenu ? Il est beau, émouvant et proche, mais pas gratuit, ni dans le domaine public. Il s'agit d'un contenu protégé par le droit d'auteur, un problème qui affecte ChatGPT et OpenAI depuis le début.
Ce n'est pas un secret. Bien sûr que non. ChatGPT a été formé avec une énorme quantité de données obtenues à partir d'Internet, de sites Web, de livres, de publications sur les réseaux sociaux, d'articles universitaires, etc. Contenu qui peut être librement accessible, mais pas gratuit. Une image qui est "sur Internet" n'est pas juste "sur Internet"; il est hébergé sur un serveur qui peut appartenir à une entreprise et peut être (et est probablement) protégé par le droit d'auteur. Ce n'est pas parce que vous pouvez le visualiser et le télécharger gratuitement sur votre téléphone portable pour l'utiliser comme fond d'écran que vous pouvez l'imprimer et le vendre ou l'utiliser pour illustrer la couverture de votre prochain roman.

OpenAI affirme avoir adopté une "approche conservatrice" à l'égard des images qui utilisent le travail d'autres artistes et avoir "ajouté un refus qui se déclenche lorsqu'un utilisateur tente de générer une image dans le style d'un artiste vivant". Comme Miyazaki, par exemple. Face au flot d'images générées dans le style de l'artiste japonais, un porte-parole de l'entreprise a déclaré à Business Insider qu'OpenAI empêcherait "les générations dans le style d'artistes vivants individuels", mais autoriserait "les styles de studios plus larges".

En d'autres termes, pas le style Hayao Miyazaki, mais le style Studio Ghibli. C'est ironique, car en 2016, après avoir vu une démonstration d'une animation générée par l'IA, le maestro Miyazaki a déclaré : "Je ne voudrais jamais intégrer cette technologie dans mon travail. Je crois fermement que c'est une insulte à la vie elle-même".

Le style. Il est à noter que personne ne peut empêcher quelqu'un de créer des œuvres dans le style de Miyazaki ou du Studio Ghibli. Le style n'est pas protégé en soi. Une autre histoire, et c'est là que réside le nœud du problème, consiste à utiliser des œuvres protégées pour former une IA capable de reproduire ce style. C'est là le vrai problème. On pourrait le comprendre comme un fan art : vous pouvez faire une illustration de Pikachu, l'imprimer et la mettre dans votre chambre, sans problème. Ce que vous ne pouvez pas faire, c'est vendre cette illustration.
Le casse-tête d'OpenAI. Cet accès et cette utilisation de contenu protégé par le droit d'auteur à des fins commerciales ont valu à OpenAI quelques poursuites judiciaires, la plus notable étant celle du New York Times. Getty a également poursuivi Stable Diffusion pour avoir utilisé ses images pour former des modèles, Anthropic a été poursuivi par un groupe d'auteurs pour avoir utilisé leurs livres pour former Claude, et Meta a apparemment téléchargé 81,7 To de livres protégés par le droit d'auteur pour former ses modèles.

>> Le créateur de Black Mirror a écrit un épisode avec ChatGPT et il ne s'attendait pas à ce résultat <<
La conclusion est claire et nous l'avons abordée à plusieurs reprises : le prix à payer pour avoir une intelligence artificielle est le pillage de tout le contenu sur Internet, que les entreprises d'IA s'appuient ou non sur le "fair use" et se protègent derrière lui. Avec l'intelligence artificielle générative, on semble avoir supposé que si c'est sur Internet, c'est gratuit, et la réalité est que ce n'est pas toujours le cas. Toutes les grandes entreprises d'IA ont ignoré les lois sur le droit d'auteur et, jusqu'à présent, il n'y a eu aucune conséquence. Le débat est cependant loin d'être clos et ce n'est probablement pas la dernière fois qu'il sera évoqué.