Au-delà de la méta et de l'extraction de l'IA des livres: nous avons besoin de nouvelles lois sur le droit d'auteur

Si vous vous souvenez des jours des bandes VHS, vous vous souviendrez probablement également des avertissements effrayants du FBI au début des films qui ont mis en garde contre le piratage. Bien qu’un peu lourd, il a toujours agi comme un avertissement solide: vous possédez la bande, mais vous ne possédez pas le contenu.

Aujourd’hui, ces types d’avertissements existent toujours avec des lois sur le piratage protégeant les travaux protégés par le droit d’auteur à travers les films, la télévision, les livres et l’art. Par définition, le piratage implique l’utilisation non autorisée ou reproduction du travail d’un autre. Cependant, en ce qui concerne la zone grise de l’IA, les lois sur le piratage et le droit d’auteur ont tendance à perdre tout leur pouvoir.

Cela semble certainement être le cas avec le dernier prétendu livre présumé de Meta. Selon les documents judiciaires récemment expurgés, le conglomérat technologique dirigé par le fondateur Mark Zuckerberg aurait utilisé la bibliothèque Genesis (mieux connue sous le nom de Libgen) et d’autres «bibliothèques Shadow» de piratage numérique pour former Llama 3, les derniers et les plus grands modèles de langage de l’IA (LLM) de la société. Et oui, si elle est vraie, cela signifie que dans une superbe émission de bravade, méta des livres essentiellement piratés qui étaient déjà piratés afin de mieux former une AI pour animaux de compagnie.

Ce qui ajoute une plus grande frustration à propos de ce dernier développement, c’est que les auteurs ont combattu la bonne lutte contre Libgen et ses semblables depuis des années. Tant étaient naturellement indignés lors de l’apprentissage que Meta peut avoir aussi volé leur travail. La principale différence ici (si elle compte même) est que Libgen reste un service controversé mais gratuit. En revanche, Meta utilise la propriété intellectuelle d’autres pour aider à alimenter ses milliards de bénéfices.

Tout le monde ne peut pas être Stephen King ou JK Rowling. La plupart des auteurs font très peu leurs livres. Peu peuvent vivre des redevances, et encore moins obtiennent des avancées substantielles. Une entreprise d’un milliard de dollars volant le travail de quiconque (y compris la publication des lourds) ressemble à une gifle géante au visage. Les États-Unis manquant de lois et de réglementations sur l’IA aux niveaux fédéral et d’État, il devient encore plus difficile pour les créatifs de protéger leur IP et de recevoir une compensation équitable.

L’IA présente des défis uniques pour les recours collectifs

Comme indiqué par la Auteur Guild, une action en justice a été prise contre Meta en 2023, et tous les auteurs touchés par la formation de Meta Llama 3 ont automatiquement été inclus dans le Kadrey c. Meta Essayage de classe dans le nord de la Californie. Cependant, l’affaire est toujours en cours et s’accroche à un fait important: la méta est-elle en violation de la violation directe du droit d’auteur?

L’IA étant ce qu’elle est, le droit d’auteur se complique, surtout lorsqu’il est combiné avec la défense de Meta à usage équitable. Essentiellement, une utilisation équitable vous permet de contourner l’autorisation du titulaire du droit d’auteur à des fins telles que la critique, l’enseignement, les rapports et la recherche. Dans la plupart des cas, le travail est «transformateur», ce qui signifie qu’il ajoute quelque chose de nouveau au matériau d’origine. Et en raison de l’ingestion, de la digestion et du crachage de Meta de Meta, un générateur de texte frankensteinien, l’argument de la juste utilisation a malheureusement quelques jambes. Cependant, comme Dan Pontefract l’a souligné dans un Forbes Article, «Les arguments d’utilisation équitable étaient destinés à l’éducation, aux commentaires et aux critiques, et non à l’exploitation des entreprises pour un profit commercial à grande échelle.»

Que la violation du droit d’auteur direct soit ou non, le raid de Meta de Libgen, qui abrite plus de 7,5 millions de livres piratés, soulève des préoccupations éthiques et met en lumière la nécessité de plus de lois et de réglementations sur l’IA.

Les raids technologiques prouvent que les lois sur l’IA sont nécessaires

L’IA ne va nulle part. Pour en jeter un autre Frankenstein Métaphore, nous avons créé un monstre qui ne peut pas être simplement abandonné. Pour beaucoup, l’IA offre une efficacité inégalée, une automatisation des tâches et une nouvelle façon de déléguer des tâches banales avec une meilleure précision. Certains champs bénéficient sans aucun doute de l’IA, mais Meta prouve que les livres et d’autres médias créatifs ne sont pas parmi eux.

Mark Twain a dit un jour: « Il n’y a pas de nouvelles idées. » C’est un argument fréquemment utilisé dans les cercles d’IA pro-génératifs. Si tout le monde recycle les idées, en quoi l’IA est-elle différente? Cependant, l’IA génératrice n’est pas seulement codée; Il est formé sur les œuvres publiées d’artistes et d’écrivains. Leur inspiration est peut-être venue des créations d’autrefois, mais ils s’asseyaient, pensaient et créaient quelque chose de nouveau avec des talents et des défauts humains. Agatha Christie a dû tracer ses romans mystères. Elle ne pouvait pas simplement les placer dans le chatte et taper: «Écrivez-moi une fin.» Mais grâce à ses efforts, tout le monde peut utiliser l’IA génératrice pour cuisiner une pièce verrouillée mystère avec probablement une conclusion familière. Cela conduit à une multitude de problèmes, comme qui possède réellement le travail s’il est créé à partir d’une compilation de nombreux détenteurs de droits d’auteur?

Actuellement, les États-Unis n’ont pas de législation fédérale réglementant le développement ou l’utilisation de l’IA (White & Case). Au niveau de l’État, il existe quelques lois concernant l’IA générative. Par exemple, le Colorado et l’Utah ont des lois indiquant que les agences doivent divulguer une utilisation générative de l’IA à leurs utilisateurs. Le Tennessee a également mis à jour son droit de droit de la publicité pour inclure une clause relative à l’utilisation non autorisée de la photographie, de la voix ou de la ressemblance d’un individu dans les algorithmes, les logiciels ou toute autre technologie. La Californie exige également que les sites Web affichent les données utilisées pour former leurs systèmes d’IA génératifs, y compris s’il provient du travail protégé par le droit d’auteur, la marque ou le brevet.

Bien que ces différentes lois décrivent des solutions potentielles pour protéger les détenteurs de droits d’auteur et les consommateurs, ce n’est qu’un début. Jusque-là, ceux qui poursuivent une action en justice contre des entreprises comme Meta devront s’appuyer sur des lois préexistantes sur le piratage et les droits d’auteur qui laissent beaucoup de marge de manœuvre en matière d’IA. Kadrey c. Meta pourrait très bien se terminer en faveur de la méta. Dans l’état actuel des choses, le tribunal a rejeté la plupart des réclamations en plus de la violation directe du droit d’auteur. Cela n’aurait peut-être pas été le cas si des réglementations sur la façon dont les entreprises forment leurs modèles d’IA avaient déjà été en place.

L’IA générative nuise à tous les médias créatifs, pas seulement des livres

Le célèbre studio d’animation japonais Ghibli a rencontré des problèmes similaires avec Openai le mois dernier. Avec l’outil de génération d’images 40 d’OpenAI (une émanation du modèle payant de Chatgpt), les utilisateurs du monde entier ont pu créer des images qu’ils prétendaient étaient dans le style de signature de Studio Ghibli. Ceux qui ne sont pas familiers avec Ghibli peuvent chercher des coups comme Fougueux et Grave des lucioles Pour un avant-goût de l’animation richement détaillée du studio et dessinée à la main. Des films comme ceux-ci ou Le garçon et le héron sont autant de travaux d’amour que les lignes et les couleurs. Et ils ne sont pas faciles à créer. Comme l’a dit le producteur de Studio Ghibli, Toshio Suzuki EWcela peut prendre un mois pour dessiner une minute d’animation. Avec l’outil de génération d’images 40 d’Openai créant des images de type Studio Ghibli prétendument avec la presse, la nouvelle fonctionnalité d’Openai a ainsi suscité la controverse.

Bien que le «style» ne puisse pas être protégé par le droit d’auteur, cela remet en question comment Openai a formé son modèle d’IA. Fan Art? Images similaires? Bien sûr, peut-être. Mais si OpenAI a utilisé le studio officiel de Ghibli pour la formation sans autorisation, nous sommes de retour en violation du droit d’auteur et en territoire de piratage (actuellement la société japonaise n’a annoncé aucun intention de poursuivre une action en justice). Il en va de même pour la fonction de résumé de l’IA de Google, qui compile les informations des articles dans les résultats de recherche pour fournir une réponse rapide et parfois extrêmement inexacte.

Quant à la littérature, Meta a eu la chance de façonner ce paysage de l’IA en demandant la permission des auteurs et des éditeurs, et / ou en payant pour l’utilisation de leur propriété intellectuelle. Cependant, sans lois fédérales réglementant une IA générative, la société de technologie aurait gâchée dans le Far Occure non gouverné de l’intelligence artificielle et des millions de livres torrentés dans le processus. Alors que Meta prétend se soucier de la construction de «l’avenir de la connexion humaine», ses actions suggèrent qu’il n’y a rien d’humain à ce sujet.