La Silicon Valley reviendra-t-elle à la richesse grâce aux produits des autres ?
La Silicon Valley est une fois de plus sur le point de tirer profit des produits d’autres personnes, réalisant une saisie de données d’une ampleur sans précédent qui a déjà engendré des poursuites et des audiences au Congrès.
Les chatbots et autres formes d’intelligence artificielle générative qui ont fait irruption sur la scène technologique ces derniers mois sont alimentés par de grandes quantités de matériel extrait d’Internet – livres, scénarios, documents de recherche, reportages, photos, art, musique, code et plus encore – pour produire réponses, images ou sons en réponse aux invites de l’utilisateur.
Les entreprises technologiques se bousculent pour tirer parti de cette nouvelle technologie potentiellement lucrative. Google, évalué à 1,5 billion de dollars, a fait tapis avec son chatbot Bard après que son rival Microsoft, évalué à 2,4 billions de dollars, ait investi des milliards dans le pionnier de l’IA générative de San Francisco, OpenAI. Meta, évalué à 680 milliards de dollars, vient d’annoncer son intention d’ajouter des chatbots à ses applications. Les capital-risqueurs injectent des milliards de dollars dans les startups génératives de l’IA.
Mais une question épineuse, controversée et hautement conséquente s’est posée : une grande partie du fourrage des bots est une propriété protégée par le droit d’auteur.
En janvier, l’artiste de la région de la baie Karla Ortiz a rejoint un dessinateur de l’Oregon et un peintre du Tennessee pour poursuivre la société britannique de génération d’images Stability AI devant le tribunal de district américain de San Francisco, affirmant que Stability avait violé les droits de millions d’artistes en formant son logiciel sur plus plus de 5 milliards d’images protégées par le droit d’auteur récupérées sur Internet sans autorisation ni compensation.
« Cela les a juste pris », a allégué le procès. Les sorties de Stability AI sont « dérivées exclusivement » de ces images et « auront un impact négatif considérable sur le marché » du travail des artistes, selon le procès.
Stability AI, dans un dossier déposé devant le tribunal en avril, a fait valoir que son logiciel « permet aux utilisateurs de créer des images entièrement nouvelles et uniques » et que sa technologie ne produit pas de matériel présentant une « similitude substantielle » avec le travail protégé par le droit d’auteur des artistes.
Le nouveau problème de propriété intellectuelle de l’IA va au-delà de l’art dans les films et la télévision, la photographie, la musique, les médias d’information et le codage informatique. Les critiques craignent que les principaux acteurs de la technologie, en s’insérant entre les producteurs et les consommateurs sur les marchés commerciaux, aspirent l’argent et suppriment les incitations financières à produire des scripts télévisés, des œuvres d’art, des livres, des films, de la musique, de la photographie, des reportages et des logiciels innovants.
« Cela pourrait être catastrophique », a déclaré Danielle Coffey, PDG de la News/Media Alliance, qui représente près de 2 000 éditeurs de presse américains, dont cet organe de presse. « Cela pourrait décimer notre industrie. »
La nouvelle technologie, comme cela s’est produit avec d’autres innovations de la Silicon Valley, y compris la recherche sur Internet, les médias sociaux et la livraison de nourriture, se propage si rapidement parmi les consommateurs et les entreprises qu’elle peut devenir enracinée – et appréciée des utilisateurs – bien avant que les régulateurs et les législateurs ne rassemblent le la connaissance et la volonté politique d’imposer des restrictions et d’atténuer les dommages.
« Nous aurons peut-être besoin d’une législation », a déclaré la députée Zoe Lofgren, D-Californie, qui, en tant que membre du comité judiciaire de la Chambre, a entendu des témoignages sur le droit d’auteur et l’IA générative le mois dernier. « Les créateurs de contenu ont des droits et nous devons trouver un moyen de respecter ces droits. »
Au cœur de la question se trouve la doctrine de l’utilisation équitable, qui permet à une œuvre protégée par le droit d’auteur d’être utilisée sans autorisation sous certaines conditions. Lofgren pense que les tribunaux trancheront cette question avant que le Congrès ne prenne des mesures.
L’avocat et programmeur informatique de Bay Area, Matthew Butterick, a lancé la première salve juridique à la fin de l’année dernière avec une proposition de recours collectif au nom de deux plaignants anonymes contre Microsoft, sa filiale GitHub et son partenaire OpenAI, alléguant l’assistant de codage alimenté par l’IA GitHub Copilot est basé sur « le piratage de logiciels à une échelle sans précédent ». Les sociétés défenderesses ont riposté en janvier devant le tribunal de district américain de San Francisco en affirmant que son outil « cristallise les connaissances acquises à partir de milliards de lignes de code public », qu’il « n’enlève rien à l’ensemble du code open source accessible au public ». » et fait progresser l’apprentissage, la compréhension et la collaboration.
La fureur à propos de l’accaparement de contenu augmente. Le géant de la vente de photos Getty poursuit également Stability AI. Le mois dernier, des scénaristes hollywoodiens en grève ont fait part de leurs inquiétudes quant au fait que les studios de cinéma commenceront à utiliser des scripts écrits par chatbot alimentés par les travaux antérieurs des écrivains. L’industrie du disque a déposé une plainte auprès des autorités fédérales au sujet de la musique protégée par le droit d’auteur utilisée pour former l’IA.
Eric Goldman, professeur à la faculté de droit de l’Université de Santa Clara, estime que la loi favorise l’utilisation de matériel protégé par le droit d’auteur pour la formation à l’IA générative. « Tous les travaux s’appuient sur des travaux précédents », a déclaré Goldman, un expert en droit de l’internet. « Nous sommes tous libres de prendre des morceaux d’œuvres précédentes. Ce que fait l’IA générative, c’est accélérer ce processus, mais c’est le même processus. Tout cela fait partie d’une évolution du réservoir de connaissances de notre société. »
Les progrès technologiques, cependant, ont l’habitude de contourner les protections légales pour les producteurs de contenu, a noté le célèbre photographe animalier Frans Lanting de Santa Cruz, en Californie. « Le caractère sacré de la loi sur le droit d’auteur a été de plus en plus miné par les nouvelles technologies », a déclaré Lanting, citant « une hypothèse du grand public, mais surtout des entreprises technologiques, selon laquelle les œuvres individuelles peuvent être reproduites… sans attribution ni aucune compensation pour les créateurs. Tout devient gratuit. »
Lanting craint que ses propres photos, généralement présentées avec des histoires sur les effets humains sur le monde naturel, puissent être reproduites via l’IA et présentées de manière à saper la confiance dans son travail.
Shomit Ghose, professeur d’ingénierie et investisseur en capital-risque à l’Université de Californie à Berkeley, a déclaré que l’IA générative pourrait avoir besoin d’une réglementation pour interdire le mimétisme direct du travail des créateurs. Mais son potentiel pour améliorer de nombreuses formes de créativité, a-t-il dit, rappelle le héros de bande dessinée et de film Iron Man, un humain augmenté par la technologie. Très probablement, a déclaré Ghose, « l’avenir est Iron Man ».
Pour Coffey de la News/Media Alliance, l’attention des législateurs fédéraux justifie un optimisme prudent, en particulier à la lumière de l’histoire de la Silicon Valley, qui a vu Google et Facebook paralyser l’industrie de l’information en s’intercalant entre les producteurs d’informations et les consommateurs pour siphonner la part du lion de revenus de la publicité numérique, les législateurs du monde entier mettant des décennies à réagir. Les « principes de l’IA » de l’Alliance stipulent que l’utilisation équitable ne s’applique pas au grattage non autorisé du contenu des éditeurs pour l’IA, et que les producteurs de nouvelles doivent être payés via un système encore à développer, éventuellement sous licence.
L’octroi de licences pourrait s’avérer une solution problématique. Lorsque des entreprises technologiques comme Apple, évaluées à près de 3 000 milliards de dollars, et 30 milliards de dollars Spotify sont intervenues entre les musiciens et les auditeurs pour diffuser de la musique en ligne, ces entreprises et maisons de disques, ainsi qu’une petite fraction de stars de la musique, ont capté l’essentiel des revenus, avec le majorité des musiciens gagnent un revenu relativement dérisoire.
Lofgren veut une solution qui ne sacrifie pas le leadership du pays sur la nouvelle technologie et les avancées qu’elle promet. « Nous voulons équilibrer nos efforts pour nous assurer que les artistes et autres sont traités équitablement », a-t-elle déclaré. « Nous ne voulons pas non plus placer l’Amérique à la deuxième ou à la troisième place. »
À Sunnyvale, en Californie, l’ingénieur logiciel Johannes Ernst, PDG de Dazzle Labs, une startup qui construit une plate-forme de contrôle des données personnelles, a déclaré que les producteurs de contenu pourraient annoter leur travail avec des conditions d’utilisation qui devraient être suivies par les entreprises qui explorent le Web pour le fourrage de l’IA. . Les débats sur les protections juridiques mettent la charrue avant les bœufs, a déclaré Ernst.
« Nous devons déterminer ce qui est bien et ce qui est mal ici », a-t-il déclaré. « Ignorez ce que dit la loi pendant une seconde et dites : « Comment cela devrait-il être ? » Ensuite, voyez quelles lois nous pouvons utiliser pour qu’il en soit ainsi, et voyez quelles nouvelles lois pourraient être nécessaires. »
Distribué par Tribune