Nl

TECH

Content is King : l'adage vaut aussi pour l'IA, par Patrick Steinfort (MM)

Jeudi 30 Mai 2024

Content is King : l'adage vaut aussi pour l'IA, par Patrick Steinfort (MM)

Les modèles de langage, bases des assistants conversationnels, nécessitent des contenus larges et variés pour assurer la pertinence de leurs réponses. Après avoir discrètement pillé, plus ou moins légalement, les contenus accessibles sur le Web, les développeurs de ces modèles ont fait face à une bronca des producteurs de contenus et à une série de plaintes de la part d’éditeurs de presse, d’auteurs et autres détenteurs de droits. Sony Music ayant à ce titre récemment rappelé à l’ordre les producteurs de ces modèles mais aussi les plateformes de streaming.

Depuis lors, OpenAI a mis en place un système qui permet à un site d’interdire à son crawler d’accéder à ses contenus et développe Media Manager, un outil qui permettra aux créateurs de contenu d’inclure ou d’exclure tout ou partie de leurs productions des bases de ChatGPT.

Par ailleurs, les développeurs concluent des accords avec ces producteurs de contenu. Derniers en date, ceux signés par OpenAI avec News Corp, entre autres propriétaire du Wall Street Journal et du Times, et avec Reddit, l’une des principales plateformes de discussion américaine. Ces accords se traitent à coup de gros chèques - $250 millions sur cinq ans pour News Corp – et/ou de prestations, News Corp et Reddit bénéficieront des développements d’OpenAI. A noter que Google a conclu le même type d’accord avec Reddit pour un montant de $60 millions par an.

Ces négociations ne ciblent pas uniquement les éditeurs de presse, Meta et Google étant en discussion avec les studios d’Hollywood, cette fois pour entrainer leurs modèles vidéo.

La diversité des contenus utilisés est évidemment cruciale pour assurer la qualité des modèles et l’équilibre de leurs réponses. Contre-exemple de cette diversité, Grok, le modèle de X, qui se base uniquement sur les contenus échangés sur sa plateforme et qui en propose des résumés. Bel exemple d’un agent conversationnel clairement biaisé et voulu comme tel par son propriétaire dans sa lutte anti-woke. Ce cas extrême illustre le fait que ces modèles et les assistants qu’ils alimentent sont ou peuvent être orientés, tout comme le sont certains médias. Dans cette perspective, choisir ChatGPT ou Grok procèdera du même principe que de se connecter sur CNN ou sur Fox News.

Archive / TECH