Nl

TECH

Pas de pause estivale dans le monde de l'IA

Jeudi 22 Août 2024

Pas de pause estivale dans le monde de l'IA

Fin juillet, Meta dévoilait Llama 3.1, la dernière itération de son modèle d’IA auto-proclamé plus puissant que ChatGPT-4o et que Claude Sonnet 3.5 d’Anthropic. La firme de Menlo Park n’a cependant pas bénéficié longtemps de ce leadership, contesté dès le lendemain par le lancement du modèle Large 2 de Mistral mais surtout, début août, par le Gemini 1.5 Pro de Google qui a pris la tête du classement de LMSYS Chatbot Arena, une plateforme communautaire qui évalue les performances de ces LLM.

xAI s’est aussi invitée dans la course en dévoilant Grok-2 qui permet aux abonnés payants de X de créer des images sans trop se soucier de gardes fous quasi inexistants sur le réseau de Musk.

Le tout en attendant le GPT-5 d’OpenAI qui devrait être dévoilé cette année selon des rumeurs persistantes.

Cette pluie d'effets d'annonces - on parle ici de versions test, en cours de développement - démontre l’ampleur de la compétition et les nouveaux enjeux financiers des acteurs de la Big Tech.

Cette technique d'annonce anticipée aussi été utilisée pour le mode vocal avancé d’OpenAI, le fameux ChatGPT 4.o présenté en mai dernier. Une démonstration bluffante tant la conversation avec l’assistant vocal était fluide, dynamique et doté de tonalité "humaine". Sauf que depuis nous avons appris que cette fonctionnalité ne sera disponible qu'auprès d'un petit groupe d’abonnés payants avant d’être déployée plus largement… Depuis, Google a pris l’avantage en présentant Gemini Live lors de sa conférence Made By Google du 13 août. Cet assistant vocal permet aux abonnés payants de Gemini de poser des questions à voix haute et celui-ci répond en utilisant la voix sélectionnée par l’utilisateur parmi les 10 proposées. Tout comme l'assistant vocal de ChatGPT, Gemini Live propose une conversation fluide et peut être interrompu.

Le match Google/OpenAI s’est aussi étendu au domaine de la recherche avec l’annonce du SearchGPT présenté comme un "prototype" accessible via une liste d’attente. Cette incursion d’OpenAI dans le domaine de la recherche était attendue. Elle participe à l’évolution actuelle sur laquelle travaillent les Google, Bing et autres Perplexity.

OpenAI s’attaque donc frontalement au monopole de Google qui a encore des difficultés avec Overview, sa nouvelle interface de recherche alimentée par l’IA. Accessoirement cela met la société de Sam Altman en concurrence directe avec Microsoft, son plus gros actionnaire, qui a quant à lui dévoilé fin juillet le Bing Generative Search, une version de son moteur de recherche basée sur l’IA.

​L’été n'a pas été pas plus calme dans le segment des IA génératives avec Midjourney qui a dévoilé fin juillet sa version 6.1. Axée sur la génération de vidéo, Runway a quant à elle présenté Gen-3 Alpha Turbo - sept fois plus rapide que la version précédente et deux fois moins chère. De son côté, Synthesia, le spécialiste de création d’avatars numériques, a lancé une fonctionnalité qui permet la création d’un avatar vidéo à votre image en quelques secondes. La vidéo de présentation est surprenante : elle montre Victor Riparbelli, le CEO de la société, et son avatar sans qu’il soit possible de distinguer l’un de l’autre.
Son concurrent HeyGen qui proposait cette même fonctionnalité dans son offre payante a directement contre-attaqué en la proposant gratuitement à tous.

Archive / TECH