Fr

TECH

Geen zomerreces voor AI-sector

Donderdag 22 Augustus 2024

Geen zomerreces voor AI-sector

Eind juli onthulde Meta Llama 3.1, de laatste versie van zijn AI-model dat naar eigen zeggen krachtiger zou zijn dan ChatGPT-4o en Claude Sonnet 3.5 van Anthropic. Lang kon het bedrijf uit Menlo Park niet van zijn zelfverklaarde topstatus genieten, want de dag erna werd die al betiwst door de lancering van het Large 2-model van Mistral, begin augustus gevolgd door Gemini 1.5 Pro van Google. Dat nam de leiding bovenaan de LMSYS Chatbot Arena, een platform dat de prestaties van de LLM’s evalueert.

Ook xAI maakte zijn opwachting en pakte uit met Grok-2 dat de betalende abonnees van X in staat stelt beelden te creëren zonder dat ze zich al te veel zorgen moeten maken om beperkingen – die zowat onbestaande zijn op het netwerk van Musk.

Dit gebeurde allemaal in afwachting van GPT-5 van OpenAI dat volgens aanhoudende geruchten nog dit jaar gereleast zou worden.

Deze vlaag van aankondigingen - we hebben het hier over testversies die momenteel in ontwikkeling zijn - toont hoe groot en hard de concurrentie is en hoe zwaar de nieuwe financiële belangen doorwegen voor de Big Tech spelers.

Dezelfde methode om innovaties al in een vroeg stadium aan te kondigen, werd ook ingezet voor de geavanceerde spraakmodus van OpenAI die je ondertussen vast wel kent. We bedoelen natuurlijk ChatGPT 4.o dat in mei dit jaar gepresenteerd werd. Het was een verbluffende demonstratie, want het gesprek met de stemassistent was vloeiend, dynamisch en had een 'menselijke' toon. Minder positief is dat we ondertussen vernamen dat deze functie alleen beschikbaar zal zijn voor een kleine groep betalende abonnees voordat ze later op grotere schaal wordt uitgerold.

Sindsdien heeft Google het voortouw genomen dankzij de presentatie van Gemini Live op zijn Made By Google-conferentie op 13 augustus. Met deze spraakassistent kunnen de betalende abonnees van Gemini hardop vragen stellen; Gemini antwoordt dan met de stem die de gebruiker uit tien stemmen heeft gekozen. Net als de spraakassistent van ChatGPT maakt Gemini Live een vloeiend gesprek mogelijk en je kunt hem zelfs onderbreken.

De krachtmeting tussen Google en OpenAI heeft zich ook uitgebreid naar search, met de aankondiging van SearchGPT dat gepresenteerd wordt als een 'prototype' dat toegankelijk is via een wachtlijst. Deze uitbreiding van OpenAI naar search was verwacht en volgt de evolutie waaraan Google, Bing en Perplexity werken.

OpenAI voert aldus een frontale aanval uit op het monopolie van Google, dat nog steeds worstelt met Overview, zijn nieuwe AI-gestuurde zoekinterface. Het plaatst het bedrijf van Sam Altman ook in directe concurrentie met Microsoft, zijn grootste aandeelhouder, die eind juli uitpakte met Bing Generative Search, een AI-gestuurde versie van zijn zoekmachine.
De zomer verliep ook al niet rustig in het generatieve AI-segment: Midjourney onthulde eind juli zijn 6.1-versie. Runway dat zich richt op het genereren van video's presenteerde dan weer Gen-3 Alpha Turbo - zeven keer sneller dan de vorige versie en de helft goedkoper. Synthesia, de specialist in het maken van digitale avatars, kwam met een functie waarmee je in een paar seconden een videoavatar naar je eigen beeld kunt maken. De videopresentatie is verrassend: ze toont Victor Riparbelli, de CEO van het bedrijf, en zijn avatar, zonder dat het mogelijk is om de ene van de andere te onderscheiden.
Concurrent HeyGen die de functie al aanbood in zijn betalende versie, ging meteen in de tegenaanval door ze gratis aan te bieden voor iedereen.

Archief / TECH