Fr

TECH

Voice: de ervaren stem van Acapela

Donderdag 7 December 2023

Voice: de ervaren stem van Acapela

Sinds de opkomst van AI zijn er steeds meer start-ups die voice cloning aanbieden. De Acapela Group is al meer dan twintig jaar actief in deze markt.
 
Het bedrijf is ontstaan uit de fusie van drie gespecialiseerde Europese bedrijven, Babel Technologies (België), Elan speech (Frankrijk) en Infovox (Zweden), en werd onlangs overgenomen door het Zweedse Tobii Dynavox, waarmee het al lange tijd samenwerkte.

Acapela is sinds zijn oprichting gevestigd in Bergen en is voornamelijk actief in Europa en de Verenigde Staten. Rémy Cadic, CEO van het bedrijf, vertelt ons waarom de stemoplossingen van de Acapela Group zo bijzonder zijn in een wereld die gedomineerd wordt door AI.

In welke domeinen zijn jullie actief?
 
Acapela Group is een uitgever van spraaksynthesesoftware die een bepaalde stem kan creëren en softwareoplossingen aanbiedt voor het omzetten van tekst in spraak. We zijn actief in drie domeinen: toegankelijkheid, transport en klantenrelaties.
 
Toegankelijkheid is vooral gericht op de wereld van de gezondheidszorg. Onze oplossingen stellen mensen die hun stem hebben verloren bijvoorbeeld in staat om zich via spraak uit te drukken met behulp van een speciale tablet. Onze ‘my-own-voice’ oplossingen synthetiseren de stem van de persoon en reproduceren deze natuurgetrouw.

In de transportsector worden onze oplossingen bijvoorbeeld gebruikt om gesproken berichten uit te zenden in stations, treinen, metrostations en luchthavens. Deze berichten bestaan in tekstformaat in de systemen van onze klanten en wij zetten ze in realtime om in spraak. Of het nu gaat om algemene informatie over dienstregelingen, spoorwijzigingen, enz. of om noodberichten.
 
Tot slot houdt onze afdeling rond klantenrelaties zich bezig met het gebruik van onze gesynthetiseerde stemmen voor interactieve voice servers, voice bots, e-learning en podcasts.
 
Onze klanten zijn software-uitgevers gespecialiseerd in communicatietools, ziekenhuizen en bedrijven in de medische sector voor wat betreft onze activiteiten rond toegankelijkheid. In onze transportafdeling zitten klanten zoals Deutsche Bahn, Aéroports de Paris en Coyote. De klantenrelatiesafdeling is diverser en telt grote bankengroepen (BNP Paribas, Crédit Agricole, Caisse d'Epargne) en weldra ook mediagroepen.
 
Wat onderscheidt jullie van de vele generatieve AI-oplossingen die nu in jullie sector op het toneel verschijnen?
 
Er gaat bijna geen dag voorbij zonder dat een klant of prospect ons deze vraag stelt. Het antwoord is dubbel. Enerzijds beschikken we over een jarenlange ervaring in text-to-speech- en stemweergaveoplossingen die we dagelijks perfectioneren. Met onze nieuwste versie van onze ‘my-own-voice’ tool, waarmee iedereen zijn eigen stem kan genereren, zijn we geselecteerd in de lijst van best presterende producten in de categorie Digital Health van de CES 2023 ‘Innovation Awards’.
 
Anderzijds is onze expertise in het creëren van computergegenereerde stemmen gebaseerd op de kwaliteit en diversiteit van de stemmen die we onze klanten bieden.

We hebben een premium propositie en werken samen met onze klanten om het type stem te bepalen dat overeenkomt met hun doelstelling en positionering. We houden ons echt bezig met hun stemidentiteit en dat is iets dat generatieve AI-tools momenteel nog niet bieden. Een stem voor aankondigingen in het station moet in de eerste plaats heel helder zijn, voor de klantendienst van een bank moet die dan weer geruststellend klinken… In het algemeen moet een stem de waarden van het bedrijf weerspiegelen.

De diversiteit aan stemmen die we aanbieden is een van onze troeven. De nieuwste online systemen baseren zich vaak op enorme datasets die dan weer vertrekken van wat er beschikbaar is op het internet vandaag de dag. Het Engels is er oververtegenwoordigd en je vindt er voornamelijk Amerikaanse stemmen of stemmen met een neutraal accent. Acapela daarentegen beschikt over een eigen dataset die bestaat uit duizenden stemmen die we sinds onze start hebben opgenomen. Ons aanbod is zeer divers op het vlak van talen, accenten en het timbre van de stemmen. Aldus kunnen we onze klanten een kwaliteitsstem op maat bieden. Daarmee maken we het verschil. Natuurlijk helpt AI, en machine learning in het bijzonder, ons om sneller in te spelen op de behoeften van onze klanten.

Die generatieve AI oplossingen beschouwen jullie dus niet als concurrenten?
 
Nee, althans nu nog niet. Ze richten zich op het produceren van stemmen die gebruikt worden voor communicatiedoeleinden, zonder beperkingen op het vlak van toegankelijkheid, noch op realtime. Onze klanten kunnen niet afhankelijk zijn van de zogenaamde ‘latencies’ die inherent zijn aan SaaS. De meeste van onze software is ingebed in en direct verbonden met de IT-systemen van onze klanten. We bieden onze klanten een hoogstaande service inzake spraak.

Wat zijn jullie activiteiten in de mediawereld?

We werken momenteel voor een aantal persgroepen, vooral in België, meer bepaald om stemmen te ontwikkelen voor geschreven artikelen en deze om te zetten in podcasts. Dit houdt in dat we stemmen op maat moeten creëren, wat veel voorbereiding en fine-tuning vereist vooraleer over te gaan tot productie.

We staan nog maar aan het begin van dit proces. We kunnen er dus niet veel over zeggen.

Archief / TECH