Les voix de synthèse, un outil IA au service du marketing digital et de la communication


Une nouvelle ère pour la communication vocale

Une voix de synthèse est une voix générée par une intelligence artificielle de synthèse vocale.

Cette technologie existe depuis des décennies. Elle a récemment fait de gros progrès grâce à la technologie du deep learning. Avec des acteurs comme ElevenLabs, Murf AI, Google cloud text-to-speech, Amazon Polly, ou Resemble AI.

Auparavant, les voix synthétiques sonnaient peu naturelles, mécaniques et sans nuances. Les voix basées sur l’apprentissage profond ont de bien meilleurs résultats. Elles ressemblent à s’y méprendre à de véritables voix humaines.

D’où l’idée de les utiliser dans le domaine du marketing digital et, en général, de la communication.

En voici quelques usages possibles.

Usages des voix générées par IA en marketing digital

Communication sur les réseaux sociaux

Par rapport au texte écrit, la voix transmet plus de chaleur et d’émotion.

Un usage des voix de synthèse consiste donc à leur faire interpréter des messages, qu’on diffuse ensuite sur les réseaux sociaux.

On peut notamment se servir de l’audio dans des vidéos, qui ont une viralité plus forte.

Chatbots sur site web

Les LLM comme ChatGPT ou Mixtral permettent de générer du texte pour répondre aux demandes des utilisateurs. Et ce, en lien avec le corpus de texte constitué par le site lui-même.

Au lieu d’interagir en mode texte, ce qui suppose que l’utilisateur tape son texte puis lise la réponse, la synthèse vocale permet d’interagir de manière plus spontanée.

L’internaute d’un site e-commerce peut ainsi demander : « tu as des tee-shirts blancs ? » L’IA répond : « Oui, pour homme ou pour femme ? » « Pour homme ». « Voici la liste des tee-shirts blancs pour homme. »

Sites web vocalisés

Le texte sur les sites web impose d’être lu. Or, il y a bien des circonstances où lire n’est pas pratique. La synthèse vocale installée sur un site web transforme tout son contenu en audio. On peut ainsi écouter la lecture d’un article de blog, alors qu’on prend le métro, fait du vélo, conduit sa voiture.

Les caractéristiques de la voix sont évidemment personnalisables en fonction du public, voire des préférences personnelles des internautes. Genre, ton, vitesse…

Par exemple, un site pour un jeune public féminin pourra parler avec une voix de jeune femme au débit énergique et enjoué.

Traductions multilingues

La synthèse vocale est possible dans des dizaines de langues, de sorte qu’une campagne de marketing digital peut se décliner à l’échelle de milliards de clients potentiels, en anglais, français, espagnol, hindi, arabe… La synthèse vocale d’ElevenLabs propose par exemple pas moins de 29 langues. L’effort de création de contenus marketing peut ainsi faire de grandes économies.

Un site web multilingue, ou une vidéo publicitaire, parlent plusieurs langues avec la même voix.

Voix clonées

Une autre forme de voix synthétique est la voix clonée. Elle consiste à numériser des enregistrements de qualité d’une voix humaine – pour ce, ElevenLabs demande par exemple un enregistrement d’au moins 30 minutes, en studio. Ensuite, cette voix s’utilisera à l’infini, pour lire et interpréter tout message écrit.

On imagine facilement l’application de la voix clonée au marketing digital. Il suffit de payer un acteur ou une actrice ayant une voix qui représente bien l’identité d’une marque. Ensuite, on utilise cette voix sur les divers canaux marketing : réseaux sociaux, site web, chatbot, callbot (voix qui répond au téléphone), publicités, podcasts, vidéos. Une entreprise, personne morale, se dote ainsi d’une voix unique et reconnaissable. On parle alors de branding vocal.

Défis et perspectives des voix de synthèse dans le marketing digital

Comme d’habitude, les progrès de l’IA posent de nouveaux problèmes à l’humanité.

Les voix de personnes célèbres font désormais l’objet de plagiat et de contrefaçon.

En mode deep fake, on leur fait dire n’importe quoi, y compris avec une intention malveillante, comme quand la voix d’un adversaire politique est instrumentalisée pour lui faire prononcer des propos choquants. Ce dont Joe Biden ou Donald Trump, aussi bien qu’Emmanuel Macron ou Taylor Swift ont été victimes.

Pour les acteurs vocaux et actrices vocales, la synthèse de voix apparait comme une menace existentielle.

Malgré ces risques, on imagine bien que la synthèse vocale a de beaux jours devant elle. La communication du futur sera largement synthétique !



Source link