Google Meet peut désormais traduire en français la voix d’un interlocuteur étranger. Une fonctionnalité d’abord réservée aux abonnés Google AI Pro ou Google AI Ultra. L’option annoncée par l’entreprise est décrite comme rapide, permettant d’échanger dans sa langue maternelle de manière quasi instantanée.
Les interprètes et les traducteurs n’ont qu’à bien se tenir : ce 28 août, Google annonce une révolution dans Meet, son service de visioconférence. Désormais, son logiciel de communication est en mesure de proposer la traduction vocale automatique du français, de manière quasi instantanée, vers et depuis d’autres langues, comme l’anglais et l’espagnol.
Cette avancée avait été initialement présentée lors de la conférence I/O de Google en mai — le déploiement, pour l’instant, est réservé à celles et ceux qui ont un abonnement à Google AI Pro (21,99 euros par mois) ou à Google AI Ultra (274,99 euros par mois), lancée plus tôt cette année, et qui donne un accès à une multitude d’avantages.

Vos données méritent d’être mieux protégées.
Les escroqueries, les virus et les ransomwares ne sont plus une fatalité. Protégez votre vie privée et vos données personnelles avec Bitdefender et profitez de votre vie numérique en toute sérénité.
Imitation du ton, des intonations et des émotions
Pour adapter les propos d’une langue au fil de la discussion, en mimant « au plus près de leurs voix, tons, intonations et émotions », selon la firme de Mountain View, l’intelligence artificielle (IA) est au centre du jeu. Google parle d’une « nouvelle approche technique » qui mobilise « les dernières avancées de AudioLM. »
Ce grand modèle de langage, conçu par DeepMind, filiale de Google, « a été conçu et est entraîné sur des données audio, et opère directement dans l’environnement sonore, préservant les qualités sonores d’origine, et donc la voix, son accent, ses intonations, pour réaliser le changement sémantique d’une langue vers une autre », est-il détaillé.


Autre particularité : cette intégration fait l’économie d’une série d’étapes (faire la capture sonore des propos dits sur Meet, en faire la transcription écrite, traduire puis interpréter oralement le texte avec une voix artificielle). Le système est « structurellement multimodal », ce qui permet de gagner du temps, et d’approcher l’effet temps réel.
Hasard du calendrier, qui ne manque pas d’ironie : l’arrivée de la traduction vocale dans Meet survient alors que l’entreprise américaine se lance aussi dans l’apprentissage des langues, là encore avec de l’IA. On peut dès lors se demander l’intérêt d’un simili-Duolingo dans Google Traduction, pendant que Meet (et Gemini Live) s’occupe de tout traduire.
Pression de l’IA sur les métiers
Cette fonctionnalité illustre en tout cas la progression des usages de l’IA et de la pression que cela exerce sur un certain nombre de métiers. De plus en plus de professions sont exposées à l’intelligence artificielle : développeurs en informatique, réceptionnistes, service client, mais également interprètes et traducteurs, et bien d’autres encore.
Les effets sur l’emploi se font d’ailleurs déjà ressentir, notamment aux États-Unis : c’est ce que montre une étude publiée le 26 août par des chercheurs de l’Université de Stanford, dans laquelle ont été trouvées « certaines des premières preuves à grande échelle d’une baisse de l’emploi chez les travailleurs débutants occupant des postes exposés à l’IA. »

Toute l’actu tech en un clin d’œil
Ajoutez Numerama à votre écran d’accueil et restez connectés au futur !