Destinée à favoriser l’accessibilité des contenus textuels à tous les utilisateurs, la synthèse vocale – qu’on appelle encore « Text To Speech (TTS) » – est une technologie qui permet de produire de la parole artificielle par conversion automatique de contenus textuels en format audio. Avec le développement des jeux vidéo, des services d’assistance vocale, la technologie a considérablement gagné du terrain et continue de le faire. Cela dit, n’est-il pas possible de mettre, délibérément, la synthèse vocale à notre service au quotidien ?
L’importance de la synthèse vocale au quotidien
Comme nous l’avons signifié dans l’introduction, le but du Text To Speech est de convertir un texte affiché sur un support numérique en parole artificielle émise par un logiciel dédié, afin de faciliter l’accès à l’information.
Au départ, cette technologie s’est développée principalement pour résoudre les difficultés d’accès aux contenus textuels éprouvées par les personnes ayant :
- Un handicap visuel ou une déficience visuelle ;
- Un faible (ou aucun) niveau de scolarisation ;
- Des problèmes de fatigue visuelle ;
- Des difficultés de concentration face aux pages blanches ;
- Etc.
Toutefois, avec le temps, la synthèse vocale a dépassé la sphère de l’assistance au handicap et à l’incapacité visuelle, pour devenir une solution destinée à rendre la lecture des textes moins contraignante pour tout le monde, handicapé ou pas.
La technologie permet donc de lire avec les oreilles, c’est-à-dire sans avoir à fixer un écran, pour des raisons de convenance. Dans la pratique, cette forme de lecture se révèle souvent plus favorable à une meilleure compréhension, puisqu’elle évite d’être distrait par une quelconque image qui bouge, de mieux se concentrer sur son ouïe et par ricochet, de mieux capter le message.
D’ailleurs, de nombreuses études scientifiques ont prouvé que, sauf dans les cas particuliers tels que l’autisme, la surdité partielle ou totale, etc., l’écoute humaine est généralement mieux développée que la vue pour la compréhension des textes, puisque nous avons appris à distinguer le son avant d’apprendre à distinguer les lettres.
Quelques cas d’application de la synthèse vocale au quotidien
Avec les évolutions technologiques en matière d’oralisation de contenus textuels, le champ d’application du Text to Speech s’est considérablement élargi. La technologie s’est donc révélée très pratique pour des cas d’utilisation quotidienne tels que :
- L’écoute de mails et de SMS ;
- La lecture de livres électroniques ou de documents numériques ;
- L’oralisation de contenus textuels d’une page web ;
- L’utilisation d’un moteur de traduction vocale pour connaître ou pour vérifier la prononciation d’une phrase dans une langue étrangère ;
- Etc.
L’utilisation du Text To Speech peut être motivée aussi bien par un besoin de convenance que par la nécessité, comme dans le cas de personnes souffrant d’un handicap visuel par exemple.
Comment fonctionne la synthèse vocale ?
Simple, le fonctionnement du Text To Speech repose sur un logiciel de lecture d’écran qui est normalement intégré à l’écran des ordinateurs, des smartphones ou autres appareils compatibles.
Ainsi, dès que les données textuelles (un livre, un mail, une page web, des notifications ou des données d’une application, etc.) apparaissant à l’écran, le logiciel de lecture d’écran les repère et les traite, en tenant compte des tableaux, des listes à puces, des champs à remplir, etc.
Après traitement, le logiciel envoie les données à un synthétiseur vocal intégré qui, à son tour, oralise ces données dans la langue présélectionnée par l’utilisateur qui pourra alors entendre le message affiché à l’écran.
Evidemment, un synthétiseur vocal ne produira pas forcément une oralisation ultrasophistiquée, l’objectif étant juste de faciliter la compréhension.
Toutefois, de plus en plus de moyens sont mis en œuvre pour que l’intelligence artificielle (c’est-à-dire la voix synthétisée) soit de plus en plus proche de la phonétique, de la rythmique et de l’intonation humaine.
Après avoir pris connaissance de tous ces détails, en quoi pensez-vous que la synthèse vocale puisse vous être utile ?