Accueil Winaide

Utilisation des voix RealSpeak de Scansoft Nextup Technology dans JAWS 6.20 et supérieurs

le 29 septembre 2006

Rubrique : Logiciels et matériels adaptés

Introduction :

La société américaine NextUp technologie, qui conçoit depuis quelques années un logiciel de lectures vocales de textes nommé textaloud, permet aux utilisateurs enregistrés de ce logiciel financièrement très abordable, d’acquérire à un tarif préférentiel (30 à 35 Euros chacune), les voix de synthèse vocales Realspeak de Scansoft, plus connues dans le monde des déficients visuels sous leur nom usuel : Virginie, Sébastien, etc. Il faut pour cela, se rendre sur [la page adéquate du site de NextUp Technology->http://www.nextup.com/scansoft.html] où l’on peut télécharger des échantillons de démonstration des voix en mp3, et acquérir ces voix en remplissant un formulaire d’achat en ligne, disponible via le lien [Acheter des voix RealSpeak->https://www.plimus.com/jsp/buynow.j...] dans ce formulaire, il suffit de cocher les voix que l’on veut acheter, et de suivre la procédure de commande en ligne au terme de laquelle des liens directs de téléchargement personnels et utilisables une seule fois, sont envoyés au client par courrier électronique. Il faut, pour bénéficier de l’offre, acheter également le logiciel Text Aloud, qui à l’instar de Textsound pour les voix Sapi 4 uniquement, et au sujet duquel on peut se référer à [l’article d’Arnaud disponible ici,->http://www.winaide.net/article85.html], permet de convertir des fichiers textes de différents formats, (.txt mais aussi .rtf et .doc entre autres), en fichiers audio .mp3. Il permet aussi de lire directement ces mêmes fichiers textes à haute voix, une fois ceux-ci chargés dans l’éditeur de texte du programme lui-même. Ce logiciel est indispensable dans la mesure où le programme d’installation de certaines voix, comme celle de Sébastien par exemple, exige la présence de Text Aloud sur l’ordinateur pour fonctionner. Mais il ne coûte que 47.84$ ce qui signifie qu’à raison de 2 voix + Text Aloud, vous en avez pour une centaine d’Euros environ, sans activation par Internet et avec un simple code d’enregistrement traditionnel. Vous recevez votre numéro de série pour Text Aloud, par courrier électronique. Pour l’enregistrer, il vous suffit, après avoir installé la version d’évaluation du produit téléchargeable sur [le site de NextUp Technology.,->http://nextup.com/files/tabeta.exe] d’aller dans le menu Help / purchase puis de copier/coller le numéro de série dans le champ d’édition prévu à cet effet. Cliquer ensuite sur OK pour valider l’enregistrement. L’interface d’installation des voix Scansoft est en Anglais, mais il s’agit d’une installation tout à fait standard, dont le bouton clé est "next", et qui ne pose aucun problème. Le grand avantage est que ces voix sont utilisables comme voix de lecture dans le logiciel de revue d’écran JAWS pour Windows, même s’il ne faut pas en attendre un temps de réaction aussi bref qu’avec Eloquence. L’intégration à JAWS se fait via une procédure que nous nous proposons de détailler maintenant.

1. Correction du problème de distorsion du son des voix Scansoft dans JAWS (à partir de la version 6.20).

Le fichier sapi5x.ini permet de passer par-dessus le format de sortie Audio par défaut pour les moteurs de synthèses vocales Sapi 5. Par défaut en effet, les moteurs de synthèses utilisent le format censément le plus adapté pour la voix concernée. Toutefois, certaines voix ne fonctionnent pas correctement avec l’utilisation de ce format. Il arrive que la voix sature ou fasse entendre des craquements. Une modification du format de sortie améliore parfois considérablement la qualité de la voix. Pour ce faire :

1. Démarrer / exécuter (touche Windows+r).

2. Dans la nouvelle boîte de dialogue, taper lacommande regedit et appuyer sur la touche entrée. S’ouvre alors l’arborescence de la base de registre de Windows dans laquelle on navigue par les flèches haut et bas de branche en branche ou à l’intérieur d’une même branche, et par les flèches gauche pour fermer et droite pour ouvrir une branche. Les manipulations qui suivent, bien menées, sont sans risque pour votre machine. Toutefois, elles touchent à ce qu’il est convenu d’appeler le squelette de Windows, et doivent donc être effectuées sans précipitation afin d’éviter toute fausse manoeuvre. C’est la raison pour laquelle ce "pas à pas" avec les flèches est préconisé de préférence à la navigation habituelle dans les explorateurs de documents, par frappes successives des initiales des branches désirées. On évitera ainsi de s’égarer dans l’arborescence pour le moins labyrinthique, du registre de Windows.

3. Ouvrir successivement les branches suivantes : Poste de travail, HKEY_LOCAL_MACHINE, Software, Microsoft, Speech, Voices, Tokens, Et enfin la clé réservée à la voix dont vous désirez modifier le format de sortie, Virginie ou Sébastien.

4. Appuyer sur la touche f6 ou sur la touche tab, au choix.

5. Flèche bas jusqu’à atteindre la valeur CLSID.

6. Appuyer sur entrée comme pour modifier cette valeur.

7. Sélectionner la totalité de la nouvelle ligne qui s’affiche, via la combinaison de touches maj+fin, puis la copier dans le presse-papier par ctrl+c.

8. Alt+f4 pour fermer l’éditeur du registre et ainsi se mettre à l’abri de toute erreur de manipulation.

9. Par le poste de travail ou explorateur Windows, aller dans c :\Program files\Freedom Scientific\Jaws\x.xx (où x.xx représente le numéro de version de JAWS). On peut aussi atteindre ce dossier en passant par le chemin :

Menu démarrer / programmes / JAWS x.xx (sous-menu) / Explorer JAWS / Explorer fichier programmes.

10. Ouvrir le fichier sapi5x.ini, qui par défaut, devrait s’ouvrir simplement avec le bloc-notes de Windows.

11. Se placer à la fin du fichier et ajouter entre crochets, la ligne contenant la chaîne que l’on vient de récupérer dans la base de registre. En pratique, crochet ouvert (alt-gr+parenthèse gauche), ctrl+v, crochet fermé (alt-gr+parenthèse droite). La syntaxe de cette ligne sera donc : un crochet ouvert, une accolade ouverte, une série de lettres et de chiffres, une accolade fermée, et un crochet fermé.

12. A la ligne suivante, écrire la valeur assignée au format de sortie audio, qui doit obligatoirement être une valeur 16 bits stéréo. A noter que la liste des valeurs et celles des formats auxquelles elles correspondent, figure en commentaire à l’intérieur même du fichier sapi5x.ini. La valeur recommandée pour Virginie comme pour Sébastien, est 23, mais dans certaines configurations, la valeur 22 semble donner de meilleurs résultats, ceci dépendant probablement de la carte son installée sur le PC. Généralement, la différence se fait entre échantillonnage mono ou stéréo, soit par conséquent un choix entre 18 et 19 pour les voix en 16 KHZ, et entre 22 et 23 pour les voix en 22 KHZ telles que Virginie et Sébastien précisément, les autres valeurs risquant d’entraîner une distortion. La syntaxe de la ligne la plus communément ajoutée à cet endroit, sera donc : Output=23

13. Ctrl+s pour enregistrer les modifications apportées à sapi5x.ini.

14. Alt+f4 pour fermer le bloc-notes de Windows et le fichier.

15. Pour que les modifications prennent effet, décharger JAWS de la mémoire par inser+f4, puis le relancer au moyen de son raccourci défini sur votre machine.

Remarque :

Afin de rendre plus compréhensible le fichier sapi5x.ini, on peut ajouter, avant la ligne contenant la clé associée à chaque nouvelle voix dans le registre, Une ligne de commentaire, c’est-à-dire commençant par un point-virgule, dans laquelle on peut indiquer par exemple, le nom de la voix et la langue qu’elle parle. Voici à titre d’illustration, les lignes ajoutées à sapi5x.ini pour Virginie et Sébastien, sur une machine tournant sous Windows XP Service Pack 1. Ceci uniquement pour donner un aperçu de la syntaxe de ces lignes, car si la procédure est à répéter pour chaque voix et sur chaque ordinateur, c’est que la valeur CLSID pour une même voix, est susceptible de changer d’un poste à l’autre. Précisons que tout semble cependant se passer comme si ce n’était pas le cas. C’est la raison pour laquelle nous vous proposons de [Télécharger ici un modèle de fichier sapi5x.ini->http://www.winaide.net/IMG/zip/sapi...]

La procédure est donc indiquée ici parce qu’elle est préconisée par Freedom Scientific. Nous la recommandons par mesure de prudence.

 ;RealSpeak Sebastien (French)

[CAC6785B-655E-4ae1-A656-BDEFD18DC46C]

Output=23

 ;RealSpeak Virginie (French)

[CAC6785B-655E-4ae1-A656-BDEFD18DC46C]

Output=23

2. Prise en charge de la ponctuation française et de la prosodie.

Une fois ce correctif mis en place, il devrait normalement suffire de choisir, à la volée vvia inser+ctrl+s, ou bien comme voix par défaut via les options de synthèse vocale du configurateur de JAWS, le moteur de synthèse Sapi 5, et dans la fenêtre principale de JAWS (accessible par inser+j), options / voix / configuration globale, celle des voix qui fait envie et dont on vient d’améliorer le fonctionnement avec JAWS. Mais un autre problème se pose. La prosodie, c’est-à-dire l’intonation résultant habituellement de la présence des ponctuations, disparaît totalement si on règle la lecture des ponctuations sur "aucune". Et si on laisse JAWS dire certaines ponctuations, celles-ci sont prononcées en Anglais. Voici comment remédier à ces dysfonctionnements :

2.1. Téléchargement des fichiers nécessaires.

Les fichiers qui interviennent dans la lecture de la ponctuation en Français, et dans sa prosodie, portent l’extension .sbl, et le nom de la synthèse vocale à laquelle chacun de ces fichiers est associé.

[Télécharger ici le fichier de ponctuation francophone pour Virginie->http://www.winaide.net/IMG/zip/L_H.zip]

[Télécharger ici le fichier de ponctuation francophone pour Sébastien->http://www.winaide.net/IMG/zip/Scan...]

2.2. Marche à suivre pour la configuration dans JAWS.

1. Dans le poste de travail, aller dans c :\Documents and settings\nom d’utilisateur\Application data\freedom scientific\Jaws\x.xx\Settings\fra. Un chemin plus simple pour atteindre ce dossier, est :

menu démarrer / programmes / JAWS x.xx (sous-menu) / Explorer JAWS / Explorer les paramètres utilisateur. On se trouve alors dans le dossier ad hoc et on peut copier/coller la ou les archives téléchargées, puis en extraire le ou les fichiers en .sbl que l’on vient d’enregistrer sur son disque dur. Une méthode sûre consiste à enregistrer les fichiers .zip directement à cet endroit depuis la fenêtre de téléchargement, puis à les décompresser sur place. Ceci a pour effet d’attribuer aux voix ScanSoft, les mêmes caractéristiques de prosodie que celles prévues d’origine pour Eloquence. Mais pour que ces caractéristiques soient opérationnelles, il faut que des voix dont les noms respectifs sont Scansoft et L&H, et pas seulement Sapi 5, soient reconnues par JAWS dès son démarrage. Pour cela, il faut déclarer dans le fichier jfw.ini, autant de voix Scansoft qu’on en a installé.

2. Dans c :\Program files\Freedom Scientific\Jaws\x.xx, chercher le fichier jfw.ini et en faire une copie de sauvegarde qu’il sera possible de réintroduire au même endroit en cas d’erreur. On placera cette copie dans un dossier de son choix (exemple "mes documents"). Pour rappel, on peut aussi y accéder via la procédure plus parlante évoquée plus haut :

Menu démarrer / programmes / JAWS x.xx (sous-menu) / Explorer JAWS / Explorer fichier programmes.

3. Ouvrir jfw.ini avec le bloc-notes de Windows, et insérer dans la section du fichier réservée aux synthétiseurs vocaux, les lignes concernant Virginie et Sébastien, en prenant modèle sur la syntaxe des lignes qui concernent Eloquence.Une manière simple de repérer cette section est de faire dans le contenu du fichier, une recherche par ctrl+f, de la chaîne de caractères "Eloq" qui est par définition, commune à tous les "jfw.ini" de toutes les versions de JAWS sur toutes les machines. La séquence sera donc : ctrl+f, taper la chaîne "Eloq" sans les guillemets", valider par entrée, puis touche échappe pour fermer la boîte de dialogue de recherche et se retrouver dans le texte du fichier, curseur positionné sur la chaîne recherchée, laquelle est d’ailleurs en surbrillance jusqu’au prochain déplacement du curseur. Pour chaque synthèse vocale déclarée, Nospeech inclus, et dans chacune des 3 lignes, est indiqué immédiatement après "Synth", un nombre de 1 à N (ou N représente la dernière synthèse vocale déclarée), par ordre d’apparition dans la liste des synthèses vocales dans JAWS, celle qui porte le numéro 1 étant la synthèse vocale par défaut. Si on veut que Virginie ou Sébastien soit la voix par défaut, il faudra décaler les numéros d’ordre des autres synthèses vocales installées, à commencer par Eloquence, et cela, tant dans la ligne "SynthXname" que dans la ligne "SynthXLongName" et aussi que la ligne SynthXDriver. Bien sûr, pour toutes les voix Scansoft, la ligne SynthDriver=Sapi5x sera commune. Il est conseillé d’insérer les 3 lignes relatives à la voix que vous désirez déclarer, après la ligne SynthXdriver de celle qui est censée la précéder dans la liste, ou bien juste avant la première de celles qui touchent Eloquence, si vous avez choisi de faire d’une voix ScanSoft, votre voix par défaut. Rappelez-vous que la syntaxe des lignes que vous allez ajouter à jfw.ini imite rigoureusement celles déjà présentes dans cette section.

Voici à titre d’illustration, les lignes pour Sébastien et Virginie sur un PC dont Eloquence est la voix par défaut, après quoi viennent dans l’ordre, Kali, NoSpeech et Sapi 5 toutes voix confondues, et enfin, nos voix ScanSoft.

Synth5Name=ScanSoft

Synth5LongName=Sébastien

Synth5Driver=Sapi5x

Synth6Name=L&H

Synth6LongName=Virginie

Synth6Driver=Sapi5x

Pour la toute première utilisation :

1. Ctrl+inser+s pour changer la synthèse vocale.

2. Dans la liste, sélectionner la voix désirée à l’aide des flèches haut/bas. On dispose maintenant des voix portant les noms de celles que l’on vient de configurer dans JAWS, en l’occurrence, Sébastien et Virginie.

3. Toutes ces voix utilisant le même pilote, Sapi5x, c’est la dernière voix utilisée qui se fait entendre. Si aucune voix n’a encore été sélectionnée dans JAWS pour le moteur Sappi 5, c’est par défaut, la voix américaine de Microsoft Sam qui sera entendue. Il est important de faire en sorte que la langue de la synthèse vocale sélectionnée, soit bien le Français. La première fois que vous choisissez Virginie ou Sébastien dans la liste des synthèses vocales, appuyez ensuite sur Windows+ctrl+l et sélectionnez le Français parmi les langues proposées. Cela vous permettra d’éviter que la voix de Sam vienne interférer avec celle du synthétiseur que vous avez sélectionné. Si vous installez d’autres voix Scansoft, comme par exemple Jenifer pour L’Anglais Américain, Daniel pour l’Anglais Britannique, Julie pour le Français du Canada, Isabel pour l’Espagnol castillan (ou traditionnel), Silvia pour l’Italien, Steffi pour l’Allemand, ou d’autres encore, à chacune de ces voix, correspondra une de ces langues qui viendra s’ajouter à la liste proposée via le raccourci Windows+ctrl+l. Depuis Virginie ou Sébastien, il vous suffira donc de taper ce raccourci pour choisir, par l’intermédiaire de la langue à laquelle elle correspond, la voix "étrangère" de votre choix. Il faudra bien sûr, penser à rebasculer vers le Français si vous voulez que Virginie ou Sébastien parlent bien avec leurs voix respectives, lors de votre prochaine session Windows, ou prochaine lecture avec les voix Scansoft.

4. Appuyer sur inser+j pour ouvrir la fenêtre principale de JAWS.

5. Menu options / voix / configuration globale...

6. Choisir dans cette boîte de dialogue, les réglages concernant le débit de la parole, la lecture des ponctuations que l’on peut désormais régler sur "aucune" sans risque d’altération de la prosodie, le débit d’épellation et la hauteur de la voix pour les majuscules.

3. Quelques notes utiles :

Ces voix étant en quelque sorte "nouvelles" pour JAWS, certains de ces réglages sont complètement à 0 la première fois. Il est même nécessaire, pour s’assurer d’un résultat optimal, d’aller, toujours dans la fenêtre principale de JAWS, options / voix, mais cette fois dans "configuration individuelle...", paramétrer la voix voulue pour chacune des rubriques, curseur PC, curseur JAWS, voix du clavier, voix du tuteur et des messages. Il arrive en effet, que le moteur Sapi 5 donne à entendre plusieurs voix dans ces divers "compartiments" de JAWS, sans qu’on sache pourquoi. Ne pas oublier, pour chaque rubrique dont les réglages ont été modifiées, de tabuler jusqu’au bouton "appliquer", et de l’activer par la barre d’espace, avant de passer à l’élément suivant de la liste.

Pour une lecture plus fluide avec JAWS, il est fortement recommandé de régler sur "phrase", le mode "dire tout". Pour ce faire :

1. Inser+j pour ouvrir la fenêtre principale de JAWS.

2. Menu utilitaires / configurateur, ou bien, à partir d’un endroit quelconque où l’on se trouve dans Windows, fenêtre de JAWS comprise, inser+6 du clavier standard ouvrira le configurateur de l’application en cours, puis ctrl+maj+d pour le configurateur par défaut.

3. Alt+m pour activer le menu "modifier options".

4. Flèche bas jusqu’à "options dire tout...", puis touche entrée pour ouvrir la boîte de dialogue.

5. Au premier champ, flèches haut/bas pour cocher le bouton radio "phrase".

6. Tabuler jusqu’au bouton OK, et l’activer avec la barre d’espace.

7. Ctrl+s pour enregistrer cette modification.

8. Alt+f4 pour fermer le configurateur de JAWS.

Conclusion

Les voix ScanSoft RealSpeak étant plus gourmandes en ressources machine, que celle d’’Eloquence habituellement utilisée avec JAWS, l’échelle des débits y est très différente. Il faut régler le débit global de Virginie ou de Sébastien à 50%, par exemple, pour obtenir une vitesse de lecture équivalente à Eloquence réglée sur 20 ou 25%. De même, la lecture de documents très volumineux comme un livre en plusieurs tomes réunis dans un seul fichier .txt, peut parfois s’avérer problématique. Il est conseillé, de préférence, de lire des fichiers de cette taille plutôt avec Text Aloud, qui est plus spécifiquement conçu à cet effet et pour lequel nous vous suggérons de consulter [le tutoriel d’arnaud disponible ici->http://www.winaide.net/article92.html], qu’avec un éditeur traditionnel et par le truchement de JAWS. Il arrive par ailleurs, dans certaines configurations, que lors d’une lecture ligne par ligne, y compris sous Microsoft Outlook Express par exemple, des caractères soient aléatoirement prononcés avant la lecture d’une ligne, alors qu’ils ne figurent pas dans le texte, par la voix en cours d’utilisation, mais avec une tonalité plus basse... ou bien encore, que la lecture s’arrête sans crier gare... Toutefois, pour un usage, disons, standard, c’est-à-dire pour la lecture de textes de longueur moyenne, Virginie, Sébastien et leurs homologues RealSpeak présentent néanmoins l’avantage sur la grande majorité de leurs concurrents, et pour un prix sensiblement réduit, d’une qualité sonore très proche de la voix naturelle.