Nachdem mein eingebautes Navi im Auto nun wirklich hoffnungslos veraltet ist, habe ich mal CoMaps auf dem Fairphone (Gen. 6) zur Navigation ausprobiert. Das hat – trotz fehlender Verkehrsinformationen – erstaunlich gut funktioniert. Allerdings, die Sprachansagen waren furchtbar. Ich fühlte mich an die 80er Jahre und den (damals tollen!) Amiga 500 erinnert.
Das Problem
Ich muss dazu sagen: Ich verwende /e/OS auf dem Fairphone. Wer ein Standard Google-Android verwendet hat das Problem vermutlich nicht und kann auf die google-eigene Sprachsynthese zurückgreifen. Ein anderes Custom-ROM und/oder Smartphone mag ebenfalls standardmäßig eine andere (bessere?) Spachsynthese verwenden. "Mein" /e/OS jedenfalls verwendet eSpeak als Text-to-Speech Engine – und die ist nach meinem Empfinden einfach schlecht. Vielleicht habe ich Einstellungsmöglichkeiten übersehen, aber es ist mir nicht gelungen, eine erträgliche Sprachausgabe zu erzeugen.
Die Lösung: SherpaTTS
Auf der Suche nach einer Alternative bin ich im F-Droid Store auf SherpaTTS gestoßen. SherpaTTS sagt über sich selbst (sinngemäß übersetzt):
SherpaTTS ist eine Android Text-to-Speech-Engine, die auf Next-gen Kaldi basiert. Sie verwendet Stimmen von Piper Voices oder Coqui.
Beim ersten Start der App wird sofort ein Auswahldialog angezeigt, worüber man eine Stimme aus einem der Modelle auswählen kann. Ich habe einfach mal aufs Geratewohl de_DE-glados-medium aus Piper Modelle genommen und danach in den Android-Einstellungen unter Bedienhilfen → Sprachausgabe als bevorzugtes Modul SherpaTTS ausgewählt.
Android: Bedienungshilfen → Sprachausgabe
Das Ergebnis war prompt um Welten besser. Die Navigationsansagen aus CoMaps hörten sich auf Anhieb "gut" an. Vielleicht hadert der eine oder die andere ja auch mit der Qualität der Sprachsynthese und findet mit SherpaTTS Abhilfe. Habt ihr weitere Tipps oder andere Erfahrungen zu dem Thema?
Quellen:
- Titelbild: https://github.com/woheller69/ttsEngine
Prima Tipp, die klingt tatsächlich viel besser als eSpeak. Vielen Dank!
Interessant, das werde ich mal testen. Danke. Für deutsch gibt es ja scheinbar einige Sprachmodelle. Manche ganz gut, manche klingen (für meine Ohren) furchtbar. Ich habe spontan keine Übersicht mit Sprachproben zur Auswahl gefunden, kennt jemand etwas gutes?
SherpaTTS ist toll, mein Tip aus den Piper Modellen ist thorsten. Das hört sich nochmal weit besser an als das von dir gewählte glados. Thorsten, also der Mensch, hält auch Vorträge auf OpenSource Veranstaltungen, zuletzt auf der FrOSCon "Alexa ade"
Dann werde ich mich demnächst mal von Thorsten navigieren lassen. Danke für den Tipp!
Installiert, getestet und für gut befunden, nutze jetzt ebenfalls SherpaTTS mit Sprachmodell von thorsten! Allerdings hätte ich gerne das Modell von uNav "British Army Officer 1940" (oder so ähnlich). Legendär die Ansage nach Ankunft: "Finally we arrived... and ALIVE!" :-) Leider lief die App unter Ubuntu Touch nicht stabil. Kann man das Sprachmodell nicht portieren?
Vielen Dank an alle Baumeister, Tippgeber und Thorsten. Bin noch nie so angenehm navigiert worden.
Ich will das schon recht lange unter LinageOs ans laufen kriegen., damit Osmand etwas richtiges sagen kann Leider stürzt der Einstellungsdialog aber immer ab, wenn man Sherpa installiert hat und osmand behauptet es gäbe keine TTS engine. Na vielleicht muss ich mal wieder updatrn ...
Ah ok habe es hinbekommen: https://github.com/k2-fsa/sherpa-onnx/issues/670 Da hatte sich noch reste einer früheren flite Installation versteckt und immer alles zum Absturz gebracht. Nun klappt es natürlich auch mit Osmand :-D