Kurztipp: Sprachsynthese mit SherpaTTS

  Martin Brodbeck   Lesezeit: ~1 Minute  🗪 8 Kommentare Auf Mastodon ansehen

SherpaTTS is eine empfehlenswerte Text-to-Speech-Engine. Auf meinem Fairphone mit /e/OS hat sie die Sprachausgabe erheblich verbessert.

kurztipp: sprachsynthese mit sherpatts

Nachdem mein eingebautes Navi im Auto nun wirklich hoffnungslos veraltet ist, habe ich mal CoMaps auf dem Fairphone (Gen. 6) zur Navigation ausprobiert. Das hat – trotz fehlender Verkehrsinformationen – erstaunlich gut funktioniert. Allerdings, die Sprachansagen waren furchtbar. Ich fühlte mich an die 80er Jahre und den (damals tollen!) Amiga 500 erinnert.

Das Problem

Ich muss dazu sagen: Ich verwende /e/OS auf dem Fairphone. Wer ein Standard Google-Android verwendet hat das Problem vermutlich nicht und kann auf die google-eigene Sprachsynthese zurückgreifen. Ein anderes Custom-ROM und/oder Smartphone mag ebenfalls standardmäßig eine andere (bessere?) Spachsynthese verwenden. "Mein" /e/OS jedenfalls verwendet eSpeak als Text-to-Speech Engine – und die ist nach meinem Empfinden einfach schlecht. Vielleicht habe ich Einstellungsmöglichkeiten übersehen, aber es ist mir nicht gelungen, eine erträgliche Sprachausgabe zu erzeugen.

Die Lösung: SherpaTTS

Auf der Suche nach einer Alternative bin ich im F-Droid Store auf SherpaTTS gestoßen. SherpaTTS sagt über sich selbst (sinngemäß übersetzt):

SherpaTTS ist eine Android Text-to-Speech-Engine, die auf Next-gen Kaldi basiert. Sie verwendet Stimmen von Piper Voices oder Coqui.

Screenshots zu SherpaTTS

Beim ersten Start der App wird sofort ein Auswahldialog angezeigt, worüber man eine Stimme aus einem der Modelle auswählen kann. Ich habe einfach mal aufs Geratewohl de_DE-glados-medium aus Piper Modelle genommen und danach in den Android-Einstellungen unter Bedienhilfen → Sprachausgabe als bevorzugtes Modul SherpaTTS ausgewählt.

Android: Bedienungshilfen → Sprachausgabe

Das Ergebnis war prompt um Welten besser. Die Navigationsansagen aus CoMaps hörten sich auf Anhieb "gut" an. Vielleicht hadert der eine oder die andere ja auch mit der Qualität der Sprachsynthese und findet mit SherpaTTS Abhilfe. Habt ihr weitere Tipps oder andere Erfahrungen zu dem Thema?

Quellen:

  • Titelbild: https://github.com/woheller69/ttsEngine

Tags

Text-to-Speech, Android

Naja
Geschrieben von Naja am 21. August 2025 um 14:56

Prima Tipp, die klingt tatsächlich viel besser als eSpeak. Vielen Dank!

kaligule
Geschrieben von kaligule am 21. August 2025 um 18:17

Interessant, das werde ich mal testen. Danke. Für deutsch gibt es ja scheinbar einige Sprachmodelle. Manche ganz gut, manche klingen (für meine Ohren) furchtbar. Ich habe spontan keine Übersicht mit Sprachproben zur Auswahl gefunden, kennt jemand etwas gutes?

PrivacyFan
Geschrieben von PrivacyFan am 21. August 2025 um 19:03

SherpaTTS ist toll, mein Tip aus den Piper Modellen ist thorsten. Das hört sich nochmal weit besser an als das von dir gewählte glados. Thorsten, also der Mensch, hält auch Vorträge auf OpenSource Veranstaltungen, zuletzt auf der FrOSCon "Alexa ade"

Martin Brodbeck
Geschrieben von Martin Brodbeck am 21. August 2025 um 19:40

Dann werde ich mich demnächst mal von Thorsten navigieren lassen. Danke für den Tipp!

gun630
Geschrieben von gun630 am 22. August 2025 um 19:20

Installiert, getestet und für gut befunden, nutze jetzt ebenfalls SherpaTTS mit Sprachmodell von thorsten! Allerdings hätte ich gerne das Modell von uNav "British Army Officer 1940" (oder so ähnlich). Legendär die Ansage nach Ankunft: "Finally we arrived... and ALIVE!" :-) Leider lief die App unter Ubuntu Touch nicht stabil. Kann man das Sprachmodell nicht portieren?

Peter
Geschrieben von Peter am 18. September 2025 um 12:08

Vielen Dank an alle Baumeister, Tippgeber und Thorsten. Bin noch nie so angenehm navigiert worden.

MaM
Geschrieben von MaM am 21. August 2025 um 21:42

Ich will das schon recht lange unter LinageOs ans laufen kriegen., damit Osmand etwas richtiges sagen kann Leider stürzt der Einstellungsdialog aber immer ab, wenn man Sherpa installiert hat und osmand behauptet es gäbe keine TTS engine. Na vielleicht muss ich mal wieder updatrn ...

MaM
Geschrieben von MaM am 23. August 2025 um 10:33

Ah ok habe es hinbekommen: https://github.com/k2-fsa/sherpa-onnx/issues/670 Da hatte sich noch reste einer früheren flite Installation versteckt und immer alles zum Absturz gebracht. Nun klappt es natürlich auch mit Osmand :-D