Wie Ihre Informations- und Lernmodule sprechen lernen (Teil 4)
Mehr und mehr bieten gute Text-to-Speech-Software-Applikationen eine echte Alternative zum professionellen Sprecher. Nicht zuletzt sprechen die immer menschenähnlichere Stimme und die niedrigen Kosten für die Lösungen.
Wir haben bereits über die Vor- und Nachteile solcher Systeme gesprochen. Der Wikipedia-Artikel zum Thema "Sprachsynthese" vertieft diesen Punkt.
Wie schon angesprochen, bedarf es einer speziellen Lizenz, um die Audio-Dateien in eLearning oder Podcasts zu veröffentlichen. Die meisten Text-to-Speech-Engines, bei Kosten oft unter CHF 100.-, sind für das Vorlesen von Texten am PC gedacht. Die als MP3 oder WAV gespeicherten Audiodateien dürfen nicht weitergegeben werden. Typische Anbieter solcher Systeme sind Naturalreaders, Nextup oder Linguatec. Linguatec bietet sowohl die kostengünstige Vorsprech-Version als auch eine Lizenz für den Einsatz von Audiodateien im eLearning- oder Podcast-Bereich an.
partekk hat sich speziell auf Text-to-Speech-Engines spezialisiert, welche für die Verwendung der Sprach-Audio-Dateien in Informations- und eLearning-Modulen oder in Podcasts ausgerichtet sind.
Spezielle Lizenzen für die Veröffentlichung von Sprach-Audio-Dateien bieten die folgenden Hersteller an:
![]() |
Produkt-Informationen | Acapela Sprach Demos |
| Produkt-Informationen | Linguatec Sprach Demos |
Die Verwendung solcher Text-to-Speech-Engines ist denkbar einfach. Sie geben den Text in das dafür vorgesehene Feld ein, wählen den gewünschten Sprecher aus und starten die Vorlesefunktion.
Die Herausforderung besteht nun darin, der Maschine die gewünschte Aussprache von Fach- oder Fremdwörtern "beizubringen". Beide Text-to-Speech-Engines bieten die Möglichkeit, ein eigenes Aussprache-Lexikon anzulegen. Dies ist essenziell, da Sie nicht für jeden Durchlauf die Aussprache immer neu "modellieren" möchten. Dazu bieten die Softwaremaschinen unterschiedliche Möglichkeiten, die Aussprache für Wörter festzulegen. Dies kann mittels spezieller Zeichen, phonetisch oder rein textlich erfolgen.
"partekk" beispielsweise soll als "paarteck" ausgesprochen werden.
Im nächsten Schritt möchten Sie eventuell die Satzmelodie oder den Satz-Rhythmus verändern. Die Applikationen bieten hierfür verschiedene Tags an, welche im Sprechtext eingefügt werden können. Eine Pause kann z. B. mit dem Tag <Pause=2000/> eingefügt werden. Die Melodie kann mittels Satzzeichen beeinflusst werden.
Um für ein Informations- oder eLearning-Modul eine brauchbare Audiodatei zu erzeugen, sind daher einige Durchläufe nach dem "try and error"-Verfahren mit manuellen Anpassungen notwendig. Diese Arbeit lässt sich nicht automatisieren. Dafür nimmt der Aufwand für die Feinabstimmung der Sprache von Mal zu Mal ab, da immer weniger Wörter im Lexikon nachgetragen werden müssen.
Wem dies zu aufwendig ist, kann diese Arbeit auch uns überlassen. partekk bietet attraktive Minutenkontingente fertiger Sprach-Audio-Dateien, aufgenommen mit einer Text-to-Speech-Engine, an. Die Feinmodellierung der Aussprache und Betonung übernimmt partekk.
5 Minuten Sprache von einem virtuellen Sprecher Ihrer Wahl sind schon ab CHF 45.- zu haben. Nachbesserungen sind bei Text-to-Speech-Aufnahmen im Preis inbegriffen!
Wünschen Sie mehr Informationen über unseren Virtuell Speaker Service oder unsere Text-to-Speech-Produkte? Kontaktieren Sie uns, wir beraten Sie gerne.

Kommentare