Thorsten-Voice TTS in Windows nutzen | DDC / VITS

Thorsten-Voice

มุมมอง 4 775

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 29 ก.ย. 2024

ความคิดเห็น • 57

@mal-avcisi9783 19 ชั่วโมงที่ผ่านมา ⁺¹
"du wirst peisn brauchen" 🤣🤣
@Dylldophlo ปีที่แล้ว ⁺¹
Eigentlich habe ich ja gehofft dass es sich um ein TTS Voice handelt das man einfach in Windows installieren kann um die schreckliche englische Anna weg zu bekommen.
Trotzdem gute Arbeit, hört sich verdammt gut an.
@ThorstenMueller ปีที่แล้ว
Vielen Dank 😊. Ich habe vor einigen Monaten mal in einen Microsoft Forum gefragt, wie ich meine Stimme ganz einfach in Windows als Stimme anbieten kann. Aber habe leider keine Antwort bekommen. Meinst du, meine TTS Stimme in Windows wäre eine sinnvolle Ergänzung? Vielleicht muss ich das Thema aktiver verfolgen.
@Dylldophlo ปีที่แล้ว
@@ThorstenMueller Also wenn ich so auf der Suche nach einer TTS Stimme bin, die nichts kostet, lande ich meist auf Kostenpflichtigen Seiten die dann oft nicht einmal ein Sample in Deutsch anbieten oder genau so "gut" sind wie Hedda, Steffi und diese ganzen veralteten SAPI Voices. Auf Github gäbe es noch das Projekt eSpeak: speech synthesis, aber die heruntergeladen Stimmen errinnern mehr an den Talking Parrot von Creative aus den 90ern.
Ich weis nicht, ob neuere Windows Versionen mittlerweile ertragbare TTS Stimmen in Deutsch mitliefern, denn ich gurke ja immer noch mit mit veralteter Soft/Hardware rum.
Wenn ich nicht auf obigen Seiten lande, dann finde hauptsächlich auch Seiten wo Blinde oder Menschen mit Leseschwäche nach vernünftiegen TTS Stimmen suchen. Ist aber alles recht alt, entweder begnügen sich diese Menschen einfach mit dem gelieferten oder haben sich eben für etwas kostenpflichtiges entschieden (Halbwissen: ich glaube da gibt es einen Kostenzuschuß).
Ich habe mich auf einigen Kostenspflichtigen Seiten herumgetrieben, gefallen finde ich da an keiner der Stimmen.
Das wirkt alles so steril von der Sprache.
In der Küche hab ich einen alten HP Pavillion mit Touchscreen, für Musik, Video, Hörspiele und Rezepte.
Wäre schön wenn man sich da bei der Küchenarbeit auch mal etwas vorlesen lassen könnte.
Auch ein altes Gerät, aber er tut es, und zwar gut, auch wenn das Displayglas oft gut geschmiert ist.
Ist natürlich auch vermutlich ein großer Aufwand so eine SAPI Stimme zu erstellen, ich will dich keineswegs da in eine Richtung schieben. Auch Fremdwörter sind problematisch, ein einfaches Guide oder Happy Birthday bringt deine Stimme schon ins straucheln. Aber, in Deutsch hört es sich super an.
@ThorstenMueller ปีที่แล้ว ⁺¹
@@Dylldophlo Ja, ich glaube eine neue SAPI Stimme bereitzustellen ist sicherlich nicht ganz einfach, aber ich hoffe bald etwas Zeit zu finden, mich da etwas genauer einlesen zu können. Dann kann ich bestimmt abschätzen, wieviel Aufwand da rein gesteckt werden müsste.
@guilloisvincent2286 ปีที่แล้ว ⁺¹
Nice ! but coqui TTS is not free 😢there is no free alternative ?
@ThorstenMueller ปีที่แล้ว ⁺¹
Hi, i'm not sure what you mean with "free". Maybe you mean Coqui Studio which isn't imho open source. But the TTS tooling/framework is.
@Jed-i6j 9 หลายเดือนก่อน ⁺¹
It’s not for commercial use
@svenpaulus363 8 หลายเดือนก่อน
Hallo Thorsten. Ich habe ab der Eingabe von der Aktualisierung des Setuptools das Problem das es das Update nicht aufspielt und mir eine Error Meldung ab der Zeile Using cached wheel-0.42.0-py3-none-any.whl.meta data (2.2 kB) , anzeigt.
ab da kann ich nichts weiter ausführen. Wo liegt da das Problem und gibt es dazu eine Lösung. Für deine Hilfe wäre ich dir sehr dankbar.
@ThorstenMueller 8 หลายเดือนก่อน
Arbeitest du mit einer virtuellen Python (venv) Umgebung?
@svenpaulus363 8 หลายเดือนก่อน
@@ThorstenMueller ja arbeite ich. Ich befolge deine Anweisung im Video und ab der Aktualisierung klappt wie gesagt leider nichts mehr.
@ThorstenMueller 8 หลายเดือนก่อน ⁺¹
@@svenpaulus363 Vielleicht mal testweise ein neues Python venv aufsetzen - vielleicht ist da was komisch. Dann nach der Aktivierung des neuen venv direkt probieren "pip install pip setuptools wheel -U", vielleicht hilft das. Ist aber sicher einen Versuch wert. Viel Erfolg dabei 😊.
@lemonscript ปีที่แล้ว ⁺¹
Hey, hast du die stimme mit open source tools erstellt? Wenn ja, mit welchen? Würde mich interessieren
@lemonscript ปีที่แล้ว ⁺¹
Ach, hat sich erledigt, ich hab den anfang nicht mitbekommen wo du coqui erwährnst. Hast du die stimmen lokal erzeugt oder coquis online service dafür genutzt? Ich versuche aktuell auch meine stimme zu klonen.
Kannst du vielleicht auch von deiner erfahrung berichten? Wieviel audiomaterial hast du gebraucht, wie lange hat das training der AI gedauert, etc.
@ThorstenMueller ปีที่แล้ว
Ich habe 2019 begonnen meine Stimme zu klonen, da gab es Coqui noch nicht 😆. Hier einige (hoffentlich) hilfreiche Videos von mir dazu:
- th-cam.com/video/jZrsz_3j16c/w-d-xo.html
- th-cam.com/video/bJjzSo_fOS8/w-d-xo.html
- th-cam.com/video/4YT8WZT_x48/w-d-xo.html
@danielspelten623 4 หลายเดือนก่อน
Hey, ist es möglich irgendwie das Paket auf Windows hinzuzufügen damit sämtliche Programme die TTS nutzen diese Voice hier nutzen könnten?
@ThorstenMueller 4 หลายเดือนก่อน ⁺¹
Die Antwort lautet "SAPI" 😊. Ich habe schon versucht meine Stimme dort zu hinterlegen, aber das ist wirklich ein Albtraum. Daher habe ich das Thema erstmal runterpriorisiert, aber es wäre schon noch irgendwann mein Wunsch, dass das möglich ist.
@PflanzPfoten 21 วันที่ผ่านมา
@@ThorstenMueller Eine Frage die ich auch stellen wollte. Also gibt es keine einfache Möglichkeit deine Stimme direkt in Windows zu Installieren, so wie es mit neuen Fonts derFall ist? Dass ist schade, die standard Stimmen sind grauenhaft in Windows und ich wollte gerne eine natürlich klingende, wie die im DDC Format, um mir im Firefox Browser, im Reader etwas vorlesen zu lassen. Manchmal habe ich nämlich Probleme dies selbst zu lesen, nicht weil ich es nicht könnte, sondern eher weil mein Kopf dann nicht mitspielt.
Bin ja eher eine Freundin der einfachen und Praktischen Dinge =)
@ThorstenMueller 13 วันที่ผ่านมา
@@PflanzPfoten Das verstehe ich. Wie geschrieben habe ich bereits Versuche unternommen, die etwas enttäuschen gelaufen sind. Vielleicht finde ich (in näherer Zukunft) nochmal Zeit und Motivation für einen neuen Versuch ;-).
@flyingwingrec หลายเดือนก่อน
Funktioniert bei mir nicht. Python ist installiert wird aber in der Kommandozeile nicht gefunden. Finde den Fehler nicht woran das liegen könnte.
@ThorstenMueller 26 วันที่ผ่านมา
Also ein "python -V" auf der Kommandozeile liefert keine installierte Python Version?
@flyingwingrec 25 วันที่ผ่านมา
@@ThorstenMueller Ja, ich habe die neueste Version von Python 3.12 Installiert sowie die anderen Tools auch. Beim kontrollieren in der Kommandozeile wie in den Video beschrieben, kommt :Python konnte nicht gefunden werden. Fuehren Sie die Verknuepfung ohne Argumente aus, um sie ³ber den Microsoft Store zu installieren, oder deaktivieren Sie diese Verknuepfung unter. Mehr kommt dann nicht. Da weiß ich dann nicht wie ich weiter vorgehen sollte.
@ThorstenMueller 22 วันที่ผ่านมา
@@flyingwingrec Kannst Du eventuelle mal nach dem genauen Pfad deiner Python Installation schauen. Dann den vollständigen Pfad angeben und nicht nur "python". Ändert das was?
@flyingwingrec 20 วันที่ผ่านมา
@@ThorstenMueller wie gebe ich den Befehl in der Kommandozeile ein? Python wurde bei mir in "User/AppData/Local/Program/Python/Python321" Installiert.
@enricowiegmann8509 ปีที่แล้ว
Ist es möglich, diese TTS-Stimmen auch z.B. in Balabolka zu nutzen?
Die zweite Frage: Gibt es einen Trick, damit Umlaute richtig gelesen werden?
@ThorstenMueller ปีที่แล้ว ⁺¹
Hi, nein das ist derzeit noch nicht möglich. Ich versuche noch eine einfache Einbindung in Windows mittels SAPI zu ermöglichen. Das könnte dann auch in bspw. Balabolka funktionieren.
Ja, machmal gibt es mit espeak-ng unter Windows Probleme mit deutschen Umlauten. Es sollte helfen, statt espeak-ng das "normale" espeak (also ohne -ng) funktionieren. Ich habe einige Hinweise dazu hier beschrieben: www.thorsten-voice.de/einfach-loslegen/#umlaut
@Vito_0912 ปีที่แล้ว
So ungewohnt die deutsche Stimme zu hören ^^.
Btw. ich glaube der englische Untertitel ist nicht richtig konvertiert oder eingefügt worden. Zumindest hatte er im Web und als mir das aufgefallen ist, auch in der App nicht funktioniert
@ThorstenMueller ปีที่แล้ว
Hehe, ja ich finde meine deutschsprachigen Videos auch ungewöhnlich. Die nächsten werden auch wieder englisch, musst dich also nicht permanent umgewöhnen 😆. Guter Hinweis mit den Untertiteln. Muss ich mal schauen. Ich wünsche Dir noch einen schönen Abend.
@evij.8781 ปีที่แล้ว
Hey Thorsten, tolle Arbeit und toll erklärt. Es hat prima geklappt. Deine Stimme hört sich großartig an. Noch eine kleine Frage.
In coqui kann man mit einem Punkt eine kleine Pause zwischen zwei Worten generieren. Manchmal hört sich diese Pause aber wie ein wh an, so als wäre was abgeschnitten. Weißt Du woran das liegen könnte?
@ThorstenMueller ปีที่แล้ว
Guude und vielen Dank für das tolle Feedback zu meiner künstlichen Stimme 😊.
Ich bin mir nicht sicher, wie ich mir "wh" vorstellen muss - klingt das vielleicht nach einer Ausatmen Pause? Das Modell interpretiert einen Punkt als Satzende und in meinen Aufnahmen ändere ich die Betonung am Satzende. Vielleicht ist es das. Bringt ein Komma oder Semikolon als Pausenzeichen mehr?
@simonsayshomeassistant ปีที่แล้ว
Hey Thorsten, great videos!
@ThorstenMueller ปีที่แล้ว
Thank you, dear Simon 😊
@Thelucyinside ปีที่แล้ว
Hallo, und zwar habe ich das Problem, dass nachdem ich tts Instaliert hatte, die Komandozeile den Befehl nicht findet. Weis da jemand etwas was ich da nicht weis? :) Ansonnsten cooles Projekt, von dem was ich bis jetzt sehen konnte.
@ThorstenMueller ปีที่แล้ว
Danke für deine nette Rückmeldung zu meinem Projekt 😊. Nutzt du eine virtuelle Python Umgebung dafür und ist die aktiviert? Sonst wird der "tts" Befehl nicht gefunden.
@Thelucyinside ปีที่แล้ว
@@ThorstenMueller Ah, nein ich hatte tatsächlich keine virtuelle Python Umgebung genutzt. Danke für die Antwort!
@NoxmilesDe ปีที่แล้ว
Ist deine Stimme auch bei Mozilla Common Voice drin?
@ThorstenMueller ปีที่แล้ว
Ich hatte es der Mozilla Community mal erwähnt. Allerdings weiß ich nicht, ob sie es (bisher) technisch integriert haben 🤔.
@IchWarNivek 5 หลายเดือนก่อน
Das macht so Spaß mit deiner Stimme rumzuwerkeln 😀
Gibt es einen Trick wie ich Umlaute ÄÖÜ aussprechen lassen kann? :D
@ThorstenMueller 5 หลายเดือนก่อน
Das freut mich sehr zu hören 😊. Manchmal gibt es unter Windows Probleme mit Umlauten wenn man espeak-ng nutzt. Die Nutzung von espeak sollte das Umlautproblem lösen. github.com/thorstenMueller/Thorsten-Voice/issues/50#issuecomment-1622363116
Wenn du es probiert hast, würde ich mich über kurze Rückmeldung freuen, ob es dein Problem lösen konnte.
@IchWarNivek 5 หลายเดือนก่อน
@@ThorstenMueller Hey :-) Ja hat super funktioniert. Danke :)
@ThorstenMueller 4 หลายเดือนก่อน
@@IchWarNivek Dann viel Spaß mit "meiner" Umlaut-sprechenden Stimme 😊.
@andiratze9591 ปีที่แล้ว
Hey Thorsten. Kannst du mal ein Tutorial machen, wie man in espeak deine Stimme und andere wie z.b. die Mbrola Voices installiert aber bitte nicht espeakNG, weil das keine Benutzeroberfläche hat. Ich will an einem großen Projekt arbeiten und wäre über eine Benutzeroberfläche dankbar, die mehrere deutsche Stimmen enthält.
@ThorstenMueller ปีที่แล้ว ⁺¹
Danke für den Themenvorschlag 😊. Da muss ich mal schauen, wie oder ob das irgendwie möglich ist, da "mbrola" Stimmen (glaube ich) sich technisch von Coqui oder Piper Stimmen stark unterscheiden.
@andiratze9591 ปีที่แล้ว
Mich würde ja interessieren, welche Stimmen man überhaupt alle in espeak verwenden kann. Deine Stimme als DDC-Model klingt auf jeden Fall schon mal sehr gut.
@joharakiri 6 หลายเดือนก่อน
Wow ich nutze tgpt mit piper schon richtig lang in Linux und wollte das jetzt auf Windows auch einrichten. Und jetzt erklärt mir das genau die Stimme die mir auch sonst immer als Stimme von tgpt bei meinen technischen Problemen hilft 😂
@ThorstenMueller 6 หลายเดือนก่อน
😂
@ThorstenMueller 6 หลายเดือนก่อน ⁺¹
Das freut mich sehr 😊. Danke auch für den Hinweis auf tgpt. Das kannte ich gar nicht und habe gleich mal etwas damit rumprobiert, aber noch ohne TTS Ausgabe.
@joharakiri 6 หลายเดือนก่อน
@@ThorstenMuellerDie TTS Ausgabe von tgpt ist per Terminal sehr simpel. Man muss es nur mit -q verwenden damit die Ladeanimation nicht vorgelesen wird und dann den Output direkt per | ins tts tool leiten. Oder aber man schreibt ein zweizeiliges Skript und hat alles sofort zur Verfügung. Ich nutze das inzwischen zum Nachschlagen viel mehr als Google.
@JustinHalbig-ut6xf 11 หลายเดือนก่อน
Hallo,
ich bin die Installationsanleitung Schritt für Schritt durchgegangen, hat anscheinend auch alles soweit geklappt, nur bei meinem Versuch den lokalen Webserver zu starten kam eine Fehlermeldung, das der tts-server nicht gefunden werden kann. Gibt es da vielleicht eine Lösumg für? In der Zwischenzeit habe ich mal die TTS Stimme auf der Demo Webseite getestet, ich bin ja echt überrascht wie gut die klingt, bei den Firmen wo man Windows TTS Sapi Stimmen für viel Geld kaufen kann sind die Stimmen doch deutlich unnatürlicher in der Aussprache.
@ThorstenMueller 11 หลายเดือนก่อน
Hallo und vielen Dank für die tolle Rückmeldung zu meiner künstlichen Stimme 😊. Verwendest du ein Python "venv"? Vielleicht hast Du das TTS Paket darin installiert und hast die venv-Umgebung bei weiteren Tests nicht aktiviert. Dann würde das "tts-server" Kommando nämlich nicht gefunden werden.
@JustinHalbig-ut6xf 11 หลายเดือนก่อน
Also ich hatte Python zu Beginn des Videos das erste Mal installiert, allerdings hat das über den Download über die Python Webseite nicht geklappt, nachdem Python installiert war kam in der cmd immer Python konnte nicht gefunden werden. Das Problem könnte ich allerdings durch eine Installation von Python mit der Microsoft Store Version lösen.
Ich hatte alle im Video gezeigten Befehle in die CMD eingegeben, ich meine auch das da venv mit dabei war.
Wie kann ich denn die venv Umgebung dann wieder aktivieren?
@ThorstenMueller 11 หลายเดือนก่อน
@@JustinHalbig-ut6xf Hier an der Stelle zeige ich, wie man die venv Umgebung aktiviert. Das sollte auch gehen, wenn man Python aus dem Microsoft Store installiert hat. Vielleicht kannst Du es so nochmal versuchen.
th-cam.com/video/vOAFyReDttk/w-d-xo.html
@JustinHalbig-ut6xf 11 หลายเดือนก่อน
Danke. Nach der Eingabe steht dann am Anfang (tts) C:...
Sollte also geklappt haben. Der tts-server wird wenn man den Befehl zum Starten der Weboberfläche eingibt allerdings immer noch nicht gefunden.
@ThorstenMueller 11 หลายเดือนก่อน
@@JustinHalbig-ut6xf Dann versuche es das TTS Paket nochmal neu zu installieren, bzw. zu aktualisieren. Dazu in dem venv einfach eingeben:
"pip install tts -U"

ต่อไป

เล่นอัตโนมัติ

Freie "Thorsten" Stimme in HOME ASSISTANT lokal nutzen | Text-to-Speech/TTS | Tutorial