Thorsten-Voice TTS in Windows nutzen | DDC / VITS

Поділитися
Вставка
  • Опубліковано 10 січ 2025

КОМЕНТАРІ •

  • @simonsayshomeassistant
    @simonsayshomeassistant Рік тому

    Hey Thorsten, great videos!

  • @joharakiri
    @joharakiri 9 місяців тому

    Wow ich nutze tgpt mit piper schon richtig lang in Linux und wollte das jetzt auf Windows auch einrichten. Und jetzt erklärt mir das genau die Stimme die mir auch sonst immer als Stimme von tgpt bei meinen technischen Problemen hilft 😂

    • @ThorstenMueller
      @ThorstenMueller  9 місяців тому

      😂

    • @ThorstenMueller
      @ThorstenMueller  9 місяців тому +1

      Das freut mich sehr 😊. Danke auch für den Hinweis auf tgpt. Das kannte ich gar nicht und habe gleich mal etwas damit rumprobiert, aber noch ohne TTS Ausgabe.

    • @joharakiri
      @joharakiri 9 місяців тому

      @@ThorstenMuellerDie TTS Ausgabe von tgpt ist per Terminal sehr simpel. Man muss es nur mit -q verwenden damit die Ladeanimation nicht vorgelesen wird und dann den Output direkt per | ins tts tool leiten. Oder aber man schreibt ein zweizeiliges Skript und hat alles sofort zur Verfügung. Ich nutze das inzwischen zum Nachschlagen viel mehr als Google.

  • @lemonscript
    @lemonscript Рік тому +1

    Hey, hast du die stimme mit open source tools erstellt? Wenn ja, mit welchen? Würde mich interessieren

    • @lemonscript
      @lemonscript Рік тому +1

      Ach, hat sich erledigt, ich hab den anfang nicht mitbekommen wo du coqui erwährnst. Hast du die stimmen lokal erzeugt oder coquis online service dafür genutzt? Ich versuche aktuell auch meine stimme zu klonen.
      Kannst du vielleicht auch von deiner erfahrung berichten? Wieviel audiomaterial hast du gebraucht, wie lange hat das training der AI gedauert, etc.

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Ich habe 2019 begonnen meine Stimme zu klonen, da gab es Coqui noch nicht 😆. Hier einige (hoffentlich) hilfreiche Videos von mir dazu:
      - ua-cam.com/video/jZrsz_3j16c/v-deo.html
      - ua-cam.com/video/bJjzSo_fOS8/v-deo.html
      - ua-cam.com/video/4YT8WZT_x48/v-deo.html

  • @IchWarNivek
    @IchWarNivek 8 місяців тому +1

    Das macht so Spaß mit deiner Stimme rumzuwerkeln 😀
    Gibt es einen Trick wie ich Umlaute ÄÖÜ aussprechen lassen kann? :D

    • @ThorstenMueller
      @ThorstenMueller  8 місяців тому

      Das freut mich sehr zu hören 😊. Manchmal gibt es unter Windows Probleme mit Umlauten wenn man espeak-ng nutzt. Die Nutzung von espeak sollte das Umlautproblem lösen. github.com/thorstenMueller/Thorsten-Voice/issues/50#issuecomment-1622363116
      Wenn du es probiert hast, würde ich mich über kurze Rückmeldung freuen, ob es dein Problem lösen konnte.

    • @IchWarNivek
      @IchWarNivek 8 місяців тому

      @@ThorstenMueller Hey :-) Ja hat super funktioniert. Danke :)

    • @ThorstenMueller
      @ThorstenMueller  8 місяців тому

      @@IchWarNivek Dann viel Spaß mit "meiner" Umlaut-sprechenden Stimme 😊.

  • @pixelboomer
    @pixelboomer 2 місяці тому

    Ich komme nicht weiter, alle Schritte klappen, bis auf "pip install pip tts -U" - da bekomme ich eine Fehlermeldung "Requirement already satisfied: pip in d:\tts\lib\site-packages (24.2)" und jede Menge rote Fehlermeldungen "ERROR: Ignored the following versions that require a different python version: 0.0.10.2 Requires-Python >=3.6.0,

    • @pixelboomer
      @pixelboomer 2 місяці тому

      Hab jetzt Python nochmal deinstalliert und eine ältere Version installiert. Jetzt funktioniert das ganze

    • @ThorstenMueller
      @ThorstenMueller  2 місяці тому +1

      Das freut mich, dass du es lösen konntest 😊.

  • @guilloisvincent2286
    @guilloisvincent2286 Рік тому +1

    Nice ! but coqui TTS is not free 😢there is no free alternative ?

    • @ThorstenMueller
      @ThorstenMueller  Рік тому +1

      Hi, i'm not sure what you mean with "free". Maybe you mean Coqui Studio which isn't imho open source. But the TTS tooling/framework is.

    • @Bonk1971
      @Bonk1971 Рік тому +1

      It’s not for commercial use

  • @svenpaulus363
    @svenpaulus363 Рік тому

    Hallo Thorsten. Ich habe ab der Eingabe von der Aktualisierung des Setuptools das Problem das es das Update nicht aufspielt und mir eine Error Meldung ab der Zeile Using cached wheel-0.42.0-py3-none-any.whl.meta data (2.2 kB) , anzeigt.
    ab da kann ich nichts weiter ausführen. Wo liegt da das Problem und gibt es dazu eine Lösung. Für deine Hilfe wäre ich dir sehr dankbar.

    • @ThorstenMueller
      @ThorstenMueller  11 місяців тому

      Arbeitest du mit einer virtuellen Python (venv) Umgebung?

    • @svenpaulus363
      @svenpaulus363 11 місяців тому

      @@ThorstenMueller ja arbeite ich. Ich befolge deine Anweisung im Video und ab der Aktualisierung klappt wie gesagt leider nichts mehr.

    • @ThorstenMueller
      @ThorstenMueller  11 місяців тому +1

      @@svenpaulus363 Vielleicht mal testweise ein neues Python venv aufsetzen - vielleicht ist da was komisch. Dann nach der Aktivierung des neuen venv direkt probieren "pip install pip setuptools wheel -U", vielleicht hilft das. Ist aber sicher einen Versuch wert. Viel Erfolg dabei 😊.

  • @evij.8781
    @evij.8781 Рік тому

    Hey Thorsten, tolle Arbeit und toll erklärt. Es hat prima geklappt. Deine Stimme hört sich großartig an. Noch eine kleine Frage.
    In coqui kann man mit einem Punkt eine kleine Pause zwischen zwei Worten generieren. Manchmal hört sich diese Pause aber wie ein wh an, so als wäre was abgeschnitten. Weißt Du woran das liegen könnte?

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Guude und vielen Dank für das tolle Feedback zu meiner künstlichen Stimme 😊.
      Ich bin mir nicht sicher, wie ich mir "wh" vorstellen muss - klingt das vielleicht nach einer Ausatmen Pause? Das Modell interpretiert einen Punkt als Satzende und in meinen Aufnahmen ändere ich die Betonung am Satzende. Vielleicht ist es das. Bringt ein Komma oder Semikolon als Pausenzeichen mehr?

  • @enricowiegmann8509
    @enricowiegmann8509 Рік тому

    Ist es möglich, diese TTS-Stimmen auch z.B. in Balabolka zu nutzen?
    Die zweite Frage: Gibt es einen Trick, damit Umlaute richtig gelesen werden?

    • @ThorstenMueller
      @ThorstenMueller  Рік тому +1

      Hi, nein das ist derzeit noch nicht möglich. Ich versuche noch eine einfache Einbindung in Windows mittels SAPI zu ermöglichen. Das könnte dann auch in bspw. Balabolka funktionieren.
      Ja, machmal gibt es mit espeak-ng unter Windows Probleme mit deutschen Umlauten. Es sollte helfen, statt espeak-ng das "normale" espeak (also ohne -ng) funktionieren. Ich habe einige Hinweise dazu hier beschrieben: www.thorsten-voice.de/einfach-loslegen/#umlaut

  • @danielspelten623
    @danielspelten623 7 місяців тому

    Hey, ist es möglich irgendwie das Paket auf Windows hinzuzufügen damit sämtliche Programme die TTS nutzen diese Voice hier nutzen könnten?

    • @ThorstenMueller
      @ThorstenMueller  7 місяців тому +1

      Die Antwort lautet "SAPI" 😊. Ich habe schon versucht meine Stimme dort zu hinterlegen, aber das ist wirklich ein Albtraum. Daher habe ich das Thema erstmal runterpriorisiert, aber es wäre schon noch irgendwann mein Wunsch, dass das möglich ist.

    • @PflanzPfoten
      @PflanzPfoten 4 місяці тому

      @@ThorstenMueller Eine Frage die ich auch stellen wollte. Also gibt es keine einfache Möglichkeit deine Stimme direkt in Windows zu Installieren, so wie es mit neuen Fonts derFall ist? Dass ist schade, die standard Stimmen sind grauenhaft in Windows und ich wollte gerne eine natürlich klingende, wie die im DDC Format, um mir im Firefox Browser, im Reader etwas vorlesen zu lassen. Manchmal habe ich nämlich Probleme dies selbst zu lesen, nicht weil ich es nicht könnte, sondern eher weil mein Kopf dann nicht mitspielt.
      Bin ja eher eine Freundin der einfachen und Praktischen Dinge =)

    • @ThorstenMueller
      @ThorstenMueller  3 місяці тому

      @@PflanzPfoten Das verstehe ich. Wie geschrieben habe ich bereits Versuche unternommen, die etwas enttäuschen gelaufen sind. Vielleicht finde ich (in näherer Zukunft) nochmal Zeit und Motivation für einen neuen Versuch ;-).

  • @flyingwingrec
    @flyingwingrec 4 місяці тому

    Funktioniert bei mir nicht. Python ist installiert wird aber in der Kommandozeile nicht gefunden. Finde den Fehler nicht woran das liegen könnte.

    • @ThorstenMueller
      @ThorstenMueller  4 місяці тому

      Also ein "python -V" auf der Kommandozeile liefert keine installierte Python Version?

    • @flyingwingrec
      @flyingwingrec 4 місяці тому

      ​@@ThorstenMueller Ja, ich habe die neueste Version von Python 3.12 Installiert sowie die anderen Tools auch. Beim kontrollieren in der Kommandozeile wie in den Video beschrieben, kommt :Python konnte nicht gefunden werden. Fuehren Sie die Verknuepfung ohne Argumente aus, um sie ³ber den Microsoft Store zu installieren, oder deaktivieren Sie diese Verknuepfung unter. Mehr kommt dann nicht. Da weiß ich dann nicht wie ich weiter vorgehen sollte.

    • @ThorstenMueller
      @ThorstenMueller  4 місяці тому

      @@flyingwingrec Kannst Du eventuelle mal nach dem genauen Pfad deiner Python Installation schauen. Dann den vollständigen Pfad angeben und nicht nur "python". Ändert das was?

    • @flyingwingrec
      @flyingwingrec 4 місяці тому

      @@ThorstenMueller wie gebe ich den Befehl in der Kommandozeile ein? Python wurde bei mir in "User/AppData/Local/Program/Python/Python321" Installiert.

  • @NoxmilesDe
    @NoxmilesDe Рік тому

    Ist deine Stimme auch bei Mozilla Common Voice drin?

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Ich hatte es der Mozilla Community mal erwähnt. Allerdings weiß ich nicht, ob sie es (bisher) technisch integriert haben 🤔.

  • @Thelucyinside
    @Thelucyinside Рік тому

    Hallo, und zwar habe ich das Problem, dass nachdem ich tts Instaliert hatte, die Komandozeile den Befehl nicht findet. Weis da jemand etwas was ich da nicht weis? :) Ansonnsten cooles Projekt, von dem was ich bis jetzt sehen konnte.

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Danke für deine nette Rückmeldung zu meinem Projekt 😊. Nutzt du eine virtuelle Python Umgebung dafür und ist die aktiviert? Sonst wird der "tts" Befehl nicht gefunden.

    • @Thelucyinside
      @Thelucyinside Рік тому

      @@ThorstenMueller Ah, nein ich hatte tatsächlich keine virtuelle Python Umgebung genutzt. Danke für die Antwort!

  • @mal-avcisi9783
    @mal-avcisi9783 3 місяці тому +1

    "du wirst peisn brauchen" 🤣🤣

  • @andiratze9591
    @andiratze9591 Рік тому

    Hey Thorsten. Kannst du mal ein Tutorial machen, wie man in espeak deine Stimme und andere wie z.b. die Mbrola Voices installiert aber bitte nicht espeakNG, weil das keine Benutzeroberfläche hat. Ich will an einem großen Projekt arbeiten und wäre über eine Benutzeroberfläche dankbar, die mehrere deutsche Stimmen enthält.

    • @ThorstenMueller
      @ThorstenMueller  Рік тому +1

      Danke für den Themenvorschlag 😊. Da muss ich mal schauen, wie oder ob das irgendwie möglich ist, da "mbrola" Stimmen (glaube ich) sich technisch von Coqui oder Piper Stimmen stark unterscheiden.

    • @andiratze9591
      @andiratze9591 Рік тому

      Mich würde ja interessieren, welche Stimmen man überhaupt alle in espeak verwenden kann. Deine Stimme als DDC-Model klingt auf jeden Fall schon mal sehr gut.

  • @Vito_0912
    @Vito_0912 Рік тому

    So ungewohnt die deutsche Stimme zu hören ^^.
    Btw. ich glaube der englische Untertitel ist nicht richtig konvertiert oder eingefügt worden. Zumindest hatte er im Web und als mir das aufgefallen ist, auch in der App nicht funktioniert

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Hehe, ja ich finde meine deutschsprachigen Videos auch ungewöhnlich. Die nächsten werden auch wieder englisch, musst dich also nicht permanent umgewöhnen 😆. Guter Hinweis mit den Untertiteln. Muss ich mal schauen. Ich wünsche Dir noch einen schönen Abend.

  • @Dylldophlo
    @Dylldophlo Рік тому +1

    Eigentlich habe ich ja gehofft dass es sich um ein TTS Voice handelt das man einfach in Windows installieren kann um die schreckliche englische Anna weg zu bekommen.
    Trotzdem gute Arbeit, hört sich verdammt gut an.

    • @ThorstenMueller
      @ThorstenMueller  Рік тому

      Vielen Dank 😊. Ich habe vor einigen Monaten mal in einen Microsoft Forum gefragt, wie ich meine Stimme ganz einfach in Windows als Stimme anbieten kann. Aber habe leider keine Antwort bekommen. Meinst du, meine TTS Stimme in Windows wäre eine sinnvolle Ergänzung? Vielleicht muss ich das Thema aktiver verfolgen.

    • @Dylldophlo
      @Dylldophlo Рік тому

      ​@@ThorstenMueller Also wenn ich so auf der Suche nach einer TTS Stimme bin, die nichts kostet, lande ich meist auf Kostenpflichtigen Seiten die dann oft nicht einmal ein Sample in Deutsch anbieten oder genau so "gut" sind wie Hedda, Steffi und diese ganzen veralteten SAPI Voices. Auf Github gäbe es noch das Projekt eSpeak: speech synthesis, aber die heruntergeladen Stimmen errinnern mehr an den Talking Parrot von Creative aus den 90ern.
      Ich weis nicht, ob neuere Windows Versionen mittlerweile ertragbare TTS Stimmen in Deutsch mitliefern, denn ich gurke ja immer noch mit mit veralteter Soft/Hardware rum.
      Wenn ich nicht auf obigen Seiten lande, dann finde hauptsächlich auch Seiten wo Blinde oder Menschen mit Leseschwäche nach vernünftiegen TTS Stimmen suchen. Ist aber alles recht alt, entweder begnügen sich diese Menschen einfach mit dem gelieferten oder haben sich eben für etwas kostenpflichtiges entschieden (Halbwissen: ich glaube da gibt es einen Kostenzuschuß).
      Ich habe mich auf einigen Kostenspflichtigen Seiten herumgetrieben, gefallen finde ich da an keiner der Stimmen.
      Das wirkt alles so steril von der Sprache.
      In der Küche hab ich einen alten HP Pavillion mit Touchscreen, für Musik, Video, Hörspiele und Rezepte.
      Wäre schön wenn man sich da bei der Küchenarbeit auch mal etwas vorlesen lassen könnte.
      Auch ein altes Gerät, aber er tut es, und zwar gut, auch wenn das Displayglas oft gut geschmiert ist.
      Ist natürlich auch vermutlich ein großer Aufwand so eine SAPI Stimme zu erstellen, ich will dich keineswegs da in eine Richtung schieben. Auch Fremdwörter sind problematisch, ein einfaches Guide oder Happy Birthday bringt deine Stimme schon ins straucheln. Aber, in Deutsch hört es sich super an.

    • @ThorstenMueller
      @ThorstenMueller  Рік тому +1

      @@Dylldophlo Ja, ich glaube eine neue SAPI Stimme bereitzustellen ist sicherlich nicht ganz einfach, aber ich hoffe bald etwas Zeit zu finden, mich da etwas genauer einlesen zu können. Dann kann ich bestimmt abschätzen, wieviel Aufwand da rein gesteckt werden müsste.