Ist das legal? | ElevenLabs und andere KI-Stimmen ausprobiert

c't 3003

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 15 тра 2024
Was der Pumuckl kann, kann Keno schon lange. Es gibt jetzt eine digitale Version von seiner Stimme - erstellt mit ElevenLabs. Wie das mit KI-Stimmen eigentlich funktioniert und in Zukunft eingesetzt werden kann, haben wir uns auch angeschaut.
►Kapitelmarker:
0:00 Intro
1:37 Werbung: nordVPN incogni
2:28 KI-Stimmen im Alltag
2:53 ElevenLabs
6:30 Open-Source Alternative TorToiSe
7:39 Interview Matthias Lehmann
12:58 KI-Stimmen & Musik
13:55 Uberduck
15:00 Apple Personal Voice
16:11 Fazit
► Links:
ElevenLabs: beta.elevenlabs.io
Uberduck: uberduck.ai/
Aflorithmic: aflorithmic.ai/
heise+-Test von Text-to-Speech-Anbietern: www.heise.de/tests/KI-Stimmen...
Artikel und Video über TorToiSe: • Ein Doppelgänger für d...
www.heise.de/ratgeber/Stimmen...
KI-Singstimmen-Generator SoftVC VITS: github.com/svc-develop-team/s...
► Wie sich dieser Channel finanziert: • So bestechlich sind wi...
=== Anzeige / Sponsorenhinweis ===
Nutze den Code CT3003 unter dem folgenden Link, um einen exklusiven Preisnachlass von 60 % auf einen Incogni-Jahresabo zu erhalten: www.incogni.com/ct3003
=== Anzeige / Sponsorenhinweis Ende ===
► c't Magazin: ct.de
► c't auf Twitter: / ctmagazin
► c't auf Instagram: / ct_magazin
► und TOTAL CRAZY auf Papier! Überall wo es Zeitschriften gibt!
► Mail schreiben: 3003@ct.de
► Adresse: c't Magazin / z. Hd. Jan-Keno Janssen / Karl-Wiechert-Allee 10 / 30625 Hannover
► Keno auf Twitter: / elektroelvis
► Keno auf Mastodon: social.tchncs.de/web/@keno3003
► Keno auf Instagram: / elektroelvis
► Credits:
Konzept & Redaktion: Lukas Rumpler, Jan-Keno Janssen
Schnitt: Sahin Erengil
Host: Jan-Keno Janssen
► Kenos Bild- und Tontechnik:
Hauptkamera amzn.to/3ut1ndE
Detailkamera amzn.to/3nYm2Uh
Licht fürs Gesicht amzn.to/3tnwNk9
Licht für Dinge amzn.to/3nT2CAo
Schwanenhals amzn.to/2R2FKSP
► Affiliate-Links! c't 3003 ist Mitglied im Partnerprogramm von Amazon. Die Links sind Affiliate-Links, der Kaufpreis ändert sich dadurch für euch nicht.
#elevenlabs #kistimme #stimmeklonen
Наука та технологія

КОМЕНТАРІ • 326

@flusskiesel 10 місяців тому ⁺¹³
Danke für den Hinweis mit dem Kennwort. Das habe ich jetzt mit meinen Eltern ausgemacht (oder dass sie mich einfach nach bestimmten Dingen fragen, wenn ihnen etwas seltsam vorkommt). Sicher werden das die Enkeltrickbetrüger bald anwenden.
Meine Eltern haben übrigens mal einen (analogen) Enkeltrick-Anruf bekommen. Sie sind zwar nicht darauf reingefallen, waren danach aber total fertig.
Also: Sprecht mit Euren Eltern usw.! In den nächsten Jahren werden wir ,,Sicherheitsfragen'' auch im echten Leben nutzen (,,Sag mal, wie hieß noch mal Dein Lieblingsteddy?'').
@plagegeist96 10 місяців тому ⁺²²
Ich würde gerne ein Video sehen wo ihr das mit dem Gesang zeigt 😂
@brennjunker 10 місяців тому ⁺¹
Euer Mini-Teppich beim Interview war richtige Hypnose :D Als ich kurz weggeschaut hab hab ich den Teppich an der Wand gesehen xD
@Ben-xf5ix 10 місяців тому ⁺¹²
Ich dachte, die Stimme von Isabel Grünewald wär schon synthetisch. Klingt immer so überbetont und künstlich.
@butchjohnson9736 10 місяців тому ⁺¹³
Synchronsprecher oder Sprecher von Audiobooks, auch Synchrondolmetscher werden sich warm anziehen müssen und sich von Chat GPT vielleicht schon mal neue Berufsfelder vorschlagen lassen. So schnell wie diese ganze KI voranschreitet, kann einem Angst und Bange werden.
@ratside9485 10 місяців тому
Na ja, könnten sie auch verkaufen und sich zu Hause zurücklehnen und die KI für sich arbeiten lassen.
@manollobango 10 місяців тому
Ja, Synchronsprecher werden es dann wohl in Zukunft nicht so leicht haben, aber irgendwie finde ich die Idee, dass die Originalstimmen der Schauspieler aus Filmen & Co einfach per KI in die jeweilige Sprache übersetzt werden, doch ganz cool. Nie mehr wechselnde Synchronstimmen eines bestimmten Schauspielers zwischen einzelnen Filmen oder innerhalb einer Serie, aus diversen Gründen, und obendrein können dann auch die verwendeten Dialekte/Akzente ganz einfach in die jeweilige Sprache übernommen werden. Das dürfte dann nicht nur die Produktionskosten in der Filmbranche deutlich senken sondern auch in der Spieleindustrie. Davon profitieren dann vor allem auch Indie Studios, die meist kein so großes Budget haben, um zusätzlich noch diverse Synchronsprecher für verschiedene Landessprachen zu bezahlen.
Das ist dann glaube ich aber auch der einzige Usecase, wo ich die Nutzung solch einer KI für akzeptabel halte.
@tlatosmd 9 місяців тому
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@ratside9485 9 місяців тому
@@tlatosmd Hast du dir schon mal Bark AI von Sono angeschaut? Ist etwas Wild und schwer zu bändigen Qualität auch nicht die beste aber erzähl nicht das man keine Nuancen in Künstliche Stimmen hereinbekommt.
@tlatosmd 9 місяців тому
@@ratside9485 Darauf bin ich doch längst eingegangen: Ein paar Schieberegler oder eine Regieanweisung sind ein Dreck gegen das, was man mit STS machen kann.
Die Macher von Bark haben übrigens längst erklärt, daß sie aus genau dem Grund keine STS-Funktionalität bzw. keine Möglichkeit für Custom Voices bei Bark einbauen wollen, weil das Ergebnis dann zu realistisch würde und sie dann Angst vor Betrugsmaschen und Fake News haben. Deshalb bleiben sie beim reinen TTS bzw. drei oder fünf von den Machern vorgegebenen Stimmen, geade *WEIL* sie keine allzu realistischen Ergebnisse haben wollen.
@OttoFaerber 10 місяців тому ⁺¹⁶⁸
Hallo Keno., Wenn ich dich nochmal singen hören muss lösch ich das Internet 😂😂
@ct3003 10 місяців тому ⁺²¹
🤓
@gummimauer 10 місяців тому ⁺⁷
wenn du Keno singen hörst, wurde das Internet schon gelöscht 😂
@torsten.breswald 10 місяців тому ⁺⁶
nach einer weile wird es erträglicher, du darfst nur nicht das blut aus den ohren wischen...
@ThomasBrocks 10 місяців тому
So bekommt die Mute Funktion eine ganz neue Bedeutung 😅
@opafritzsche 10 місяців тому ⁺²
@@ct3003 Also: es ist interessant. Das Missbrauchs Potential ist extrem.
**ABER AM SCHÖNSTEN** ist mal wieder das "Pricing".
Also : 10 000 Charakters == nichts. Bis du 3 Värseln fertig hast wie du sie brauchst, sind 2000 - 3000 weg.
dann die Preisgestaltung: für 5 Takken, 30 000 Charakters, also auch nichts.
für **ZWEIUNDZWANZIG** gerade mal 100 000, also auch nichts.
und alles was eine halwegs vernünftige Nutzung vorsihet, kostet **AB 99 EURO PRO MONAT**
öhm.
ich lebe noch weil ich Abofrei bin!
Nicht weil ich an jedr Ecke abonniere.
Also :
schönes interessantes Thema - *aber absolut 100% NEIN DANKE*
TTS ist heutzutage relativ machbar, man muss kein Geld ausgeben.
also : nö
@importartist1730 10 місяців тому ⁺⁶
Hi Keno, ein Video über so-vits svc wäre geil, geiles Format, macht weiter so Gruß
@pupu4234123 10 місяців тому ⁺¹⁰
Nigerianischen Prinzen gefällt das.
@nixloswie 10 місяців тому ⁺³
Das ist mein Onkel!
@TheMaverickORG 10 місяців тому ⁺⁴
Zwar ein klein wenig OffTopic, aber bei dem ganzen Video ging mir immer wieder ein Insider durch den Kopf: Arbeitsoberfläche ;) Heute fast normal, damals wohl revolutionär. War glaube ich zu OS/2 WARP Zeiten. Da hat IBM versucht, Sprachsteuerung in ein OS einzubauen. Da mußte man auch erstmal komische Standardsätze ablesen, damit das System die individuelle Stimme erkennt (oder sollte ;) Naja, stundenlanges Training... Ich rede mit mir selbst, äh, nein, dem Computer... Bei der 'Präsentation' der tollen neuen Technik für einen Freund kam dann halt der GAU ;) Schau mal, der wechselt auf den Desktop (damals hat IBM alles eingedeutscht, also Arbeitsoberfläche) wenn ich das sage. Ne, hat er eben nicht ;) Wurde dann irgendwie immer lauter und versuchte es besser auszusprechen. Endete dann halt im schreienden 'ARBEITSOBERFLÄCHE', trotzdem ohne Effekt. Irgendwie lustig, wie man sich heute schon an Computerstimmen gewöhnt hat, es aber wohl immer noch ein Problem ist, solche vernünftig oder überzeugend herzustellen. Und dann noch Individualität reinzubringen...
@silvomuller595 10 місяців тому ⁺⁶
Hallo Netflix, ich würde gerne James Bond - no time to die sehen. James soll die Stimme von Rowan Atkinson haben, die anderen Darstellerinnen und Darsteller sollen bitte bayrisch sprechen. Den Villan möchte ich auf Französisch hören und zwar mit der Stimme vom Merowinger aus Matrix 2. Danke :)
@pupu4234123 10 місяців тому ⁺²¹
Der Boss Move wäre gewesen, wenn das Interview mit Matthias Lehmann von seiner KI Stimme geführt worden wäre.
@PrinzMidas 10 місяців тому ⁺²
"Boss Move"... wenn ich so etwas lese... diese ganze "Like a Boss"-Scheiße...
@pupu4234123 10 місяців тому
@@PrinzMidas nailed it
@postscriptum9856 10 місяців тому ⁺³
Ich freue mich auf die Computerspieleimplementation!
@agent00rugenwalder94 10 місяців тому ⁺²
Uuuuh wie geil!
Endlich kann ich die Synchronstimme von Skeletor aus den He-Man-Hörspielen zum Leben erwecken, muahahahaha!
@alanfenetre8418 10 місяців тому ⁺²
Wenn kann man denn jetzt noch glauben im Netz. Super Beitrag.
@goldensurfer2778 10 місяців тому ⁺⁴
Mir kannst du trauen, versprochen.
@alanfenetre8418 10 місяців тому ⁺²
@@goldensurfer2778 Dann wird ja alles wieder gut.
@tlatosmd 9 місяців тому
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
@sammy81nrw 10 місяців тому ⁺²
Prima Video wieder, danke und weiter so :)
@RCWhy 6 місяців тому ⁺²
Ich finde deine Videos immer so ultra authentisch. Du wirst lange nicht durch eine KI ersetzt 🙂
@ct3003 6 місяців тому
Ok, puh!
@Lareo1964 2 дні тому
Er ist schon eine KI - so witzig kann kein Mensch sein :)
@irgendniemand 10 місяців тому ⁺¹
Kommt demnächst der KI-Fingerabdruck? Oder die KI-Iris? KI-Ohrenabdruck?
@phookjuu7019 10 місяців тому
BITTE MEHR SONGS VON DIR !!!!!
Macht einfach gute Laune ❤
@streamglotzer 10 місяців тому ⁺¹
Radioprogramm Veranstalter liebäugeln auch mit KI-Stimmerzeugung, manche Sendung scheint auch schon im Testbetrieb zu laufen. Ist ein Thema beim Teltarif Podcast.
@samthesomniator 9 місяців тому ⁺¹
Mega. Dann brauche ich in Zukunft die gierigen Voice Actors in meinem Animationsfilm nur noch einmal kurz zu bezahlen. 😍
@TG-eb8vl 9 місяців тому
Hi wieder mal ein toller Beitrag! Was mich nur mal interessieren würde, wie sieht es denn rechtlich aus, wenn man eine Stimme eines anderen klont? Wie bei eurem Pumukl Beispiel. Hans Clarin ist ja nun schon seid einigen Jahren tot und das Persönlichkeitsrecht erlischt soweit ich weiß ja mit dem Tot der Person. die Etischen Fragen lassen wir mal außen vor das wäre noch ein ganz anderes Thema..
@forsta6654 10 місяців тому ⁺⁵
Es ist sicher super schwer einen Witz über Martin Luther, einen Raspberry Pie und einem Schokoladenkuchen mittels KI Stimme gut rüberzubringen.
@ct3003 10 місяців тому ⁺¹
Sehr gute Idee, gleich mal ausprobieren.
@ONeillsBude 10 місяців тому ⁺¹
ElevenLabs Nutze ich auch schon für meine Videos, nur kann man Kostenlos nicht wirklich viel machen, da ich einige Texte doch 3-4 mal generieren muss bis die Betonung einigermaßen so klingt wie ich es haben will.
@ismirdochegal4804 10 місяців тому ⁺²
Finde das Thema unglaublich spannend. Vor dem Enkeltrick habe ich etwas Angst.
Ansonsten habe ich kein Problem damit. In Deutschland werden zwar alle Filme und Serien synchronisiert, aber im gesamten ha man nur ein paar Synchronsprecher und die Sprechen einfach mal JEDE Rolle ein. Das ist mir lange nie aufgefallen, bis ich doch mal angefangen habe Serien auch auf Englisch zu gucken.
Die beiden deutschen Synchronsprecher von Arnold Schwarzenegger und Bruce Willis finde ich zwar besser, aber ich habe kein Problem damit bald Filme auf Deutsch mit der Stimme des Originalschauspielers zu sehen.
Ich sehe auch einen großen Vorteil dafür sich längere Sachbücher als Audiobook rein zu ziehen.
@fyora 7 місяців тому ⁺¹
Hey, gibt es mittlerweile eine deutsche Version? Wo deutsche Stimme auch gut anhören?
@Linux_made_experiences 10 місяців тому ⁺³
Ich sage es mal ganz direkt, was wäre wenn dein Arbeitskollege dir einen schlechten Scherz antun will.
In Form, deiner Stimme bei dein Chef anruft, und ihn beleidigt oder sonstige dinge macht.
@NonameNoorg 10 місяців тому ⁺⁹
So spannend und faszinierend das im Moment erscheinen mag, schlussendlich ziehen wir uns als menschliche Wesen den Boden zum Leben unter den Füßen weg. Meine Meinung.
@mekkes321 10 місяців тому ⁺²
Its called Transhumanismus
@tom.shanghai 10 місяців тому
lassen sich die technischen für stimm Training mit Textual eversions/Loras und fine tuning vergleichen?
@maxsimkammerer 10 місяців тому
Ich hab das gleich mal auf M in meiner "⛩ The Singularity Is Nigh" - Serie kommentiert.
🤘39🤘
@touchdepp4507 9 місяців тому
Welche KI generierten Stimmen darf ich denn kommerziell nutzen? Und was heißt kommerziell? UA-cam Videos können irgendwann monetarisiert werden. Hab ich dann anfangs keine Probleme, aber wenn die Monetarisierung anfängt muss ich alles lösch?
@DanielTheDriver 10 місяців тому ⁺²
Ich hoffe das die Hui-Buh Hörspielserie aus den 80’er Jahren, mit der original Hans Clarin Ki-Stimme, weitergeführt wird 😂👍
@Arcadier 10 місяців тому ⁺¹
Und dann noch Robby Tobby und das FliWaTüt und Räuber Hotzenplotz .. nicht zu vergessen : Hexe Schrumpeldei :-)
@keineangaben8523 10 місяців тому
Hahah 8:18 einfach die Paulaner Spezi geil😍👍
@andreassobing 9 місяців тому
Sehr interessantes Thema. Die Erfahrung hatte ich auch schon gemacht dass bisher sich nur die englischsprachigen Stimmen gut angehört haben. Speziell bei deutschen Stimmen mit englischen Wörtern gab es anfangs sehr komischen Output. Neu war für mich dass ich die Stimme auch auf englisch einsprechen kann für die deutsche Sprachausgabe. Deine AI Stimme hat sich schon sehr gut angehört. Habt ihr da auch noch Filter rauf gelegt oder den direkten Output vom Tool übernommen? Vielleicht kann man ja dadurch noch etwas raus holen?
@mikebiker9817 10 місяців тому ⁺⁴
Gute Info Keno, gibt es auch die Stimme von Walter Ulbricht?😄
@ct3003 10 місяців тому ⁺⁵
Niemand hat die Absicht, eine Mauer zu errichten!
@tlatosmd 9 місяців тому ⁺¹
@@ct3003 Niemand hat die Absicht, einen Stimmklon von Walter Ulbricht zu erstellen! ;)
@b10ck3d-studios 10 місяців тому
15:18 Wieso erinnert mich das so an Mission Impossible Phantom Protokol mit der Szene im Bad wo er irgendein random Text vorlesen musste.
@wizardm 10 місяців тому ⁺¹
Ich finde diese Technik wirklich faszinierend. Aber ehrlich gesagt mir graut davor wo das hinführen wird.
@dakoskin 10 місяців тому
Kann man bei ElevenLabs auch ohne Kreditkarte bezahlen? habe keine....
@misaenoharafrulein7238 10 місяців тому ⁺³
Solange die originalen Synchronsprecher für die Nutzung der geklonten Stimme Tantiemen bekommt, wäre mir es recht.
@MkOne001 10 місяців тому ⁺¹⁹
Ziemlich schlau von RTL, den Synchronsprecher musste man früher ja bezahlen 🖤
@kaffeeringe 10 місяців тому ⁺¹
Die werden da auch irgendwie für bezahlen.
@importartist1730 10 місяців тому
@@kaffeeringe du sagst es irgendwie
@bubbibabba 10 місяців тому ⁺²
Und der "Maxi Schafroth" wird jetzt nicht bezahlt, oder was?
@tlatosmd 9 місяців тому
Es wird nachwievor ein Synchronsprecher eingesetzt, weil die von RTL eingesetzte Technik null mit solchen Vorleseprogrammen (TTS) wie Elevenlabs zu tun hat. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@bubbibabba 9 місяців тому
@@tlatosmd Im Endeffekt wird Maxi Schafroth zwei mal einsprechen. Einmal so, wie Clarin ihn gesprochen hätte, um ihn dann mit STS verändern zu können und einmal so, wie er selbst den Pumuckl sprechen würde. Also das Gegenteil von den Synchronsprecher nicht zu bezahlen.
@DanielFlemming 10 місяців тому
Machst du mal ein Video über den Einsatz von monica von OpenAI?
Ich finde das Potential so gewaltig und es ist so wunderschön intuitiv nutzbar, ABER ich habe Angst vor der Datenkrake, besonders im kommerzionellen Nutzen.
Besonders bei den Desktop-Variante.
@hofnaerrchen 10 місяців тому ⁺⁴
Bei Hörbüchern kommt noch ein weiteres Problem hinzu: Gute Leser verwenden verschiedene Stimmen für die unterschiedlichen Charaktere einer Geschichte. Dafür müsste die KI auch noch den Text korrekt interpretieren.
@meisterton_ 8 місяців тому ⁺¹
Ist doch gar kein Problem, das kann man entsprechend im Text markieren und schon spricht die KI an der Stelle mit anderem Duktus.
@Kig_Ama 9 місяців тому
Wie kann ich meine eigene stimme clonen?
@Synapsenkitzler 10 місяців тому
wenn ich meine stimme in ios o. bei anderen anbietern einspreche/digitalisieren lasse; wie ist das rechtlich? behalte ich alle rechte, oder welche gebe ich ab? will ich das? das hätte man noch thematisieren können. oder künftig ein thema? ihr habt ja einen hervorragenden hausjuristen. danke lg
@Synapsenkitzler 10 місяців тому
sehr wahrscheinlich wäre ja z.b., dass wenn ich meine stimme einspreche, anbieter x y sich das recht einräumt, diese für x y z zu nutzen.
@kaffeeringe 10 місяців тому
Passt auf mit der "Spezi"-Schleichwerbung in der Interview-Szene! ☝️🤓
@niklasstein1192 10 місяців тому ⁺⁶
14:15 bitte setzt uberduck nicht für social Media oder kommerziell ein. 14:51 Geil Super Mario macht jetzt Werbung für unseren Kanal 😁
@thomaskamp9365 10 місяців тому ⁺²
Mit diesen KI-Stimmen könnte mich keiner täuschen, auch nicht am Telefon. Da stimmt weder die Stimmfrequenzen, noch Sprachrythmus, noch Resonanzen. Keno Du hast zum Beispiel so einen schönen Bass das man deine Stimmbänder sofort raus hören kann. Die Resonanzen die die Stimmbänder zusammen mit dem Mundraum bilden, gibt deiner Stimme ein so charakteristische Aussehen das ich die in 99% der Fälle immer wieder raus hören würde. Dazu kommt noch dein Sprachrytmuss und dein Dialekt.
Ich habe zwar ein besonders gute Gehör und kann einige Sachen mehr höhren wie zB. Gefühle oder Medikamente die mein Gegenüber eingenommen hat (mit Schulung und einem guten Gehör kann das fast jeder siehe unten bei PS) aber die KI-Stimmen sind so schlecht das die mir noch weniger sorgen machen als Künstliche Intilligenz.
PS: Ja man kann Gefühle oder Medikamente hören, wenn diese den emotionalen Grundzustand verändern. Beispiel ist z.B. das Ehepaar das abends im Bett liegt und der Mann hat dann wesentlich mehr Bass als tagsüber, weil Er tiefenentspannt ist. Viele Frauen hören das z.B. nach dem Sex, wenn die Männer mehr Bass bekommen.
Anderes Beispiel: Medikamente wie Opiate, Methadon, starke Beruhigungsmittel verändern auch das Bild einer Stimme, da die Stimmbänder nicht mehr so unter Spannung stehen.
Der Volksmund sagt z.B. die Frau mit der hysterischen Stimme und meint damit das diese Frau eine kreischende Stimme hat und Sie entsprechend aufgeregt/panisch ist.
Daher beeinflussen Gefühle die Stimme. Wir bemerken das nur selten ganz bewusst, sondern nehmen es meisten nur unterschwellig war. Wir Menschen sind ja dadrauf konditioniert fast alles mit den Augen oder Händen war zu nehmen und machen unser Gehör dafür geren in einer Disco kaputt.
@dtjanixx 9 місяців тому
Mal wieder super interessant! Danke🎉
@ossianhaufe4671 10 місяців тому ⁺¹
Technisch unfassbar beeindruckend, aber wie die Nukleartechnik darf sowas niemals in falsche Hände geraten.
@tlatosmd 9 місяців тому ⁺¹
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
@KarlAlfredRoemer 10 місяців тому
Sehr sehr geil aber auch gefährlich.
@chrismoritz6706 10 місяців тому ⁺¹
cool, dann kann man ja die 2. Staffel von "Ein Colt für alle Fälle" endlich neu vertonen, da ja der Synchronsprecher von Lee Majors verstorben ist, und es da Probleme mit Urheberrecht auf die original Spur gibt, was DVD Produktion angeht ...
@devluz 10 місяців тому
Sind die alle text -> speech oder gibt es auch welche die speech -> speech uebersetzen ohne den Zwischenschritt mit Text? Da geht ja sicher vieles der Betonung verloren.
@tlatosmd 9 місяців тому
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
@birkenfelderland-meineheim2006 9 місяців тому
Hallo, ich komme gleich auf den Punkt-ich möchte meine Stimme klonen, das Ergebnis mit Elewen Labs ist eine Katastrophe, bei dir hört sich deine Stimme recht natürlich an, es wäre toll, wenn du hier mal zeigst wie du das so hinbekommen hast. Liebe Grüße, Dein Kanal ist echt Spitze.
@Tarsonis42 10 місяців тому ⁺³
Ein weiterer Schritt in Richtung des Universal Translater aus Star Trek 😌
@user-ft3ed5wv7w 10 місяців тому ⁺⁵
Also ich höre einen konkreten Unterschied in der generierten Stimme von Dir zur Originalen. Das mag daran liegen das ich keine billo-Brüllwürfel am PC habe oder nur Kopfhöhrer. Alleine die Tiefe ist anders, genau wie die Klangfarbe. Zum Thema Stimmcloning sollte man evtl verpflichtend einen Startton oder ein Hintergrundrauschen einbauen müssen gesetzlich.
@schmuf78 10 місяців тому ⁺⁷
Das ganze KI-Thema ist wirklich interessant und unglaublich unglaublich. Und es wäre spannend zu sehen, zu was KI in ein paar Jahren im Stande ist. Allerdings sind wir gesellschaftlich überhaupt nicht darauf vorbereitet, dass unglaublich viele Arbeitsplätze obsolet werden. Ich bin echt gespannt wo das hinführt. Vielleicht kommt das Ganze ja so wie in "Das Ende des Kapitalismus" vorgeschlagen. Die Leute haben weniger Geld und können deshalb auch weniger ausgeben. Damit können wir Klimaziele viel einfacher erreichen. ;)
@ismirdochegal4804 10 місяців тому
Das mit den Arbeitsplätzen sehe ich nicht so schlimm. Du brauchst immer noch jemanden der der syntetischen Stimme als Muster dient und du brauchst jemanden, der den Text formuliert, der dann ausgegeben werden soll.
Da es auf dieser Welt genug Arbeit gibt, sehe ich das befürchtete Szenario von Tausenden, die dann ohne Einkommen und damit ohne Geld darstehen, nicht so groß.
@tlatosmd 9 місяців тому
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@toniweber7495 10 місяців тому ⁺¹
Also ich würde meine Stimme gerne geklont haben... Gerade weil ich gerne Video-Trainings machen will, aber einfach keine Geduld habe das einzusprechen... Der Text kann ja grundsätzlich generiert werden... Und dann das Timing im Video und dann wäre die Bearbeitung wesentlich schneller fertig...
@saxpert 10 місяців тому ⁺¹
Funktioniert das bald live? Könnte ich z.b. bei meiner Bank anrufen, die mittels eines Stimmenabdrucks meine Identität verifizieren und dann über die Tastatur mit denen labern und mein Konto manipulieren?
@ct3003 10 місяців тому ⁺¹
Gute Frage.
@MetalheadAndNerd 10 місяців тому
Welche Bank lässt denn Kontozugriffe anhand einer Stimmenerkennung zu?
@tlatosmd 9 місяців тому
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
@Tegaquart 10 місяців тому ⁺²
Das Highlight ist Kenos Singstimme 😂😂
@manfredthiele5282 10 місяців тому ⁺²
Bei Bildern, Stimmen und Videos von KI sollte immer ein Wasserzeichen, ein Untertitel oder ein Hinweis auf KI sein. Aber mal ehrlich - bei schnell gezeigten Bildern, bei kleingedruckten Einblendungen in Videos oder am Ende im Abspann verpackt, wer kann da noch echt von nachgemacht unterscheiden?
Übrigens hätte ich zur Zeit Probleme bei irgendeiner kostenlosen Probe-KI mein Sprachprofil zu hinterlassen! Ob das dann jemals gelöscht wird oder vielleicht in "falsche Hände geraten" kann? Und am Telefon wird zuweilen ja auch nachgefragt, ob man das Telefongespräch zu "Verbesserungszwecken" der Qualität aufzeichnen lassen will!
Also vielleicht doch ein Verbot von KI-Stimmen-Klonen nach dem Motto: "Meine Stimme gehört mir?"
@Hoto74 10 місяців тому
Alles kann missbraucht werden, daher aber immer alles verbieten kann ja auch nicht die Lösung sein, das wäre dann doch zu einfach.
@manfredthiele5282 10 місяців тому ⁺¹
@@Hoto74 Ist eine Frage der Abwegung und des Konsenses in der Gesellschaft. Vielleicht in diesem Zusammenhang ein Beispiel: Möchtest Du, dass Du in drei-D eingescannt wirst und irgendwelche Filme mit Deinem Avatar und Deiner Stimme erscheinen (ein durchaus mögliches Zukunftsszenario!). Recht am eigenen Bild ist jedenfalls durch Urhebergesetz geschützt!). Ich bin insoweit auch für eine Regelung im Kunst und Urheberrecht für die Stimme. Zuerst kommt die neue technische Entwicklung und dann die rechtliche Regelung. Das ist normal. Im Beispiel von Hans Clarin, der ja tot ist, weiß ich auch nicht, ob das rechtlich sauber ist und wie Gelder an z. B. Erben verteilt werden.
Synchronsprecher ist doch ein Beruf! Die Stimme aus dem Jenseits müßte dann ja auch irgendwie geschützt sein? Verbot zu einfach - vielleicht - rechtliche Regelungen - unbedingt ja!
@Hoto74 10 місяців тому
@@manfredthiele5282 Nun, wenn ich dafür gut entlohnt würde und abgesichert wäre, dass das Model nur für bestimmte Einsatzzwecke genutzt werden darf. Ja, hätte ich keine Probleme damit. Aber wie du sagst, ohne Regeln geht es nicht. Aber wenn es Regeln gibt bedeutet es ja auch das es nicht verboten ist.
Ich schätze mal schon, dass das mit den Erben von Hans Clarin abgeklärt ist und die entsprechend auch entlohnt wurden. Sollte es allerdings keine Erben geben, was ja auch möglich wäre, frage ich mich wie man das dann rechtlich klären kann.
@manfredthiele5282 10 місяців тому
@@Hoto74 Noch ein kurzer Gedanke: KI kann doch auch neue Stimmen erstellen?! Wozu eigentlich covern? O. K., Satire oder für Filme zum nachbearbeiten - aber wozu eigentlich die Stimme von Herrn Müller oder Frau Müller von nebenan? Mal ehrlich, da fallen mir nur wenige Beispiele für den produktiven nützlichen Gebrauch, aber umgekehrt tausend Beispiele für den Missbrauch ein...Gegen neue natürlichere Stimmen - ähnlich wie bei dem schriftlichen Verkehr eben Schrifttypen - ist doch nichts zu sagen und das fände ich toll. Auch wenn jemand seine eigene Stimme selbst verwendet ist natürlich dagegen nichts zu sagen...
@pozzblizz5450 10 місяців тому ⁺¹
Bin mal gespannt, wann es tatsächlich Geruchsfernsehen gibt. Das wäre ein echter Gamechanger.
@cheook7029 10 місяців тому ⁺¹
Das fängt erstmal mit 4 Gerüchen an und irgendwann kann man dann Fernseher mit 16 Gerüchen kaufen. Wird am Anfang aber nur von wenigen Filmen unterstützt, Avatar 7 z.B..
@tomkroebel4936 8 місяців тому
War schon im Kino kein Erfolg...
@allenpayne9182 10 місяців тому ⁺²
Gerade das "aufpolieren" stört mich bei ElevenLabs. Ich spreche Englisch eben mit einem stark deutschen Akzent und das möchte ich gerne behalten. Ich hätte also gerne das die KI von Eleven Labs meinen deutschen Akzent beibehält. Das klappt leider nicht. Somit wird immer deutlich, dass eben nicht ICH das spreche, sondern eine AI.
@tiefensucht 10 місяців тому ⁺⁴
Für Filme und Serien ist das eine super Technik. Was damals Fan-Untertitel waren, könnten morgen Fan-KI-Stimmenübersetzungen sein. Besonders bei alten Filmen, die nie auf Deutsch oder Englisch erschienen sind, eine feine Sache. Aber auch so, man stelle sich vor, man könnte bei Serien einfach für jeden Charakter seinen Lieblingssprecher dynamisch einstellen.
@SprecherFabi 10 місяців тому ⁺¹
Und zerstört damit ein ganzes Berufsfeld und nimmt der deutschen Synchronbranche ihre Existenz :D Wieso auch Achtung und Wertschätzung für das Handwerk des Schauspiels haben oder wahren.. Ja, super Technik!
@tiefensucht 10 місяців тому
@@SprecherFabi Natürlich werden einige Synchronsprecher ihre Jobs verlieren, aber so ist das eben mit Fortschritt. Auf der anderen Seite können Leute die sich anpassen, jetzt allein einen ganzen Film vertonen und mehr verdienen. Es wird sicher auch irgendwann ein Copyright für Stimmen geben, so dass man seine Stimme lizenzieren kann.
@mutosanrc1933 10 місяців тому
@@SprecherFabi Synchronsprechen ist keine Schauspielkunst. Nur mal so nebenbei erwähnt.
@SprecherFabi 10 місяців тому ⁺²
@@mutosanrc1933 Das sagt leider alles. Viel zu viele glauben das :) Heißt nicht umsonst Stimmschauspieler oder auch im englischen Voice Actor
@gk... 10 місяців тому ⁺¹
Für Flopflix und co. mag das ja reichen. Aber bei ordentlichen Filmen will ich auch ordentliche Stimmen hören, Stimmen mit einer Seele, wo man Emotionen heraushört, und nicht so'n synthetischen Mist. Schon bei der Otto-Stimme im obigen Video konnte man das hören; nicht mal in der Lage zu lachen oder zu weinen, ironisch oder zynisch zu wirken, etc. Sarkasmus, Humor und solche Dinge, sind ganz besondere menschliche Fähigkeiten, die in der K.I. ganz am Ende stehen, so sie denn überhaupt auf absehbare Zeit möglich sind.
Ich bin ein großer Fan von Synchronschauspielern und bin jedes Mal bestürzt, wenn wieder einer von den guten geht. Ein Elsholtz oder Danneberg als K.I.? Lächerlich. Mit K.I. ist sehr viel möglich, aber man muss jetzt nicht auf Biegen und Brechen _alles_ ersetzen wollen, was gut war. Bislang hat man immer noch jemanden gefunden, der die Synchronrolle übernimmt, und obwohl ich bei den Stimmen recht pingelig bin, komme ich damit klar -- mit Sicherheit besser als mit einem leblosen Ersatz aus dem Computer.
@alexandermaschke1633 10 місяців тому
Hi, suche eine Software / Ki, wo ich meine UA-camfilme in Englisch, mit meiner Stimme, übersetzen kann, also nur die Tonspur. Geht das auch schon? LG Alex
@tlatosmd 9 місяців тому
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
@wassollderscheiss33 10 місяців тому
Woher kommt das Video ab 0:30? Hat der Keno da versucht, zum Fake-Audio synchron zu sprechen oder wurde das ebenfalls irgendwie KI-generiert?
@ct3003 10 місяців тому ⁺¹
Das Video ist echt. Einfach Mund bewegt zu den KI-Audios.
@plusgesundheitsnetzwerk 10 місяців тому ⁺²
Puh, sehe ich gespalten. Als Creator denke ich daran, wie praktisch es wäre seinen Content in andere Sprachen zu übersetzen.
Als kritischer Mensch macht ich mir Gedanken darum, dass bald neben meinen ganzen Standartdaten, auch Fingerabdrücke, digitale Bodyscans und nun auch die Stimme frei zu erwerben ist.
@Stechobst 10 місяців тому
Ich finde KI-Stimmen sehr spannend. Allerdings brauche ich eine OpenSource Lösung für meine Projekte, da ich mich sonst auf die dauerhafte Verfügbarkeit eines Anbieters verlassen muss, was erfahrungsgemäß nicht immer der Fall ist.
@Handelsbilanzdefizit 10 місяців тому ⁺¹
In Kombination mit DeepFaceLab ist das bestimmt interessant.
@gummimauer 10 місяців тому ⁺²
ihr dürft die Stimmen nicht kommerziell nutzen, das kann richtig Ärger geben. Die Stimmen erstmal hier kommerziell eingefügt. Genau mein Humor 😂😂😂
@ct3003 10 місяців тому
Wir sind doch nicht kommerziell 😇
@IOOISqAR 10 місяців тому
@@ct3003 Da Ihr Werbung macht, schon.
@gnutacid 10 місяців тому ⁺¹
Wenn ich die KI-Stimme nutzen kann um beim Italiener zu bestellen dann wird es interessant :)
@schlagsaite1378 10 місяців тому ⁺⁴
5:43 das bedeutet: ich muss meine Oma mit einem Passwort versehen?!?.
@ThomasBrocks 10 місяців тому ⁺⁴
Für mich als Musik Produzent interessant.
Stimme generieren, anpassen und takten.
Billiger als eine Sängerin 👍🏼
Die Zukunft mit KI wird auch Vorteile mitbringen.
Nutze schon eine um Stimme vollständig von Song zu trennen.
Früher fast undenkbar
@thekey6153 10 місяців тому
Es gibt jetzt schon KI - Bands die rocken 24/7 durch während sie in Realtime produzieren und sind für Laien akkustisch nicht von echten Musikern zu unterscheiden.
@gizehfine 10 місяців тому
@@thekey6153 Die wäre welche? :D
@thekey6153 10 місяців тому
@@gizehfine Wie eine Suchmaschine funktioniert ist dir bekannt? :)
@senecaaurel8050 10 місяців тому ⁺¹
Es tut mir leid das sagen zu müssen aber Stephen Hawking ist leider seit 2018 verstorben. Ich kann mich gut daran erinnern weil ich zu dem Zeitpunkt einen Podcast gehört habe und dann die Nachricht reingekommen ist.
Aber jetzt wo ich die Nachricht geschrieben habe fällt mir ein du wahrscheinlich dieses Beispiel gemacht hast weil auch mir keine berühmter Mensch einfallen der seine Stimme verloren hat der so bekannt ist.
Gutes Video ✌️
@marcoeschenweck2616 10 місяців тому
Val Kilmer
@Apfelkaninchen 8 місяців тому
Wie ist das eigentlich mit der Legalität? muss man sich jetzt auch die erlaubnis oder lizenz oder berechtigung von den original personen einholen, nur, wenn man sich privat ein stück text vorlesen lassen möchte, ohne es öffentlich zu machen? oder wenn man sich die stimme, weil man sie cool findet, als AI stimme auf sein handy holen möchte, z.b. als weckerstimme oder sowas?
@parcival 10 місяців тому ⁺²
Also ich stelle mir Kenos echten Gesangskünste genau so vor. 😆
@ct3003 10 місяців тому ⁺¹
Waaaaaaaas?
@uwemoebus 10 місяців тому ⁺²
Die Büchse der Pandorra ist ganz weit offen.
@Flaximilian 10 місяців тому ⁺¹
Vielen Dank für das Video.
Leider hat der Inhalt nach dem Titel "ist das legal" nicht meine Erwartung erfüllt. habe es mir angeschaut, weil ich genau dazu mehr wissen wollte. Ob es legal ist, findet sich immer nur in einem Nebensatz. Mich würde schon mal genauer interessieren, wie da die Regelung ist. So habe ich Menschen in meinem Umfeld, die in kreativen Berufen tätig sind und die feiern diese Möglichkeit mit den KI Stimmen sehr. Schlagwort: Synchronsprecher einsparen.
Es ist vermutlich naheliegend, dass man natürlich keine Stimmen von (prominenten) Personen zu kommerziellen Zwecken nutzen darf. Aber was ist, wenn man diese minimal ändert. somit hat man nicht direkt kopiert. Gibt es hier schon Regelungen? Ggf. könnt ihr noch mal genauer auf die rechtliche Lage dazu eingehen.
Liebe Grüße
@tlatosmd 9 місяців тому
In den USA wäre es möglich, die Likeness-Gesetze für Promis auch auf Stimmen anzuwenden; allerdings zeigt sich in der Rechtsprechung der US-Gerichte der letzten Jahre, daß diese Rechte der Promis an ihrer eigenen Likeness zunehmend zugunsten ihrer Arbeitgeber (Studios) verschoben werden. Auch das viel (falsch)zitierte Urteil Authors Guild vs. Google, wo derzeit eine Menge Blödsinn in der Richtung behauptet wird, daß es eine Entscheidung über Urheberrecht bei KI gewesen wäre (de facto ging es allein um die Tatsache, daß die Autoren unwissentlich ihre Urheberrechte an Google abgetreten hatten, so daß Google ihre Bücher für staatlich betriebene Bibliotheken scannen darf, ohne die Autoren dann für jede einzelne Ausleihe vergüten zu müssen), weist in eine ähnliche Richtung, daß Urheberrechte zunehmend zugunsten der zahlungskräftigsten Konzerne entschieden wird. Vor ein paar Jahrzehnten hätte das Gericht noch entschieden, daß derart vorsätzlich unklare oder verschwurbelte Formulierungen im von den Autoren unterzeichneten Vertragstext zu einer Annulierung geführt hätten.
In der EU hingegen gibt es hingegen keinerlei Gesetze gegen Stimmklonung; es gibt in der EU kein Pendant zum Recht am eigenen Bild, das auf die Stimme anwendbar wäre. Beim kürzlichen KI-Gipfel in Brüssel wurde lediglich entscheiden, daß die Hersteller den Output kennzeichnen müssen. Das tun Stimmklonungsprogramme aber schon seit Jahren, nämlich mit unhörbaren akustischen Wasserzeichen; bevor die Branche auf den Trichter gekommen ist, wurden Pioniere wie Adobe VoCo und WaveNet einfach kurzerhand aufgrund von Bedenken von Politik und Geheimdiensten abgeschossen, da man mit Stimmklonen, die nicht schnell und eindeutig als solche identifziert werden können, ja z. B. auch einen Krieg auslösen und Fake News verbreiten kann.
Bis vor ein paar Jahren hätten in der EU zumindest Platten- und Produktionsfirmen wegen Verwendung von Stimmaufnahmen, an denen sie Urheber- bzw. Verwertungsrechte haben, zu Klonzwecken in der EU rein theoretisch wegen URV klagen können; das wäre aber schon damals an der Praxis gescheitert, weil es technisch unmöglich ist, nachzuweisen, welche spezifische Aufnahme einem fertigen Stimmodell zugrundeliegt. Mit der EU-Urheberrechtsreform vor ein paar Jahren, die medial vor allem als Memeverbot und Vorstufe zu Uploadfiltern thematisiert wurde, wurde dann aber das Konzept des legalen Dataminings für genau solche KI- alias ML-Anwendungen eingeführt, was zum einen mit der Tatsache begründet wurde, daß das wichtige innovative Forschung ist, und zum anderen, weil das Modell, das eine ML erstellt, de facto einen so hohen Abstraktionsgrad vom Ursprungsobjekt aufweist, daß eben nicht nachweisbar ist, welche Vorlage benutzt wurde bzw. der Abstand auch aufgrund des schon allein technisch nötigen Abstraktionsaufwands, um aus einer statischen Kopie eine derart dynamisch steuerbare Nachahmung zu machen, einfach zu groß ist, um noch vom selben Objekt zu sprechen.
Der eminente Schönheitsfehler, den die EU-Gesetze zum Datamining aber bislang aufweisen, besteht darin, daß sie extra für Institute und Großkonzerne maßgeschneidert wurden, denen dieses Recht eingeräumt wurde. Was in der Praxis wiederum heißt, daß die so entstehenden KI-Tools von Künstlern, beauftragten Arbeitnehmern und Konsumenten zwar so genutzt werden können wie Photoshop, die Urheber- und Nutzungsrechte der Ergebnisse liegen dann aber laut EU-Recht bei den KI-Firmen, die das Programm hergestellt haben (wo dann bestenfalls ein kaufkräftiger Arbeitgeber eine mehr oder weniger begrenzte Mitnutzungslizenz erwerben kann). Wie ein Blog dazu schrieb, ist das so, als hätte eine Pinselfabrik per Lobbyarbeit durchgesetzt, daß sie automatisch sämtliche Urheber- und Nutzunsgrechte an den Bildern erhält, die mit ihren Pinseln gemalt worden sind.
Es ist daher zu raten, stattdessen Open-Source-Programme (z. B. von GitHub) zu nutzen (aber auch hier Vorsicht: Inzwischen laufen findige Firmen wie die Website Replicate rum, die auf jedes halbwegs vielversprechende Open-Source-GitHub-KI-Modell eine Webseiten-GUI draufklatschen, deren Nutzung dann nicht nur an sich schon per Abo kostenpflichtig ist, sondern wo der Nutzer laut TOS auch automatisch sämtliche Rechte an Replicate abgibt), oder solche von Firmen, die in ihren Nutzungsbedingungen definitiv ausschließen, ihre Nutzer auf diese Weise enteignen zu wollen. Speziell beim Thema KI-Stimmen läßt sich bei Firmen und Dienstleistern mit einer TOS, die den Nutzern ihre Rechte läßt, vor allem voice.ai nennen, das außerdem kein dummes Vorleseprogramm (TTS) wie das hier präsentierte Elevenlabs ist, sondern viel natürlicher klingende und leichter steuerbare Stimmkonvertierung (STS), wo auf die Aufnahme eines anderen Sprechers einfach nur quasi ein nachträglicher Filter zur Umwandlung der Stimme draufgelegt wird; bei STS spielt der lebende Sprecher, der vorne reinspricht, mit seiner eigenen Stimme die KI-Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt.
@amiganer681130 9 місяців тому
Mal so ein Gedanke: Wenn Die Stimmen dann perfekt werden, kann man auch mit dem Computer einen mit der Stimme gesicherten Verschluß öffnen.
Der "Enkel TRick" am Telefon wird noch schlechter durchschaubar.
Ich möchte hier nur sagen: Das kann auch missbraucht werden, daran müssen wir uns dann auch gewöhnen...
@roboterbasteln 9 місяців тому
Warum klone ich meine Stimme, wenn sie sich danach nicht wie meine Stimme anhört? Beim Wort "klonen" erwarte ich eine identische Kopie. Das hier Geklonte hörte sich ja überhaupt nicht nach Keno an. Auch nicht 80% sondern vielleicht 30%.
@allessagendelerche6343 10 місяців тому ⁺⁵
Wusste ichs doch gleich, das war gar nicht Hitler, der mich gestern angerufen hat
@tlatosmd 9 місяців тому
"Führerbeleidigung! Sofort mitkommen!" - Browser Ballet
@georgdania1919 10 місяців тому
Bitte ein Tutorial zu so-vits-svc!
@Der_X_Buddne 10 місяців тому ⁺¹
Irgendwie werden teilweise eher so zweitrangige Engines bissl laienhaft benutzt und dann am Ende heisst es: So dolle ist es nicht. Bei Sascha Lobo, R.D. Precht und bei ZDF heute beim Thema K.I. das Gleiche in grün...
@kerkilabro4361 10 місяців тому ⁺¹
Kennt ihr noch die Szene aus Terminator 2 wo der T800 bei Johns Eltern anruft, mit Johns Stimme? Also wenn eines Tages ein T800 klopfend mit Großmutters Stimme bei mir vor der Haustür steht, dann haben wir ein Problem!
@tlatosmd 9 місяців тому
Vor allem, weil der schon eine Menge Dezibel bräuchte, um mittels der Stimme an die Tür zu klopfen!
@marcfree2855 7 місяців тому ⁺¹
Darf ich deine Stimme nehmen?
@Fastwalkers 10 місяців тому
Das ganze wäre auch für die Spieleindustrie ein Gamechanger. Meist hat man nur englische Sprachausgabe... Hiermit ließen sich zumindest die wichtigsten Sprachen auf der Welt ohne Synchronsprecher in ein Spiel einbinden. Also ein Mitlesen der Sprache viele somit weg. Bei mir ist es zwar so, dass ich Englisch einigermaßen verstehe, jedoch manchmal irgendein Wort nicht, was dann den ganzen Satz für mich unverständlich macht. Da wäre es super, wenn man nicht nur auf deutsch mitlesen könnte, sondern sich auf das Spielgeschehen konzentrieren könnte mit ner deutschen Sprachausgabe.👍
@michaelbeiyt 10 місяців тому ⁺²
Die medizinische Anwendung wird bestimmt ein Segen. Ansonsten finde ich das gruselig!
@ThePluuG 10 місяців тому ⁺¹
denke damit kann man eine Menge Schindluder betreiben, halte nicht wirklich viel davon🤔
@michaellichter4091 10 місяців тому
Gut das ist jetzt wirklich gruselig.
@xxxh4g3nxxx 10 місяців тому
Gibt es eigentlich einen wissenschaftlichen Test, der in so einem Fall prüfen könnte, dass die Stimme geklaut ist? Vlt kann ich ja auch einfach nur gut Stimmen imitieren.
@tlatosmd 9 місяців тому
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
@fabse_kl 10 місяців тому
Never forget wie Stefan Raab Schnipsel aus dem Hörbuch von Dieter Bohlen genommen hat und überall angerufen hat 😂
@florianmeixnerde 10 місяців тому ⁺¹
Ich hab das selber ausprobiert und ich bin Baff! Wie echt das schon klinkt..... Klar paar Fehler sind da, z.B die Stimme hat meinen namen, Florian, in leicht englischen Slang ausgesprochen
@TheThagenesis 10 місяців тому ⁺²
wegen Anrufe mir meiner geklonten Stimme bei Eltern/Großeltern mache ich mir keine Gedanken. wir sprechen in der Familie einen SEHR speziellen Dialekt(der sich nichtmal geographisch einwandfrei zuordnen lässt), teilweise mit Wörtern, die in keinem Wörterbuch auftauchen. das ist dann ein wenig so, wie die Navajo Code Talkers im 2. Weltkrieg :) und außerhalb der Familie rede ich ausschließlich hochdeutsch. wenn ich meine Eltern so anrufen würde, würden die nach 2 Sekunden auflegen
@fortunato1957 10 місяців тому ⁺¹
Das wird keine Jahre mehr dauern. "KI" ist das heftigste und am schnellsten fortschreitende "Ding" in meiner Lebensgeschichte.
Erst gestern noch habe ich uralte, eingescannte Fotos per KI restauriert. Für diese Arbeit hätte ich vor 3 Jahren bei einem Profi ein Vermögen auf den Tisch legen müssen. Manche der Ergebnisse wären damals technisch gar nicht denkbar gewesen.
Hawking hätte bestimmt Spaß daran gehabt.
Die Songs, die Dieter Bohlen in den späten 80ern produziert hat, waren immer das selbe Geschrammel mit anderen Hampelmännern. Weder Produzent noch Publikum waren künstlich intelligent, sondern einfach nur echt dumm. Wetten, er trainiert seine Modelle heute auch digital?
@mertlandreas 10 місяців тому
Mit welchen Programm haben Sie die Bilder restauriert?
@fortunato1957 10 місяців тому ⁺¹
@@mertlandreas VanceAI
@timmkrause6684 9 місяців тому
Wurde Uberduck in der Zwischenzeit umgebaut? Kann das nicht reproduzieren. Was ist bei denen passiert?
@DD-gq6lx 16 днів тому
Ja....die Text to Speech existiert so nichtmehr!
@thomaskurschner2949 10 місяців тому
Krass, aber auch sehr gefährlich 😮
@sebastiankreienbrink6280 10 місяців тому
Dirk Bach könnte wieder Hörbücher sprechen....das wäre ja toll. :)
@spekulatius1337 10 місяців тому
Wann kann Google Maps dann endlich mit der Stimme von KITT sprechen?
@Datenschutz_Datenschutz 10 місяців тому ⁺⁵
das Thema wird zukünftig sicher noch für Schlagzeilen sorgen.
@ct3003 10 місяців тому ⁺³
Glaub ich auch.
@stupido655 10 місяців тому ⁺²
Sicher mehr negative 😢
@BockworschtSoldier 10 місяців тому
13:45 Wow habe noch nie gehört das eine Stimme Gerickrolled wurde.
@marcopolo9052 10 місяців тому
als Synchronsprecher hätte ich nun angst um meinen job, als zuschauer würde ich gerne mal zum beispiel Tom Hanks original stimme in deutsch hören ...
@Hoto74 10 місяців тому
Ja, Synchronsprecher müssen auch Angst um ihren Job in Zukunft haben, aber noch nicht heute, jedoch in ein paar Jahren. Kann mir schon gut vorstellen, dass Hollywood uns die KI original Stimmen der Schauspieler aufdrücken möchte um noch mehr Geld für Lizenzen einzusacken. Die Geldgier ist leider unermesslich.
@tlatosmd 9 місяців тому ⁺²
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@marcopolo9052 9 місяців тому
@@tlatosmd danke für deine ausführliche Antwort 👍
@Hoto74 9 місяців тому
@@tlatosmd Danke für die Erklärung. Natürlich wird STS immer mehr menschliche Kontrolle haben, aber TTS wird sich auch weiter entwickeln und in Zukunft vor allem Context besser verstehen und somit besser zu verstehen wann wie welche Worte betont werden müssen. Alles andere wird dann mit einem Stimmen Charakter Profil definiert. Zudem hat STS eben auch den Nachteil, dass hier immer noch ein Mensch vorher einsprechen muss, STS ist also für das vorlesen von zufälligem Text völlig ungeeignet, was bei einer Serie aber natürlich nicht der Fall ist, da hat STS dann klare Vorteile... noch.
TTS muss gar nicht so gut sein wie STS, es reicht ein bestimmtes Qualitätslevel zu erreichen, das reicht den meisten Menschen völlig aus. Ist doch bei allem so, alles richtet sich immer mehr was der breiten Masse genügt und die hat IMMER einen niedrigeren Anspruch, wer mehr will gehört zu einer Randgruppe, die kaum mehr bedient wird weil es gegen die Gewinnmaximierung ist, worauf unser ganzes Wirtschaftssystem aufgebaut ist.
@alfredjodokus5012 9 місяців тому
Keno, ich fand deine geklonte Stimme über elevenlabs nicht so natürlich. Klang sehr nach dem was ich mir unter voice transfer vorstelle. Klang nach dir, gemixt mit einer anderen Stimme

Наступне

Автоматичне відтворення

Die Cloud macht mich wahnsinnig | Google und Apple Fotos