Danke für den Hinweis mit dem Kennwort. Das habe ich jetzt mit meinen Eltern ausgemacht (oder dass sie mich einfach nach bestimmten Dingen fragen, wenn ihnen etwas seltsam vorkommt). Sicher werden das die Enkeltrickbetrüger bald anwenden. Meine Eltern haben übrigens mal einen (analogen) Enkeltrick-Anruf bekommen. Sie sind zwar nicht darauf reingefallen, waren danach aber total fertig. Also: Sprecht mit Euren Eltern usw.! In den nächsten Jahren werden wir ,,Sicherheitsfragen'' auch im echten Leben nutzen (,,Sag mal, wie hieß noch mal Dein Lieblingsteddy?'').
Synchronsprecher oder Sprecher von Audiobooks, auch Synchrondolmetscher werden sich warm anziehen müssen und sich von Chat GPT vielleicht schon mal neue Berufsfelder vorschlagen lassen. So schnell wie diese ganze KI voranschreitet, kann einem Angst und Bange werden.
Ja, Synchronsprecher werden es dann wohl in Zukunft nicht so leicht haben, aber irgendwie finde ich die Idee, dass die Originalstimmen der Schauspieler aus Filmen & Co einfach per KI in die jeweilige Sprache übersetzt werden, doch ganz cool. Nie mehr wechselnde Synchronstimmen eines bestimmten Schauspielers zwischen einzelnen Filmen oder innerhalb einer Serie, aus diversen Gründen, und obendrein können dann auch die verwendeten Dialekte/Akzente ganz einfach in die jeweilige Sprache übernommen werden. Das dürfte dann nicht nur die Produktionskosten in der Filmbranche deutlich senken sondern auch in der Spieleindustrie. Davon profitieren dann vor allem auch Indie Studios, die meist kein so großes Budget haben, um zusätzlich noch diverse Synchronsprecher für verschiedene Landessprachen zu bezahlen. Das ist dann glaube ich aber auch der einzige Usecase, wo ich die Nutzung solch einer KI für akzeptabel halte.
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@@tlatosmd Hast du dir schon mal Bark AI von Sono angeschaut? Ist etwas Wild und schwer zu bändigen Qualität auch nicht die beste aber erzähl nicht das man keine Nuancen in Künstliche Stimmen hereinbekommt.
@@ratside9485 Darauf bin ich doch längst eingegangen: Ein paar Schieberegler oder eine Regieanweisung sind ein Dreck gegen das, was man mit STS machen kann. Die Macher von Bark haben übrigens längst erklärt, daß sie aus genau dem Grund keine STS-Funktionalität bzw. keine Möglichkeit für Custom Voices bei Bark einbauen wollen, weil das Ergebnis dann zu realistisch würde und sie dann Angst vor Betrugsmaschen und Fake News haben. Deshalb bleiben sie beim reinen TTS bzw. drei oder fünf von den Machern vorgegebenen Stimmen, geade *WEIL* sie keine allzu realistischen Ergebnisse haben wollen.
@@ct3003 Also: es ist interessant. Das Missbrauchs Potential ist extrem. **ABER AM SCHÖNSTEN** ist mal wieder das "Pricing". Also : 10 000 Charakters == nichts. Bis du 3 Värseln fertig hast wie du sie brauchst, sind 2000 - 3000 weg. dann die Preisgestaltung: für 5 Takken, 30 000 Charakters, also auch nichts. für **ZWEIUNDZWANZIG** gerade mal 100 000, also auch nichts. und alles was eine halwegs vernünftige Nutzung vorsihet, kostet **AB 99 EURO PRO MONAT** öhm. ich lebe noch weil ich Abofrei bin! Nicht weil ich an jedr Ecke abonniere. Also : schönes interessantes Thema - *aber absolut 100% NEIN DANKE* TTS ist heutzutage relativ machbar, man muss kein Geld ausgeben. also : nö
So spannend und faszinierend das im Moment erscheinen mag, schlussendlich ziehen wir uns als menschliche Wesen den Boden zum Leben unter den Füßen weg. Meine Meinung.
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
Zwar ein klein wenig OffTopic, aber bei dem ganzen Video ging mir immer wieder ein Insider durch den Kopf: Arbeitsoberfläche ;) Heute fast normal, damals wohl revolutionär. War glaube ich zu OS/2 WARP Zeiten. Da hat IBM versucht, Sprachsteuerung in ein OS einzubauen. Da mußte man auch erstmal komische Standardsätze ablesen, damit das System die individuelle Stimme erkennt (oder sollte ;) Naja, stundenlanges Training... Ich rede mit mir selbst, äh, nein, dem Computer... Bei der 'Präsentation' der tollen neuen Technik für einen Freund kam dann halt der GAU ;) Schau mal, der wechselt auf den Desktop (damals hat IBM alles eingedeutscht, also Arbeitsoberfläche) wenn ich das sage. Ne, hat er eben nicht ;) Wurde dann irgendwie immer lauter und versuchte es besser auszusprechen. Endete dann halt im schreienden 'ARBEITSOBERFLÄCHE', trotzdem ohne Effekt. Irgendwie lustig, wie man sich heute schon an Computerstimmen gewöhnt hat, es aber wohl immer noch ein Problem ist, solche vernünftig oder überzeugend herzustellen. Und dann noch Individualität reinzubringen...
sehr interessantes Thema, leider ist das Video ja jetzt schon 1 Jahr alt. Gibt es hier nennenswerte neue Entwicklungen die ein Update in einem neuen Video rechtfertigen?
Hallo Netflix, ich würde gerne James Bond - no time to die sehen. James soll die Stimme von Rowan Atkinson haben, die anderen Darstellerinnen und Darsteller sollen bitte bayrisch sprechen. Den Villan möchte ich auf Französisch hören und zwar mit der Stimme vom Merowinger aus Matrix 2. Danke :)
Im Titel steht "Ist das legal?". Darauf scheint aber niemand eingegangen zu sein. Elevenlabs scheint für kommerzielle Zwecke wie Viddeos erstellen auch nach Beendigung des Vertrags legal zu sein ... bzw. darf danach weiterhin genutzt werden.
Kennt ihr noch die Szene aus Terminator 2 wo der T800 bei Johns Eltern anruft, mit Johns Stimme? Also wenn eines Tages ein T800 klopfend mit Großmutters Stimme bei mir vor der Haustür steht, dann haben wir ein Problem!
Radioprogramm Veranstalter liebäugeln auch mit KI-Stimmerzeugung, manche Sendung scheint auch schon im Testbetrieb zu laufen. Ist ein Thema beim Teltarif Podcast.
Finde das Thema unglaublich spannend. Vor dem Enkeltrick habe ich etwas Angst. Ansonsten habe ich kein Problem damit. In Deutschland werden zwar alle Filme und Serien synchronisiert, aber im gesamten ha man nur ein paar Synchronsprecher und die Sprechen einfach mal JEDE Rolle ein. Das ist mir lange nie aufgefallen, bis ich doch mal angefangen habe Serien auch auf Englisch zu gucken. Die beiden deutschen Synchronsprecher von Arnold Schwarzenegger und Bruce Willis finde ich zwar besser, aber ich habe kein Problem damit bald Filme auf Deutsch mit der Stimme des Originalschauspielers zu sehen. Ich sehe auch einen großen Vorteil dafür sich längere Sachbücher als Audiobook rein zu ziehen.
Das ganze KI-Thema ist wirklich interessant und unglaublich unglaublich. Und es wäre spannend zu sehen, zu was KI in ein paar Jahren im Stande ist. Allerdings sind wir gesellschaftlich überhaupt nicht darauf vorbereitet, dass unglaublich viele Arbeitsplätze obsolet werden. Ich bin echt gespannt wo das hinführt. Vielleicht kommt das Ganze ja so wie in "Das Ende des Kapitalismus" vorgeschlagen. Die Leute haben weniger Geld und können deshalb auch weniger ausgeben. Damit können wir Klimaziele viel einfacher erreichen. ;)
Das mit den Arbeitsplätzen sehe ich nicht so schlimm. Du brauchst immer noch jemanden der der syntetischen Stimme als Muster dient und du brauchst jemanden, der den Text formuliert, der dann ausgegeben werden soll. Da es auf dieser Welt genug Arbeit gibt, sehe ich das befürchtete Szenario von Tausenden, die dann ohne Einkommen und damit ohne Geld darstehen, nicht so groß.
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
Bei Hörbüchern kommt noch ein weiteres Problem hinzu: Gute Leser verwenden verschiedene Stimmen für die unterschiedlichen Charaktere einer Geschichte. Dafür müsste die KI auch noch den Text korrekt interpretieren.
Mit diesen KI-Stimmen könnte mich keiner täuschen, auch nicht am Telefon. Da stimmt weder die Stimmfrequenzen, noch Sprachrythmus, noch Resonanzen. Keno Du hast zum Beispiel so einen schönen Bass das man deine Stimmbänder sofort raus hören kann. Die Resonanzen die die Stimmbänder zusammen mit dem Mundraum bilden, gibt deiner Stimme ein so charakteristische Aussehen das ich die in 99% der Fälle immer wieder raus hören würde. Dazu kommt noch dein Sprachrytmuss und dein Dialekt. Ich habe zwar ein besonders gute Gehör und kann einige Sachen mehr höhren wie zB. Gefühle oder Medikamente die mein Gegenüber eingenommen hat (mit Schulung und einem guten Gehör kann das fast jeder siehe unten bei PS) aber die KI-Stimmen sind so schlecht das die mir noch weniger sorgen machen als Künstliche Intilligenz. PS: Ja man kann Gefühle oder Medikamente hören, wenn diese den emotionalen Grundzustand verändern. Beispiel ist z.B. das Ehepaar das abends im Bett liegt und der Mann hat dann wesentlich mehr Bass als tagsüber, weil Er tiefenentspannt ist. Viele Frauen hören das z.B. nach dem Sex, wenn die Männer mehr Bass bekommen. Anderes Beispiel: Medikamente wie Opiate, Methadon, starke Beruhigungsmittel verändern auch das Bild einer Stimme, da die Stimmbänder nicht mehr so unter Spannung stehen. Der Volksmund sagt z.B. die Frau mit der hysterischen Stimme und meint damit das diese Frau eine kreischende Stimme hat und Sie entsprechend aufgeregt/panisch ist. Daher beeinflussen Gefühle die Stimme. Wir bemerken das nur selten ganz bewusst, sondern nehmen es meisten nur unterschwellig war. Wir Menschen sind ja dadrauf konditioniert fast alles mit den Augen oder Händen war zu nehmen und machen unser Gehör dafür geren in einer Disco kaputt.
ElevenLabs Nutze ich auch schon für meine Videos, nur kann man Kostenlos nicht wirklich viel machen, da ich einige Texte doch 3-4 mal generieren muss bis die Betonung einigermaßen so klingt wie ich es haben will.
Für Filme und Serien ist das eine super Technik. Was damals Fan-Untertitel waren, könnten morgen Fan-KI-Stimmenübersetzungen sein. Besonders bei alten Filmen, die nie auf Deutsch oder Englisch erschienen sind, eine feine Sache. Aber auch so, man stelle sich vor, man könnte bei Serien einfach für jeden Charakter seinen Lieblingssprecher dynamisch einstellen.
Und zerstört damit ein ganzes Berufsfeld und nimmt der deutschen Synchronbranche ihre Existenz :D Wieso auch Achtung und Wertschätzung für das Handwerk des Schauspiels haben oder wahren.. Ja, super Technik!
@@SprecherFabi Natürlich werden einige Synchronsprecher ihre Jobs verlieren, aber so ist das eben mit Fortschritt. Auf der anderen Seite können Leute die sich anpassen, jetzt allein einen ganzen Film vertonen und mehr verdienen. Es wird sicher auch irgendwann ein Copyright für Stimmen geben, so dass man seine Stimme lizenzieren kann.
Für Flopflix und co. mag das ja reichen. Aber bei ordentlichen Filmen will ich auch ordentliche Stimmen hören, Stimmen mit einer Seele, wo man Emotionen heraushört, und nicht so'n synthetischen Mist. Schon bei der Otto-Stimme im obigen Video konnte man das hören; nicht mal in der Lage zu lachen oder zu weinen, ironisch oder zynisch zu wirken, etc. Sarkasmus, Humor und solche Dinge, sind ganz besondere menschliche Fähigkeiten, die in der K.I. ganz am Ende stehen, so sie denn überhaupt auf absehbare Zeit möglich sind. Ich bin ein großer Fan von Synchronschauspielern und bin jedes Mal bestürzt, wenn wieder einer von den guten geht. Ein Elsholtz oder Danneberg als K.I.? Lächerlich. Mit K.I. ist sehr viel möglich, aber man muss jetzt nicht auf Biegen und Brechen _alles_ ersetzen wollen, was gut war. Bislang hat man immer noch jemanden gefunden, der die Synchronrolle übernimmt, und obwohl ich bei den Stimmen recht pingelig bin, komme ich damit klar -- mit Sicherheit besser als mit einem leblosen Ersatz aus dem Computer.
Ich sage es mal ganz direkt, was wäre wenn dein Arbeitskollege dir einen schlechten Scherz antun will. In Form, deiner Stimme bei dein Chef anruft, und ihn beleidigt oder sonstige dinge macht.
wenn ich meine stimme in ios o. bei anderen anbietern einspreche/digitalisieren lasse; wie ist das rechtlich? behalte ich alle rechte, oder welche gebe ich ab? will ich das? das hätte man noch thematisieren können. oder künftig ein thema? ihr habt ja einen hervorragenden hausjuristen. danke lg
Es wird nachwievor ein Synchronsprecher eingesetzt, weil die von RTL eingesetzte Technik null mit solchen Vorleseprogrammen (TTS) wie Elevenlabs zu tun hat. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@@tlatosmd Im Endeffekt wird Maxi Schafroth zwei mal einsprechen. Einmal so, wie Clarin ihn gesprochen hätte, um ihn dann mit STS verändern zu können und einmal so, wie er selbst den Pumuckl sprechen würde. Also das Gegenteil von den Synchronsprecher nicht zu bezahlen.
Bei Bildern, Stimmen und Videos von KI sollte immer ein Wasserzeichen, ein Untertitel oder ein Hinweis auf KI sein. Aber mal ehrlich - bei schnell gezeigten Bildern, bei kleingedruckten Einblendungen in Videos oder am Ende im Abspann verpackt, wer kann da noch echt von nachgemacht unterscheiden? Übrigens hätte ich zur Zeit Probleme bei irgendeiner kostenlosen Probe-KI mein Sprachprofil zu hinterlassen! Ob das dann jemals gelöscht wird oder vielleicht in "falsche Hände geraten" kann? Und am Telefon wird zuweilen ja auch nachgefragt, ob man das Telefongespräch zu "Verbesserungszwecken" der Qualität aufzeichnen lassen will! Also vielleicht doch ein Verbot von KI-Stimmen-Klonen nach dem Motto: "Meine Stimme gehört mir?"
@@Hoto74 Ist eine Frage der Abwegung und des Konsenses in der Gesellschaft. Vielleicht in diesem Zusammenhang ein Beispiel: Möchtest Du, dass Du in drei-D eingescannt wirst und irgendwelche Filme mit Deinem Avatar und Deiner Stimme erscheinen (ein durchaus mögliches Zukunftsszenario!). Recht am eigenen Bild ist jedenfalls durch Urhebergesetz geschützt!). Ich bin insoweit auch für eine Regelung im Kunst und Urheberrecht für die Stimme. Zuerst kommt die neue technische Entwicklung und dann die rechtliche Regelung. Das ist normal. Im Beispiel von Hans Clarin, der ja tot ist, weiß ich auch nicht, ob das rechtlich sauber ist und wie Gelder an z. B. Erben verteilt werden. Synchronsprecher ist doch ein Beruf! Die Stimme aus dem Jenseits müßte dann ja auch irgendwie geschützt sein? Verbot zu einfach - vielleicht - rechtliche Regelungen - unbedingt ja!
@@manfredthiele5282 Nun, wenn ich dafür gut entlohnt würde und abgesichert wäre, dass das Model nur für bestimmte Einsatzzwecke genutzt werden darf. Ja, hätte ich keine Probleme damit. Aber wie du sagst, ohne Regeln geht es nicht. Aber wenn es Regeln gibt bedeutet es ja auch das es nicht verboten ist. Ich schätze mal schon, dass das mit den Erben von Hans Clarin abgeklärt ist und die entsprechend auch entlohnt wurden. Sollte es allerdings keine Erben geben, was ja auch möglich wäre, frage ich mich wie man das dann rechtlich klären kann.
@@Hoto74 Noch ein kurzer Gedanke: KI kann doch auch neue Stimmen erstellen?! Wozu eigentlich covern? O. K., Satire oder für Filme zum nachbearbeiten - aber wozu eigentlich die Stimme von Herrn Müller oder Frau Müller von nebenan? Mal ehrlich, da fallen mir nur wenige Beispiele für den produktiven nützlichen Gebrauch, aber umgekehrt tausend Beispiele für den Missbrauch ein...Gegen neue natürlichere Stimmen - ähnlich wie bei dem schriftlichen Verkehr eben Schrifttypen - ist doch nichts zu sagen und das fände ich toll. Auch wenn jemand seine eigene Stimme selbst verwendet ist natürlich dagegen nichts zu sagen...
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
Es tut mir leid das sagen zu müssen aber Stephen Hawking ist leider seit 2018 verstorben. Ich kann mich gut daran erinnern weil ich zu dem Zeitpunkt einen Podcast gehört habe und dann die Nachricht reingekommen ist. Aber jetzt wo ich die Nachricht geschrieben habe fällt mir ein du wahrscheinlich dieses Beispiel gemacht hast weil auch mir keine berühmter Mensch einfallen der seine Stimme verloren hat der so bekannt ist. Gutes Video ✌️
Ich bin die Stimmen unserer Synchronsprecher derart gewohnt, dass selbst wenn ich die Wahl hätte die Original-Stimme der Schauspielers zu wählen (auf deutsch), würde ich die der deutschen Synchronsprechers den Vorzug nehmen. Meistens schaudere ich, wenn ich mir anhöre, wie Schauspieler tatsächlich klingen. Es gibt wenige Schauspieler, deren Original-Stimme ich tatsächlich mag.
Hi, suche eine Software / Ki, wo ich meine TH-camfilme in Englisch, mit meiner Stimme, übersetzen kann, also nur die Tonspur. Geht das auch schon? LG Alex
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
Funktioniert das bald live? Könnte ich z.b. bei meiner Bank anrufen, die mittels eines Stimmenabdrucks meine Identität verifizieren und dann über die Tastatur mit denen labern und mein Konto manipulieren?
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
cool, dann kann man ja die 2. Staffel von "Ein Colt für alle Fälle" endlich neu vertonen, da ja der Synchronsprecher von Lee Majors verstorben ist, und es da Probleme mit Urheberrecht auf die original Spur gibt, was DVD Produktion angeht ...
Hi wieder mal ein toller Beitrag! Was mich nur mal interessieren würde, wie sieht es denn rechtlich aus, wenn man eine Stimme eines anderen klont? Wie bei eurem Pumukl Beispiel. Hans Clarin ist ja nun schon seid einigen Jahren tot und das Persönlichkeitsrecht erlischt soweit ich weiß ja mit dem Tot der Person. die Etischen Fragen lassen wir mal außen vor das wäre noch ein ganz anderes Thema..
Sind die alle text -> speech oder gibt es auch welche die speech -> speech uebersetzen ohne den Zwischenschritt mit Text? Da geht ja sicher vieles der Betonung verloren.
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
Vielen Dank für das Video. Leider hat der Inhalt nach dem Titel "ist das legal" nicht meine Erwartung erfüllt. habe es mir angeschaut, weil ich genau dazu mehr wissen wollte. Ob es legal ist, findet sich immer nur in einem Nebensatz. Mich würde schon mal genauer interessieren, wie da die Regelung ist. So habe ich Menschen in meinem Umfeld, die in kreativen Berufen tätig sind und die feiern diese Möglichkeit mit den KI Stimmen sehr. Schlagwort: Synchronsprecher einsparen. Es ist vermutlich naheliegend, dass man natürlich keine Stimmen von (prominenten) Personen zu kommerziellen Zwecken nutzen darf. Aber was ist, wenn man diese minimal ändert. somit hat man nicht direkt kopiert. Gibt es hier schon Regelungen? Ggf. könnt ihr noch mal genauer auf die rechtliche Lage dazu eingehen. Liebe Grüße
In den USA wäre es möglich, die Likeness-Gesetze für Promis auch auf Stimmen anzuwenden; allerdings zeigt sich in der Rechtsprechung der US-Gerichte der letzten Jahre, daß diese Rechte der Promis an ihrer eigenen Likeness zunehmend zugunsten ihrer Arbeitgeber (Studios) verschoben werden. Auch das viel (falsch)zitierte Urteil Authors Guild vs. Google, wo derzeit eine Menge Blödsinn in der Richtung behauptet wird, daß es eine Entscheidung über Urheberrecht bei KI gewesen wäre (de facto ging es allein um die Tatsache, daß die Autoren unwissentlich ihre Urheberrechte an Google abgetreten hatten, so daß Google ihre Bücher für staatlich betriebene Bibliotheken scannen darf, ohne die Autoren dann für jede einzelne Ausleihe vergüten zu müssen), weist in eine ähnliche Richtung, daß Urheberrechte zunehmend zugunsten der zahlungskräftigsten Konzerne entschieden wird. Vor ein paar Jahrzehnten hätte das Gericht noch entschieden, daß derart vorsätzlich unklare oder verschwurbelte Formulierungen im von den Autoren unterzeichneten Vertragstext zu einer Annulierung geführt hätten. In der EU hingegen gibt es hingegen keinerlei Gesetze gegen Stimmklonung; es gibt in der EU kein Pendant zum Recht am eigenen Bild, das auf die Stimme anwendbar wäre. Beim kürzlichen KI-Gipfel in Brüssel wurde lediglich entscheiden, daß die Hersteller den Output kennzeichnen müssen. Das tun Stimmklonungsprogramme aber schon seit Jahren, nämlich mit unhörbaren akustischen Wasserzeichen; bevor die Branche auf den Trichter gekommen ist, wurden Pioniere wie Adobe VoCo und WaveNet einfach kurzerhand aufgrund von Bedenken von Politik und Geheimdiensten abgeschossen, da man mit Stimmklonen, die nicht schnell und eindeutig als solche identifziert werden können, ja z. B. auch einen Krieg auslösen und Fake News verbreiten kann. Bis vor ein paar Jahren hätten in der EU zumindest Platten- und Produktionsfirmen wegen Verwendung von Stimmaufnahmen, an denen sie Urheber- bzw. Verwertungsrechte haben, zu Klonzwecken in der EU rein theoretisch wegen URV klagen können; das wäre aber schon damals an der Praxis gescheitert, weil es technisch unmöglich ist, nachzuweisen, welche spezifische Aufnahme einem fertigen Stimmodell zugrundeliegt. Mit der EU-Urheberrechtsreform vor ein paar Jahren, die medial vor allem als Memeverbot und Vorstufe zu Uploadfiltern thematisiert wurde, wurde dann aber das Konzept des legalen Dataminings für genau solche KI- alias ML-Anwendungen eingeführt, was zum einen mit der Tatsache begründet wurde, daß das wichtige innovative Forschung ist, und zum anderen, weil das Modell, das eine ML erstellt, de facto einen so hohen Abstraktionsgrad vom Ursprungsobjekt aufweist, daß eben nicht nachweisbar ist, welche Vorlage benutzt wurde bzw. der Abstand auch aufgrund des schon allein technisch nötigen Abstraktionsaufwands, um aus einer statischen Kopie eine derart dynamisch steuerbare Nachahmung zu machen, einfach zu groß ist, um noch vom selben Objekt zu sprechen. Der eminente Schönheitsfehler, den die EU-Gesetze zum Datamining aber bislang aufweisen, besteht darin, daß sie extra für Institute und Großkonzerne maßgeschneidert wurden, denen dieses Recht eingeräumt wurde. Was in der Praxis wiederum heißt, daß die so entstehenden KI-Tools von Künstlern, beauftragten Arbeitnehmern und Konsumenten zwar so genutzt werden können wie Photoshop, die Urheber- und Nutzungsrechte der Ergebnisse liegen dann aber laut EU-Recht bei den KI-Firmen, die das Programm hergestellt haben (wo dann bestenfalls ein kaufkräftiger Arbeitgeber eine mehr oder weniger begrenzte Mitnutzungslizenz erwerben kann). Wie ein Blog dazu schrieb, ist das so, als hätte eine Pinselfabrik per Lobbyarbeit durchgesetzt, daß sie automatisch sämtliche Urheber- und Nutzunsgrechte an den Bildern erhält, die mit ihren Pinseln gemalt worden sind. Es ist daher zu raten, stattdessen Open-Source-Programme (z. B. von GitHub) zu nutzen (aber auch hier Vorsicht: Inzwischen laufen findige Firmen wie die Website Replicate rum, die auf jedes halbwegs vielversprechende Open-Source-GitHub-KI-Modell eine Webseiten-GUI draufklatschen, deren Nutzung dann nicht nur an sich schon per Abo kostenpflichtig ist, sondern wo der Nutzer laut TOS auch automatisch sämtliche Rechte an Replicate abgibt), oder solche von Firmen, die in ihren Nutzungsbedingungen definitiv ausschließen, ihre Nutzer auf diese Weise enteignen zu wollen. Speziell beim Thema KI-Stimmen läßt sich bei Firmen und Dienstleistern mit einer TOS, die den Nutzern ihre Rechte läßt, vor allem voice.ai nennen, das außerdem kein dummes Vorleseprogramm (TTS) wie das hier präsentierte Elevenlabs ist, sondern viel natürlicher klingende und leichter steuerbare Stimmkonvertierung (STS), wo auf die Aufnahme eines anderen Sprechers einfach nur quasi ein nachträglicher Filter zur Umwandlung der Stimme draufgelegt wird; bei STS spielt der lebende Sprecher, der vorne reinspricht, mit seiner eigenen Stimme die KI-Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt.
Für mich als Musik Produzent interessant. Stimme generieren, anpassen und takten. Billiger als eine Sängerin 👍🏼 Die Zukunft mit KI wird auch Vorteile mitbringen. Nutze schon eine um Stimme vollständig von Song zu trennen. Früher fast undenkbar
Es gibt jetzt schon KI - Bands die rocken 24/7 durch während sie in Realtime produzieren und sind für Laien akkustisch nicht von echten Musikern zu unterscheiden.
Puh, sehe ich gespalten. Als Creator denke ich daran, wie praktisch es wäre seinen Content in andere Sprachen zu übersetzen. Als kritischer Mensch macht ich mir Gedanken darum, dass bald neben meinen ganzen Standartdaten, auch Fingerabdrücke, digitale Bodyscans und nun auch die Stimme frei zu erwerben ist.
Das fängt erstmal mit 4 Gerüchen an und irgendwann kann man dann Fernseher mit 16 Gerüchen kaufen. Wird am Anfang aber nur von wenigen Filmen unterstützt, Avatar 7 z.B..
Welche KI generierten Stimmen darf ich denn kommerziell nutzen? Und was heißt kommerziell? TH-cam Videos können irgendwann monetarisiert werden. Hab ich dann anfangs keine Probleme, aber wenn die Monetarisierung anfängt muss ich alles lösch?
Das wird keine Jahre mehr dauern. "KI" ist das heftigste und am schnellsten fortschreitende "Ding" in meiner Lebensgeschichte. Erst gestern noch habe ich uralte, eingescannte Fotos per KI restauriert. Für diese Arbeit hätte ich vor 3 Jahren bei einem Profi ein Vermögen auf den Tisch legen müssen. Manche der Ergebnisse wären damals technisch gar nicht denkbar gewesen. Hawking hätte bestimmt Spaß daran gehabt. Die Songs, die Dieter Bohlen in den späten 80ern produziert hat, waren immer das selbe Geschrammel mit anderen Hampelmännern. Weder Produzent noch Publikum waren künstlich intelligent, sondern einfach nur echt dumm. Wetten, er trainiert seine Modelle heute auch digital?
Gerade das "aufpolieren" stört mich bei ElevenLabs. Ich spreche Englisch eben mit einem stark deutschen Akzent und das möchte ich gerne behalten. Ich hätte also gerne das die KI von Eleven Labs meinen deutschen Akzent beibehält. Das klappt leider nicht. Somit wird immer deutlich, dass eben nicht ICH das spreche, sondern eine AI.
Also ich würde meine Stimme gerne geklont haben... Gerade weil ich gerne Video-Trainings machen will, aber einfach keine Geduld habe das einzusprechen... Der Text kann ja grundsätzlich generiert werden... Und dann das Timing im Video und dann wäre die Bearbeitung wesentlich schneller fertig...
Ich würde die Videos nicht mit KI-Füllern verbessern. Du hast ein perfektes Video, obwohl du nicht perfekt warst. Das wird deine Fähigkeiten als Sprecher nicht unbedingt verbessern. Ist doch mit der ganzen Technik so: irgendwie schön, aber wir müssen uns weniger anstrengen und werden dümmer dabei. Gibt immer noch gute Anwendungsmöglichkeiten, aber das würde ich mir sparen. Außerdem: das Video ist von Menschen gemacht und Menschen machen Fehler. Wenn ihr KI-Beiträge sendet, dann ist das was anders.
Wie ist das eigentlich mit der Legalität? muss man sich jetzt auch die erlaubnis oder lizenz oder berechtigung von den original personen einholen, nur, wenn man sich privat ein stück text vorlesen lassen möchte, ohne es öffentlich zu machen? oder wenn man sich die stimme, weil man sie cool findet, als AI stimme auf sein handy holen möchte, z.b. als weckerstimme oder sowas?
Sehr interessantes Thema. Die Erfahrung hatte ich auch schon gemacht dass bisher sich nur die englischsprachigen Stimmen gut angehört haben. Speziell bei deutschen Stimmen mit englischen Wörtern gab es anfangs sehr komischen Output. Neu war für mich dass ich die Stimme auch auf englisch einsprechen kann für die deutsche Sprachausgabe. Deine AI Stimme hat sich schon sehr gut angehört. Habt ihr da auch noch Filter rauf gelegt oder den direkten Output vom Tool übernommen? Vielleicht kann man ja dadurch noch etwas raus holen?
Wer KI-Stimmen /menschliche Sprachausgabe lokal am eigenen PC erstellen möchte ist mit der Thorsten Stimme (Kostenfrei, Lokal lauffähig, Open Source Lizenz) deutlich besser bedient: Video für Linux Nutzer: th-cam.com/video/uyG1Sx7_3Yg/w-d-xo.html Auch für Windows und andere Nutzer sind Videos in seinem Kanal zu finden.
Warum klone ich meine Stimme, wenn sie sich danach nicht wie meine Stimme anhört? Beim Wort "klonen" erwarte ich eine identische Kopie. Das hier Geklonte hörte sich ja überhaupt nicht nach Keno an. Auch nicht 80% sondern vielleicht 30%.
wegen Anrufe mir meiner geklonten Stimme bei Eltern/Großeltern mache ich mir keine Gedanken. wir sprechen in der Familie einen SEHR speziellen Dialekt(der sich nichtmal geographisch einwandfrei zuordnen lässt), teilweise mit Wörtern, die in keinem Wörterbuch auftauchen. das ist dann ein wenig so, wie die Navajo Code Talkers im 2. Weltkrieg :) und außerhalb der Familie rede ich ausschließlich hochdeutsch. wenn ich meine Eltern so anrufen würde, würden die nach 2 Sekunden auflegen
Irgendwie werden teilweise eher so zweitrangige Engines bissl laienhaft benutzt und dann am Ende heisst es: So dolle ist es nicht. Bei Sascha Lobo, R.D. Precht und bei ZDF heute beim Thema K.I. das Gleiche in grün...
Also wenn ich meine Stimme verliere, will ich als Ersatz die von Thomas Danneberg! 🙂 Am meisten aus Richtung Terence Hill, garniert mit ein wenig Sly & Arnie, und nur ner Prise John Cleese. 😀
Hallo, ich komme gleich auf den Punkt-ich möchte meine Stimme klonen, das Ergebnis mit Elewen Labs ist eine Katastrophe, bei dir hört sich deine Stimme recht natürlich an, es wäre toll, wenn du hier mal zeigst wie du das so hinbekommen hast. Liebe Grüße, Dein Kanal ist echt Spitze.
Mein liebes CT Team, schön wäre es gewesen wenn ihr dazu gesagt hättet. Das mit solchen Tools auch verstorbene Syncronstimmen wiederbelebt werden. Hab vor kurzem Boss Level gesehn und ohh Mann hat mich die neue Stimme von Mel Gibson gekillt und da muss ich raus finden. Das der Sprecher schon am 31.10.23 verstorben sei, Danneberg ein paar Tage später. Siehe auch Denzel Washington oder die von Tom Hanks, ich will in keiner Welt sein wo ich die neuen annehmen muss. Jetzt hätte man die Möglichkeit neue Filme nach zu vertonen. wenn es möglich ist. Wir haben (noch) die besten Syncros und was ist wen die mal nicht mehr sind, siehe Marge und Homer Simpson oder Bud Spencer. Tucker Carlson hat es vor kurzem gezeigt kurz vor Putin, seine Stimme ist göttlich.
Das ganze wäre auch für die Spieleindustrie ein Gamechanger. Meist hat man nur englische Sprachausgabe... Hiermit ließen sich zumindest die wichtigsten Sprachen auf der Welt ohne Synchronsprecher in ein Spiel einbinden. Also ein Mitlesen der Sprache viele somit weg. Bei mir ist es zwar so, dass ich Englisch einigermaßen verstehe, jedoch manchmal irgendein Wort nicht, was dann den ganzen Satz für mich unverständlich macht. Da wäre es super, wenn man nicht nur auf deutsch mitlesen könnte, sondern sich auf das Spielgeschehen konzentrieren könnte mit ner deutschen Sprachausgabe.👍
Am Ende wird keiner unter dem Content angeben, ob es mit Hilfe von Ki erstellt wurde oder nicht. Sobald es möglich sein wird Ki Inhalte zu identifizieren, wird es eine noch bessere Ki Version geben, bei der das dann nicht mehr möglich sein wird
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
Also ich höre einen konkreten Unterschied in der generierten Stimme von Dir zur Originalen. Das mag daran liegen das ich keine billo-Brüllwürfel am PC habe oder nur Kopfhöhrer. Alleine die Tiefe ist anders, genau wie die Klangfarbe. Zum Thema Stimmcloning sollte man evtl verpflichtend einen Startton oder ein Hintergrundrauschen einbauen müssen gesetzlich.
Interessantes Thema. Die Hörprobe von der generierten Isabel Grünewald-Stimme hat mich nicht überzeugt. Isabel Grünewald spricht mit einer klingenden "Sprachmelodie", die der geklonten Stimme komplett fehlt. Dadurch klingt die Klon-Variante kalt und leblos. Die Stimme unseres Bundeskanzlers ließe sich vermutlich dankbarer klonen.
Machst du mal ein Video über den Einsatz von monica von OpenAI? Ich finde das Potential so gewaltig und es ist so wunderschön intuitiv nutzbar, ABER ich habe Angst vor der Datenkrake, besonders im kommerzionellen Nutzen. Besonders bei den Desktop-Variante.
Mal so ein Gedanke: Wenn Die Stimmen dann perfekt werden, kann man auch mit dem Computer einen mit der Stimme gesicherten Verschluß öffnen. Der "Enkel TRick" am Telefon wird noch schlechter durchschaubar. Ich möchte hier nur sagen: Das kann auch missbraucht werden, daran müssen wir uns dann auch gewöhnen...
Vielleicht schaffen bald Polen, nicht nur einen synchronsprecher zu haben als Mann für eine Schauspielerin, einen Schauspieler und sogar einem Hund xD Dann kommen endlich gute synchronisierten Filme bei raus 👍😂
Ich hab das selber ausprobiert und ich bin Baff! Wie echt das schon klinkt..... Klar paar Fehler sind da, z.B die Stimme hat meinen namen, Florian, in leicht englischen Slang ausgesprochen
Ich finde KI-Stimmen sehr spannend. Allerdings brauche ich eine OpenSource Lösung für meine Projekte, da ich mich sonst auf die dauerhafte Verfügbarkeit eines Anbieters verlassen muss, was erfahrungsgemäß nicht immer der Fall ist.
Danke für den Hinweis mit dem Kennwort. Das habe ich jetzt mit meinen Eltern ausgemacht (oder dass sie mich einfach nach bestimmten Dingen fragen, wenn ihnen etwas seltsam vorkommt). Sicher werden das die Enkeltrickbetrüger bald anwenden.
Meine Eltern haben übrigens mal einen (analogen) Enkeltrick-Anruf bekommen. Sie sind zwar nicht darauf reingefallen, waren danach aber total fertig.
Also: Sprecht mit Euren Eltern usw.! In den nächsten Jahren werden wir ,,Sicherheitsfragen'' auch im echten Leben nutzen (,,Sag mal, wie hieß noch mal Dein Lieblingsteddy?'').
Synchronsprecher oder Sprecher von Audiobooks, auch Synchrondolmetscher werden sich warm anziehen müssen und sich von Chat GPT vielleicht schon mal neue Berufsfelder vorschlagen lassen. So schnell wie diese ganze KI voranschreitet, kann einem Angst und Bange werden.
Na ja, könnten sie auch verkaufen und sich zu Hause zurücklehnen und die KI für sich arbeiten lassen.
Ja, Synchronsprecher werden es dann wohl in Zukunft nicht so leicht haben, aber irgendwie finde ich die Idee, dass die Originalstimmen der Schauspieler aus Filmen & Co einfach per KI in die jeweilige Sprache übersetzt werden, doch ganz cool. Nie mehr wechselnde Synchronstimmen eines bestimmten Schauspielers zwischen einzelnen Filmen oder innerhalb einer Serie, aus diversen Gründen, und obendrein können dann auch die verwendeten Dialekte/Akzente ganz einfach in die jeweilige Sprache übernommen werden. Das dürfte dann nicht nur die Produktionskosten in der Filmbranche deutlich senken sondern auch in der Spieleindustrie. Davon profitieren dann vor allem auch Indie Studios, die meist kein so großes Budget haben, um zusätzlich noch diverse Synchronsprecher für verschiedene Landessprachen zu bezahlen.
Das ist dann glaube ich aber auch der einzige Usecase, wo ich die Nutzung solch einer KI für akzeptabel halte.
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@@tlatosmd Hast du dir schon mal Bark AI von Sono angeschaut? Ist etwas Wild und schwer zu bändigen Qualität auch nicht die beste aber erzähl nicht das man keine Nuancen in Künstliche Stimmen hereinbekommt.
@@ratside9485 Darauf bin ich doch längst eingegangen: Ein paar Schieberegler oder eine Regieanweisung sind ein Dreck gegen das, was man mit STS machen kann.
Die Macher von Bark haben übrigens längst erklärt, daß sie aus genau dem Grund keine STS-Funktionalität bzw. keine Möglichkeit für Custom Voices bei Bark einbauen wollen, weil das Ergebnis dann zu realistisch würde und sie dann Angst vor Betrugsmaschen und Fake News haben. Deshalb bleiben sie beim reinen TTS bzw. drei oder fünf von den Machern vorgegebenen Stimmen, geade *WEIL* sie keine allzu realistischen Ergebnisse haben wollen.
Ich dachte, die Stimme von Isabel Grünewald wär schon synthetisch. Klingt immer so überbetont und künstlich.
Euer Mini-Teppich beim Interview war richtige Hypnose :D Als ich kurz weggeschaut hab hab ich den Teppich an der Wand gesehen xD
Hallo Keno., Wenn ich dich nochmal singen hören muss lösch ich das Internet 😂😂
🤓
wenn du Keno singen hörst, wurde das Internet schon gelöscht 😂
nach einer weile wird es erträglicher, du darfst nur nicht das blut aus den ohren wischen...
So bekommt die Mute Funktion eine ganz neue Bedeutung 😅
@@ct3003 Also: es ist interessant. Das Missbrauchs Potential ist extrem.
**ABER AM SCHÖNSTEN** ist mal wieder das "Pricing".
Also : 10 000 Charakters == nichts. Bis du 3 Värseln fertig hast wie du sie brauchst, sind 2000 - 3000 weg.
dann die Preisgestaltung: für 5 Takken, 30 000 Charakters, also auch nichts.
für **ZWEIUNDZWANZIG** gerade mal 100 000, also auch nichts.
und alles was eine halwegs vernünftige Nutzung vorsihet, kostet **AB 99 EURO PRO MONAT**
öhm.
ich lebe noch weil ich Abofrei bin!
Nicht weil ich an jedr Ecke abonniere.
Also :
schönes interessantes Thema - *aber absolut 100% NEIN DANKE*
TTS ist heutzutage relativ machbar, man muss kein Geld ausgeben.
also : nö
Nigerianischen Prinzen gefällt das.
Das ist mein Onkel!
Ich würde gerne ein Video sehen wo ihr das mit dem Gesang zeigt 😂
So spannend und faszinierend das im Moment erscheinen mag, schlussendlich ziehen wir uns als menschliche Wesen den Boden zum Leben unter den Füßen weg. Meine Meinung.
Its called Transhumanismus
Wenn kann man denn jetzt noch glauben im Netz. Super Beitrag.
Mir kannst du trauen, versprochen.
@@goldensurfer2778 Dann wird ja alles wieder gut.
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
Hi Keno, ein Video über so-vits svc wäre geil, geiles Format, macht weiter so Gruß
Zwar ein klein wenig OffTopic, aber bei dem ganzen Video ging mir immer wieder ein Insider durch den Kopf: Arbeitsoberfläche ;) Heute fast normal, damals wohl revolutionär. War glaube ich zu OS/2 WARP Zeiten. Da hat IBM versucht, Sprachsteuerung in ein OS einzubauen. Da mußte man auch erstmal komische Standardsätze ablesen, damit das System die individuelle Stimme erkennt (oder sollte ;) Naja, stundenlanges Training... Ich rede mit mir selbst, äh, nein, dem Computer... Bei der 'Präsentation' der tollen neuen Technik für einen Freund kam dann halt der GAU ;) Schau mal, der wechselt auf den Desktop (damals hat IBM alles eingedeutscht, also Arbeitsoberfläche) wenn ich das sage. Ne, hat er eben nicht ;) Wurde dann irgendwie immer lauter und versuchte es besser auszusprechen. Endete dann halt im schreienden 'ARBEITSOBERFLÄCHE', trotzdem ohne Effekt. Irgendwie lustig, wie man sich heute schon an Computerstimmen gewöhnt hat, es aber wohl immer noch ein Problem ist, solche vernünftig oder überzeugend herzustellen. Und dann noch Individualität reinzubringen...
Der Boss Move wäre gewesen, wenn das Interview mit Matthias Lehmann von seiner KI Stimme geführt worden wäre.
"Boss Move"... wenn ich so etwas lese... diese ganze "Like a Boss"-Scheiße...
@@PrinzMidas nailed it
Ich finde deine Videos immer so ultra authentisch. Du wirst lange nicht durch eine KI ersetzt 🙂
Ok, puh!
Er ist schon eine KI - so witzig kann kein Mensch sein :)
sehr interessantes Thema, leider ist das Video ja jetzt schon 1 Jahr alt. Gibt es hier nennenswerte neue Entwicklungen die ein Update in einem neuen Video rechtfertigen?
Ich freue mich auf die Computerspieleimplementation!
Hallo Netflix, ich würde gerne James Bond - no time to die sehen. James soll die Stimme von Rowan Atkinson haben, die anderen Darstellerinnen und Darsteller sollen bitte bayrisch sprechen. Den Villan möchte ich auf Französisch hören und zwar mit der Stimme vom Merowinger aus Matrix 2. Danke :)
Uuuuh wie geil!
Endlich kann ich die Synchronstimme von Skeletor aus den He-Man-Hörspielen zum Leben erwecken, muahahahaha!
Im Titel steht "Ist das legal?". Darauf scheint aber niemand eingegangen zu sein. Elevenlabs scheint für kommerzielle Zwecke wie Viddeos erstellen auch nach Beendigung des Vertrags legal zu sein ... bzw. darf danach weiterhin genutzt werden.
Prima Video wieder, danke und weiter so :)
Kennt ihr noch die Szene aus Terminator 2 wo der T800 bei Johns Eltern anruft, mit Johns Stimme? Also wenn eines Tages ein T800 klopfend mit Großmutters Stimme bei mir vor der Haustür steht, dann haben wir ein Problem!
Vor allem, weil der schon eine Menge Dezibel bräuchte, um mittels der Stimme an die Tür zu klopfen!
Es ist sicher super schwer einen Witz über Martin Luther, einen Raspberry Pie und einem Schokoladenkuchen mittels KI Stimme gut rüberzubringen.
Sehr gute Idee, gleich mal ausprobieren.
Solange die originalen Synchronsprecher für die Nutzung der geklonten Stimme Tantiemen bekommt, wäre mir es recht.
Hey, gibt es mittlerweile eine deutsche Version? Wo deutsche Stimme auch gut anhören?
Radioprogramm Veranstalter liebäugeln auch mit KI-Stimmerzeugung, manche Sendung scheint auch schon im Testbetrieb zu laufen. Ist ein Thema beim Teltarif Podcast.
15:18 Wieso erinnert mich das so an Mission Impossible Phantom Protokol mit der Szene im Bad wo er irgendein random Text vorlesen musste.
Finde das Thema unglaublich spannend. Vor dem Enkeltrick habe ich etwas Angst.
Ansonsten habe ich kein Problem damit. In Deutschland werden zwar alle Filme und Serien synchronisiert, aber im gesamten ha man nur ein paar Synchronsprecher und die Sprechen einfach mal JEDE Rolle ein. Das ist mir lange nie aufgefallen, bis ich doch mal angefangen habe Serien auch auf Englisch zu gucken.
Die beiden deutschen Synchronsprecher von Arnold Schwarzenegger und Bruce Willis finde ich zwar besser, aber ich habe kein Problem damit bald Filme auf Deutsch mit der Stimme des Originalschauspielers zu sehen.
Ich sehe auch einen großen Vorteil dafür sich längere Sachbücher als Audiobook rein zu ziehen.
Wusste ichs doch gleich, das war gar nicht Hitler, der mich gestern angerufen hat
"Führerbeleidigung! Sofort mitkommen!" - Browser Ballet
Das ganze KI-Thema ist wirklich interessant und unglaublich unglaublich. Und es wäre spannend zu sehen, zu was KI in ein paar Jahren im Stande ist. Allerdings sind wir gesellschaftlich überhaupt nicht darauf vorbereitet, dass unglaublich viele Arbeitsplätze obsolet werden. Ich bin echt gespannt wo das hinführt. Vielleicht kommt das Ganze ja so wie in "Das Ende des Kapitalismus" vorgeschlagen. Die Leute haben weniger Geld und können deshalb auch weniger ausgeben. Damit können wir Klimaziele viel einfacher erreichen. ;)
Das mit den Arbeitsplätzen sehe ich nicht so schlimm. Du brauchst immer noch jemanden der der syntetischen Stimme als Muster dient und du brauchst jemanden, der den Text formuliert, der dann ausgegeben werden soll.
Da es auf dieser Welt genug Arbeit gibt, sehe ich das befürchtete Szenario von Tausenden, die dann ohne Einkommen und damit ohne Geld darstehen, nicht so groß.
Es werden nachwievor Synchronsprecher eingesetzt werden; die von RTL bei der neuen Pumucklserie eingesetzte Technik hat null mit solchen dummen Vorleseprogrammen (TTS) wie Elevenlabs zu tun. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
Mega. Dann brauche ich in Zukunft die gierigen Voice Actors in meinem Animationsfilm nur noch einmal kurz zu bezahlen. 😍
Bei Hörbüchern kommt noch ein weiteres Problem hinzu: Gute Leser verwenden verschiedene Stimmen für die unterschiedlichen Charaktere einer Geschichte. Dafür müsste die KI auch noch den Text korrekt interpretieren.
Ist doch gar kein Problem, das kann man entsprechend im Text markieren und schon spricht die KI an der Stelle mit anderem Duktus.
Ich hoffe das die Hui-Buh Hörspielserie aus den 80’er Jahren, mit der original Hans Clarin Ki-Stimme, weitergeführt wird 😂👍
Und dann noch Robby Tobby und das FliWaTüt und Räuber Hotzenplotz .. nicht zu vergessen : Hexe Schrumpeldei :-)
Mit diesen KI-Stimmen könnte mich keiner täuschen, auch nicht am Telefon. Da stimmt weder die Stimmfrequenzen, noch Sprachrythmus, noch Resonanzen. Keno Du hast zum Beispiel so einen schönen Bass das man deine Stimmbänder sofort raus hören kann. Die Resonanzen die die Stimmbänder zusammen mit dem Mundraum bilden, gibt deiner Stimme ein so charakteristische Aussehen das ich die in 99% der Fälle immer wieder raus hören würde. Dazu kommt noch dein Sprachrytmuss und dein Dialekt.
Ich habe zwar ein besonders gute Gehör und kann einige Sachen mehr höhren wie zB. Gefühle oder Medikamente die mein Gegenüber eingenommen hat (mit Schulung und einem guten Gehör kann das fast jeder siehe unten bei PS) aber die KI-Stimmen sind so schlecht das die mir noch weniger sorgen machen als Künstliche Intilligenz.
PS: Ja man kann Gefühle oder Medikamente hören, wenn diese den emotionalen Grundzustand verändern. Beispiel ist z.B. das Ehepaar das abends im Bett liegt und der Mann hat dann wesentlich mehr Bass als tagsüber, weil Er tiefenentspannt ist. Viele Frauen hören das z.B. nach dem Sex, wenn die Männer mehr Bass bekommen.
Anderes Beispiel: Medikamente wie Opiate, Methadon, starke Beruhigungsmittel verändern auch das Bild einer Stimme, da die Stimmbänder nicht mehr so unter Spannung stehen.
Der Volksmund sagt z.B. die Frau mit der hysterischen Stimme und meint damit das diese Frau eine kreischende Stimme hat und Sie entsprechend aufgeregt/panisch ist.
Daher beeinflussen Gefühle die Stimme. Wir bemerken das nur selten ganz bewusst, sondern nehmen es meisten nur unterschwellig war. Wir Menschen sind ja dadrauf konditioniert fast alles mit den Augen oder Händen war zu nehmen und machen unser Gehör dafür geren in einer Disco kaputt.
ElevenLabs Nutze ich auch schon für meine Videos, nur kann man Kostenlos nicht wirklich viel machen, da ich einige Texte doch 3-4 mal generieren muss bis die Betonung einigermaßen so klingt wie ich es haben will.
Woher kommt das Video ab 0:30? Hat der Keno da versucht, zum Fake-Audio synchron zu sprechen oder wurde das ebenfalls irgendwie KI-generiert?
Das Video ist echt. Einfach Mund bewegt zu den KI-Audios.
Für Filme und Serien ist das eine super Technik. Was damals Fan-Untertitel waren, könnten morgen Fan-KI-Stimmenübersetzungen sein. Besonders bei alten Filmen, die nie auf Deutsch oder Englisch erschienen sind, eine feine Sache. Aber auch so, man stelle sich vor, man könnte bei Serien einfach für jeden Charakter seinen Lieblingssprecher dynamisch einstellen.
Und zerstört damit ein ganzes Berufsfeld und nimmt der deutschen Synchronbranche ihre Existenz :D Wieso auch Achtung und Wertschätzung für das Handwerk des Schauspiels haben oder wahren.. Ja, super Technik!
@@SprecherFabi Natürlich werden einige Synchronsprecher ihre Jobs verlieren, aber so ist das eben mit Fortschritt. Auf der anderen Seite können Leute die sich anpassen, jetzt allein einen ganzen Film vertonen und mehr verdienen. Es wird sicher auch irgendwann ein Copyright für Stimmen geben, so dass man seine Stimme lizenzieren kann.
@@SprecherFabi Synchronsprechen ist keine Schauspielkunst. Nur mal so nebenbei erwähnt.
@@mutosanrc1933 Das sagt leider alles. Viel zu viele glauben das :) Heißt nicht umsonst Stimmschauspieler oder auch im englischen Voice Actor
Für Flopflix und co. mag das ja reichen. Aber bei ordentlichen Filmen will ich auch ordentliche Stimmen hören, Stimmen mit einer Seele, wo man Emotionen heraushört, und nicht so'n synthetischen Mist. Schon bei der Otto-Stimme im obigen Video konnte man das hören; nicht mal in der Lage zu lachen oder zu weinen, ironisch oder zynisch zu wirken, etc. Sarkasmus, Humor und solche Dinge, sind ganz besondere menschliche Fähigkeiten, die in der K.I. ganz am Ende stehen, so sie denn überhaupt auf absehbare Zeit möglich sind.
Ich bin ein großer Fan von Synchronschauspielern und bin jedes Mal bestürzt, wenn wieder einer von den guten geht. Ein Elsholtz oder Danneberg als K.I.? Lächerlich. Mit K.I. ist sehr viel möglich, aber man muss jetzt nicht auf Biegen und Brechen _alles_ ersetzen wollen, was gut war. Bislang hat man immer noch jemanden gefunden, der die Synchronrolle übernimmt, und obwohl ich bei den Stimmen recht pingelig bin, komme ich damit klar -- mit Sicherheit besser als mit einem leblosen Ersatz aus dem Computer.
Ich sage es mal ganz direkt, was wäre wenn dein Arbeitskollege dir einen schlechten Scherz antun will.
In Form, deiner Stimme bei dein Chef anruft, und ihn beleidigt oder sonstige dinge macht.
14:15 bitte setzt uberduck nicht für social Media oder kommerziell ein. 14:51 Geil Super Mario macht jetzt Werbung für unseren Kanal 😁
wenn ich meine stimme in ios o. bei anderen anbietern einspreche/digitalisieren lasse; wie ist das rechtlich? behalte ich alle rechte, oder welche gebe ich ab? will ich das? das hätte man noch thematisieren können. oder künftig ein thema? ihr habt ja einen hervorragenden hausjuristen. danke lg
sehr wahrscheinlich wäre ja z.b., dass wenn ich meine stimme einspreche, anbieter x y sich das recht einräumt, diese für x y z zu nutzen.
Kommt demnächst der KI-Fingerabdruck? Oder die KI-Iris? KI-Ohrenabdruck?
Ziemlich schlau von RTL, den Synchronsprecher musste man früher ja bezahlen 🖤
Die werden da auch irgendwie für bezahlen.
@@kaffeeringe du sagst es irgendwie
Und der "Maxi Schafroth" wird jetzt nicht bezahlt, oder was?
Es wird nachwievor ein Synchronsprecher eingesetzt, weil die von RTL eingesetzte Technik null mit solchen Vorleseprogrammen (TTS) wie Elevenlabs zu tun hat. Die Stimme von Maxi Schafroth wird per KI-Stimmumwandlung (STS) konvertiert, quasi wie ein nachträglicher Filter auf der Aufnahme. STS läßt sich viel besser steuern als TTS, nämlich durch den Synchronsprecher selber, dessen Intonation, Schauspieltechnik usw. bei der Umwandlung erhalten bleiben. Der lebende Synchronsprecher spielt dabei mit seiner eigenen Stimme die Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt. Sowas geht mit bloßen TTS-Vorleseprogrammen wie Elevenlabs überhaupt nicht; da kann man bestenfalls an ein paar Reglern drehen oder eine Regieanweisung reinschreiben, womit man nicht ansatzweise an die Millionen Nuancen, das Timing, die Wort- und Satzmelodie des Stimmschauspiels eines echten Synchronsprechers rankommt, mit denen er die STS-Stimmumwandlung steuert.
@@tlatosmd Im Endeffekt wird Maxi Schafroth zwei mal einsprechen. Einmal so, wie Clarin ihn gesprochen hätte, um ihn dann mit STS verändern zu können und einmal so, wie er selbst den Pumuckl sprechen würde. Also das Gegenteil von den Synchronsprecher nicht zu bezahlen.
Bei Bildern, Stimmen und Videos von KI sollte immer ein Wasserzeichen, ein Untertitel oder ein Hinweis auf KI sein. Aber mal ehrlich - bei schnell gezeigten Bildern, bei kleingedruckten Einblendungen in Videos oder am Ende im Abspann verpackt, wer kann da noch echt von nachgemacht unterscheiden?
Übrigens hätte ich zur Zeit Probleme bei irgendeiner kostenlosen Probe-KI mein Sprachprofil zu hinterlassen! Ob das dann jemals gelöscht wird oder vielleicht in "falsche Hände geraten" kann? Und am Telefon wird zuweilen ja auch nachgefragt, ob man das Telefongespräch zu "Verbesserungszwecken" der Qualität aufzeichnen lassen will!
Also vielleicht doch ein Verbot von KI-Stimmen-Klonen nach dem Motto: "Meine Stimme gehört mir?"
Alles kann missbraucht werden, daher aber immer alles verbieten kann ja auch nicht die Lösung sein, das wäre dann doch zu einfach.
@@Hoto74 Ist eine Frage der Abwegung und des Konsenses in der Gesellschaft. Vielleicht in diesem Zusammenhang ein Beispiel: Möchtest Du, dass Du in drei-D eingescannt wirst und irgendwelche Filme mit Deinem Avatar und Deiner Stimme erscheinen (ein durchaus mögliches Zukunftsszenario!). Recht am eigenen Bild ist jedenfalls durch Urhebergesetz geschützt!). Ich bin insoweit auch für eine Regelung im Kunst und Urheberrecht für die Stimme. Zuerst kommt die neue technische Entwicklung und dann die rechtliche Regelung. Das ist normal. Im Beispiel von Hans Clarin, der ja tot ist, weiß ich auch nicht, ob das rechtlich sauber ist und wie Gelder an z. B. Erben verteilt werden.
Synchronsprecher ist doch ein Beruf! Die Stimme aus dem Jenseits müßte dann ja auch irgendwie geschützt sein? Verbot zu einfach - vielleicht - rechtliche Regelungen - unbedingt ja!
@@manfredthiele5282 Nun, wenn ich dafür gut entlohnt würde und abgesichert wäre, dass das Model nur für bestimmte Einsatzzwecke genutzt werden darf. Ja, hätte ich keine Probleme damit. Aber wie du sagst, ohne Regeln geht es nicht. Aber wenn es Regeln gibt bedeutet es ja auch das es nicht verboten ist.
Ich schätze mal schon, dass das mit den Erben von Hans Clarin abgeklärt ist und die entsprechend auch entlohnt wurden. Sollte es allerdings keine Erben geben, was ja auch möglich wäre, frage ich mich wie man das dann rechtlich klären kann.
@@Hoto74 Noch ein kurzer Gedanke: KI kann doch auch neue Stimmen erstellen?! Wozu eigentlich covern? O. K., Satire oder für Filme zum nachbearbeiten - aber wozu eigentlich die Stimme von Herrn Müller oder Frau Müller von nebenan? Mal ehrlich, da fallen mir nur wenige Beispiele für den produktiven nützlichen Gebrauch, aber umgekehrt tausend Beispiele für den Missbrauch ein...Gegen neue natürlichere Stimmen - ähnlich wie bei dem schriftlichen Verkehr eben Schrifttypen - ist doch nichts zu sagen und das fände ich toll. Auch wenn jemand seine eigene Stimme selbst verwendet ist natürlich dagegen nichts zu sagen...
Die Büchse der Pandorra ist ganz weit offen.
Technisch unfassbar beeindruckend, aber wie die Nukleartechnik darf sowas niemals in falsche Hände geraten.
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
5:43 das bedeutet: ich muss meine Oma mit einem Passwort versehen?!?.
Hahah 8:18 einfach die Paulaner Spezi geil😍👍
Ich finde diese Technik wirklich faszinierend. Aber ehrlich gesagt mir graut davor wo das hinführen wird.
lassen sich die technischen für stimm Training mit Textual eversions/Loras und fine tuning vergleichen?
Es tut mir leid das sagen zu müssen aber Stephen Hawking ist leider seit 2018 verstorben. Ich kann mich gut daran erinnern weil ich zu dem Zeitpunkt einen Podcast gehört habe und dann die Nachricht reingekommen ist.
Aber jetzt wo ich die Nachricht geschrieben habe fällt mir ein du wahrscheinlich dieses Beispiel gemacht hast weil auch mir keine berühmter Mensch einfallen der seine Stimme verloren hat der so bekannt ist.
Gutes Video ✌️
Val Kilmer
Gute Info Keno, gibt es auch die Stimme von Walter Ulbricht?😄
Niemand hat die Absicht, eine Mauer zu errichten!
@@ct3003 Niemand hat die Absicht, einen Stimmklon von Walter Ulbricht zu erstellen! ;)
Ein weiterer Schritt in Richtung des Universal Translater aus Star Trek 😌
Ich bin die Stimmen unserer Synchronsprecher derart gewohnt, dass selbst wenn ich die Wahl hätte die Original-Stimme der Schauspielers zu wählen (auf deutsch), würde ich die der deutschen Synchronsprechers den Vorzug nehmen.
Meistens schaudere ich, wenn ich mir anhöre, wie Schauspieler tatsächlich klingen.
Es gibt wenige Schauspieler, deren Original-Stimme ich tatsächlich mag.
Hi, suche eine Software / Ki, wo ich meine TH-camfilme in Englisch, mit meiner Stimme, übersetzen kann, also nur die Tonspur. Geht das auch schon? LG Alex
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
Funktioniert das bald live? Könnte ich z.b. bei meiner Bank anrufen, die mittels eines Stimmenabdrucks meine Identität verifizieren und dann über die Tastatur mit denen labern und mein Konto manipulieren?
Gute Frage.
Welche Bank lässt denn Kontozugriffe anhand einer Stimmenerkennung zu?
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
cool, dann kann man ja die 2. Staffel von "Ein Colt für alle Fälle" endlich neu vertonen, da ja der Synchronsprecher von Lee Majors verstorben ist, und es da Probleme mit Urheberrecht auf die original Spur gibt, was DVD Produktion angeht ...
Hi wieder mal ein toller Beitrag! Was mich nur mal interessieren würde, wie sieht es denn rechtlich aus, wenn man eine Stimme eines anderen klont? Wie bei eurem Pumukl Beispiel. Hans Clarin ist ja nun schon seid einigen Jahren tot und das Persönlichkeitsrecht erlischt soweit ich weiß ja mit dem Tot der Person. die Etischen Fragen lassen wir mal außen vor das wäre noch ein ganz anderes Thema..
Sind die alle text -> speech oder gibt es auch welche die speech -> speech uebersetzen ohne den Zwischenschritt mit Text? Da geht ja sicher vieles der Betonung verloren.
Ja, es gibt auch STS alias Stimmkonvertierung. Aber wenn ich nur den Namen von solcher Software hier nenne, die ganz legal kommerziell bzw. als Freemium erhältlich ist, löscht YT meine Posts immer innerhalb weniger Sekunden.
Vielen Dank für das Video.
Leider hat der Inhalt nach dem Titel "ist das legal" nicht meine Erwartung erfüllt. habe es mir angeschaut, weil ich genau dazu mehr wissen wollte. Ob es legal ist, findet sich immer nur in einem Nebensatz. Mich würde schon mal genauer interessieren, wie da die Regelung ist. So habe ich Menschen in meinem Umfeld, die in kreativen Berufen tätig sind und die feiern diese Möglichkeit mit den KI Stimmen sehr. Schlagwort: Synchronsprecher einsparen.
Es ist vermutlich naheliegend, dass man natürlich keine Stimmen von (prominenten) Personen zu kommerziellen Zwecken nutzen darf. Aber was ist, wenn man diese minimal ändert. somit hat man nicht direkt kopiert. Gibt es hier schon Regelungen? Ggf. könnt ihr noch mal genauer auf die rechtliche Lage dazu eingehen.
Liebe Grüße
In den USA wäre es möglich, die Likeness-Gesetze für Promis auch auf Stimmen anzuwenden; allerdings zeigt sich in der Rechtsprechung der US-Gerichte der letzten Jahre, daß diese Rechte der Promis an ihrer eigenen Likeness zunehmend zugunsten ihrer Arbeitgeber (Studios) verschoben werden. Auch das viel (falsch)zitierte Urteil Authors Guild vs. Google, wo derzeit eine Menge Blödsinn in der Richtung behauptet wird, daß es eine Entscheidung über Urheberrecht bei KI gewesen wäre (de facto ging es allein um die Tatsache, daß die Autoren unwissentlich ihre Urheberrechte an Google abgetreten hatten, so daß Google ihre Bücher für staatlich betriebene Bibliotheken scannen darf, ohne die Autoren dann für jede einzelne Ausleihe vergüten zu müssen), weist in eine ähnliche Richtung, daß Urheberrechte zunehmend zugunsten der zahlungskräftigsten Konzerne entschieden wird. Vor ein paar Jahrzehnten hätte das Gericht noch entschieden, daß derart vorsätzlich unklare oder verschwurbelte Formulierungen im von den Autoren unterzeichneten Vertragstext zu einer Annulierung geführt hätten.
In der EU hingegen gibt es hingegen keinerlei Gesetze gegen Stimmklonung; es gibt in der EU kein Pendant zum Recht am eigenen Bild, das auf die Stimme anwendbar wäre. Beim kürzlichen KI-Gipfel in Brüssel wurde lediglich entscheiden, daß die Hersteller den Output kennzeichnen müssen. Das tun Stimmklonungsprogramme aber schon seit Jahren, nämlich mit unhörbaren akustischen Wasserzeichen; bevor die Branche auf den Trichter gekommen ist, wurden Pioniere wie Adobe VoCo und WaveNet einfach kurzerhand aufgrund von Bedenken von Politik und Geheimdiensten abgeschossen, da man mit Stimmklonen, die nicht schnell und eindeutig als solche identifziert werden können, ja z. B. auch einen Krieg auslösen und Fake News verbreiten kann.
Bis vor ein paar Jahren hätten in der EU zumindest Platten- und Produktionsfirmen wegen Verwendung von Stimmaufnahmen, an denen sie Urheber- bzw. Verwertungsrechte haben, zu Klonzwecken in der EU rein theoretisch wegen URV klagen können; das wäre aber schon damals an der Praxis gescheitert, weil es technisch unmöglich ist, nachzuweisen, welche spezifische Aufnahme einem fertigen Stimmodell zugrundeliegt. Mit der EU-Urheberrechtsreform vor ein paar Jahren, die medial vor allem als Memeverbot und Vorstufe zu Uploadfiltern thematisiert wurde, wurde dann aber das Konzept des legalen Dataminings für genau solche KI- alias ML-Anwendungen eingeführt, was zum einen mit der Tatsache begründet wurde, daß das wichtige innovative Forschung ist, und zum anderen, weil das Modell, das eine ML erstellt, de facto einen so hohen Abstraktionsgrad vom Ursprungsobjekt aufweist, daß eben nicht nachweisbar ist, welche Vorlage benutzt wurde bzw. der Abstand auch aufgrund des schon allein technisch nötigen Abstraktionsaufwands, um aus einer statischen Kopie eine derart dynamisch steuerbare Nachahmung zu machen, einfach zu groß ist, um noch vom selben Objekt zu sprechen.
Der eminente Schönheitsfehler, den die EU-Gesetze zum Datamining aber bislang aufweisen, besteht darin, daß sie extra für Institute und Großkonzerne maßgeschneidert wurden, denen dieses Recht eingeräumt wurde. Was in der Praxis wiederum heißt, daß die so entstehenden KI-Tools von Künstlern, beauftragten Arbeitnehmern und Konsumenten zwar so genutzt werden können wie Photoshop, die Urheber- und Nutzungsrechte der Ergebnisse liegen dann aber laut EU-Recht bei den KI-Firmen, die das Programm hergestellt haben (wo dann bestenfalls ein kaufkräftiger Arbeitgeber eine mehr oder weniger begrenzte Mitnutzungslizenz erwerben kann). Wie ein Blog dazu schrieb, ist das so, als hätte eine Pinselfabrik per Lobbyarbeit durchgesetzt, daß sie automatisch sämtliche Urheber- und Nutzunsgrechte an den Bildern erhält, die mit ihren Pinseln gemalt worden sind.
Es ist daher zu raten, stattdessen Open-Source-Programme (z. B. von GitHub) zu nutzen (aber auch hier Vorsicht: Inzwischen laufen findige Firmen wie die Website Replicate rum, die auf jedes halbwegs vielversprechende Open-Source-GitHub-KI-Modell eine Webseiten-GUI draufklatschen, deren Nutzung dann nicht nur an sich schon per Abo kostenpflichtig ist, sondern wo der Nutzer laut TOS auch automatisch sämtliche Rechte an Replicate abgibt), oder solche von Firmen, die in ihren Nutzungsbedingungen definitiv ausschließen, ihre Nutzer auf diese Weise enteignen zu wollen. Speziell beim Thema KI-Stimmen läßt sich bei Firmen und Dienstleistern mit einer TOS, die den Nutzern ihre Rechte läßt, vor allem voice.ai nennen, das außerdem kein dummes Vorleseprogramm (TTS) wie das hier präsentierte Elevenlabs ist, sondern viel natürlicher klingende und leichter steuerbare Stimmkonvertierung (STS), wo auf die Aufnahme eines anderen Sprechers einfach nur quasi ein nachträglicher Filter zur Umwandlung der Stimme draufgelegt wird; bei STS spielt der lebende Sprecher, der vorne reinspricht, mit seiner eigenen Stimme die KI-Stimme des toten Sprechers so, wie ein Musiker ein Instrument spielt.
ihr dürft die Stimmen nicht kommerziell nutzen, das kann richtig Ärger geben. Die Stimmen erstmal hier kommerziell eingefügt. Genau mein Humor 😂😂😂
Wir sind doch nicht kommerziell 😇
@@ct3003 Da Ihr Werbung macht, schon.
Für mich als Musik Produzent interessant.
Stimme generieren, anpassen und takten.
Billiger als eine Sängerin 👍🏼
Die Zukunft mit KI wird auch Vorteile mitbringen.
Nutze schon eine um Stimme vollständig von Song zu trennen.
Früher fast undenkbar
Es gibt jetzt schon KI - Bands die rocken 24/7 durch während sie in Realtime produzieren und sind für Laien akkustisch nicht von echten Musikern zu unterscheiden.
@@thekey6153 Die wäre welche? :D
@@gizehfine Wie eine Suchmaschine funktioniert ist dir bekannt? :)
Puh, sehe ich gespalten. Als Creator denke ich daran, wie praktisch es wäre seinen Content in andere Sprachen zu übersetzen.
Als kritischer Mensch macht ich mir Gedanken darum, dass bald neben meinen ganzen Standartdaten, auch Fingerabdrücke, digitale Bodyscans und nun auch die Stimme frei zu erwerben ist.
Darf ich deine Stimme nehmen?
Bin mal gespannt, wann es tatsächlich Geruchsfernsehen gibt. Das wäre ein echter Gamechanger.
Das fängt erstmal mit 4 Gerüchen an und irgendwann kann man dann Fernseher mit 16 Gerüchen kaufen. Wird am Anfang aber nur von wenigen Filmen unterstützt, Avatar 7 z.B..
War schon im Kino kein Erfolg...
Welche KI generierten Stimmen darf ich denn kommerziell nutzen? Und was heißt kommerziell? TH-cam Videos können irgendwann monetarisiert werden. Hab ich dann anfangs keine Probleme, aber wenn die Monetarisierung anfängt muss ich alles lösch?
Das wird keine Jahre mehr dauern. "KI" ist das heftigste und am schnellsten fortschreitende "Ding" in meiner Lebensgeschichte.
Erst gestern noch habe ich uralte, eingescannte Fotos per KI restauriert. Für diese Arbeit hätte ich vor 3 Jahren bei einem Profi ein Vermögen auf den Tisch legen müssen. Manche der Ergebnisse wären damals technisch gar nicht denkbar gewesen.
Hawking hätte bestimmt Spaß daran gehabt.
Die Songs, die Dieter Bohlen in den späten 80ern produziert hat, waren immer das selbe Geschrammel mit anderen Hampelmännern. Weder Produzent noch Publikum waren künstlich intelligent, sondern einfach nur echt dumm. Wetten, er trainiert seine Modelle heute auch digital?
Mit welchen Programm haben Sie die Bilder restauriert?
@@mertlandreas VanceAI
Kann man bei ElevenLabs auch ohne Kreditkarte bezahlen? habe keine....
Ich hab das gleich mal auf M in meiner "⛩ The Singularity Is Nigh" - Serie kommentiert.
🤘39🤘
Gerade das "aufpolieren" stört mich bei ElevenLabs. Ich spreche Englisch eben mit einem stark deutschen Akzent und das möchte ich gerne behalten. Ich hätte also gerne das die KI von Eleven Labs meinen deutschen Akzent beibehält. Das klappt leider nicht. Somit wird immer deutlich, dass eben nicht ICH das spreche, sondern eine AI.
Das Rick Roll Video war echt gut 😂
Passt auf mit der "Spezi"-Schleichwerbung in der Interview-Szene! ☝️🤓
Also ich würde meine Stimme gerne geklont haben... Gerade weil ich gerne Video-Trainings machen will, aber einfach keine Geduld habe das einzusprechen... Der Text kann ja grundsätzlich generiert werden... Und dann das Timing im Video und dann wäre die Bearbeitung wesentlich schneller fertig...
Ich würde die Videos nicht mit KI-Füllern verbessern. Du hast ein perfektes Video, obwohl du nicht perfekt warst. Das wird deine Fähigkeiten als Sprecher nicht unbedingt verbessern. Ist doch mit der ganzen Technik so: irgendwie schön, aber wir müssen uns weniger anstrengen und werden dümmer dabei. Gibt immer noch gute Anwendungsmöglichkeiten, aber das würde ich mir sparen. Außerdem: das Video ist von Menschen gemacht und Menschen machen Fehler. Wenn ihr KI-Beiträge sendet, dann ist das was anders.
Wie ist das eigentlich mit der Legalität? muss man sich jetzt auch die erlaubnis oder lizenz oder berechtigung von den original personen einholen, nur, wenn man sich privat ein stück text vorlesen lassen möchte, ohne es öffentlich zu machen? oder wenn man sich die stimme, weil man sie cool findet, als AI stimme auf sein handy holen möchte, z.b. als weckerstimme oder sowas?
Sehr interessantes Thema. Die Erfahrung hatte ich auch schon gemacht dass bisher sich nur die englischsprachigen Stimmen gut angehört haben. Speziell bei deutschen Stimmen mit englischen Wörtern gab es anfangs sehr komischen Output. Neu war für mich dass ich die Stimme auch auf englisch einsprechen kann für die deutsche Sprachausgabe. Deine AI Stimme hat sich schon sehr gut angehört. Habt ihr da auch noch Filter rauf gelegt oder den direkten Output vom Tool übernommen? Vielleicht kann man ja dadurch noch etwas raus holen?
Wer KI-Stimmen /menschliche Sprachausgabe lokal am eigenen PC erstellen möchte ist mit der Thorsten Stimme (Kostenfrei, Lokal lauffähig, Open Source Lizenz) deutlich besser bedient:
Video für Linux Nutzer: th-cam.com/video/uyG1Sx7_3Yg/w-d-xo.html
Auch für Windows und andere Nutzer sind Videos in seinem Kanal zu finden.
Warum klone ich meine Stimme, wenn sie sich danach nicht wie meine Stimme anhört? Beim Wort "klonen" erwarte ich eine identische Kopie. Das hier Geklonte hörte sich ja überhaupt nicht nach Keno an. Auch nicht 80% sondern vielleicht 30%.
wegen Anrufe mir meiner geklonten Stimme bei Eltern/Großeltern mache ich mir keine Gedanken. wir sprechen in der Familie einen SEHR speziellen Dialekt(der sich nichtmal geographisch einwandfrei zuordnen lässt), teilweise mit Wörtern, die in keinem Wörterbuch auftauchen. das ist dann ein wenig so, wie die Navajo Code Talkers im 2. Weltkrieg :) und außerhalb der Familie rede ich ausschließlich hochdeutsch. wenn ich meine Eltern so anrufen würde, würden die nach 2 Sekunden auflegen
Irgendwie werden teilweise eher so zweitrangige Engines bissl laienhaft benutzt und dann am Ende heisst es: So dolle ist es nicht. Bei Sascha Lobo, R.D. Precht und bei ZDF heute beim Thema K.I. das Gleiche in grün...
Also wenn ich meine Stimme verliere, will ich als Ersatz die von Thomas Danneberg! 🙂
Am meisten aus Richtung Terence Hill, garniert mit ein wenig Sly & Arnie, und nur ner Prise John Cleese. 😀
Weiß jemand wie man Elevenlabs kaufen kann? Die erkennen keine deutschen Banken an, kein PayPal kein GooglePay. Nur Kreditkarten und USA Banken?
Hallo, ich komme gleich auf den Punkt-ich möchte meine Stimme klonen, das Ergebnis mit Elewen Labs ist eine Katastrophe, bei dir hört sich deine Stimme recht natürlich an, es wäre toll, wenn du hier mal zeigst wie du das so hinbekommen hast. Liebe Grüße, Dein Kanal ist echt Spitze.
Mein liebes CT Team, schön wäre es gewesen wenn ihr dazu gesagt hättet. Das mit solchen Tools auch verstorbene Syncronstimmen wiederbelebt werden.
Hab vor kurzem Boss Level gesehn und ohh Mann hat mich die neue Stimme von Mel Gibson gekillt und da muss ich raus finden. Das der Sprecher schon am 31.10.23 verstorben sei, Danneberg ein paar Tage später.
Siehe auch Denzel Washington oder die von Tom Hanks, ich will in keiner Welt sein wo ich die neuen annehmen muss.
Jetzt hätte man die Möglichkeit neue Filme nach zu vertonen. wenn es möglich ist. Wir haben (noch) die besten Syncros und was ist wen die mal nicht mehr sind, siehe Marge und Homer Simpson oder Bud Spencer.
Tucker Carlson hat es vor kurzem gezeigt kurz vor Putin, seine Stimme ist göttlich.
Sehr sehr geil aber auch gefährlich.
Wie kann ich meine eigene stimme clonen?
Das ganze wäre auch für die Spieleindustrie ein Gamechanger. Meist hat man nur englische Sprachausgabe... Hiermit ließen sich zumindest die wichtigsten Sprachen auf der Welt ohne Synchronsprecher in ein Spiel einbinden. Also ein Mitlesen der Sprache viele somit weg. Bei mir ist es zwar so, dass ich Englisch einigermaßen verstehe, jedoch manchmal irgendein Wort nicht, was dann den ganzen Satz für mich unverständlich macht. Da wäre es super, wenn man nicht nur auf deutsch mitlesen könnte, sondern sich auf das Spielgeschehen konzentrieren könnte mit ner deutschen Sprachausgabe.👍
In Kombination mit DeepFaceLab ist das bestimmt interessant.
Wenn ich die KI-Stimme nutzen kann um beim Italiener zu bestellen dann wird es interessant :)
Am Ende wird keiner unter dem Content angeben, ob es mit Hilfe von Ki erstellt wurde oder nicht. Sobald es möglich sein wird Ki Inhalte zu identifizieren, wird es eine noch bessere Ki Version geben, bei der das dann nicht mehr möglich sein wird
Beim kürzlichen KI-Gipfel in Brüssel wurden die Hersteller von KI-Programmen gesetzlich dazu verpflichtet, den Output ihrer Programme eindeutig zu kennzeichnen. Wer Software verbreitet, die das nicht tut, macht sich somit strafbar; dasselbe gilt für die Entfernung dieser Kennzeichnung und die Verbreitung von Programmen, die zur Entfernung dieser Kennzeichnung dienen können. Programme zur Stimmklonung zum Beispiel nutzen bereits seit Jahren unhörbare Wasserzeichen.
Wurde Uberduck in der Zwischenzeit umgebaut? Kann das nicht reproduzieren. Was ist bei denen passiert?
Ja....die Text to Speech existiert so nichtmehr!
Also ich stelle mir Kenos echten Gesangskünste genau so vor. 😆
Waaaaaaaas?
Das Highlight ist Kenos Singstimme 😂😂
Also ich höre einen konkreten Unterschied in der generierten Stimme von Dir zur Originalen. Das mag daran liegen das ich keine billo-Brüllwürfel am PC habe oder nur Kopfhöhrer. Alleine die Tiefe ist anders, genau wie die Klangfarbe. Zum Thema Stimmcloning sollte man evtl verpflichtend einen Startton oder ein Hintergrundrauschen einbauen müssen gesetzlich.
Interessantes Thema. Die Hörprobe von der generierten Isabel Grünewald-Stimme hat mich nicht überzeugt. Isabel Grünewald spricht mit einer klingenden "Sprachmelodie", die der geklonten Stimme komplett fehlt. Dadurch klingt die Klon-Variante kalt und leblos. Die Stimme unseres Bundeskanzlers ließe sich vermutlich dankbarer klonen.
Darum sagte ja auch der von der Firma, dass es noch Jahre brauchen wird ehe die Stimmen so gut sind, dass man keinen Unterschied mehr hören kann.
Machst du mal ein Video über den Einsatz von monica von OpenAI?
Ich finde das Potential so gewaltig und es ist so wunderschön intuitiv nutzbar, ABER ich habe Angst vor der Datenkrake, besonders im kommerzionellen Nutzen.
Besonders bei den Desktop-Variante.
Mal so ein Gedanke: Wenn Die Stimmen dann perfekt werden, kann man auch mit dem Computer einen mit der Stimme gesicherten Verschluß öffnen.
Der "Enkel TRick" am Telefon wird noch schlechter durchschaubar.
Ich möchte hier nur sagen: Das kann auch missbraucht werden, daran müssen wir uns dann auch gewöhnen...
BITTE MEHR SONGS VON DIR !!!!!
Macht einfach gute Laune ❤
Never forget wie Stefan Raab Schnipsel aus dem Hörbuch von Dieter Bohlen genommen hat und überall angerufen hat 😂
Vielleicht schaffen bald Polen, nicht nur einen synchronsprecher zu haben als Mann für eine Schauspielerin, einen Schauspieler und sogar einem Hund xD
Dann kommen endlich gute synchronisierten Filme bei raus 👍😂
Ich hab das selber ausprobiert und ich bin Baff! Wie echt das schon klinkt..... Klar paar Fehler sind da, z.B die Stimme hat meinen namen, Florian, in leicht englischen Slang ausgesprochen
Die medizinische Anwendung wird bestimmt ein Segen. Ansonsten finde ich das gruselig!
Ich finde KI-Stimmen sehr spannend. Allerdings brauche ich eine OpenSource Lösung für meine Projekte, da ich mich sonst auf die dauerhafte Verfügbarkeit eines Anbieters verlassen muss, was erfahrungsgemäß nicht immer der Fall ist.