驚愕のアニメ音声合成アプリ「Moe TTS」を詳しく解説【MoeGoe】
Вставка
- Опубліковано 16 лип 2024
- 中国発と思われるアニメキャラの音声合成AIを使ったアプリ「Moe TTS」を解説します。
3000人以上の合成音声を無料で使うことができますが権利関係も含めて不透明なため、現時点では個人で楽しむ程度にしておくことをおすすめします。
▼Moe TTS(Hugging Face)
huggingface.co/spaces/skytnt/...
▼MoeGoe(GitHub)
github.com/CjangCjengh
▼チャプター(目次)
00:00 OPトーク
00:26 Moe TTSとは
00:51 使いかた
01:41 音声モデル紹介
02:51 使われている技術
03:20 ボイチェン機能紹介
04:35 EDトーク
▼引用元
■Hugging Face(Moe TTS)
huggingface.co/spaces/skytnt/...
■GitHub(MoeGoe)
github.com/CjangCjengh
▼参考にした動画
■MoeGoe開発者 CjangCjenghさんの動画①(Bilibili動画)
www.bilibili.com/video/BV1P84...
■MoeGoe開発者 CjangCjenghさんの動画②(UA-cam)
• 綾地寧々の声を作ってみた
-------------------------------------------------------
▼ゆうぷろとは?
合成音声関係や動画投稿にまつわる情報をメインに発信しています
▼チャンネル登録もお願いします
※ 新着動画や関連動画が「おすすめ動画」などに表示されやすくなります
ua-cam.com/users/yuupro?sub_...
▼サブチャンネル(ゆうぷろ 2nd)
/ yuupro2nd
▼再生リスト(全動画)
• 全作品まとめ
▼ゆうぷろの人気動画
■【VOICEVOX】ずんだもんっていったい何者? ~5分でわかりやすく解説
• 【VOICEVOX】ずんだもんっていったい何...
■【初心者向け】ゆっくりとボイスロイドとVOICEVOX(ボイスボックス)は何が違うの?~音声合成ソフトの特徴や性質の違いを解説
• 【初心者向け】ゆっくりとボイスロイドとVOI...
■一番使われているゆっくりの立ち絵ってどれ? ~人気1000チャンネルのリサーチ結果を解説
• 一番使われているゆっくりの立ち絵ってどれ? ...
■【5種類+α】無料の音声合成ソフト&VOICEPEAKを聴き比べ
• 【5種類+α】無料の音声合成ソフト&VOIC...
■【歴史に幕】SofTalkの“ゆっくりボイス”対応終了の件を詳しく解説
• 【歴史に幕】SofTalkの“ゆっくりボイス...
■【レビュー】超リアル音声変換ソフト『SeirenVoice(セイレンボイス)先行版』を解説
• 超リアル音声変換ソフト『SeirenVoic...
■【初心者必見】VOICEVOX 0.10.4 の基本的な使い方を10分で解説 ~ダウンロードから声の出力まで
• 【初心者必見】VOICEVOX 0.10.4...
■【合成音声の収益化剥奪問題】収益化停止を受けた100チャンネルのリサーチ結果を解説
• 【合成音声の収益化剥奪問題】収益化停止を受け...
■【必見!】音声合成ソフト『VOICEPEAK(ボイスピーク)』を解説&レビュー【商用・業務利用無料】
• 【必見】音声合成ソフト『VOICEPEAK(...
■【必見】ゆっくりボイス(AquesTalk)のライセンスを完全解説
• 【必見】ゆっくりボイス(AquesTalk)...
▼Twitter
/ yuupro_2022
▼出演
■冬霧サイカ:あまつじ 様
mochigometei.booth.pm/items/3...
■ずんだもん:akihiyo 様
seiga.nicovideo.jp/seiga/im10...
▼音声
■VOICEVOX ずんだもん:voicevox.hiroshiba.jp/
▼BGM
■DOVA-SYNDROME 様:dova-s.jp/
■甘茶の音楽工房 様:amachamusic.chagasi.com/
■PeriTune 様:peritune.com/
■ポケットサウンド 様:pocket-se.info/
▼動画編集ソフト
■ゆっくりムービーメーカー4 Lite:manjubox.net/ymm4/
■DaVinci Resolve:www.blackmagicdesign.com/jp/p...
▼リクエストやご質問・ご感想などはこちら
• 【限定公開】ゆうぷろへの書き込み用動画(リク...
#コメント歓迎です
#合成音声
#MoeGoe - Навчання та стиль
VITSはピッコマを擁するカカオ所属の韓国人研究員3名によって2021年に論文が書かれた技術ですね🥺
(現在の所属はSKテレコムになっている研究者もいる)
前進はtacotron2(google産)辺りと思われ、モデルの作りやデータセットは非常に酷似している用に思えます。
まだ日本語でのネイティブモデル制作のノウハウは少ないように見えるため、ネィティブ日本人がソースを選別し
データセットを作れば、正直飛躍的に質は上がると思いますね🥺(ただ、この量は驚き。Tt2モデルを作る場合、手作業だと1人作るのに1日2日かかる(体験談)
1000人単位のプロジェクトだという話もあるため、中国人の横の繋がりの凄さに驚く)
データセットの例としてtacotron2では5分ほどの音声データで発話がはっきりとし始め、
10分ほどで聞き取れる15分でクオリティがはっきりと確立し、それ以上のデータはより学習を長くしても過学習にならない(バリエーション、ゆらぎの多さなどに関わってくる?)という認識です。ラジオや、一人喋りをする機会のある声優さんならば、かなりの質のモデルが作れると思いますね。
またVitsでは内部でシンセサイザーのように感情、起伏を追加するプラグインも開発されているため
ボイスロイド的な使い方をより簡易に直感的に行えるGUIソフトの開発が待たれる技術ですね。
ありがとうございます。とても参考になりました
これはやべぇ・・・・いやホントやべぇ・・・
技術が進歩すれば、ゲームやアニメから音声を取り込むだけで
誰でも声優さんの声を合成できるアプリが登場してしまうかもしれないですね…
VITSの技術がさらに発展すればできてしまうかもしれませんね...
声優さんの仕事が……
せめて、声優さんが声を使われるたびに印税みたいなの貰えるぐらいしないといろいろまずい気がします。
声優さんの表現には勝てないはず、そう信じたい
ぶっちゃけ、海外にこういう技術があると日本としては揉め事の原因になりそう。だからこそ日本が開発でリードして、ある程度ルールを定める方がいいと思う。
まあ個人的には亡くなってしまった声優のキャラクターを再現できるかもって魅力がある。
権利関係ガン無視なあたりが中華発なんだよなあ
それが良いところでもある
声に権利なんてない
これはなんか怖い…ひろゆきメーカーとは色々違いすぎる
正規にリリースされてるソフトでもないので触れないようにするのが一番だと思います
Good thing is it has potential to simulate all voices
Bad thing is someone can take your voice to do something, if it's fully developed
You are right.
I think this could be a real possibility if the speech synthesis technology called VITS is further developed.
規模と早さがまるでちげぇ....
これって音声合成界のnovel AI(無断転載がベース)だと認識していいのだろか… これであえて有名声優さんがちゃんとした合成音声ソフトで収録発売してクリーンな合成音声ソフトを作る流れになるかむしろ声優さんの合成音声化の許諾が今まで以上に厳しくなるか…わからないですね…
学習モデルの出所がハッキリしないので何ともいえませんが、ネット上で勝手に音声を収集して開発している可能性はあるかもしれませんね...
あんまりこういうこと言いたくないんだけど、政治でちゃんとAIに関することを決めていかないとこの先、声優さんたちの居場所はどんどん無くなるだろうね。
他にもこれから始まるインボイスで廃業する人がたくさんいることも知っておくべき。
守るものをちゃんと自分たちの政治で守っていかないとどんどん衰退していくと思う。
とても重要なことだと思います。
これ声優やアニメ会社などが裁判起こしたら勝てるんじゃね
これらの技術に価値アリと認識したら、ものすごい勢いで開発してきそうですね…。
いつも本当にありがとうございます!
ネット上での情報ですがMoeGoeの開発者は1000人規模ともいわれているので、商売価値があると判断して本腰を入れてきたのかもしれませんね...
怖いのは、これが進化してあっちでゲームとかアニメとか作られたときの吹き替えにこれを使ってきそう。。。
その場合たぶんまだ法律ないから声優さん手出しできなそう・・・
これは対象がアニメというだけでディープフェイクの一種ですね。声優ボイスの場合は収録した企業にその著作権があります。声優への肖像権は企業との契約内容による。例:ゼロの使い魔、ルイズ cv釘宮理恵の場合だとKADOKAWAへの権利侵害が成立する。ローカル環境を組む事も出来ますが、学習データの権利を考えたら公開も出来ずに個人利用しかできないので諦めました。これを利用したブロリーMADとか凄い見たいけど・・・。モデル12を試したらMAD動画と大差ないですね(´・ω・`)
Moe TTSには話者につくよみちゃんがある(14:中国語方言モデル)からそれをバンバン使うのだ
面白い紹介ありがとうございました!
このソフトは去年くらい発表された15aiに思い出す。MITの生徒さんが作ったらしくて色んなゲームや海外アニメキャラの声が再現できるっていう。最大の特徴はサンプルの少なさ:30分のサンプル量だけで割といい声ができてしまうしなんと2~3分のサンプル量だけの声もある。そいつも版権をもろもろガン無視してたんだよなぁ…w
気になったら調べて見てね(英語対応のみみたいだけど)
いろんな技術が出回ってるんですね...あとで見てみます
おい!ゆずソフト祭りじゃねえか!
ゆずソフトのゲームマジでおすすめです(ボソッ)
TTSの使い方はweb版voicevoxを思い出しました。2891人もあるのは驚きですが、音源の許可や出所、規約が不明瞭なのはヤバい匂いしかしませんね。
たしかにWEB版と似てる感じですね。ただMoeGoeは不透明な部分が多すぎるので触れないようにするのが安全だと思います。
bilibiliなどでそこそこのクオリティーのやつとかあったり..ai音声合成の底知れなさを感じた...
中国製は規約が怖い。
殆どのアニメキャラになりきれるのは良いが…
先手打っとかないとまずい気がする
テンセントが関わってて草も生えない
やばいやんけ…
あっちのデカい会社が関わってるとかそこらのエロゲ制作会社じゃあ太刀打ちできんやろ…
ま?そーすくだちゃい
ルイズの声は少し似てるレベルだけど、声優さんの版権はどうなってるんだろう?ダメそうだけど...結構有名なアニメの声優さんもいっぱい居てビックリした
ルイズの声は原作を知らなくてわかりませんでしたが、やはりそれくらいのレベルだったんですね
さすが、スケールがでかいwww
人間のように喋るようになった初音ミクと称して中の人の無断盗用もあり得るな
アニメと違ってエロゲは結構簡単に音声データだけを抽出出来るからね。
…さ、さすが中国…
こういうアンダーグラウンドには強い…(´・ω・`)
でも、利用規約やプライバシーポリシーなど、データが何処に流れてるかわからないものを使うのは怖いし、国産のボイスボックスやコエイロインクは強いってことはわかった気がする…
だが、いつかコナンの蝶ネクタイ型声変換みたいなものが出来る可能性があるというちょっと夢のある話かも?
…まあ、明らかにアウトだよ!!な声だけど…💦
…中国製…そういう部分はガバガバだからねぇ💦
ネットを見てると数百人規模の人海戦術で開発してるという情報もあるので、小型の変声機なども開発されちゃうかもしれませんね...
@@yuupro
…下手したらディープフェイクにも使えるって考えるともはや声にも著作権のような権利が必要な時代になってきたのかもしれませんね💦
ディープフェイクもどれが本物かわからないくらい…AIによる対ディープフェイク解析ソフトを使わなきゃわからないくらい巧妙につくられるリスクがあると考えると…
とんでもない時代に生まれちゃったなぁってちょっと恐怖を感じますね…(´・ω・`)
あらゆるものがAIに学習され、AIでAIを解析しなきゃわからない時代…
…な、何だが数十年前はSFや空想上の話しだったものが現実になってきている脅威はちょっと怖さを感じますね…
…コナンもびっくりなものがたくさん…
…恐るべし…
わああ…こういうのがあるって初めて知りました。少し触ってみたけど、イントネーションがまだまだって感じですね(何度か音声を出力して再生するとマシになる)
でもわりと悪くない感じでも喋る場合もあり、音源の種類で見ても技術の高さに驚きましたね。
版権の云々としては危ないものですが…
no entiendo y es el unico tutorial que existe :c
これは怖い話ですね……
早めに著作権や肖像権なんかと合わせて、
自身の作品やいかなる情報も無断でのサンプリングや利用を禁じ防止する必要がありそう
AI技術の発達により、10年くらいしたらVtuber死滅してるかもしれんな
兎田ぺこらの声とかも完全再現されそうだから、声だけは生き続けるのかも
サノバウィッチ…
これは怪しくて自分で使おうとは思わないですね。これを使って作った動画を公開するのは危険だと思います。
これには触れないようにするのが一番安全ですね!
2:56 カツオくんは新旧2種類あるのに、波平さんは旧タイプしかなかったw
Alguien que traduzca al español? jajaja
ルイズは有名声優の釘宮理恵さん演じるキャラクターですね。歌声合成ソフトの「UTAU」も、最初は釘宮ボイスで歌わせていたソフトでした。「UTAU」はネットがまだアングラで、個人で作ったものが収益化しにくい時代だった事。釘宮ボイスからさっぱりと離れて版権問題をクリアにして、独自の進化を遂げていきました。
「Moe TTS」は技術はとてもすごいけど、声優さんに許可をとったものなのだろうか…。まだまだ不安要素が強いですね。
UTAUにはそのような歴史があったのですね...!
許可をとっているかは不明ですが海外では日本の法律や倫理などは通用しないので無断で使っている可能性が高い気がします。
没声優さんの声を再現して補完してほしいわ
そもそもMOE-TTS自体が権利侵害してたりしないのか!?
偽実況に最適…だけど、色々やばいっすねぇ…
すごい、けど、、、うーん
こういうアプリを見ると厳格なAI法律規制が必要なのだなと改めて思い知らされる
動画の内容と関係のない話をして申し訳ございません。
今日(11月12日)、突然コミュニティが解放されて使えるようになりました。
今日まで❝登録者500人以上に到達した者だけの特権❞というイメージがあったので、突然の出来事に驚いております。
調べてみたら、昨日から今日(11月11日~11月12日)にかけて、他の多くのチャンネル主の方々が「解説された」と報告しています。「上級者認証」に関して、大きな規制緩和が行われたみたいです。しかし、登録者56人・動画14本でも解放されているチャンネルもあった一方で、登録者200人以上・動画50本以上でも解放されていないチャンネルもあったので、❝全チャンネル一律で解放❞ということではなさそうです。私が調べた感じでは、霊夢・魔理沙の「ゆっくり解説」はOKだけど、ゲーム実況系(繰り返しの多いコンテンツの判定を受けている?)には厳しいみたいです。最新の動画の公開が6か月以上前のチャンネルもダメでした。私は活動量が十分で、動画の内容も良質であると認めていただけたみたいです。