驚愕のアニメ音声合成アプリ「Moe TTS」を詳しく解説【MoeGoe】

Поділитися
Вставка
  • Опубліковано 16 лип 2024
  • 中国発と思われるアニメキャラの音声合成AIを使ったアプリ「Moe TTS」を解説します。
    3000人以上の合成音声を無料で使うことができますが権利関係も含めて不透明なため、現時点では個人で楽しむ程度にしておくことをおすすめします。
    ▼Moe TTS(Hugging Face)
    huggingface.co/spaces/skytnt/...
    ▼MoeGoe(GitHub)
    github.com/CjangCjengh
    ▼チャプター(目次)
    00:00 OPトーク
    00:26 Moe TTSとは
    00:51 使いかた
    01:41 音声モデル紹介
    02:51 使われている技術
    03:20 ボイチェン機能紹介
    04:35 EDトーク
    ▼引用元
    ■Hugging Face(Moe TTS)
    huggingface.co/spaces/skytnt/...
    ■GitHub(MoeGoe)
    github.com/CjangCjengh
    ▼参考にした動画
    ■MoeGoe開発者 CjangCjenghさんの動画①(Bilibili動画)
    www.bilibili.com/video/BV1P84...
    ■MoeGoe開発者 CjangCjenghさんの動画②(UA-cam)
    • 綾地寧々の声を作ってみた
    -------------------------------------------------------
    ▼ゆうぷろとは?
    合成音声関係や動画投稿にまつわる情報をメインに発信しています
    ▼チャンネル登録もお願いします
    ※ 新着動画や関連動画が「おすすめ動画」などに表示されやすくなります
    ua-cam.com/users/yuupro?sub_...
    ▼サブチャンネル(ゆうぷろ 2nd)
    / yuupro2nd
    ▼再生リスト(全動画)
    • 全作品まとめ
    ▼ゆうぷろの人気動画
    ■【VOICEVOX】ずんだもんっていったい何者? ~5分でわかりやすく解説
    • 【VOICEVOX】ずんだもんっていったい何...
    ■【初心者向け】ゆっくりとボイスロイドとVOICEVOX(ボイスボックス)は何が違うの?~音声合成ソフトの特徴や性質の違いを解説
    • 【初心者向け】ゆっくりとボイスロイドとVOI...
    ■一番使われているゆっくりの立ち絵ってどれ? ~人気1000チャンネルのリサーチ結果を解説
    • 一番使われているゆっくりの立ち絵ってどれ? ...
    ■【5種類+α】無料の音声合成ソフト&VOICEPEAKを聴き比べ
    • 【5種類+α】無料の音声合成ソフト&VOIC...
    ■【歴史に幕】SofTalkの“ゆっくりボイス”対応終了の件を詳しく解説
    • 【歴史に幕】SofTalkの“ゆっくりボイス...
    ■【レビュー】超リアル音声変換ソフト『SeirenVoice(セイレンボイス)先行版』を解説
    • 超リアル音声変換ソフト『SeirenVoic...
    ■【初心者必見】VOICEVOX 0.10.4 の基本的な使い方を10分で解説 ~ダウンロードから声の出力まで
    • 【初心者必見】VOICEVOX 0.10.4...
    ■【合成音声の収益化剥奪問題】収益化停止を受けた100チャンネルのリサーチ結果を解説
    • 【合成音声の収益化剥奪問題】収益化停止を受け...
    ■【必見!】音声合成ソフト『VOICEPEAK(ボイスピーク)』を解説&レビュー【商用・業務利用無料】
    • 【必見】音声合成ソフト『VOICEPEAK(...
    ■【必見】ゆっくりボイス(AquesTalk)のライセンスを完全解説
    • 【必見】ゆっくりボイス(AquesTalk)...
    ▼Twitter
    / yuupro_2022
    ▼出演
    ■冬霧サイカ:あまつじ 様
    mochigometei.booth.pm/items/3...
    ■ずんだもん:akihiyo 様
    seiga.nicovideo.jp/seiga/im10...
    ▼音声
    ■VOICEVOX ずんだもん:voicevox.hiroshiba.jp/
    ▼BGM
    ■DOVA-SYNDROME 様:dova-s.jp/
    ■甘茶の音楽工房 様:amachamusic.chagasi.com/
    ■PeriTune 様:peritune.com/
    ■ポケットサウンド 様:pocket-se.info/
    ▼動画編集ソフト
    ■ゆっくりムービーメーカー4 Lite:manjubox.net/ymm4/
    ■DaVinci Resolve:www.blackmagicdesign.com/jp/p...
    ▼リクエストやご質問・ご感想などはこちら
    • 【限定公開】ゆうぷろへの書き込み用動画(リク...
    #コメント歓迎です
    #合成音声
    #MoeGoe
  • Навчання та стиль

КОМЕНТАРІ • 66

  • @coldcase666
    @coldcase666 Рік тому +40

    VITSはピッコマを擁するカカオ所属の韓国人研究員3名によって2021年に論文が書かれた技術ですね🥺
    (現在の所属はSKテレコムになっている研究者もいる)
    前進はtacotron2(google産)辺りと思われ、モデルの作りやデータセットは非常に酷似している用に思えます。
    まだ日本語でのネイティブモデル制作のノウハウは少ないように見えるため、ネィティブ日本人がソースを選別し
    データセットを作れば、正直飛躍的に質は上がると思いますね🥺(ただ、この量は驚き。Tt2モデルを作る場合、手作業だと1人作るのに1日2日かかる(体験談)
    1000人単位のプロジェクトだという話もあるため、中国人の横の繋がりの凄さに驚く)
    データセットの例としてtacotron2では5分ほどの音声データで発話がはっきりとし始め、
    10分ほどで聞き取れる15分でクオリティがはっきりと確立し、それ以上のデータはより学習を長くしても過学習にならない(バリエーション、ゆらぎの多さなどに関わってくる?)という認識です。ラジオや、一人喋りをする機会のある声優さんならば、かなりの質のモデルが作れると思いますね。
    またVitsでは内部でシンセサイザーのように感情、起伏を追加するプラグインも開発されているため
    ボイスロイド的な使い方をより簡易に直感的に行えるGUIソフトの開発が待たれる技術ですね。

    • @yuupro
      @yuupro  Рік тому +5

      ありがとうございます。とても参考になりました

  • @user-un5mx6sq6w
    @user-un5mx6sq6w Рік тому +6

    これはやべぇ・・・・いやホントやべぇ・・・

  • @TheTAKESHITAKESHI
    @TheTAKESHITAKESHI Рік тому +47

    技術が進歩すれば、ゲームやアニメから音声を取り込むだけで
    誰でも声優さんの声を合成できるアプリが登場してしまうかもしれないですね…

    • @yuupro
      @yuupro  Рік тому +9

      VITSの技術がさらに発展すればできてしまうかもしれませんね...

    • @user-zt5qd4yg3h
      @user-zt5qd4yg3h Рік тому +10

      声優さんの仕事が……
      せめて、声優さんが声を使われるたびに印税みたいなの貰えるぐらいしないといろいろまずい気がします。

    • @m.cheese9823
      @m.cheese9823 Рік тому +2

      声優さんの表現には勝てないはず、そう信じたい

  • @mckee9872
    @mckee9872 Рік тому +39

    ぶっちゃけ、海外にこういう技術があると日本としては揉め事の原因になりそう。だからこそ日本が開発でリードして、ある程度ルールを定める方がいいと思う。
    まあ個人的には亡くなってしまった声優のキャラクターを再現できるかもって魅力がある。

  • @yuzukusu2613
    @yuzukusu2613 Рік тому +74

    権利関係ガン無視なあたりが中華発なんだよなあ

  • @user-ih_conlo
    @user-ih_conlo Рік тому +42

    これはなんか怖い…ひろゆきメーカーとは色々違いすぎる

    • @yuupro
      @yuupro  Рік тому +15

      正規にリリースされてるソフトでもないので触れないようにするのが一番だと思います

  • @fieocbdjdq
    @fieocbdjdq Рік тому +17

    Good thing is it has potential to simulate all voices
    Bad thing is someone can take your voice to do something, if it's fully developed

    • @yuupro
      @yuupro  Рік тому +4

      You are right.
      I think this could be a real possibility if the speech synthesis technology called VITS is further developed.

  • @user-ee3gl8tx2k
    @user-ee3gl8tx2k Рік тому +7

    規模と早さがまるでちげぇ....

  • @user-ol7se6vt9w
    @user-ol7se6vt9w Рік тому +47

    これって音声合成界のnovel AI(無断転載がベース)だと認識していいのだろか… これであえて有名声優さんがちゃんとした合成音声ソフトで収録発売してクリーンな合成音声ソフトを作る流れになるかむしろ声優さんの合成音声化の許諾が今まで以上に厳しくなるか…わからないですね…

    • @yuupro
      @yuupro  Рік тому +7

      学習モデルの出所がハッキリしないので何ともいえませんが、ネット上で勝手に音声を収集して開発している可能性はあるかもしれませんね...

  • @user-ws1pj6xr9h
    @user-ws1pj6xr9h Рік тому +12

    あんまりこういうこと言いたくないんだけど、政治でちゃんとAIに関することを決めていかないとこの先、声優さんたちの居場所はどんどん無くなるだろうね。
    他にもこれから始まるインボイスで廃業する人がたくさんいることも知っておくべき。
    守るものをちゃんと自分たちの政治で守っていかないとどんどん衰退していくと思う。

    • @user-lo7on1wf2o
      @user-lo7on1wf2o Рік тому +1

      とても重要なことだと思います。

  • @ミカンだお
    @ミカンだお Рік тому +6

    これ声優やアニメ会社などが裁判起こしたら勝てるんじゃね

  • @ponko-2
    @ponko-2 Рік тому +16

    これらの技術に価値アリと認識したら、ものすごい勢いで開発してきそうですね…。

    • @yuupro
      @yuupro  Рік тому +6

      いつも本当にありがとうございます!
      ネット上での情報ですがMoeGoeの開発者は1000人規模ともいわれているので、商売価値があると判断して本腰を入れてきたのかもしれませんね...

    • @user-un5mx6sq6w
      @user-un5mx6sq6w Рік тому +3

      怖いのは、これが進化してあっちでゲームとかアニメとか作られたときの吹き替えにこれを使ってきそう。。。
      その場合たぶんまだ法律ないから声優さん手出しできなそう・・・

  • @ch7915
    @ch7915 Рік тому +11

    これは対象がアニメというだけでディープフェイクの一種ですね。声優ボイスの場合は収録した企業にその著作権があります。声優への肖像権は企業との契約内容による。例:ゼロの使い魔、ルイズ cv釘宮理恵の場合だとKADOKAWAへの権利侵害が成立する。ローカル環境を組む事も出来ますが、学習データの権利を考えたら公開も出来ずに個人利用しかできないので諦めました。これを利用したブロリーMADとか凄い見たいけど・・・。モデル12を試したらMAD動画と大差ないですね(´・ω・`)

  • @yosi1989
    @yosi1989 Рік тому +3

    Moe TTSには話者につくよみちゃんがある(14:中国語方言モデル)からそれをバンバン使うのだ

  • @ozzi9816
    @ozzi9816 Рік тому +7

    面白い紹介ありがとうございました!
    このソフトは去年くらい発表された15aiに思い出す。MITの生徒さんが作ったらしくて色んなゲームや海外アニメキャラの声が再現できるっていう。最大の特徴はサンプルの少なさ:30分のサンプル量だけで割といい声ができてしまうしなんと2~3分のサンプル量だけの声もある。そいつも版権をもろもろガン無視してたんだよなぁ…w
    気になったら調べて見てね(英語対応のみみたいだけど)

    • @yuupro
      @yuupro  Рік тому +2

      いろんな技術が出回ってるんですね...あとで見てみます

  • @B-S-S-Iris
    @B-S-S-Iris Рік тому +9

    おい!ゆずソフト祭りじゃねえか!
    ゆずソフトのゲームマジでおすすめです(ボソッ)

  • @user-Sofvi.tp5mg6cf3
    @user-Sofvi.tp5mg6cf3 Рік тому +23

    TTSの使い方はweb版voicevoxを思い出しました。2891人もあるのは驚きですが、音源の許可や出所、規約が不明瞭なのはヤバい匂いしかしませんね。

    • @yuupro
      @yuupro  Рік тому +5

      たしかにWEB版と似てる感じですね。ただMoeGoeは不透明な部分が多すぎるので触れないようにするのが安全だと思います。

  • @kemo49568
    @kemo49568 Рік тому +6

    bilibiliなどでそこそこのクオリティーのやつとかあったり..ai音声合成の底知れなさを感じた...

  • @user-yg7gn1dr3z
    @user-yg7gn1dr3z Рік тому +6

    中国製は規約が怖い。
    殆どのアニメキャラになりきれるのは良いが…

  • @user-lo7on1wf2o
    @user-lo7on1wf2o Рік тому +7

    先手打っとかないとまずい気がする

  • @user-hv4lb1ct4g
    @user-hv4lb1ct4g Рік тому +10

    テンセントが関わってて草も生えない

    • @SUNSAN_33
      @SUNSAN_33 Рік тому +3

      やばいやんけ…
      あっちのデカい会社が関わってるとかそこらのエロゲ制作会社じゃあ太刀打ちできんやろ…

    • @coldcase666
      @coldcase666 Рік тому

      ま?そーすくだちゃい

  • @user-vr1hz5tk5p
    @user-vr1hz5tk5p Рік тому +9

    ルイズの声は少し似てるレベルだけど、声優さんの版権はどうなってるんだろう?ダメそうだけど...結構有名なアニメの声優さんもいっぱい居てビックリした

    • @yuupro
      @yuupro  Рік тому +2

      ルイズの声は原作を知らなくてわかりませんでしたが、やはりそれくらいのレベルだったんですね

  • @seiwaseiwa
    @seiwaseiwa Рік тому

    さすが、スケールがでかいwww

  • @dropoid5130
    @dropoid5130 Рік тому +5

    人間のように喋るようになった初音ミクと称して中の人の無断盗用もあり得るな

  • @user-hp9fq2mo7k
    @user-hp9fq2mo7k Рік тому +7

    アニメと違ってエロゲは結構簡単に音声データだけを抽出出来るからね。

  • @dkgoriapi
    @dkgoriapi Рік тому +9

    …さ、さすが中国…
    こういうアンダーグラウンドには強い…(´・ω・`)
    でも、利用規約やプライバシーポリシーなど、データが何処に流れてるかわからないものを使うのは怖いし、国産のボイスボックスやコエイロインクは強いってことはわかった気がする…
    だが、いつかコナンの蝶ネクタイ型声変換みたいなものが出来る可能性があるというちょっと夢のある話かも?
    …まあ、明らかにアウトだよ!!な声だけど…💦
    …中国製…そういう部分はガバガバだからねぇ💦

    • @yuupro
      @yuupro  Рік тому +4

      ネットを見てると数百人規模の人海戦術で開発してるという情報もあるので、小型の変声機なども開発されちゃうかもしれませんね...

    • @dkgoriapi
      @dkgoriapi Рік тому

      @@yuupro
      …下手したらディープフェイクにも使えるって考えるともはや声にも著作権のような権利が必要な時代になってきたのかもしれませんね💦
      ディープフェイクもどれが本物かわからないくらい…AIによる対ディープフェイク解析ソフトを使わなきゃわからないくらい巧妙につくられるリスクがあると考えると…
      とんでもない時代に生まれちゃったなぁってちょっと恐怖を感じますね…(´・ω・`)
      あらゆるものがAIに学習され、AIでAIを解析しなきゃわからない時代…
      …な、何だが数十年前はSFや空想上の話しだったものが現実になってきている脅威はちょっと怖さを感じますね…
      …コナンもびっくりなものがたくさん…
      …恐るべし…

  • @user-tz3ub8oi5z
    @user-tz3ub8oi5z Рік тому +5

    わああ…こういうのがあるって初めて知りました。少し触ってみたけど、イントネーションがまだまだって感じですね(何度か音声を出力して再生するとマシになる)
    でもわりと悪くない感じでも喋る場合もあり、音源の種類で見ても技術の高さに驚きましたね。
    版権の云々としては危ないものですが…

  • @SharoDesertor
    @SharoDesertor Рік тому +1

    no entiendo y es el unico tutorial que existe :c

  • @riwosu
    @riwosu Рік тому +9

    これは怖い話ですね……
    早めに著作権や肖像権なんかと合わせて、
    自身の作品やいかなる情報も無断でのサンプリングや利用を禁じ防止する必要がありそう

  • @fujicountrymaam
    @fujicountrymaam Рік тому +3

    AI技術の発達により、10年くらいしたらVtuber死滅してるかもしれんな
    兎田ぺこらの声とかも完全再現されそうだから、声だけは生き続けるのかも

  • @Yo-u-tu-be
    @Yo-u-tu-be 11 місяців тому +2

    サノバウィッチ…

  • @飛翔のキーホルダー
    @飛翔のキーホルダー Рік тому +9

    これは怪しくて自分で使おうとは思わないですね。これを使って作った動画を公開するのは危険だと思います。

    • @yuupro
      @yuupro  Рік тому +2

      これには触れないようにするのが一番安全ですね!

    • @飛翔のキーホルダー
      @飛翔のキーホルダー Рік тому +3

      2:56 カツオくんは新旧2種類あるのに、波平さんは旧タイプしかなかったw

  • @AlvaroJGV
    @AlvaroJGV Рік тому +2

    Alguien que traduzca al español? jajaja

  • @06sab88
    @06sab88 Рік тому +9

    ルイズは有名声優の釘宮理恵さん演じるキャラクターですね。歌声合成ソフトの「UTAU」も、最初は釘宮ボイスで歌わせていたソフトでした。「UTAU」はネットがまだアングラで、個人で作ったものが収益化しにくい時代だった事。釘宮ボイスからさっぱりと離れて版権問題をクリアにして、独自の進化を遂げていきました。
    「Moe TTS」は技術はとてもすごいけど、声優さんに許可をとったものなのだろうか…。まだまだ不安要素が強いですね。

    • @yuupro
      @yuupro  Рік тому +3

      UTAUにはそのような歴史があったのですね...!
      許可をとっているかは不明ですが海外では日本の法律や倫理などは通用しないので無断で使っている可能性が高い気がします。

  • @user-zt5qd4yg3h
    @user-zt5qd4yg3h Рік тому +8

    没声優さんの声を再現して補完してほしいわ

  • @hatobousi
    @hatobousi Рік тому +1

    そもそもMOE-TTS自体が権利侵害してたりしないのか!?

  • @user-tg7nz3tz5r
    @user-tg7nz3tz5r Рік тому +6

    偽実況に最適…だけど、色々やばいっすねぇ…

  • @user-cw5vk7xb7r
    @user-cw5vk7xb7r Рік тому +1

    すごい、けど、、、うーん

  • @sh3RiVi
    @sh3RiVi Рік тому +2

    こういうアプリを見ると厳格なAI法律規制が必要なのだなと改めて思い知らされる

  • @Hisho-Key-Holder-PC
    @Hisho-Key-Holder-PC Рік тому +3

    動画の内容と関係のない話をして申し訳ございません。
    今日(11月12日)、突然コミュニティが解放されて使えるようになりました。
    今日まで❝登録者500人以上に到達した者だけの特権❞というイメージがあったので、突然の出来事に驚いております。
    調べてみたら、昨日から今日(11月11日~11月12日)にかけて、他の多くのチャンネル主の方々が「解説された」と報告しています。「上級者認証」に関して、大きな規制緩和が行われたみたいです。しかし、登録者56人・動画14本でも解放されているチャンネルもあった一方で、登録者200人以上・動画50本以上でも解放されていないチャンネルもあったので、❝全チャンネル一律で解放❞ということではなさそうです。私が調べた感じでは、霊夢・魔理沙の「ゆっくり解説」はOKだけど、ゲーム実況系(繰り返しの多いコンテンツの判定を受けている?)には厳しいみたいです。最新の動画の公開が6か月以上前のチャンネルもダメでした。私は活動量が十分で、動画の内容も良質であると認めていただけたみたいです。