GPT-SoVITS语音克隆AI，只需一分钟素材训练模型，效果堪比商用。一键安装，附Colab脚本 | TTS | RVC|GPT-SoVITS Colab

AI探索与发现

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 29 гру 2024

КОМЕНТАРІ • 731

@AIDiscovery2045 11 місяців тому ⁺¹⁶
补充：第一环节中最后一步，给文本打标注那里忘说了一句，修改完文本后要先点【Submit Text】按钮
附Colab脚本：colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb#scrollTo=e9b7iFV3dm1f
@niceovo8120 11 місяців тому ⁺¹
怪不得savefile，还是不变，软件效果真是太棒了
@foserli 11 місяців тому ⁺¹
这版Colab脚本非常棒，调整一下目录位置后能正常执行，在语音转文字上准确度很高，要修正的字很少 (我才改了两个字)，在文字转语音上速度也比抖音上网友的版本快(也有可能和Colab不同时段负载有关)，能直接重复使用先前建立的模型，真是太完美了。
@AIDiscovery2045 11 місяців тому ⁺¹
@@foserli 执行最后一步把训练好的模型导入，再打开推理界面
@AIDiscovery2045 10 місяців тому ⁺¹
@@foserli 关闭VPN或者梯子软件即可
@foserli 10 місяців тому
@@AIDiscovery2045 config.py里第10列 is_share_str = os.environ.get("is_share","False") 最后的False改成True就能显示 public URL了。
@Jason-jc3ed 9 місяців тому ⁺¹
太赞了！一直没找到合适的中文语音tts，中间用你自己声音训练的一段我跳着看我都没发现是训练的演示成果，感谢分享👍
@R福氣啦 10 місяців тому ⁺⁴
非常有用! 真實，操作詳細，照這樣出片下去，你會是AI界工具介紹類的權威頻道
@刘军杰 10 місяців тому
老师真的厉害啊，可惜我中途遇到了模型的提示：很遗憾您这没有能用的显卡来支持您训练，惨，买的笔记本没有独立显卡，呜呜呜，台式电脑在其他城市，好难受啊，嘿嘿嘿第一次在UA-cam上，第一次翻墙，第一次在外网上评论，见证历史，嘿嘿嘿老师很有幸，您见证了未来的一个伟大企业家的历史痕迹
@刘军杰 10 місяців тому
感谢老师分享，已经学习和下载了，换一台电脑应该就可以弄了，复习了几遍视频，讲解非常仔细，十分感谢
@AIDiscovery2045 9 місяців тому
感谢支持
@antboy 8 місяців тому
平时不爱评论的我，特别动动手指给个好赞吧，的却讲的太详细了。期待博主的更多更新
@AIDiscovery2045 8 місяців тому
谢谢你的支持~😃
@djd5966 11 місяців тому ⁺⁵
关注很久了，每次带来的软件多超级实用
@AIDiscovery2045 11 місяців тому ⁺¹
感谢支持！
@異姓親兄弟 10 місяців тому ⁺³
太牛了，感谢感谢，省钱省事，自媒体良心博主 win10没问题，效果杠杠的
@AIDiscovery2045 10 місяців тому
感谢支持~
@houpinGao-tt4bj 2 місяці тому
异性兄弟，这个我不会弄，请问你能帮我克隆一段声音，并告诉我如何使用吗？盼复。
@異姓親兄弟 2 місяці тому
@@houpinGao-tt4bj 这边可以用AI音频克隆&TTS训练推理工具离线版V3.2，更方便呢，博主也有介绍，简单的多
@houpinGao-tt4bj 2 місяці тому
@@異姓親兄弟这个效果可能没前者好。你帮我弄，有点费用你喝杯咖啡，😃
@MacGuo 8 місяців тому
太棒了，这个对做视频的人来说，做旁白解说太有用了！
@yedingwang9519 10 місяців тому
太棒了秩序井然层层推进细致贴心的讲解
@jamesongnotjamesbond7018 11 місяців тому ⁺²
不错，又有新的 a.i 工具了！，期待接下来还有更多的介绍😊，谢谢🎉❤
@owengreen593 10 місяців тому ⁺¹
虽然很麻烦，但技术贴，很有意思，支持先
@Oboy-n2h 9 місяців тому
您的讲解得太好了👍👍
@dadaWang-er5gf 6 місяців тому
感謝分享，簡直跟原聲一模一樣😁
@cornng 11 місяців тому
絕對是干貨分享❤❤❤❤
@stonecrazy9686 9 місяців тому
发自内心的感谢大佬无私的分享
@tjs4403 10 місяців тому
好棒的分享！！谢谢！！ AI太强啦
@kory5379 11 місяців тому
非常的牛又快又好用😎
@Xin 10 місяців тому
简单扼要，都是精华
@LKelly-t8q 9 місяців тому
很细心，连怎么删除都讲！
@f.g.9110 11 місяців тому ⁺¹
非常感谢，正在之前看的换脸，正在考虑要什么方案换声呢，感谢大佬分享
@8Y88 11 місяців тому ⁺¹
用整合包试了可行，克隆出来的声音还行
@freestylerLark 4 дні тому
mac系统下有推荐的克隆工具吗
@黃宗翰-v7s 8 місяців тому
这是一个恨棒的频道，我已经订阅。想请问若这个开源软件更新后，我是需要重新再下载一次吗?并且需重复在执行一次模型训练的动作吗?谢谢您
@AIDiscovery2045 8 місяців тому ⁺¹
整合包需要重新下载，模型可以复用。
@黃宗翰-v7s 8 місяців тому
@@AIDiscovery2045 非常感谢您的回覆，另外我想请问这个开源软件可以使用繁体中文进行操作吗？
@AIDiscovery2045 8 місяців тому
@@黃宗翰-v7s 推理合成文本可以写繁体，但参考音频的对应内容必须是简体。因为第一环节里ASR之后，标注文件里是简体的标注文本。
@Panfengjiang 8 місяців тому ⁺⁴
外面确实能学习很多东西，不像有的地方连个剪辑都要用来坑你的钱，各种课程，总是利用信息差去坑自己人，想学东西还是上这来。。
@yilinc.4162 7 місяців тому
講解得太棒了。請問訓練了第一次發現雖然相似度高達70%，但有些發音有瑕疵需要修正的話，該如何處理呢？上傳新的文本重新再跑一次嗎
@lw9173 10 місяців тому
老師好。請問出現這個問題該怎麽處理？
2024-02-23 16:24:24,275 - modelscope - INFO - PyTorch version 2.0.0+cu118 Found.
2024-02-23 16:24:24,277 - modelscope - INFO - Loading ast index from C:\Users\User\.cache\modelscope\ast_indexer
2024-02-23 16:24:24,417 - modelscope - INFO - Loading done! Current index file version is 1.10.0, with md5 dc0c9ee702463555275a41f8a2fb65fe and a total number of 946 components indexed
2024-02-23 16:24:24,995 - modelscope - INFO - Use user-specified model revision: v2.0.4
Downloading: 0%| | 0.00/840M [00:00
@AIDiscovery2045 10 місяців тому
可能是你的显卡CUDA版本高于11.8
@shaoli1714 11 місяців тому ⁺¹
可以做成前段时间国内抖音很火的改歌词唱歌的那种吗？抖音电影解说现在卷的全是唱歌了，用的ACE Studio，直接改了歌词之后，可以唱歌
@voiceover-jack 11 місяців тому
非常详尽的教程。请问老师，如果mac环境下，不使用cuda，而使用mac的显卡加速，能成功搭建训练模型么？
@AIDiscovery2045 11 місяців тому
mac支持M1和M2芯片，请参考官网手动安装指令
@voiceover-jack 11 місяців тому
谢谢，昨天测试了。但是到打标住的环节总是出错，还没搞明白问题原因。@@AIDiscovery2045
@LiuxixiGua 3 місяці тому
博主你好，训练的素材需要语调都统一还是说包含多种情感语调的，比如开心，愤怒，伤心的？如果可以多种情感语调的，那训练好模型以后克隆推理的时候才方便使用不同参考音频生成不同情感语调的音频。
@AIDiscovery2045 3 місяці тому
素材有多种情感确实在推理时可以选择不同的参考音频；但更重要的是素材的语音清晰度
@LiuxixiGua 3 місяці тому
@@AIDiscovery2045 我的意思是我的目的是为了生成不同情感的音频，那我训练模型所用的素材也需要不同情感风格的音频还是统一风格的音频，只是在推理的时候用不同情感的参考音频生成不同风格的而已？
@AIDiscovery2045 3 місяці тому
@@LiuxixiGua 统一风格和不同情感的都可以；参考音频的说话语气会影响推理结果
@AIDiscovery2045 3 місяці тому
@@LiuxixiGua 你也可以看下频道里另一期关于gpt-sovits控制情感语气的视频
ua-cam.com/video/SL9WIPSd10M/v-deo.html
@TheBlvision 9 місяців тому
好屌喔
太誇張了
@lxyzlx 8 місяців тому ⁺¹
大佬，两次微调之后，GPT_weights等两个文件夹里没保存的模型是什么情况呀
@rossiwang4381 11 місяців тому ⁺¹
我的电脑手动安装了还是运行run.bat无反应，如果可以云端执行就好了
@zjing007 10 місяців тому
逆天！感谢分享！
@MC-929 11 місяців тому
2:30 请教，为什么我的执行后ame子目录，只有一个文件。
@AIDiscovery2045 11 місяців тому
声音时长不足10秒？
@MC-929 11 місяців тому
@@AIDiscovery2045 1分钟的音频。我是下载整合包后，打开直接运行的。还需要下载其它什么文件吗？
@AIDiscovery2045 11 місяців тому
@@MC-929 整合包目前好像只支持英伟达显卡，并且需要提前安装好CUDA，估计是整合包运行出错了
@MC-929 11 місяців тому
@@AIDiscovery2045 1、我电脑上之前装过Stable diffution绘画整合包，刚才查看了一下CUDA版本是12.3，这个是有的，启动GPT-SoVITS也没报什么异常。2、另外，刚才看到评论区有个朋友的解决了。他说他的是最开始没有消除背景音，而且是英文，后来换中文就没问题了。而我选的1分钟音频是一段电影解说的选段，先用UVR5分离掉了背景音乐，但人声音频里，仍然带有一点儿原电影角色的说话声，不过很小。我再换个音频试试吧。
@MC-929 11 місяців тому
问题已解决。换了一个干净的配音，没有其它杂声的音频，就可以正常切分了。
@leontang2086 10 місяців тому
感谢分享🎉
@LiuxixiGua 3 місяці тому
另外，推理的时候上传的参考音频必须是训练模型打标生成的音频吗？
@AIDiscovery2045 3 місяці тому
参考音可以用切割后的5秒左右音频
@LiuxixiGua 3 місяці тому
@@AIDiscovery2045 谢谢博主，还有个问题，由于自动切割成4s的音频，导致有些语句断开了，我就在打标页面将其合并，我看打标页面也有分割音频按钮，但是不知怎么再将该合并的音频按照合适的位置再切开，请问该如何操作呢？
@AIDiscovery2045 3 місяці тому
@@LiuxixiGua 不要用打标页面合并、切割功能，BUG很多
@xz215279 10 місяців тому
很厲害可是聽起來很沙啞感覺還不太真實，但我相信再過幾年可以改善這問題
@FengweiLI Місяць тому
前面一切正常，但在最后合成声音时，结果是ERROR，为什么，谢谢
@LSYang 9 місяців тому
方言才是王道
@jiyang3911 24 дні тому
文件夹中文路径可以吗
@耗子尾汁马保国 9 місяців тому
这个效果就完全像是你在念稿念顺口溜说外语或是在用别人现成的配音一样😮
@shawnzhsh 8 місяців тому
谢谢。有没有推荐 text to speech 的免费的？目前都是超过一定字符收费。
@AIDiscovery2045 8 місяців тому
这个就是免费的，且开源；但需要自己训练模型。
MeloTTS也是免费，但只有一种自带的音色可选。这期视频有介绍 ua-cam.com/video/5WHvFLDZg18/v-deo.html
@youwang9156 12 днів тому
谢谢大佬视频，有办法批量生成吗？只能通过webui一个一个的生成吗？
@AIDiscovery2045 12 днів тому
这一款目前只能单条克隆
@physobornsicx 3 місяці тому
請問有辦法用自己錄的一個音檔，然後運用已經訓練好的模型，來複述一次讓原音重現嗎？就不是透過文字來合成語音，是用已經有的語音來將聲音轉換成訓練好的聲音。
@AIDiscovery2045 2 місяці тому ⁺¹
要用己錄音檔训练模型来複述
@paulfay2195 11 місяців тому
我觉得好神啊，西游记里取的女声，竟然配音感觉把握得那么准，Ai能力吓到我了。谢谢分享问下GoLab上能用吗
@AIDiscovery2045 11 місяців тому
可以，视频下方详细说明里有链接
@CanDoSo_org 10 місяців тому
真牛！但是只能在windows 下使用吗？
@AIDiscovery2045 10 місяців тому
linux、mac全平台支持，只是没有整合包，需手动安装；
@Duwin68 9 місяців тому
你培养出来的女王声音分享下呀0.0 懒人准备只拿不自己生成
@kennysujia 9 місяців тому ⁺¹
粤语好像不能使用呢
@肥貓-b6z 9 місяців тому
很方便快速感謝教學，只是好像無法用在歌曲?
@AIDiscovery2045 9 місяців тому ⁺²
嗯，目前歌曲RVC功能还没发布
@肥貓-b6z 9 місяців тому
@@AIDiscovery2045 期待發布後up主的教學感恩
@shinesun841 8 місяців тому
声音已经成功切割为什么我的 asr 批量处理的出来的list文件为空里面什么都没有
@DavidBrown-tv8fx 11 місяців тому
这个确实挺牛的
@晨曦冰封 10 місяців тому
感觉机械感还是不少，如果训练够久不知道会不会好些。
@FelixMayer-yn1fw 8 місяців тому
大神，如果是英语训练要怎么训练啊，求带
@yaojason-m2u 11 місяців тому ⁺²
如果只用推理模型的话，怎么选？
@AIDiscovery2045 11 місяців тому ⁺²
直接到推理标签页，勾选推理页面方框，在新网页里选模型、推理即可
@chaochicheng1521 4 дні тому
請問一下，用windows訓練完成後，能不能移至Mac運行?
因為有移動需求，沒有買windows筆電
@AIDiscovery2045 4 дні тому
目前暂时不支持Mac运行
@Jimix-is7um 10 місяців тому
刚留言的一堆报错问题被UA-cam删了，就是log目录下面没有任何新建文件，但是提示有“输出logs/实验名目录下应有23456开头的文件和文件夹”，另外就是一堆Python的报错，传上来被删掉了，应该如何解决？
@智梵傅 7 місяців тому ⁺¹
老师在进行开始离线ASR 的时候出现SystemError: initialization of _internal failed without raising an exception怎么办啊
@AIDiscovery2045 7 місяців тому
硬件什么配置
@智梵傅 7 місяців тому
6G 显存
@AIDiscovery2045 7 місяців тому
@@智梵傅 ASR模型有没有自动下载，在C盘Cache目录里
@Appreciatingzggs 10 місяців тому
我下载的prezip, 2-gpt-sovits-变声下面显示的是施工中，请耐心等待。这是我没弄好还是这个软件现在暂停使用
@Nikobest-8bbb 6 місяців тому
想请问ASR批量处理后为什么不会生成新的list文件呢？感谢
@AIDiscovery2045 6 місяців тому
可能是语音没有识别成功，ASR时切换到命令窗口看下输出信息有没有报错
@你爹小飞 10 місяців тому
哥咱就是说，能分享一下模型吗，电脑太慢训练不了
@66l-wb9yp 5 місяців тому
请问下，如果是法语、西班牙语或者是其他国家的语言，应该怎么选择？
@AIDiscovery2045 5 місяців тому
目前还不支持法语和西班牙语的训练
@historiwave 11 місяців тому
还有个问题大佬，我在云平台训练好后，把训练好的SoVITS_weights和GPT_weights文件下载到本地对应文件夹里，怎么用不了啊？合成出了视频但是没有声音
@JJK-sd1vr 9 місяців тому
相当强悍啊
@bacharmohamad3549 10 місяців тому ⁺¹
老师你好问下这个文件生成可以用在电销机器人里吗
@AIDiscovery2045 10 місяців тому
生成的是标准格式的WAV音频文件，应该各类播放软件都能支持
@喵喵-c2o 9 місяців тому
感谢分享
@pengpeter7345 10 місяців тому ⁺¹
显卡是 NVIDIA GeForce GTX 960M，是不是配置太低了？提示“很遗憾您这没有能用的显卡来支持您训练”
@AIDiscovery2045 10 місяців тому
这个配置确实有点低。不过你可以安装一下显卡CUDA驱动试下，cuda11.8
@不要着急 11 місяців тому
可以提供一下你的那个音频给我吗？SoVITS正常，我老卡CPT训练，点了几百遍才有一次成功，就算是成功了还是没有模型，也不知道那里出的问题，我想拿你的音频做参考
@sleeptight9954 10 місяців тому
请教一下老兄，文本校对标注那一步，我手动改了界面上某句话的文字，并且保存文件，怎么list文件里没有改呢？如果我直接跳过那个界面，手动改那个list文件是否也可以？
@AIDiscovery2045 10 місяців тому
submit 看下置顶评论
@sleeptight9954 10 місяців тому
哦，看见了@@AIDiscovery2045
@user_li_PPP Місяць тому
您好,请教一下,最后推理合成语音时,我合成的文本只有: 今天天气真好啊,真想出去走一走呢. 结果推理的特别久,700多秒了还在推理,这是什么情况呢,电脑配置太差了吗
@user_li_PPP Місяць тому
哦,找到问题了,本地缺少NLTK,补齐就好了
@謙-m3g 3 місяці тому
大佬你好我在微調訓練中 Sovlts訓練中已完成但SoVITS_weights資料夾內是空的
命令顯示這串文字:RuntimeError: cuFFT doesn't support signals of half type with compute capability less than SM_53, but the device containing input half tensor only has SM_52
能否請大老支援謝謝
@AIDiscovery2045 3 місяці тому
两种可能，一是显存配置低了；二是请至该项目github官网下载最新的版本
@enki5420 10 місяців тому ⁺¹
有没有把英文视频语音翻译成中文的ai 神器
@AIDiscovery2045 10 місяців тому
最近一期6个AI工具里有，openai开源的whisper
@kesijack 4 місяці тому
生成的多个模型能进行分角色对话么？像chattts那样
@AIDiscovery2045 4 місяці тому
多角色对话要手动拆分
@郭新晴 10 місяців тому ⁺¹
FileNotFoundError: [Errno 2] No such file or directory: 'logs/讲故事男声1/2-name2text-0.txt'
错误: 没有找到进程 "8584"。
错误: 没有找到进程 "10860"。
老师，一键三连时报错，是哪里出了问题？
@AIDiscovery2045 10 місяців тому
看出错信息好像是路径不对；对着视频看看标注文件那填写的路径是不是不完整
@郭新晴 10 місяців тому
好的，我再查查，谢谢老师@@AIDiscovery2045
@郭新晴 10 місяців тому
呀，我没看到你下面的补充，我再试试，那个脚本是啥？需要加进去吗？@@AIDiscovery2045
@Gav6661 9 місяців тому
我也是这里报错
@Gav6661 9 місяців тому
后来您这个问题解决了吗？怎么解决的？
@xiaoniangao-24 8 місяців тому
请问博主，我要翻唱一首歌，还要更改歌词，用这个AI能做到吗？
@AIDiscovery2045 8 місяців тому
目前还没有翻唱功能。想翻唱可以看这期，但改不了歌词。ua-cam.com/video/ocXOeMZc1XI/v-deo.html
@t王-h3k Місяць тому
大神您好，请问训练出来的模型可以用来手机端小说软件的tts朗读吗😊
@AIDiscovery2045 Місяць тому
手机端这个AI可能跑不动
@banaka-q8y 9 місяців тому
请问目前是只能支持中日英三种语言的输入和输出吗，有什么方法可以训练其他小语种吗
@AIDiscovery2045 9 місяців тому
暂时没办法，底模不支持
@QQ-mn2hl 7 місяців тому
可以試試看SVC
@bater1602 10 місяців тому
群晖上可以用吗?
@yizhou4228 10 місяців тому
请问有没有mac 版本能用的详细教程啊？
@AIDiscovery2045 10 місяців тому
项目主页上有；安装流程和windows下的手动安装一样，仅激活虚拟环境指令有区别
@daiyuejia 5 місяців тому
老师， GitHub上下载的的 ZIP 就是整合包吗？还是老师这里单独准备的整合包？
@AIDiscovery2045 5 місяців тому
ZIP就是整合包。
@jamhome5211 8 місяців тому
请教一下，我老是卡在ASR处理这一步，显示：funasr_asr.py: error: the following arguments are required: -o/--output_folder，有解决办法吗？用的是beta0217版
@AIDiscovery2045 8 місяців тому
看出错信息可能问题在输出目录设置上。使用默认输出路径试一下；另外检查下整合包解压路径里是否有中文目录
@jameschu4502 10 місяців тому ⁺¹
我在ASR处理之后不会生成list文件，不知道怎么回事？
@CA9527oc 9 місяців тому
同问
@FelixMayer-yn1fw 8 місяців тому ⁺¹
大神英语切片以后，然后一直训练失败，要怎么训练英语啊
@AIDiscovery2045 8 місяців тому
训练英语素材跟中文一样的流程，唯一区别是ASR时选whisper。
@郑宁-f3c 7 місяців тому
想请教一下，训练模型SOVIT显示成功。但是推理时SOVIT模型列表下面没有对应模型选项，查看训练模型文件夹也是空的。但是训练时提示成功。而GPT模型提示成功，文件夹不是空的
@AIDiscovery2045 7 місяців тому
提升成功有时会出Bug,要看命令窗口有没有success提示。训练时要切命令窗口看详细提示才行。
@郑宁-f3c 7 місяців тому
@@AIDiscovery2045 感谢大佬回复！窗口也提示成功了，我卸载两次又重新安装两次还是这样的情况（克隆出的声音就不好）。之前使用的时候一直是好的。（克隆出来很好）
@张三-t4q 11 місяців тому
做大篇幅的语音阅读，这个适合吗？
@AIDiscovery2045 11 місяців тому
建议多批次，每段300以内
@異姓親兄弟 10 місяців тому
太牛了
@E8L6I7J2A8H 9 місяців тому ⁺¹
請問原本語音是英文，要怎麼操作？
@AIDiscovery2045 9 місяців тому
训练语音暂不支持英文；推理支持中英混合
@luandy1486 9 місяців тому
挂不得英文的没有办法切割@@AIDiscovery2045
@sadas-bk3yr 11 місяців тому ⁺¹
为什么要这样安装？不是有压缩包解压即用吗
@AIDiscovery2045 11 місяців тому ⁺¹
目前整合包并不一定适合所有机器环境，整合包通用就不用手动安装了
@cyl-lm6oy 11 місяців тому
整合包好像删了@@AIDiscovery2045
@3svrmlm241 11 місяців тому
问下如果要配置一台差不多的台式需要什么级别的显卡和CPU 内存32够吗？3060+32内存顺带剪剪视频加上一些常用的AI工具什么配置能跑起来？
@AIDiscovery2045 11 місяців тому
应该够了，这个AI其实8G显存就能非常顺畅
@章天佑 6 місяців тому
兄弟，你这个CPU和显卡分别是什么型号的，我也准备整一台这样的设备，现在用的老机器都快10年了，200字文本转语音耗无法言语，时真的比蜗牛还慢
@joshuatse3726 Місяць тому
开启GTP训练时候出现这个怎么解决没有模型文件 File "ctypes\__init__.py", line 374, in __init__
FileNotFoundError: Could not find module 'E:\AI\GPT-SoVITS
untime\Lib\site-packages\torchaudio\lib\libtorchaudio.pyd' (or one of its dependencies). Try using the full path with constructor syntax.
@AIDiscovery2045 Місяць тому
看错误提示是缺少torch依赖包，不知你是手动安装还是用的整合包？整合包只支持N卡
@joshuatse3726 Місяць тому
@@AIDiscovery2045 下的整合包是n卡第一个SoVITS训练可以正常训练 GPT训练就提示错误我用其他电脑的旧版本可以SoVITS训练再把模型转到新版里来合成合成之后觉得有漏读的情况按你的方法调整后还是不好使语速按标点切完还是感觉快但是声音很像了不知道怎么去调整
@AIDiscovery2045 Місяць тому
@@joshuatse3726 重新用更好的声音素材训练；或者更换提示音频
@joshuatse3726 Місяць тому
@@AIDiscovery2045 好的谢谢如果我想把多个要训练的音频都放在一个list文件里可以吗
@joshuatse3726 Місяць тому
@@AIDiscovery2045 我下的整合包重新解压还是不好使这个文件包在哪里手动安装呢
@Meow-m8l 20 днів тому
我在第一个开启训练这里运行了七八个小时，最后显示失败
@gangwei7126 11 місяців тому
辛苦了。谢谢。我发现一个问题，我用中文作为Model name后报错。改英文名通过。但是第三步死掉了：In construction, please wait
@AIDiscovery2045 11 місяців тому
看看命令窗口有没有输出训练模型的进度，两个模型训练还是需要点时间的。我演示用的9分钟录音大概跑了十几分钟
@gangwei7126 11 місяців тому
界面没有出现，只有in construction 的提示。我再重新试试看。@@AIDiscovery2045
@gangwei7126 11 місяців тому
谢谢。成功了。虽然界面不是很方便，但效果确实很厉害！有一处需要注意，就是校对文字的时候，每一页都要存一下。我就是在第二页存了，不知道这个，第一页等于没有校对。@@AIDiscovery2045
@physobornsicx 3 місяці тому
請問中文語境有辦法講出台灣的口音嗎
@AIDiscovery2045 2 місяці тому
目前还不支持训练闽南语
@physobornsicx 2 місяці тому
@@AIDiscovery2045 不是閩南語是台灣的口音沒有這麼字正腔圓
@AIDiscovery2045 2 місяці тому ⁺¹
@@physobornsicx 如果稍带口音的声音素材来训练，是可以部分克隆口音的，可以看看另一期我克隆的周星驰的配音
@physobornsicx 2 місяці тому
@@AIDiscovery2045 請問標題？我只看到一個叫長安老張的頻道有克隆周星馳
@AIDiscovery2045 2 місяці тому ⁺¹
@@physobornsicx ua-cam.com/video/SL9WIPSd10M/v-deo.html
可以看下我这期，开头的demo就是克隆的声音
@Tonyahoo-q4p 11 місяців тому ⁺¹
老师你好！使用整合包，在一件三联的时候，我的GPU imformation显示的是：Unfortunately, there is no compatible GPU available to support your training. 所以一件三联没有成功。这个说明我的笔记本硬件不符合要求吗？一定要有独立显卡？
@AIDiscovery2045 11 місяців тому
是的
@suonian 10 місяців тому
考虑云主机
@月白秋 7 місяців тому
用他生成400多字的文案，但是它经常会丢一两句直接跳过，或者重复一两句，怎么解决啊，就是输出的中文啊
@AIDiscovery2045 7 місяців тому
ua-cam.com/video/SL9WIPSd10M/v-deo.html
@zfxyjx 10 місяців тому ⁺¹
感觉很复杂有没有更简单的工具 😂
@河蟹-q7y 6 місяців тому
大佬，最后一步，推理模型，提示施工中请静候佳音，怎么解决？
@AIDiscovery2045 6 місяців тому
施工中不是推理，还未开放的RVC，推理功能在下面一行
@historiwave 11 місяців тому ⁺¹
为啥我去人声，最后文件夹里面没文件啊...哪里错了
@AIDiscovery2045 11 місяців тому ⁺¹
自带分离工具可能有问题，可以试试用单独版，这个分离工具在VALL-E-X那期视频有介绍
@ttzsgame 11 місяців тому
UP，你好。我刚刚看了你的教程，就想去克隆一款gal里面女主的配音。于是我把文件解包，然后把女主的语音文件按照视频步骤一步步操作。可是到最后生成语音文件时，可以成功生成，但生成的文件没有声音。我一开始以为是我第一次在修改语音转文字时，误把多个语音文件给合并后又重新拆分。然后我就把这部分文件删除后，重新第二次重头重来。但故障依旧，生成的语音文件没有声音。所以我现在怀疑，是不是第一步语音文件拆分那里的问题。因为gal语音文件一般都只有几秒，而且就是纯语音，没有背景音。所以我就直接拿来用模型训练。
@AIDiscovery2045 11 місяців тому
更换提示语音片段试下
@ttzsgame 11 місяців тому
@@AIDiscovery2045 更换参考音频还是一样，生成的语音没有声音。我有点怀疑，是不是我电脑硬件配置的原因？这台电脑还是两年前买的，配的是GTX1650。
@AIDiscovery2045 11 місяців тому
@@ttzsgame 用正带工具，把语音素材去混音，重新训练一次，模型名换个新的试试
@張樵益 10 місяців тому
請教前輩手動安裝成功輸入 c:\voice\deepfacelive-rec.WAV output/slicer_opt/ame 開啟語音切割卻出現error 如何處理謝謝
@AIDiscovery2045 10 місяців тому
c:\voice\deepfacelive-rec.WAV 这个是我视频里演示的声音素材文件，要换成你自己的声音文件
@張樵益 10 місяців тому
@AIDiscovery2045 謝謝解答之前問題已解決但在操作訓練集格式化工具時開啟一鍵三連出現報錯訊息找不到程序處理 "6568"及"10972", 在第二項開啟SSL提取時出現 You should probably TRAIN this model on a down-stream task to able to use it for prediction and inference @@AIDiscovery2045 請協助感謝
@AIDiscovery2045 10 місяців тому
@@張樵益少语音识别模型，应该是直接下载的整合包运行的吧。推荐手动安装并下载相应模型，视频后半部分有手动安装演示
@WealthJourney127 11 місяців тому
这种报错怎么整啊 UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`. In PyTorch 1.1.0 and later, you should call them in the opposite order: `optimizer.step()` before `lr_scheduler.step()`. Failure to do this will result in PyTorch skipping the first value of the learning rate schedule. See more details at
@AIDiscovery2045 11 місяців тому
这是用整合包运行报错的吗？
@WealthJourney127 11 місяців тому
@@AIDiscovery2045 对，运行到sovits训练的时候报错了，我从网上查了查，让改几段代码，但是我不知道是哪个文件
@AIDiscovery2045 11 місяців тому
@@WealthJourney127 整合包可能在一些机器上运行不了。试试换声音素材
@WealthJourney127 11 місяців тому
@@AIDiscovery2045 不是电脑的原因，因该是PyTorch版本的原因
@AIDiscovery2045 11 місяців тому
@@WealthJourney127 整合包自带的python3.9+pytorch2.0.1,你可以试试手动安装；我手动安装测试的是python3.10.6+pytorch2.1.1+cuda11.8，视频后半部分有演示

Наступне

Автоматичне відтворення