大佬你好 我在微調訓練中 Sovlts訓練中 已完成 但SoVITS_weights資料夾內是空的 命令顯示這串文字:RuntimeError: cuFFT doesn't support signals of half type with compute capability less than SM_53, but the device containing input half tensor only has SM_52 能否請大老支援 謝謝
老師好。請問出現這個問題該怎麽處理? 2024-02-23 16:24:24,275 - modelscope - INFO - PyTorch version 2.0.0+cu118 Found. 2024-02-23 16:24:24,277 - modelscope - INFO - Loading ast index from C:\Users\User\.cache\modelscope\ast_indexer 2024-02-23 16:24:24,417 - modelscope - INFO - Loading done! Current index file version is 1.10.0, with md5 dc0c9ee702463555275a41f8a2fb65fe and a total number of 946 components indexed 2024-02-23 16:24:24,995 - modelscope - INFO - Use user-specified model revision: v2.0.4 Downloading: 0%| | 0.00/840M [00:00
老师你好!使用整合包,在一件三联的时候,我的GPU imformation显示的是:Unfortunately, there is no compatible GPU available to support your training. 所以一件三联没有成功。这个说明我的笔记本硬件不符合要求吗?一定要有独立显卡?
大佬第一步切片的时候报错File "C:\Program Files (x86)\AI\GPT-SoVITS-beta0217fix2\GPT-SoVITS-beta0217fix2\tools\slice_audio.py", line 6, in from my_utils import load_audio ModuleNotFoundError: No module named 'my_utils'怎么解决呀
这种报错怎么整啊 UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`. In PyTorch 1.1.0 and later, you should call them in the opposite order: `optimizer.step()` before `lr_scheduler.step()`. Failure to do this will result in PyTorch skipping the first value of the learning rate schedule. See more details at
补充:第一环节中最后一步,给文本打标注那里忘说了一句,修改完文本后要先点【Submit Text】按钮
附Colab脚本:colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb#scrollTo=e9b7iFV3dm1f
怪不得savefile,还是不变,软件效果真是太棒了
这版Colab脚本非常棒,调整一下目录位置后能正常执行,在语音转文字上准确度很高,要修正的字很少 (我才改了两个字),在文字转语音上速度也比抖音上网友的版本快(也有可能和Colab不同时段负载有关),能直接重复使用先前建立的模型,真是太完美了。
@@foserli 执行最后一步把训练好的模型导入,再打开推理界面
@@foserli 关闭VPN或者梯子软件即可
@@AIDiscovery2045 config.py里第10列 is_share_str = os.environ.get("is_share","False") 最后的False改成True就能显示 public URL了。
非常有用! 真實,操作詳細, 照這樣出片下去,你會是AI界 工具介紹類的權威頻道
太牛了,感谢感谢,省钱省事,自媒体良心博主 win10没问题,效果杠杠的
感谢支持~
关注很久了,每次带来的软件多超级实用
感谢支持!
平时不爱评论的我,特别动动手指给个好赞吧,的却讲的太详细了。期待博主的更多更新
谢谢你的支持~😃
太棒了,这个对做视频的人来说,做旁白解说太有用了!
太棒了 秩序井然 层层推进 细致贴心的讲解
不错,又有新的 a.i 工具了!,期待接下来还有更多的介绍😊,谢谢🎉❤
感謝分享,簡直跟原聲一模一樣😁
您的讲解得太好了👍👍
好棒的分享!!谢谢!! AI太强啦
絕對是干貨分享❤❤❤❤
非常的牛 又快又好用😎
逆天!感谢分享!
用整合包试了可行,克隆出来的声音还行
非常感谢,正在之前看的换脸,正在考虑要什么方案换声呢,感谢大佬分享
很细心,连怎么删除都讲!
好屌喔
太誇張了
很厲害 可是聽起來很沙啞 感覺還不太真實,但我相信再過幾年可以改善這問題
方言才是王道
相当强悍啊
外面确实能学习很多东西,不像有的地方连个剪辑都要用来坑你的钱,各种课程,总是利用信息差去坑自己人,想学东西还是上这来。。
这个效果就完全像是你在念稿念顺口溜说外语或是在用别人现成的配音一样😮
太牛了
可以做成前段时间国内抖音很火的改歌词唱歌的那种吗?抖音电影解说现在卷的全是唱歌了,用的ACE Studio,直接改了歌词之后,可以唱歌
大佬,两次微调之后,GPT_weights等两个文件夹里没保存的模型是什么情况呀
我的电脑手动安装了还是运行run.bat无反应,如果可以云端执行就好了
非常详尽的教程。请问老师,如果mac环境下,不使用cuda,而使用mac的显卡加速,能成功搭建训练模型么?
mac支持M1和M2芯片,请参考官网手动安装指令
谢谢,昨天测试了。但是到打标住的环节总是出错,还没搞明白问题原因。@@AIDiscovery2045
博主你好,训练的素材需要语调都统一还是说包含多种情感语调的,比如开心,愤怒,伤心的?如果可以多种情感语调的,那训练好模型以后克隆推理的时候才方便使用不同参考音频生成不同情感语调的音频。
素材有多种情感确实在推理时可以选择不同的参考音频;但更重要的是素材的语音清晰度
@@AIDiscovery2045 我的意思是我的目的是为了生成不同情感的音频,那我训练模型所用的素材也需要不同情感风格的音频还是统一风格的音频,只是在推理的时候用不同情感的参考音频生成不同风格的而已?
@@LiuxixiGua 统一风格和不同情感的都可以;参考音频的说话语气会影响推理结果
@@LiuxixiGua 你也可以看下频道里另一期关于gpt-sovits控制情感语气的视频
ua-cam.com/video/SL9WIPSd10M/v-deo.html
我觉得好神啊,西游记里取的女声,竟然配音感觉把握得那么准,Ai能力吓到我了。 谢谢分享 问下GoLab上能用吗
可以,视频下方详细说明里有链接
这是一个恨棒的频道,我已经订阅。 想请问若这个开源软件更新后,我是需要重新再下载一次吗?并且需重复在执行一次模型训练的动作吗?谢谢您
整合包需要重新下载,模型可以复用。
@@AIDiscovery2045 非常感谢您的回覆,另外我想请问这个开源软件可以使用繁体中文进行操作吗?
@@黃宗翰-v7s 推理合成文本可以写繁体,但参考音频的对应内容必须是简体。因为第一环节里ASR之后,标注文件里是简体的标注文本。
大神英语切片以后,然后一直训练失败,要怎么训练英语啊
训练英语素材跟中文一样的流程,唯一区别是ASR时选whisper。
老师在进行开始离线ASR 的时候出现SystemError: initialization of _internal failed without raising an exception怎么办啊
硬件什么配置
6G 显存
@@智梵傅 ASR模型有没有自动下载,在C盘Cache目录里
粤语好像不能使用呢
感觉机械感还是不少,如果训练够久不知道会不会好些。
大佬你好 我在微調訓練中 Sovlts訓練中 已完成 但SoVITS_weights資料夾內是空的
命令顯示這串文字:RuntimeError: cuFFT doesn't support signals of half type with compute capability less than SM_53, but the device containing input half tensor only has SM_52
能否請大老支援 謝謝
两种可能,一是显存配置低了;二是请至该项目github官网下载最新的版本
有没有把英文视频语音翻译成中文的ai 神器
最近一期6个AI工具里有,openai开源的whisper
另外,推理的时候上传的参考音频必须是训练模型打标生成的音频吗?
参考音可以用切割后的5秒左右音频
@@AIDiscovery2045 谢谢博主,还有个问题,由于自动切割成4s的音频,导致有些语句断开了,我就在打标页面将其合并,我看打标页面也有分割音频按钮,但是不知怎么再将该合并的音频按照合适的位置再切开,请问该如何操作呢?
@@LiuxixiGua 不要用打标页面合并、切割 功能,BUG很多
显卡是 NVIDIA GeForce GTX 960M,是不是配置太低了?提示“很遗憾您这没有能用的显卡来支持您训练”
这个配置确实有点低。不过你可以安装一下显卡CUDA驱动试下,cuda11.8
还有个问题大佬,我在云平台训练好后,把训练好的SoVITS_weights和GPT_weights文件下载到本地对应文件夹里,怎么用不了啊?合成出了视频但是没有声音
刚留言的一堆报错问题被UA-cam删了,就是log目录下面没有任何新建文件,但是提示有“输出logs/实验名目录下应有23456开头的文件和文件夹”,另外就是一堆Python的报错,传上来被删掉了,应该如何解决?
老師好。請問出現這個問題該怎麽處理?
2024-02-23 16:24:24,275 - modelscope - INFO - PyTorch version 2.0.0+cu118 Found.
2024-02-23 16:24:24,277 - modelscope - INFO - Loading ast index from C:\Users\User\.cache\modelscope\ast_indexer
2024-02-23 16:24:24,417 - modelscope - INFO - Loading done! Current index file version is 1.10.0, with md5 dc0c9ee702463555275a41f8a2fb65fe and a total number of 946 components indexed
2024-02-23 16:24:24,995 - modelscope - INFO - Use user-specified model revision: v2.0.4
Downloading: 0%| | 0.00/840M [00:00
可能是你的显卡CUDA版本高于11.8
哥咱就是说,能分享一下模型吗,电脑太慢训练不了
**施工中,请静候佳音** 是什么情况?
这部分功能还没开发完成
有人用粵語測試這個人工智慧模型嗎?ai模型支持粵語嗎?
这个暂时还不支持粤语,包括闽南语也不支持。
一鍵三連時3-bert資料夾沒東西....問題出在哪
看起來是'预训练的中文BERT模型路径'出問題
可是我不知道問題出在哪,而且我用的是日文的語音檔....
感觉很复杂 有没有更简单的工具 😂
老师你好 问下 这个文件生成 可以用在电销机器人里吗
生成的是标准格式的WAV音频文件,应该各类播放软件都能支持
声音已经成功切割 为什么我的 asr 批量处理的 出来的list文件为空 里面什么都没有
你培养出来的女王声音分享下呀0.0 懒人准备只拿不自己生成
好厉害的 ai
請問粵語可以訓練嗎
目前还不支持方言
老师, GitHub上下载的的 ZIP 就是整合包吗?还是老师这里单独准备的整合包?
ZIP就是整合包。
谢谢。有没有推荐 text to speech 的免费的?目前都是超过一定字符收费。
这个就是免费的,且开源;但需要自己训练模型。
MeloTTS也是免费,但只有一种自带的音色可选。这期视频有介绍 ua-cam.com/video/5WHvFLDZg18/v-deo.html
请问下,如果是法语、西班牙语或者是其他国家的语言,应该怎么选择?
目前还不支持法语和西班牙语的训练
请问老师,这个训练的音频是越长越好么?我这里有几个小时的音频素材,不知道是不是全部拿来训练更好。。
不是越长越好,声音素材音质没有杂音,10-15分钟就能训练出很像的模型
为啥我去人声,最后文件夹里面没文件啊...哪里错了
自带分离工具可能有问题,可以试试用单独版,这个分离工具在VALL-E-X那期视频有介绍
想请问ASR批量处理后为什么不会生成新的list文件呢?感谢
可能是语音没有识别成功,ASR时切换到命令窗口看下输出信息有没有报错
我下载的prezip, 2-gpt-sovits-变声下面显示的是施工中,请耐心等待。这是我没弄好还是这个软件现在暂停使用
做大篇幅的语音阅读,这个适合吗?
建议多批次,每段300以内
一些模型可以吗
用他生成400多字的文案,但是它经常会丢一两句直接跳过,或者重复一两句,怎么解决啊,就是输出的中文啊
ua-cam.com/video/SL9WIPSd10M/v-deo.html
FileNotFoundError: [Errno 2] No such file or directory: 'logs/讲故事男声1/2-name2text-0.txt'
错误: 没有找到进程 "8584"。
错误: 没有找到进程 "10860"。
老师,一键三连时报错,是哪里出了问题?
看出错信息好像是路径不对;对着视频看看标注文件那填写的路径是不是不完整
好的,我再查查,谢谢老师@@AIDiscovery2045
呀,我没看到你下面的补充,我再试试,那个脚本是啥?需要加进去吗?@@AIDiscovery2045
我也是这里报错
后来您这个问题解决了吗?怎么解决的?
对比sovist v4那个集成版效果区别大吗,那个要训练几个小时成模型再推理,要的素材30分钟以上切成10s左右的素材,效果唱歌还行,这个版本没有训练过程不知道效果差距大不大
目前这个版本只有TTS的功能,RVC也就是翻唱功能还没开放。至于效果可看视频里几个克隆例子
老师你好!使用整合包,在一件三联的时候,我的GPU imformation显示的是:Unfortunately, there is no compatible GPU available to support your training. 所以一件三联没有成功。这个说明我的笔记本硬件不符合要求吗?一定要有独立显卡?
是的
考虑云主机
辛苦了。谢谢。我发现一个问题,我用中文作为Model name后报错。改英文名通过。但是第三步死掉了:In construction, please wait
看看命令窗口有没有输出训练模型的进度,两个模型训练还是需要点时间的。我演示用的9分钟录音大概跑了十几分钟
界面没有出现,只有in construction 的提示。我再重新试试看。@@AIDiscovery2045
谢谢。成功了。虽然界面不是很方便,但效果确实很厉害!有一处需要注意,就是校对文字的时候,每一页都要存一下。我就是在第二页存了,不知道这个,第一页等于没有校对。@@AIDiscovery2045
这个怎么用啊?有软件直接可以安装?
为什么要这样安装?不是有压缩包解压即用吗
目前整合包并不一定适合所有机器环境,整合包通用就不用手动安装了
整合包好像删了@@AIDiscovery2045
請問原本語音是英文,要怎麼操作?
训练语音暂不支持英文;推理支持中英混合
挂不得英文的没有办法切割@@AIDiscovery2045
能够长文本 不切割语音吗
最长测试过一次合成1000字左右,没有漏读发生
请问博主,我要翻唱一首歌,还要更改歌词,用这个AI能做到吗?
目前还没有翻唱功能。想翻唱可以看这期,但改不了歌词。ua-cam.com/video/ocXOeMZc1XI/v-deo.html
手动安装的第一步就提示错误:failed to load library 'libcurl-4.dll'
视频的12分05秒克隆的那一步
@@YSP1996 能用整合包尽量用整合包,解压即用。不推荐手动安装。另外,需要英伟达显卡,否则跑不动
@@AIDiscovery2045 显卡没问题
@@YSP1996 重新安装下GIT 试试
群晖上可以用吗?
最后找不到训练的模型,不知哪部出错了
训练时要看下命令窗口里的输出信息,会看到错误提示
问下如果要配置一台差不多的台式 需要什么级别的显卡和CPU 内存32够吗?3060+32内存 顺带剪剪视频 加上一些常用的AI工具什么配置能跑起来?
应该够了,这个AI其实8G显存就能非常顺畅
兄弟,你这个CPU和显卡分别是什么型号的,我也准备整一台这样的设备,现在用的老机器都快10年了,200字文本转语音耗无法言语,时真的比蜗牛还慢
老师您 好,第一步语音切割,提示我输入路径不存在,怎么回事儿?
路径弄错了吧
大佬,最后一步,推理模型,提示施工中请静候佳音,怎么解决?
施工中不是推理,还未开放的RVC,推理功能在下面一行
要先安装python吗?
整合包不需要;N卡就先安装好cuda
请教一下,我老是卡在ASR处理这一步,显示:funasr_asr.py: error: the following arguments are required: -o/--output_folder,有解决办法吗?用的是beta0217版
看出错信息可能问题在输出目录设置上。使用默认输出路径试一下;另外检查下整合包解压路径里是否有中文目录
你好,一键三连提示中途错误,我的显卡是:NVIDIA Geforce GTX 660,显卡信息,显示:很遗憾您这没有能用的显卡来支持您训练,命令框显示:TypeError:str expected,not Nonetype
traceback (most recent call last), 请问老师是不是我的显卡不支持?还是配置有问题?
660估计跑不动,AI用到的依赖包不支持
请问这个必须是N卡吗?Intel和AMD的核显就无缘这个工具了吗 我在这两种设备上执行到最后一步的时候直接报错 控制台错误中有cuda字样
上云吧,免费的colab可以跑
另外,请问这次训练出来的模型,下次可以用吗?还是要重新训练?
下次可以用直接,前面步骤跳过,直接钩选推理标签就能克隆了
太棒了!谢谢。@@AIDiscovery2045
大佬第一步切片的时候报错File "C:\Program Files (x86)\AI\GPT-SoVITS-beta0217fix2\GPT-SoVITS-beta0217fix2\tools\slice_audio.py", line 6, in
from my_utils import load_audio
ModuleNotFoundError: No module named 'my_utils'怎么解决呀
AI相关的应用,特别是整合包,不要放到C:\Program Files (x86)目录下,移到C盘根目录,或者其他盘;目录里不要有空格、汉字等
第二步微调训练模型,为什么会这样啊lightning_fabric.utilities.exceptions.MisconfigurationException: No supported gpu backend found!啊啊啊笔记本还是用不了
No supported gpu backend found!
没找到显卡
手機怎麼弄
这个有点复杂
我的天哪 !!
之前的问题解决了,是独显检查不出来,改了相关文件的检测,把GPU改为0,但是1Ba-SoVITS训练部分,既不报错,也不知道有没有生成模型,也不保存模型,这个是真没辙了,还请老师帮忙参谋一下,看看如何解决好?
显卡问题,程序用到CUDA,太老的型号可能找不到相应的依赖包和驱动
@@AIDiscovery2045 已经更换更高级别的显卡,顺利完成声音克隆,感谢老师的指导!
这个最低支持什么型号的显卡
我想问下,这个用于训练的语音文字在哪里找?我是随便说什么都可以吗?随便内容都可以吗?
要以看下视频中声音克隆那一段的演示,推理部分
哎,好难啊。第一步我都把音频文件的路径填了进去了,但是切分的时候提示输入路径不存在
因为你的系统默认不显示文件扩展名。复制的文件名可能少了扩展名。
Mac可以用这个吗?
可以,但只支持CPU运行,效率非常低。
这个对显卡和电脑有要求吧
嗯,至少6G显存,16G内存
大佬,我进行到微调训练后,你说的sovits-weights和,gpt-weights文件夹里都没有模型,应该怎么处理
那估计是在一键三连按钮那里就报错了
请问大神,我的2-GPT-SoVITS-Voice Changer页面没有任何功能。只显示In construction, please wait,是怎么回事
是这样的,目前这块功能还没开放
@@AIDiscovery2045 那我就没办法模拟声音了呀。我做到两个weights文件的时候就终止了,两个文件夹都没有文件产生。
打开出错,通常每个套接字地址只允许使用一次什么意思啊?
运行前关梯子
有没有跟我一样的,全部都没问题,到最后训练完没有模型
机器配置够吗,看看命令窗口是不是爆显存了。
@@AIDiscovery2045 电脑配置没问题,之前克隆过一次,只有一个模型,过几天再上去看什么模型都没有了,又重新克隆,结果死活刷新不到其他模型
能不能帮我训练一段祝福语呀
你好,解压出错,提示其中一个文件是不受支持类型,什么原因。win11
可能是网络原因下载的整合包的文件不完整
我的媽阿, 這東西也太強大了, 這恐怕是毀天滅地性的創新, 很容易被濫用
这种报错怎么整啊 UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`. In PyTorch 1.1.0 and later, you should call them in the opposite order: `optimizer.step()` before `lr_scheduler.step()`. Failure to do this will result in PyTorch skipping the first value of the learning rate schedule. See more details at
这是用整合包运行报错的吗?
@@AIDiscovery2045 对,运行到sovits训练的时候报错了,我从网上查了查,让改几段代码,但是我不知道是哪个文件
@@WealthJourney127 整合包可能在一些机器上运行不了。试试换声音素材
@@AIDiscovery2045 不是电脑的原因,因该是PyTorch版本的原因
@@WealthJourney127 整合包自带的python3.9+pytorch2.0.1,你可以试试手动安装;我手动安装测试的是python3.10.6+pytorch2.1.1+cuda11.8,视频后半部分有演示
请问目前是只能支持中日英三种语言的输入和输出吗,有什么方法可以训练其他小语种吗
暂时没办法,底模不支持
可以試試看SVC