GPT-SoVITS整合包 | 声音克隆新纪元!1分钟完美声音克隆,完美复刻任何语音、语调、语气!效果超神
Вставка
- Опубліковано 27 сер 2024
- 看标题就知道了,这个声音克隆工具神了,过程简单,快捷,效果完美!
夸克:pan.quark.cn/s... 提取码:rCpa
mega:mega.nz/folder...
讨论群:t.me/+E0YOhSEc...
-------------------------------------------------------------------------------------------------------------
💥全网最快最稳定VPN:
💎主流AI 会员优惠1:nf.video/7sSbN (优惠码:yqmm)
💎主流AI 会员优惠2 :shorturl.at/nKQT7 (优惠码:QS666)
🎈PS AI
🎈ChatGPT Plus
🎈Netflix
🎈Midjourney
🎈Spotify
🌟5ber优惠链接(9折):esim.5ber.com/...
🌟esim海外手机号购买: • 5ber神卡,帮你足不出户,轻松拥有海外手机...
-----------------------------------------------------------------------------------------------
AI声音克隆: • 语音克隆vits | 训练自己的声音模型 |...
一键换脸2.0: • Roop换脸- v2.0整合包 | 一键...
去除水印: • 【超详细教程】去除水印 ,简单 ,易操作 ,...
文字转语音: • 【吐血推荐】【AI文字转语音工具】 超强高...
太细了,连报错都演示出来了,赞!!!太赞了!
非常感谢,期待的终于来了,就喜欢简单免部署的,点赞
非常感谢!up讲解非常清晰,
太強了~~~比我之前還花10美金買colab算出來的來強
这个确实牛,作者还是免费开源,纯粹是做贡献了
很棒 很棒!
好牛。有好多可以玩的。订阅点赞
非常好
老师您好 请问目前您所使用过的效果最自然,效果最逼真的声音克隆工具是哪一款呢?😊
这个就不错,算最好的那一种了
牛
两次都这样 做到微调部分了
File "D:\AAshengyinkelong\GPT-SoVITS\GPT_SoVITS\AR\data\dataset.py", line 107, in __init__
self.init_batch()
File "D:\AAshengyinkelong\GPT-SoVITS\GPT_SoVITS\AR\data\dataset.py", line 187, in init_batch
for _ in range(max(2, int(min_num / leng))):
ZeroDivisionError: division by zero
如果步骤没错,就换一段语音试试,少一点排除下异常
謝謝分享!!!
請教大大!!!
1.SoVITS训练完成.
2.GPT訓練 ....GPT训练完成...RuntimeError: unmatched '}' in format string....GPT_weights內沒檔案.....不知何問題!!!???
再試一次出現:
1."C:\AI\GPT-SoVITS
untime\python.exe" GPT_SoVITS/s1_train.py --config_file "TEMP/tmp_s1.yaml"
Seed set to 1234
Using 16bit Automatic Mixed Precision (AMP)
GPU available: True (cuda), used: True
TPU available: False, using: 0 TPU cores
IPU available: False, using: 0 IPUs
...
RuntimeError: unmatched '}' in format string
2.GPT训练完成....GPT_weights內仍沒沒檔案!!!.....不知何問題!!!???
我也是1660的顯卡,我是前面步驟都沒問題,但是就是推理那邊的時候,我的SoVITS_weights是有文件出來,但GPT_weights裡面是空的
1660需要关闭半精度
@@yhqqxq 我也是这个问题。第一次使用笔记本3070显卡,输出正常。第二次换了个音频,gpt_weights里就没有文件了。第三次换了个电脑双1080ti,同样gpt_weights没有输出文件。请问这个半精度在哪里关闭?
换个音频文件试试,我试了4个, 2个成功,2个不行,就是这个问题,没有文件。
@@lionyang5420 3070应该是支持半精度的,换了音频可以了吗?
@@yhqqxq 换音频文件OK
我操作时候,它显示无法识别文件
請問大大~GPT-SoVITS只能合成文本是嗎?可否合成歌聲?謝謝!
没试过,但应该是不行的
我也是1070的顯卡,我是前面步驟都沒問題,但是就是推理那邊的時候,我的SoVITS_weights是有文件出來,但GPT_weights裡面是空的,请问怎么回事呢?
没别的提示了吗?你试试将batch_size调到1
我也是这个问题,应该是显卡问题吧。命令符里面还在下载东西一样
@@Huzhezhong 可以改一下模型名字,重新训练一次试试
感谢分享,没独立显卡,Ultra 7能用吗
没独立显卡好像不行
請問能否跳過第一步驟,直接使用自己剪的短音頻訓練,還是一定得透過程式分割音頻,必須讓音頻保持一樣長度大小??
可以跳过,不过效果不能保证
@@yhqqxq 謝謝
骑士老师,你好!在一件三联的时候,我的GPU imformation显示的是:Unfortunately, there is no compatible GPU available to support your training. 所以一件三联没有成功。这个说明我的笔记本硬件不符合要求吗?一定要有独立显卡?
对,需要N卡
1650显卡,去除背景错误,跳过这步到训练模型时,没有新的模型文件生成。把半精度改成False还是不行
麻烦问一下,asr模型有网盘资源吗?那一步直接下不了
ASR进程的时候,无法定位程序输入点
老师你好,为什么GPT训练会如此慢,视频上您是3060,几乎秒完成,我是2080TI 22G显存,半小时都不动一下,显存已经拉满到21.6G了
这个训练很快的,你这个确实不对劲,音频多长?建议你换一段声音试试
你好,就一个问题。关机后第二天,得重新操作一遍吗?之前训练好的模型如何到最后的输出界面?谢谢。
不用,直接勾上“是否开启TTS推理WebUI”,就可以打开输出界面了,上面有选项可以更换模型
@@yhqqxq感谢❤
请问一下切割成功后只有一个声音文件是啥情况😅
請問在GPT訓練時出現 runtimeError : unmatched '}' in format string 是什麼意思?
路径或者文件命名,检查一下试试
我找不到这个文件没办法进行下一步,不知道怎么回事试了很多遍都没有这个文件出来 .list
路径填对了吗,这工具有时候填文件夹,有时候是填文件,要仔细分辨
請問 當我照視頻跑完流程,不過卻只有訓練出SoVITS模型,GPT模型列表裡還是只有預設的檔案,並沒有像視頻裡有多個檔案(所以也沒數字大的可選),請教是我漏勾什麼選項嗎? 對其效果有沒有什麼影響?
如果确定都训练完了,那就是显存不够,或者虚拟内存太低。对照着你的显存调整batch size,调高虚拟内存
@@yhqqxq 確定兩個都有按訓練。我再試著調高虛擬內存看看,感謝回答!
@@yhqqxq 😥還是不行! 跑完訓練GPT模型列表都只有一個GPT_SoVITS/pretrained_models/s1bert25hz-2kh-longer-epoch=68e-step=50232.ckpt
訓練出來的SoVITS模型倒是能用,只是聲音相似度約五、六分。不知是否有影響⋯
請問是否只需保留數字大的模型,數字小的模型能刪除嗎?
看到有新版本了,我該用新版試試,感謝up主~
@@user-bh4oq4cz8r 可以删
尊敬的UP.我发现我切片的时候.分割结束后还是原音.并没切到.请问这是哪里出了问题
看看是不是报错了
这种情况我也遇见过,音频文件低于1分钟,将 500改为70就好了,500是默认值
请教一下,为什么他们不开发成 一个 简单操作的页面,比如说选一个原始语音,然后设置一个 生成地址,这样多简单,为啥还要这么多步骤,操作起来有些麻烦😁,普通人不好操作
这个是b站花儿不哭大佬一个人开发的,免费分享出来给大家用,应该是人力有限吧,这么好的效果,其他就不能要求太多了
老师,gradio怎么出来的啊?文字校对那个请问在哪里?
运行完有地址啊,点一下
老师,我第一步双击go-webui
就进不去,出现运行程序,点任意键继续,之后就没反应了。我用的是笔记本,是配置问题吗?
是不是没独立显卡?
应该建立一个群大家一起学习啊
有啊
错误,每个网络地址接口只允许使用一次咋办國。
大神您好!有训练好的模型,拿来就能用的吗?
么有啊,这个一分钟语音就行,很简单的
最后生成的文件在哪里呢?
3060显卡切割完 程序显示远程主机强迫关闭了一个现有的连接
你好请问原来弄好的模型关了任务在打开这个app怎么继续用啊,还有能不能继续迭代什么的,不知道怎么弄,我现在有个30步的模型,我重启app之后不知道怎么让他变成50步
训练好的模型在第二步刷新就有了,30变50这个问题,视频里专门说了,在后面一点,你可以看一下
@@yhqqxq 谢谢牢大,我再看一下,这个效果很好,但是我感觉语速太快了有没有什么方法能让他语速稍微慢一点
@@frankzhong1251 声音右侧三个点,应该可以调整语速。不行的话,就只能下载下来再处理,或者是对声音原素材进行处理
你好,请问这个报错是什么原因?
RuntimeError: "slow_conv2d_cpu" not implemented for 'Half'
什么显卡
@@yhqqxq A卡,好像很A卡不行。所以我这边已经使用云端训练已经成功了,谢谢啦
@@user-qf9nh8dv7d A卡确实不行,解决就好
你好 gtp训练后刷新模型路径没有是怎么回事?
请问,我切割后还是一个文件,文件没有切割成多个是什么原因呢,提示完成了
多长的音频?换一个试试
@@yhqqxq 只有37秒
什么时候支持语音转语音?
感谢分享,现在GPT和SoVITS都训练完了,但是没有看到任何保存的模型,问题出在哪,步骤都没有问题。
什么显卡
N卡,已经按提示更新驱动了,现在进行到2个模型训练已完成,但没有看到保存文件,没更新前只有一个CMD窗口要求更新的
@@user-sf1mn1gl3q 16系显卡吗?
@@yhqqxqGTX1050,前面的步骤都没问题,2个都显示训练完成,就是推理那里无法保存训练结果
@@yhqqxq 大神您好,我也是这个问题,但我有时候会有模型,有时候没有
大神我是直接,进入最后一页1C推理,导入3-10秒音频WAV格式,直接就可以了,前面都可以不用做
最后那个我也试过,确实有时候也可以
试了,A卡不行,N卡得20系以上的
老师你好,这软件是不是需要电脑装子系统才能使用
不用啊
切割不出来多段视频
请问老师,我的第一步gowebui为什么进不去
启动不了?有什么提示
打开只允许使用一次,什么意思啊
骑士老师,这个好像不能唱歌,有点遗憾,语言克隆很棒👍
请问什么软件能很好的使克隆出的声音唱歌
唱歌这个功能,作者还在开发,我们耐心等待
@@user-ll7ki3wo4h RVC
大佬你好 最后生不不了模型文件怎么解决 命令窗口信息提示OutOfMemoryout Error 3050显卡
爆显存了,检查数据集中要没有超过'显存数'秒的音频,有的话手动切分至'显存数'秒以下,重新开始ASR。并且在训练时调低batch_size。
@@yhqqxq 感谢大佬我试试
这个视频非常棒,但是我发现一个问题,这个好像最多就只能训练50轮就到max了
这个工具就是这样的,训练少是本身的设定
请问远程主机强迫关闭了一个现有的连接。这是什么情况
这个一般不会影响运行,可以忽略,如果受影响了,就彻底重新开一次
老师,一键三连显示没有找到进程8892或者1万什么的数字是什么原因
有其他提示吗?只有这个看不出来
再显卡信息那里显示没有能用的显卡,是因为显卡太垃圾了还是没检测到?显卡名称是 AMD Radeon RX 6400
A卡只能用cpu
大佬SoVITS_weights和GPT_weights都没有生成文件
步骤没对,或者模型名字重复了,改一下
在文件夹里找到config.py,开头有一个is_half=True,改成False,关闭半精度。骑士哥,我没有这个文件夹啊,我只有config.py,不是文件夹,是个文件。更没有is_half=True这个东西,是哪里出了问题😭
大佬能给个联系方式,付费咨询一下,出不来,人都麻了
@@yunzhao3828 付啥费,不用,你邮件联系我吧
骑士老师,锐龙的显卡是不是不行
应该是只能N卡
能一次弄上万字吗
没试过那么多,估计够呛
模型没出来,weight文件夹里什么都没有,是保存到别的文件夹里了吗
什么显卡?
amd radeon graphics和gtx 1660 ti@@yhqqxq
@@user-rs7wq1ts6d 1660需要改一个设置,你翻一下评论,有改的方法
是将is_half=True,改成False吗?改完了,又试了一次还是不行🤣我又查看了一下进程,进程里有显示运行错误。RuntimeError: Parent directory logs/112233/4-cnhubert does not exist.@@yhqqxq
@@user-rs7wq1ts6d 文件路径呢?检查下,是不是有中文
哥,我一键三连出现 错误没有找到进程“19724” “11920”请问是什么问题?
应该是前面的步骤出错了,从头再做一次试试
warnings.warn("Detected call of `lr_scheduler.step()` before `optimizer.step()`.
这什么意思 走不动了
有些字他不读怎么办呢?
博主
是不是字太长了,短一点应该可以
@@yhqqxq 明天再去试试估计要分割
@@dayichou 分割出来的音频不要超过10秒
不錯,可惜還沒支持廣東話
大神🎉最后一步 输出的语音 没声音 是什么原因
成功了吗?有没有生成文件
说吧 录屏时候百度盘在下啥 这个速率是不舍开会员 毕竟不划算..
🤣观察这么仔细呢,你懂得
老哥,识别不了显卡,N卡太旧了,怎么破
砸了换新的,或者用cpu凑活过日子
up请问我可以用英文的音源吗
可以
一键三连中途报错错误: 没有找到进程 "4620"。
错误: 没有找到进程 "9520"。
报错后直接进入下一步是一样
@@user-xg7dl3nm5m 什么显卡
NVIDIA GeForce GTX 1650 (4096MB)显卡
@@user-xg7dl3nm5m 你先关闭半精度试试,如果不行就换一个音频文件
显卡不行,怎么弄,没有这么好的显卡,识别不出来!
用cpu也行,不嫌慢的话
A卡不行???
支持不好,出问题可能性很大
虚拟机能运行嘛 性能要求
没试过
你的这个降噪音和切分和批量这些能不能省略掉,既然是克隆,肯定都是在安静环境下录制声音样本了,所以你一半时间是在浪费大家时间,你非要把几分钟的视频做到10多分钟以上?
你跳着看呗
@@yhqqxq 从那开始看呢?
@@dingbangjiang 有这问的时间你都看完了。如果 是克隆自己的声音,国内都有很多不错的工具,为啥还要用这个。这个工具,很明显是让你克隆他人的声音啊,他人的声音,你不可能让别人给你录制样本吧
训练出来 读文本为啥没声音呢?
能合成应该不是软件的问题
@@yhqqxq 啥情况呢 咋办呢,,哎,按步骤一步一步走的!最后合成播放没有声音。。
@@norris3348 你是什么显卡?
@@yhqqxq 1660s
@@yhqqxq 1660s 第一步分离音频后 文件夹里 并没有分离的音频 文件夹是空的,
a卡可以吗大佬
A卡用cpu吧
为啥我的克隆出来再说胡话😅
如果步骤都对,那就是语音问题了,换一个试试
@@yhqqxq 好的,感谢
@@yhqqxq 声音是挺像,不过输入的文本读不完整,说一句漏一句。
请问文本字数有没限制,最大大概可多少字?
最好不要太长,可能会出问题,可以分段
使用的最新版本,在最后一步操作合成语音中现实error错误
大神,为什么我第一步去背景音结束以后,右边的框框就提示这个啊,不像您的WAV. success。打开文件夹里面也是空的。
tkggfyupth.wav.reformatted.wav->Traceback (most recent call last):
File "G:\tools\GPT-SoVITS\tools\uvr5\webui.py", line 82, in uvr
pre_fun._path_audio_(
File "G:\tools\GPT-SoVITS\tools\uvr5\vr.py", line 118, in _path_audio_
wav_instrument = spec_utils.cmb_spectrogram_to_wave(
File "G:\tools\GPT-SoVITS\tools\uvr5\lib\lib_v5\spec_utils.py", line 396, in cmb_spectrogram_to_wave
wave = librosa.resample(
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\decorators.py", line 104, in inner_f
return f(**kwargs)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\core\audio.py", line 576, in resample
util.valid_audio(y, mono=False)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\decorators.py", line 88, in inner_f
return f(*args, **kwargs)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\utils.py", line 294, in valid_audio
raise ParameterError("Audio buffer is not finite everywhere")
librosa.util.exceptions.ParameterError: Audio buffer is not finite everywhere
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "G:\tools\GPT-SoVITS\tools\uvr5\webui.py", line 90, in uvr
pre_fun._path_audio_(
File "G:\tools\GPT-SoVITS\tools\uvr5\vr.py", line 118, in _path_audio_
wav_instrument = spec_utils.cmb_spectrogram_to_wave(
File "G:\tools\GPT-SoVITS\tools\uvr5\lib\lib_v5\spec_utils.py", line 396, in cmb_spectrogram_to_wave
wave = librosa.resample(
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\decorators.py", line 104, in inner_f
return f(**kwargs)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\core\audio.py", line 576, in resample
util.valid_audio(y, mono=False)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\decorators.py", line 88, in inner_f
return f(*args, **kwargs)
File "G:\tools\GPT-SoVITS
untime\lib\site-packages\librosa\util\utils.py", line 294, in valid_audio
raise ParameterError("Audio buffer is not finite everywhere")
librosa.util.exceptions.ParameterError: Audio buffer is not finite everywhere
检查下你的声音,路径是不是带中文了
@@yhqqxq 没有中文啊。
@@Wesley-ur9uk 16系显卡不支持半精度,现在很多AI软件都默认开启半精度,所以你可能会遇到各种各样的问题。在文件夹里找到config.py,开头有一个is_half=True,改成False,关闭半精度
@@yhqqxq 大神新春快乐。今天试了该半精度,还是不行,唉
@@Wesley-ur9uk 去背景音不行,你先不去,直接跳过试试。看看能不能往下走
系统找不到文件路径是怎么回事,安装在g盘
黑窗提示发一下看看
@@yhqqxq win11系统
ASR进程的时候,无法定位程序输入点