[2025-01-17] 학습 코랩(RVC v2 Disconnected) 추론 코랩(Harmonify.ipynb) 현재 두 코랩 모두 오류 발생으로 인해 정상적으로 이용할 수 없는 상황입니다. 원인은 파이썬 버전이 3.11로 올라감에 따른 호환성 문제로 추측하고 있습니다. 오류가 발생한 지 얼마 되지 않아 앞으로 어떻게 될지는 알 수 없지만, 당분간 기다려야 할 것 같습니다. + ua-cam.com/video/TMh-6E0XlD0/v-deo.htmlsi=3XTV0h_UqZeZ7JDV 학습코랩 오류 해결영상을 제작했습니다 혹시 모르니 이것도 시도해보세요 추론 코랩의 경우, 단순히 파이썬 버전을 낮추는 것만으로는 오류가 해결되지 않았습니다. ----------------------------------------------------------------------- 학습 코랩 : colab.research.google.com/drive/1XIPCP9ken63S7M6b5ui1b36Cs17sP-NS UVR5 다운로드 링크 : github.com/Anjok07/ultimatevocalremovergui UVR5 코드 : 02aeb35c203ed0a9 목소리 변환(추론) 코랩 : colab.research.google.com/drive/1X8YR4Ruv7zzY8YAMPTfC7hkxqT_d4Q5d 0:10 학습 코랩 시작 4:40 음원 분리 7:20 목소리 변환(추론) ※필독※ 학습할 목소리 파일은 10분정도 필요하고, 노이즈,음악,에코 등이 없어야 합니다 WAV 확장자 파일 사용을 권장합니다 음성 파일 길이는 총 10분 ~ 20분 정도면 충분하며, 1분씩 여러개의 파일을 준비하셔도 됩니다 코랩을 장시간 방치하면 자동으로 연결을 끊을 수 있습니다 학습이 오래걸리므로 가끔씩 코랩을 봐주셔야 합니다 오류가 발생하면 영상 어떤부분에서 오류가 발생했는지 알려주세요 제가 최대한 도와드리겠습니다 + 오류문구를 적어주시면 좋아요 예시) 2:45 Index training 을 실행하면 오류가 나요 + 모델 추가학습방법 1. 1:20 부분에서 추가 학습할 모델이름과 변수를 과거에 했던 설정 그대로 적어주세요 2. 2:39 부분에 보이는 'Load preprocessed dataset files from Google Drive' 셀을 실행해주세요 3. 2:39 부분에 'Import Model from Drive to Notebook' 셀에 2333333을 입력하고 실행해주세요 4. 3:17 'total_epochs' 부분을 제외하고 훈련 변수를 과거에 했던 설정 그대로 적어주세요 'total_epochs' 여기에 목표 에포크수를 입력하시면 추가 학습이 가능합니다 :) 예시) 250에포크 모델을 300 에포크까지 학습을 하고 싶다면 300을 입력해주세요! 5. 4:00 훈련이 끝나면 실행해주세요 (기존 모델은 삭제되니 필요하면 미리 다운로드 해두기!) + 추론용 코랩 오류 해결 8:32 현재 해당 코랩에서 구글 드라이브 링크를 사용하면 오류가 발생하며, 이 오류는 코랩 자체의 문제입니다 임시로 'Pixel drain' 사이트에 모델 ZIP 파일을 업로드 하여 진행해주세요 (업로드후에 링크 복사하고 붙여 넣기 하기!) Pixel drain 링크는 일정 기간이 지나면 링크를 사용할 수 없는거 같습니다. 1주일마다 사이트에서 Zip 파일을 계속 업로드 하여 사용해주세요 (더 귀찮아짐__) 예전에 다른 추론용 코랩에서도 이와 같은 오류가 발생했었는데, 곧 업데이트가 멈추더라고요(사실상 섭종) 혹시 모르니 다른 코랩을 찾아봐야겠습니다 + 2024-3-15 기준 추론용 코랩에서 구글드라이브 링크 오류가 해결되었습니다 이제 'Pixel drain' 사이트를 사용하지 않아도 됩니다 구글드라이브 링크를 사용해주세요!!! + 코랩이 업데이트 되어서 영상과 다른 추가 설정을 하셔야 합니다 1:02 부분 아래에 'Download Pretrained Model' 셀이 있습니다 (업뎃 전 영상이기 때문에 영상에는 보이지 않습니다) 1:02 먼저 기존 방식으로 실행 하시고 추가로 Download Pretrained Model 셀을 실행하시면 됩니다 (설정은 아무것도 건들지 말기!)
@@너를바라보는니가 추측되는것으로는 1. 학습에 사용된 음성파일이 잡음이 너무 심할경우 2. 모델 학습 문제 (너무 많거나 적은 학습수, 또는 너무 적은 음성 파일) 3. 변환하려고자 하는 노래 특성상 목소리가 서로 겹치는 부분이 많거나 에코,화음,반주 등이 제대로 분리가 되지 않을경우 한번 검토해보세요 나머진 기술적인 문제인데 그건 해결하기가 어렵습니다 (조금 다른 변수로 모델을 다시 만들어 보는것도 방법일 수 있습니다) + 추가 질문을 하실때 여기 말고 영상 댓글로 달아주세요!
@@세이리아 추가 학습할 때 기본 실행하는 것들 다 실행 누르는데서 Load preprocessed dataset files from Google Drive 셀이랑 mport Model from Drive to Notebook' 셀에 2333333 기입후 실행을 추가적으로 하는 건가요? 추가 학습 땐 어떤 것들을 실행해야하는지 알려주시면 감사하겠슴다 선생님 ㅠ
@@dreamscometru1e 음원분리만 잘 된다면 아무거나 사용하셔도 됩니다 오류가 발생하면 영어로 오류문구가 출력되는데 그걸 적어주세요 KeyError 오류가 발생하는 원인은 1.오타나 잘못된 키 2. 키가 존재하지 않음 정도인데.. 이걸로는 문제를 특정할 수 없어요ㅜㅜ
@@dreamscometru1e 모델 설정이나 불러오는 과정 또는 모델 자체의 문제일 가능성이 높습니다 (모델이 잘못되었거나 학습이 잘못되었을 수 있습니다) 1. Zip파일에 pth, index 파일만 존재하는지 2. 본인이 설정한 이름의 pth 파일이 맞는지 3. G_2333333 또는 D_2333333 파일이 있는건 아닌지 (이건 사용하시면 안됩니다) 4. 모델을 불러올때 같은 이름을 사용했는지 5. 학습에 사용한 오디오 파일이 정상적인지
현재 추론 코랩에서도 오류가 발생하는 것 같네요ㅜ 고정 댓글에 추가로 올려주신 건 학습 코랩 수정 방법이라 마냥 기다리는중... 마지막 챕터 [Inference] 단계에서 ValueError Traceback (most recent call last) in () 3 main_dir = "/content/Harmonify" 4 os.chdir(main_dir) ----> 5 from lib.infer import infer_audio 6 from google.colab import files 7 from pydub import AudioSegment (생략) ValueError: mutable default for field common is not allowed: use default_factory 이렇게 오류가 뜨면서 중지되는데, 이것 역시 파이썬 관련해서 생긴 오류일까요?
Preprocessing and Feature Extraction 실행하면 can't open file '/content/Mangio-RVC-Fork/trainset_preprocess_pipeline_print.py': [Errno 2] No such file or directory 라고 뜨는데 혹시 이유를 아신다면 도움을 받을 수 있을까요?🥺
Exception: No pth model file was found in the extracted zip. Please check models/ zazaza During handling of the above exception, another exception occurred 구글 드라이브에 음원파잉 복사하고 붙여넣기 해서 실행하였더니 이렇게 떠요ㅠ
저는 트레이닝 부분에서 막혔습니다 에러 코드는 밑에 처럼 뜹니다 입력 값은 순서대로 50, 250, 16 이렇게 저장하였습니다 AssertionError Traceback (most recent call last) in () 7 8 ----> 9 assert 'pretrain_type' in locals(), "You need to download a pretrain! Please run the \"Download Pretrained Model\" cell before continuing." 10 11 AssertionError: You need to download a pretrain! Please run the "Download Pretrained Model" cell before continuing.
세이리아님처럼 원신 호두를 이용해 만들어봤는데 목소리가 뚝뚝 끊기고 꽤 부자연스럽게 만들어졌습니다. 인게임 호두 보이스를 잡음 없이 가져와서 학습 시켰기 때문에 학습 데이터 품질 부분에선 문제가 없는 것 같은데 뭐가 문제인 걸까요? 호두 음성대사들을 이어붙인 8~9분 가량의 음원으로 학습 시켰고 epoch는 300회로 설정했습니다.
선생님 선생님! ㅠㅠㅠ 이거 트레이닝 (훈련) 다 끝내고 Export Model from Notebook to Drive 까지 완료했는데도 rvcDisconnected 폴더에 완성된 다른 폴더가 안떠요 ㅠㅠㅠ 그냥 기존에 넣어둔 zip파일만 덩그러니있고 다른 폴더가 생성이안되는데 이거 왜이런가요 ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ
2:43 인덱스 트레이닝 과정을 하고 나면 폴더가 생기면서 인덱스 파일이 나오는데 (이때 폴더가 생성된다는 뜻) 전 과정을 모두 했지만 폴더가 뜨지 않았다는건 뭔가 문제가 있긴 한 거 같습니다 (원인은 모르겠습니다 드라이브 용량이 부족하거나 경로 문제.. 는 아닌 거 같고요) 시간이 조금 걸리더라도 천천히 한번 더 해보시는걸 추천드립니다 (방금 테스트를 해봤는데 이상은 없었어요!)
현재 해당 코랩에서 구글 드라이브 관련 링크에 오류가 있으며, 이 오류는 코랩 자체의 문제입니다 임시로 'Pixel drain' 사이트에 모델 ZIP 파일을 업로드 하여 진행해주세요 (업로드후에 링크 복사하고 붙여 넣기 하기!) 예전에 다른 추론용 코랩에서도 이와 같은 오류가 발생했었는데, 곧 업데이트가 멈추더라고요(사실상 섭종) 혹시 모르니 다른 코랩을 찾아봐야겠습니다
학습이 잘 진행됐다면 4:00를 실행했을때 pth모델 파일이 나와야 하는게 맞는데... index파일이 나온걸 보면 소스양 때문은 아닌거 같고요 가장 의심되는건 훈련쪽인데 이것만 가지고는 알 방법이 없네요 다시 만들어 보는걸 조심스럽게 권장해봅니다 저도 모델 10번은 넘게 만들었었어요
선생님 8:52 에서 막혔습니다. Download models using urls 에서 오류) Exception: Voice model directory mangya already exists! Choose a different name for your voice model. During handling of the above exception, another exception occurred: Exception Traceback (most recent call last) 1 frames in download_online_model(url, dir_name) 61 62 except Exception as e: ---> 63 raise Exception(str(e)) 64 65 #@markdown Enter in the model download url. The url could be a Google Drive url, HuggingFace url, or Pixeldrain url. Exception: Voice model directory mangya already exists! Choose a different name for your voice model.
No supported N-card found, use CPU for inference /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm. warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.") Attempting to load /content/drive/MyDrive/waa.wav... /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
No supported N-card found, use CPU for inference /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm. warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.") Attempting to load /content/drive/MyDrive/waa.wav... /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.") Attempting to load /content/drive/MyDrive/waa.wav... /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.") Attempting to load /content/drive/MyDrive/waa.wav... /usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn. 코드 보기 하면 마지막 적힌 코드가 이건데 여기에서 더이상 코드가 없어요
헉... 보통 이런 건 기밀(?)로 안 알려주셔야 채널의 컨셉(캐릭)이 산다구 생각했는데...! (?) 굉장히 잘 찍어주신 가이드네요 히히; 헉 저 근데 따라했는데, Inference 에서 실행 후 3초 정도 하다가 빨간 !가 뜨면서 중단 되네요. Inference 옆에 뜬 붉은 ! 쪽에 마우스를 올리니 "마지막 변경 이후 실행된 셀, 이전 실행이 예기치 못하게 종료되었습니다." 라는 오류가 보이네요. 어.. 근데 분명 Inference 이전(Download models using urls) 부분은 한 5초만에 깔끔하게 끝나고 초록 체크까지 떴는데... 이렇게 되네요. 혹시 추측 되시는 문제점이 있을까요? (만약 텍스트만으로 해결이 힘드시다면, 내일 영상 찍어서 다시 여쭤봐볼게용...!) (하나 문제는, 코랩 GPU 연결할 때 사용 가능치를 다 써서 개인 연결을 한 문제가 있었어요!)
@@세이리아 헉 그때 무슨 use CPU인가 하는 건 봤는데... 그걸 확인해서 같이 말씀드렸어야 했네요 (당시 했을 땐 오류 내용이 너~무 밑에 뜨길래 이게 해당 오류가 맞나.. 하면서 말씀을 안 드렸던 ㅠ) 그래서 오늘 다시 오류를 확인하려고 돌려봤는데, 이번엔 특이하게 코랩 T4 연결 시에 GPU로 되더라구요 (사용 가능치가 매일 초기화인가봐요!) 그래서 어... 하면서 그냥 똑같이 했는데 해결 했네요.. ㄷㄷ T4 연결이 (물론 확신은 못하지만) 안 되는 경우엔 뭔가 안 되는 게 있나봅니당..!! 아무튼 도와주셔서 감사합니다~
@@세이리아 앗 추가로 몇 개만 더 여쭤봐도 될까요? 1. 학습 시킬 때 음성 파일은 무조건 wav 파일이어야하나요? 아니면 ogg, mp3 같은 것도 상관 없나요? 2. 보컬이랑 inst랑 혹시 합칠 때 어떻게 합치시나요? 이번엔 영상 편집 프로그램으로 합쳤는데... 조금 더 좋은 / 편한 방법을 찾고 싶네요... ㅎ; 3. 한번 작업한 후에 다른 목소리 교육 시키려면, 기존의 파일들을 옮겨두고 하시는 편인가요? 아니면 조금 추가 설정으로 굳이 파일 안 옮기고도 진행 가능한가요...?
@@SinyoNuni1. Wav 확장자를 쓰는 이유는 단순히 무손실 포맷이기 때문입니다. mp3 같은 경우는 손실 압축이기에 목소리 일부가 손실될 우려가 있어 학습에 권장하지 않는 포맷입니다. 무조건은 아니고 wav파일이 없으면 mp3 쓰셔도 되지만 퀄리티 차이는 있을겁니다 (mp3를 wav로 변환해서 쓰지말기!) 2. Studio One 6 전 이거 사용해서 믹싱합니다. MR 과 보컬 + 리버브 정도 하시면 됩니다. 편한건 없어요! 3. 저는 다른 모델을 만들때 다른 구글계정을 사용하거나, 이름을 다르게(zip파일, 모델 이름) 하면 오류없이 같은 드라이브 에서도 다른 모델 학습이 가능합니다 :)
@@펑-c8x 1. 1:20 부분에서 추가 학습할 모델이름과 변수를 과거에 했던 설정 그대로 적어주세요 2. 2:39 부분에 보이는 'Load preprocessed dataset files from Google Drive' 셀을 실행해주세요 3. 2:39 부분에 'Import Model from Drive to Notebook' 셀에 2333333을 입력하고 실행해주세요 4. 3:17 'total_epochs' 부분을 제외하고 훈련 변수를 과거에 했던 설정 그대로 적어주세요 'total_epochs' 여기에 목표 에포크수를 입력하시면 추가 학습이 가능합니다 :) (200->300 이면 300을 적어주세요!) 5. 4:00 훈련이 끝나면 실행해주세요 (기존 모델은 삭제되니 필요하면 미리 다운로드 해두기!)
8:35 여기서 FileURLRetrievalError: Cannot retrieve the public link of the file. You may need to change the permission to 'Anyone with the link', or have had many accesses. 이렇게 에러가 뜨는데 뭐가 문제일까요? 공유 설정 했는데 그러네요
@@sukim3915 사본 공유 기능을 사용해보지 않아서 잘 모르지만, 훈련중인 모델이 백업이 되어있다는 가정에서 다른 구글계정으로 계속 제작하는 방법입니다. (만약 모델이 백업되어있지 않으면 진행 하던 건 초기화입니다) 드라이브 rvcdisconnected 폴더 자체를 다른 구글계정 드라이브로 옮긴뒤 (또는 자동으로 rvc~ 폴더가 생성되니 폴더 안 내용물만 복사하거나) 0:25 ~ 3:00 과정을 동일하게 하고 (변수도 모두 같게, 전에 index training 을 해서 index파일이 있다면 index training은 건너뛰세요) 3:00 부터 고정댓글의 훈련 이어서 하기(모델 추가학습)를 하시면 문제없이 될거 같습니다 추가학습방법은 기존 방법과 조금 다르니 고정댓글을 먼저 확인해주세요
1. 학습에 사용된 음성파일이 대체로 저음인 경우 2. 학습 수(epoch)를 너무 많이 잡은 경우 3. 음성변환을 진행할 노래 보컬이 저음인 경우 4. 데이터가 잡음이 많을 경우 등등 여러가지 원인이 있습니다 해결법으로는 1. 음성변환을 진행할때 피치(pitch)를 높이기 2. EQ 같은 프로그램을 사용하기 등등 여러가지가 있겠지만, 근본적인 원인을 찾아서 해결하는것을 추천드립니다 만약 모델 자체가 저음으로 학습된 것이라면 모델을 조금 다른 변수로 다시 만들어 보는걸 추천합니다 (사실 원인을 찾기가 어렵고, 저도 모델이 이상한거 같으면 다시 만들었습니다.) 학습시 사용했던 파일 특징이나 훈련 변수 설정등 정보를 적어주시면 좋을거 같아요!
각각 순서대로 인덱스 트레이닝이랑 트레이닝에서 뜬 문구인데 무슨 말인지 잘 모르겠어요ㅠ Exception: No features exist for this model yet. Did you run Feature Extraction AssertionError: You need to download a pretrain! Please run the "Download Pretrained Model" cell before continuing.
@@서영고-m9p 코랩이 업데이트 되어서 영상과 다른 추가 설정을 하셔야 합니다 1:02 부분 아래에 'Download Pretrained Model' 셀이 있습니다 (업뎃 전 영상이기 때문에 영상에는 보이지 않습니다) 1:02 먼저 기존 방식으로 실행 하시고 추가로 Download Pretrained Model 셀을 실행하시면 됩니다 (설정은 아무것도 건들지 말기!) 그래도 이상이 있다면 다시 말씀해주세요 :)
@@서영고-m9p 방금 테스트 해봤는데 모두 정상작동합니다 다른건 건들지 마시고, 영상처럼 하되 Download Pretrained Model 셀만 추가로 실행해주세요 0:12 부분 마우스 옆 삼각형 모양을 클릭하시면 '런타임 연결 해제 삭제' 가 있습니다 클릭하신 후 '다시연결' 을 클릭해 처음부터 다시 진행할 수 있습니다 순서 (설정은 영상처럼) 1. Dependencies 2. Set Training Variables 3. Download Pretrained Model 4. Load Dataset 5. Preprocessing and Feature Extraction 6. Index Training 7. Training 8. Export Model from Notebook to Drive 그래도 안되시면 편하게 말해주세요! 될 때까지 답장해 드리겠습니다! + Preprocessing and Feature Extraction 이거 실행을 안 하신 거 같습니다 확인해 보세요!
학습된 모델의 특성을 얼마나 참고할지(가중치) 정도로 알면 됩니다 따라서 숫자가 커질수록 모델의 특성(목소리 특성)등을 더 반영하지만 기계소리가 심할 수 있고, 숫자를 낮추면 상대적으로 모델의 특성 참고 비율이 낮아집니다 기본값이 0.75 인데 (0.4 ~ 0.8) 정도의 값을 입력해서 비교해보고 가장 마음에 드는 숫자를 선택해서 하면 되는데 그냥 0.75 하셔도 무방합니다 :) (사실 큰 차이는 없거든요 진짜 조금 달라지는 정도?)
윗 답글 읽었습니다! 마지막으로 추가 학습할 때 zip파일의 내용물이 바껴도 상관없을까요? 처음 학습땐 1,2 wav파일이 있다가 추가 학습 땐 3,4 wav 파일이 있는 식으로요. 물론 압축파일의 이름은 똑같이 해서 드라이브에 넣고 기입하고요 (번거롭게 답글 달고 질문 하는데에 친절히 대답해주셔서 정말 감사합니다😂😂)
@@너를바라보는니가 목소리에는 보통 여러 음역대가 있습니다 비교적 낮게 들리는 음과 높게 들리는 음이 있죠, 이러한 음역대를 적절하게 섞어서 15분 정도로 맞추면 좋은 모델이 나올거라고 생각합니다 아니면 2시간짜리 파일 중에서 랜덤으로 15분정도의 파일을 구해서 학습해보세요 추가로 여자 목소리를 학습시킨후 모델 A를 만들었다면 모델 A는 특별한 경우가 아니라면 무조건 여자 목소리만 변환할 수 있습니다 (여자목소리로 학습시킨 모델을 남자 목소리 변환에 쓰일 수 없다는 뜻입니다) 참고하세요!
@@dollaya2020 1. UVR5 -> 2. CHOOSE PROCESS METHOD 여기서 Audio Tools 선택 -> 3. CHOOSE AUDIO TOOL 여기서 Change Pitch 선택 -> 4. 적절한 SEMITONES 선택 (피치 조절 옵션 같습니다) -> 5. 오디오 파일을 넣고 실행
1:30 초 부터 Load Dataset 여기서xception Traceback (most recent call last) in () 47 48 if not os.path.exists(dataset_path): ---> 49 raise Exception(f'I can\'t find {dataset} in {os.path.dirname(dataset_path)}.') 50 51 os.makedirs(final_directory, exist_ok=True) Exception: I can't find eumseong-cv-munyujeong-dolpa-gyeolx in /content/drive/MyDrive/rvcDisconnected. 이라면서 오류가 납니다 이유가 뭘까요?
[2025-01-17]
학습 코랩(RVC v2 Disconnected)
추론 코랩(Harmonify.ipynb)
현재 두 코랩 모두 오류 발생으로 인해
정상적으로 이용할 수 없는 상황입니다.
원인은 파이썬 버전이 3.11로 올라감에 따른
호환성 문제로 추측하고 있습니다.
오류가 발생한 지 얼마 되지 않아 앞으로 어떻게
될지는 알 수 없지만, 당분간 기다려야 할 것 같습니다.
+
ua-cam.com/video/TMh-6E0XlD0/v-deo.htmlsi=3XTV0h_UqZeZ7JDV
학습코랩 오류 해결영상을 제작했습니다
혹시 모르니 이것도 시도해보세요
추론 코랩의 경우, 단순히 파이썬 버전을 낮추는 것만으로는
오류가 해결되지 않았습니다.
-----------------------------------------------------------------------
학습 코랩 :
colab.research.google.com/drive/1XIPCP9ken63S7M6b5ui1b36Cs17sP-NS
UVR5 다운로드 링크 :
github.com/Anjok07/ultimatevocalremovergui
UVR5 코드 : 02aeb35c203ed0a9
목소리 변환(추론) 코랩 :
colab.research.google.com/drive/1X8YR4Ruv7zzY8YAMPTfC7hkxqT_d4Q5d
0:10 학습 코랩 시작
4:40 음원 분리
7:20 목소리 변환(추론)
※필독※
학습할 목소리 파일은 10분정도 필요하고, 노이즈,음악,에코 등이 없어야 합니다
WAV 확장자 파일 사용을 권장합니다
음성 파일 길이는 총 10분 ~ 20분
정도면 충분하며, 1분씩 여러개의 파일을 준비하셔도 됩니다
코랩을 장시간 방치하면 자동으로 연결을 끊을 수 있습니다
학습이 오래걸리므로 가끔씩 코랩을
봐주셔야 합니다
오류가 발생하면 영상 어떤부분에서 오류가 발생했는지 알려주세요
제가 최대한 도와드리겠습니다
+ 오류문구를 적어주시면 좋아요
예시) 2:45 Index training 을 실행하면 오류가 나요
+ 모델 추가학습방법
1. 1:20 부분에서 추가 학습할 모델이름과 변수를 과거에 했던 설정 그대로 적어주세요
2. 2:39 부분에 보이는 'Load preprocessed dataset files from Google Drive' 셀을 실행해주세요
3. 2:39 부분에 'Import Model from Drive to Notebook' 셀에 2333333을 입력하고 실행해주세요
4. 3:17 'total_epochs' 부분을 제외하고 훈련 변수를 과거에 했던 설정 그대로 적어주세요
'total_epochs' 여기에 목표 에포크수를 입력하시면 추가 학습이 가능합니다 :)
예시) 250에포크 모델을 300 에포크까지 학습을 하고 싶다면 300을 입력해주세요!
5. 4:00 훈련이 끝나면 실행해주세요 (기존 모델은 삭제되니 필요하면 미리 다운로드 해두기!)
+ 추론용 코랩 오류 해결 8:32
현재 해당 코랩에서 구글 드라이브 링크를 사용하면 오류가 발생하며,
이 오류는 코랩 자체의 문제입니다
임시로 'Pixel drain' 사이트에 모델 ZIP 파일을 업로드 하여 진행해주세요
(업로드후에 링크 복사하고 붙여 넣기 하기!)
Pixel drain 링크는 일정 기간이 지나면 링크를 사용할 수 없는거 같습니다.
1주일마다 사이트에서 Zip 파일을 계속 업로드 하여 사용해주세요
(더 귀찮아짐__)
예전에 다른 추론용 코랩에서도 이와 같은 오류가 발생했었는데,
곧 업데이트가 멈추더라고요(사실상 섭종)
혹시 모르니 다른 코랩을 찾아봐야겠습니다
+ 2024-3-15 기준
추론용 코랩에서 구글드라이브 링크 오류가 해결되었습니다
이제 'Pixel drain' 사이트를 사용하지 않아도 됩니다
구글드라이브 링크를 사용해주세요!!!
+
코랩이 업데이트 되어서 영상과 다른 추가 설정을 하셔야 합니다
1:02 부분 아래에 'Download Pretrained Model' 셀이 있습니다
(업뎃 전 영상이기 때문에 영상에는 보이지 않습니다)
1:02 먼저 기존 방식으로 실행 하시고 추가로
Download Pretrained Model 셀을 실행하시면 됩니다
(설정은 아무것도 건들지 말기!)
게속 사용가능한가요?
목소리 너무 깨지는데 왜그럴까요
@@너를바라보는니가
추측되는것으로는
1. 학습에 사용된 음성파일이 잡음이 너무 심할경우
2. 모델 학습 문제 (너무 많거나 적은 학습수, 또는 너무 적은 음성 파일)
3. 변환하려고자 하는 노래 특성상 목소리가
서로 겹치는 부분이 많거나 에코,화음,반주 등이
제대로 분리가 되지 않을경우
한번 검토해보세요
나머진 기술적인 문제인데 그건 해결하기가 어렵습니다
(조금 다른 변수로 모델을 다시 만들어 보는것도 방법일 수 있습니다)
+ 추가 질문을 하실때 여기 말고 영상 댓글로 달아주세요!
8개로 6분~7분
정도 학습했는데 부족할까요?
@@세이리아 추가 학습할 때 기본 실행하는 것들 다 실행 누르는데서 Load preprocessed dataset files from Google Drive 셀이랑 mport Model from Drive to Notebook' 셀에 2333333 기입후 실행을 추가적으로 하는 건가요?
추가 학습 땐 어떤 것들을 실행해야하는지 알려주시면 감사하겠슴다 선생님 ㅠ
기다렸숩니다 😍😍😍
학습목소리는 몇분이 가장 적당한가여? 길수록 좋을려나
학습목소리 추출이 가장 난관이네요오
고수..
9:05 고정댓글 보고 픽셀어쩌구 해서 링크는 해결이 됐는데 마지막 메인세팅에서 자꾸 안 돼요..ㅠ KeyError 라고 뜨는데 뭐가 문제일까요…!ㅠㅠ 감사합니다 ㅠㅠ
KeyError 이거만 가지고 오류원인을 찾기어렵습니다
영상을 보고 천천히 따라해보세요
(방금 테스트 해봤는데 잘 작동합니다!)
@@세이리아 아 혹시 음원추출을 UVR5에서 꼭 해야할까욤?? 전 가우디오에서 하고 wav로 바꿔서 sound path에 넣어줬거든요! 이게 문제일까요...? ㅠㅠ
@@dreamscometru1e
음원분리만 잘 된다면 아무거나 사용하셔도 됩니다
오류가 발생하면 영어로 오류문구가 출력되는데 그걸 적어주세요
KeyError 오류가 발생하는 원인은
1.오타나 잘못된 키
2. 키가 존재하지 않음
정도인데.. 이걸로는 문제를 특정할 수 없어요ㅜㅜ
@@세이리아 오류문구는 inferred_audio = infer audio 가 빨강색으로 뜨고 맨 아래에는 KeyError: ‘config’ 라고 떠요ㅠㅠㅠ 감사합니다!!!
@@dreamscometru1e
모델 설정이나 불러오는 과정
또는 모델 자체의 문제일 가능성이 높습니다
(모델이 잘못되었거나 학습이 잘못되었을 수 있습니다)
1. Zip파일에 pth, index 파일만 존재하는지
2. 본인이 설정한 이름의 pth 파일이 맞는지
3. G_2333333 또는 D_2333333 파일이 있는건 아닌지
(이건 사용하시면 안됩니다)
4. 모델을 불러올때 같은 이름을 사용했는지
5. 학습에 사용한 오디오 파일이 정상적인지
현재 추론 코랩에서도 오류가 발생하는 것 같네요ㅜ
고정 댓글에 추가로 올려주신 건 학습 코랩 수정 방법이라 마냥 기다리는중...
마지막 챕터 [Inference] 단계에서
ValueError Traceback (most recent call last)
in ()
3 main_dir = "/content/Harmonify"
4 os.chdir(main_dir)
----> 5 from lib.infer import infer_audio
6 from google.colab import files
7 from pydub import AudioSegment
(생략)
ValueError: mutable default for field common is not allowed: use default_factory
이렇게 오류가 뜨면서 중지되는데, 이것 역시 파이썬 관련해서 생긴 오류일까요?
확실하지 않지만, 이것도 파이썬이 3.11 버전으로 업데이트 된 것이
원인 같습니다.
훈련코랩 처럼 3.10으로 다운그레이드도 해보고
나름 해결법을 찾아보려 했지만
계속 오류가 나더라고요.
이것도 일단 기다려봐야 될 거 같습니다
FileNotFoundError: [Errno 2] No such file or directory: '/content/Mangio-RVC-Fork/logs/karina3/2a_f0' 이라고 떠요 학습에서요 똑같이 했는데 ..?
load pro 실행할 때요 위에 gpu체크가 ...으로 바뀌는데 이거 때문에 그런걸까요?
@@빅진_AI load pro가 어떤 셀인지 풀네임으로 적어주실 수 있나요?
이것만 가지고는 해결이 어렵네요
@@세이리아 그게 아니더라도 모든셀을 실행할때 체크 표시가 ...으로 되면서 실행할 수 없음이라고 떠요
@@Roses_are_Rosie_bigjin
현재 RVC v2 Disconnected 코랩 자체에 문제가 발생했네요.
파이썬 버전이 올라가면서 생긴 호환성 문제가 원인이라는데...
지금은 기다리는 것 말고는 별다른 방법이 없네요..
혹시 Index Training에서 에러가 나는 사유도 알고 계시나요 ? ㅠㅠ 마지막 관문이라 아쉽네요...
2:13 이거 실행 안 하면 그렇게 뜨더라고요
아니면 학습 보컬 파일 문제입니다
데이터전처리,특징추출 안하면 학습이 진행안됩니다 데이터전처리가 ai가 학습하기 위해 파일을 세분화시키는 과정이라 없으면 진행안됩니다
감사합니다!
따라서 해서 소리 파일이 나왔는데 마지막에 변경된 소리가 순서가 한 5초간격으로 뒤죽박죽이 되버렸는데 어떡하나요? 대충 첫번째 소절부르다가 갑자기 하이라이트부분 부르다가 다시 두번쨰 소절 이어서 부르듯이 바뀌어서 나와요. 원본 파일은 멀쩡한데 목소리 변환만하면 섞여유
Preprocessing and Feature Extraction 실행하면
can't open file '/content/Mangio-RVC-Fork/trainset_preprocess_pipeline_print.py': [Errno 2] No such file or directory
라고 뜨는데 혹시 이유를 아신다면 도움을 받을 수 있을까요?🥺
방금 테스트 해봤는데 딱히 이상은 없었어요
코랩 Dependencies 셀의 하위 6개가 모두 실행되었는지 확인해보세요
혹니 Loaddataset 안누르셨나요? 그쪽의심되는데
@@abc-11556 영상 속 과정에서 안 누른 건 없었어요 ! 이유는 모르겠지만 런타임 끊었다가 다시 하니까 작동 되더라고요😅
마지막 작업을 했는데 목소리 시간이 29초 밖에 안돼요 해결 방법 좀 알려 주세요.
헉 세상에 그럼 현재로써는 이 방법으로 ai 학습이 불가능한걸까요? ㅜㅜ
ai 학습은 고정댓글에 있는 오류 해결영상을 참고하시면 가능합니다
그냥 이 영상으로는 불가능해요
도움 많이 받았습니다. 3번정도는 무리없이 썼는데, 오늘은 index파일없이 데이터가 나왔어요;; 이제 안되는 건가요~ 수정방법이 있다면 말씀부탁드립니다 ㅠㅠ
No features exist for this model yet. Did you run Feature Extraction? 다시해보는데 이런 오류가 뜨네요 ㅠㅠ 어떻게 하면 index파일을 추출할 수 있을까요 ㅠㅠ 모델은 오리지널그대로 따라했어요..
@@니다-y1y
2:11부분을 실행해야 index파일을 받을 수 있습니다
목소리 파일 업로드 하고 실행한 다음에 파일을 받아보세요
9:40 거의 다 와서 여기사 막히네요 ㅠㅠ 똑같이 보컬추출 파일명도 간단한걸로 바꾸고 했는데 에러가 나네요...
발생한 오류문구를 적어주세요!
(아마 영어로 많이 출력됐을겁니다)
Exception: No pth model file was found in the extracted zip. Please check models/ zazaza
During handling of the above exception, another exception occurred
구글 드라이브에 음원파잉 복사하고 붙여넣기 해서 실행하였더니 이렇게 떠요ㅠ
Wav파일이 아니여서 그런건가요?ㅠ
@@user-xq3zw3us5v
8:32 부분에 사용했던 Zip 파일에 학습된 모델 파일(Pth 확장자)이 없는 것 같습니다
Zip 파일을 한번 확인해보세요
그리고 음원은 Wav 파일로 해주세요 :)
추가학습 방법몰라서 1100epoch짜리 그냥 8시간 존버탔는데 나중에 시간날때 해봐야겠네요
저도 완성은 됬는데 노래는 4분인데 결과값은 29초만 계속 나와요ㅠㅠ
모델 문제는 아닌거 같은데..
저도 처음보는 현상이어서
잘 모르겠네요ㅜㅜ
4:13 여기에 업글하면 똑같은 이름의 파일이 2쌍 생기나요?
어떻게 구분하죠? 처음건 삭제하고 업글하나요?
기존모델은 삭제되는걸로 알고있습니다
(정확하지않음)
저는 트레이닝 부분에서 막혔습니다
에러 코드는 밑에 처럼 뜹니다 입력 값은 순서대로 50, 250, 16 이렇게 저장하였습니다
AssertionError Traceback (most recent call last)
in ()
7
8
----> 9 assert 'pretrain_type' in locals(), "You need to download a pretrain! Please run the \"Download Pretrained Model\" cell before continuing."
10
11
AssertionError: You need to download a pretrain! Please run the "Download Pretrained Model" cell before continuing.
업데이트로 인해 영상에는 보이지 않지만,
Download Pretrained Model 셀이 있습니다.
기본 설정으로 실행해주세요
그래도 해결이 안된다면
다시 말씀해주세요!
세이리아님처럼 원신 호두를 이용해 만들어봤는데 목소리가 뚝뚝 끊기고 꽤 부자연스럽게 만들어졌습니다. 인게임 호두 보이스를 잡음 없이 가져와서 학습 시켰기 때문에 학습 데이터 품질 부분에선 문제가 없는 것 같은데 뭐가 문제인 걸까요? 호두 음성대사들을 이어붙인 8~9분 가량의 음원으로 학습 시켰고 epoch는 300회로 설정했습니다.
epoch는 높을수록 좋은 게 아닌 건가요?
@@시로-n5x
epoch는 높을수록 무조건 좋은건 아니며
200~250 정도를 권장드립니다
(300도 괜찮아요)
결과물에 문제가 있는건 음원 분리가
잘 안돼서 그런거 같습니다
노래 보컬파일을 변환할때 변환할 보컬
파일에도 잡음이 있으면 안됩니다
선생님 선생님! ㅠㅠㅠ
이거 트레이닝 (훈련) 다 끝내고
Export Model from Notebook to Drive 까지 완료했는데도
rvcDisconnected 폴더에 완성된 다른 폴더가 안떠요 ㅠㅠㅠ 그냥 기존에 넣어둔 zip파일만 덩그러니있고 다른 폴더가 생성이안되는데
이거 왜이런가요 ㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠㅠ
2:43 인덱스 트레이닝 과정을 하고 나면
폴더가 생기면서 인덱스 파일이 나오는데
(이때 폴더가 생성된다는 뜻)
전 과정을 모두 했지만 폴더가 뜨지 않았다는건
뭔가 문제가 있긴 한 거 같습니다
(원인은 모르겠습니다
드라이브 용량이 부족하거나
경로 문제.. 는 아닌 거 같고요)
시간이 조금 걸리더라도
천천히 한번 더 해보시는걸 추천드립니다
(방금 테스트를 해봤는데 이상은 없었어요!)
ㅠㅠㅠㅠㅠ오늘 다시해봐도 안생겨요....ㅠㅠㅠ
안녕하세요!
08:32 에서 오류가 뜨면서 진행이 안되는데(파일경로가 안불러와지는듯 합니다) 이유가 있을까요
현재 해당 코랩에서 구글 드라이브 관련 링크에 오류가 있으며,
이 오류는 코랩 자체의 문제입니다
임시로 'Pixel drain' 사이트에 모델 ZIP 파일을 업로드 하여 진행해주세요
(업로드후에 링크 복사하고 붙여 넣기 하기!)
예전에 다른 추론용 코랩에서도 이와 같은 오류가 발생했었는데,
곧 업데이트가 멈추더라고요(사실상 섭종)
혹시 모르니 다른 코랩을 찾아봐야겠습니다
@@세이리아 아 감사합니다!!!!
와 저때는 pretrain type 3가지밖에 없었구나
학습한 목소리가 실제랑 음색은 비슷한데 기계음이 섞여 들리는 것 같습니다.
이 경우에는 학습 데이터를 좀 더 깔끔하고 다양한 음역대로 구성해서 해야할지,
학습 데이터 양 자체를 늘릴지(기존 10분), epoch(기존 150)를 올려야할지 질문 드립니다.
@@Andriy-ln9ho
학습 데이터의 품질이 가장 중요합니다
가능하다면 더 깔끔한 데이터를 구성하는게
1순위 같고, 학습 횟수는 적당해 보입니다
@@세이리아 감사합니다! 많은 도움이 되었습니다.
배치사이즈 올리는것도 하나의 방법입니다 배치가 너무 작으면 노이즈껴서 이상한소리납니다
index 파일 제외하고는 pth파일 등의 다른 파일이 안나왔어요 다른과정은 똑같이 따라했다고 생각해서 혹시 소스의 양이 영향을 미쳤을까요? 음성이 적은 게임캐릭터라 2분정도밖에 안돼서 이 부분이 신경쓰이네요 아니라면 과정 포함해서 해결방법알려주시면 감사하겠습니다
학습이 잘 진행됐다면 4:00를 실행했을때 pth모델 파일이 나와야 하는게 맞는데...
index파일이 나온걸 보면 소스양 때문은 아닌거 같고요
가장 의심되는건 훈련쪽인데 이것만 가지고는 알 방법이 없네요
다시 만들어 보는걸 조심스럽게 권장해봅니다
저도 모델 10번은 넘게 만들었었어요
@세이리아 해결했어요 도움주셔서 감사합니다
새해복 많이 받으세요!!!
트레이닝에서 You need to download a pretrain! Please run the "Download Pretrained Model" cell before continuing. 라고 오류가 나오는 데 어떻게 해야 할까요?
고정댓글 마지막 부분 확인해주세요!
추가학습 했는데 add~index를 다운하나요 아니면 events~를 하나요? 이건 두개에요 최근건데
~pth, ~index 두개만 사용합니다
추가학습을 했다면 ~pth가 학습되는게 정상인데
~pth는 그대로 인가요?
@@세이리아 네 찾아보니 그러네요! 답변 감사합니다!!
GPU 백엔드에 연결할 수 없음
현재 Colab의 사용량 제한으로 인해 GPU에 연결할 수 없습니다. 이럴때 gpu없이 해도 되나요?
gpu 있어야 해요. 하루 gpu 사용제한이 있어서 며칠 지나고 하거나 다른 계정으로 하시면 됩니다.
@@세이리아 감사합니다!
선생님 8:52 에서 막혔습니다.
Download models using urls 에서
오류)
Exception: Voice model directory mangya already exists! Choose a different name for your voice model.
During handling of the above exception, another exception occurred:
Exception Traceback (most recent call last)
1 frames
in download_online_model(url, dir_name)
61
62 except Exception as e:
---> 63 raise Exception(str(e))
64
65 #@markdown Enter in the model download url. The url could be a Google Drive url, HuggingFace url, or Pixeldrain url.
Exception: Voice model directory mangya already exists! Choose a different name for your voice model.
설정한 이름의 모델이 이미 있는거 같습니다
다른 이름으로 변경하면 해결될듯 합니다!
@@세이리아 바꿔도 안되던데용 1이나 2 붙어도
Preprocessing에서 Load Dataset 실행을하려하는데
정확한 폴더생성하고, 파일명도 잘기재했는데
파일을 찾을수없다는 오류가 계속떠서진행이안되네요 ㅠ왜그럴까요
(파일명).zip인지 (파일명).Zip인지 확인해 보세요. 저도 안되서 뭔가 했는데 zip 대소문자 때문에 안됐더라고요.
구글 드라이브에 연결하겠냐는 창이 안떠요ㅠㅠ어떡해야할까요..
다 잘 했는데 9:37 에서 Inference 실행하면 에러뜨는데 왜 그런걸까요..?ㅠㅠ
GPU가 없어서 그런걸까요..?
영어로 오류문구가 출력될텐데
그걸 적어주세요!
No supported N-card found, use CPU for inference
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
Attempting to load /content/drive/MyDrive/waa.wav...
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
No supported N-card found, use CPU for inference
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
Attempting to load /content/drive/MyDrive/waa.wav...
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
Attempting to load /content/drive/MyDrive/waa.wav...
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
Attempting to load /content/drive/MyDrive/waa.wav...
/usr/local/lib/python3.10/dist-packages/torch/nn/utils/weight_norm.py:28: UserWarning: torch.nn.
코드 보기 하면 마지막 적힌 코드가 이건데 여기에서 더이상 코드가 없어요
Index training에서 마지막 변경 이후로 실행된 셀 이전 셀이 예기치 못하게 종료되었습니다라고 뜨는데 어떡하죠😢
일시적인 오류나 GPU 할당량이 문제일 수 있습니다.
조금 시간이 지난 후에 다시 시도해주세요
@@세이리아 넹
인덱스 트레이닝 다음 트레이닝 할때
FileNotFoundError: [Errno 2] No such file or directory: 'pretrained_v2/f0G48k.pth' 라고 뜨면서 PTH 파일이 생성이 안되는데 혹시 해결방법 아실까요? ㅜㅜ
@@랴뛟
고정댓글 마지막 부분 확인해주세요!
앗 감사합니다. 좋은 하루 되세요!
헉... 보통 이런 건 기밀(?)로 안 알려주셔야 채널의 컨셉(캐릭)이 산다구 생각했는데...! (?)
굉장히 잘 찍어주신 가이드네요 히히;
헉 저 근데 따라했는데, Inference 에서 실행 후 3초 정도 하다가 빨간 !가 뜨면서 중단 되네요.
Inference 옆에 뜬 붉은 ! 쪽에 마우스를 올리니 "마지막 변경 이후 실행된 셀, 이전 실행이 예기치 못하게 종료되었습니다." 라는 오류가 보이네요.
어.. 근데 분명 Inference 이전(Download models using urls) 부분은 한 5초만에 깔끔하게 끝나고 초록 체크까지 떴는데... 이렇게 되네요.
혹시 추측 되시는 문제점이 있을까요?
(만약 텍스트만으로 해결이 힘드시다면, 내일 영상 찍어서 다시 여쭤봐볼게용...!)
(하나 문제는, 코랩 GPU 연결할 때 사용 가능치를 다 써서 개인 연결을 한 문제가 있었어요!)
오류가 발생했다면 영어로 오류문구가 출력됩니다. 그걸 적어주시면 좋아요!
추측되는 문제는
1. 파일 또는 모델 이름 문제(이름 영어로 써야됨)
2. 파일 경로 문제
3. 실수로 설정을 잘못한 문제
4. 파일이나 제작한 모델 자체의 문제
등등..
@@세이리아 헉 그때 무슨 use CPU인가 하는 건 봤는데... 그걸 확인해서 같이 말씀드렸어야 했네요 (당시 했을 땐 오류 내용이 너~무 밑에 뜨길래 이게 해당 오류가 맞나.. 하면서 말씀을 안 드렸던 ㅠ)
그래서 오늘 다시 오류를 확인하려고 돌려봤는데, 이번엔 특이하게 코랩 T4 연결 시에 GPU로 되더라구요 (사용 가능치가 매일 초기화인가봐요!)
그래서 어... 하면서 그냥 똑같이 했는데 해결 했네요.. ㄷㄷ
T4 연결이 (물론 확신은 못하지만) 안 되는 경우엔 뭔가 안 되는 게 있나봅니당..!!
아무튼 도와주셔서 감사합니다~
@@세이리아 앗 추가로 몇 개만 더 여쭤봐도 될까요?
1. 학습 시킬 때 음성 파일은 무조건 wav 파일이어야하나요? 아니면 ogg, mp3 같은 것도 상관 없나요?
2. 보컬이랑 inst랑 혹시 합칠 때 어떻게 합치시나요? 이번엔 영상 편집 프로그램으로 합쳤는데... 조금 더 좋은 / 편한 방법을 찾고 싶네요... ㅎ;
3. 한번 작업한 후에 다른 목소리 교육 시키려면, 기존의 파일들을 옮겨두고 하시는 편인가요? 아니면 조금 추가 설정으로 굳이 파일 안 옮기고도 진행 가능한가요...?
@@SinyoNuni1. Wav 확장자를 쓰는 이유는 단순히 무손실 포맷이기 때문입니다.
mp3 같은 경우는 손실 압축이기에 목소리 일부가 손실될 우려가 있어 학습에 권장하지 않는 포맷입니다. 무조건은 아니고 wav파일이 없으면 mp3 쓰셔도 되지만
퀄리티 차이는 있을겁니다
(mp3를 wav로 변환해서 쓰지말기!)
2. Studio One 6 전 이거 사용해서 믹싱합니다. MR 과 보컬 + 리버브 정도 하시면 됩니다. 편한건 없어요!
3. 저는 다른 모델을 만들때 다른 구글계정을 사용하거나, 이름을 다르게(zip파일, 모델 이름) 하면 오류없이 같은 드라이브 에서도 다른 모델 학습이 가능합니다 :)
영상 감사합니다! 혹시 생성된 모델에게 추가 학습을 시키려고하면 어떻게 해야 할까요??
에포크 200으로 만들었는데 300까지 올려도 될거 같아서용
@@펑-c8x
1. 1:20 부분에서 추가 학습할 모델이름과 변수를 과거에 했던 설정 그대로 적어주세요
2. 2:39 부분에 보이는 'Load preprocessed dataset files from Google Drive' 셀을 실행해주세요
3. 2:39 부분에 'Import Model from Drive to Notebook' 셀에 2333333을 입력하고 실행해주세요
4. 3:17 'total_epochs' 부분을 제외하고 훈련 변수를 과거에 했던 설정 그대로 적어주세요
'total_epochs' 여기에 목표 에포크수를 입력하시면 추가 학습이 가능합니다 :)
(200->300 이면 300을 적어주세요!)
5. 4:00 훈련이 끝나면 실행해주세요 (기존 모델은 삭제되니 필요하면 미리 다운로드 해두기!)
친절한 답변 감사합니다!!!!!
8:35 여기서 FileURLRetrievalError: Cannot retrieve the public link of the file. You may need to change the permission to 'Anyone with the link', or have had many accesses. 이렇게 에러가 뜨는데 뭐가 문제일까요? 공유 설정 했는데 그러네요
@@펑-c8x
고정댓글 마지막부분 확인해주세요!
12시간걸려서 테스트 성공했습니당 감사합니다 이제 보이스샘플잘따는 일만 남앗네용 근데 좀 탁한목소리로 들리는데 깔끔하게하려면 어떻게 해야할지 아실까여
탁한목소리를 일으키는 원인이 많아서...
명확한 해결법을 드리긴 어려워보이네요
5:15 코드 오류뜨네요...
복사해서 정확히 입력해보세요
잘 작동합니다!
새해복 많이 받으세요😊
@@세이리아 넵 새해 복 많이 받으세요!
안녕하세요 Training 150에코에서 - 70에코 까지 한 뒤 :::현재 Colab의 사용량 제한으로 인해 GPU에 연결할 수 없습니다. 문구가 뜨면서 멈추었습니다. 이건 어떻게 해결을 해야 될까요?
GPU 사용량이 정해져 있습니다
하루에 너무 많이 쓰면 막더라고요
며칠 지나면 다시 이용 가능합니다 :)
(아니면 다른 구글계정으로 하는것도 방법입니당)
@@세이리아 정말 감사합니다. 다른 구글계정이라고 하면, 사본을 공유 해서 하면 되는 걸까요?. 그리고 진행 하던 건 초기화 되는 건지요?
@@sukim3915
사본 공유 기능을 사용해보지 않아서 잘 모르지만,
훈련중인 모델이 백업이 되어있다는 가정에서
다른 구글계정으로 계속 제작하는 방법입니다.
(만약 모델이 백업되어있지 않으면
진행 하던 건 초기화입니다)
드라이브 rvcdisconnected 폴더 자체를
다른 구글계정 드라이브로 옮긴뒤
(또는 자동으로 rvc~ 폴더가 생성되니 폴더 안 내용물만 복사하거나)
0:25 ~ 3:00 과정을 동일하게 하고
(변수도 모두 같게, 전에 index training 을 해서
index파일이 있다면 index training은 건너뛰세요)
3:00 부터 고정댓글의 훈련 이어서 하기(모델 추가학습)를 하시면
문제없이 될거 같습니다
추가학습방법은 기존 방법과 조금 다르니
고정댓글을 먼저 확인해주세요
@@세이리아 많이 배우고 있습니다. 감사합니다 몇일 지나서 사용이 가능 해 진다면 03:00 training save_frequency (설정) 저장이 되었다면 저장된 내역 부터 불러와서 재 시작은 가능 한 걸까요?
혹시 음역대가 안 맞는 모델이랑 합성하면 결과물이 탁한 목소리가 나오나요?... 아니면 학습모델이 mp3 확장자거나 너무 짧은 10분 이하 모델이면 그런가요 아 너무 어렵다
@@frog.j9056
mp3 확장자, 적거나 잡음이 많은 데이터등
이유로 탁한 목소리가 발생할수 있습니다
학습 데이터를 늘리는것 보단
품질이 우선입니다(무조건!!)
완전히 깔끔한 목소리를 얻는것 부터
해보세요
파이팅입니다!
@@세이리아 넵 감사해요
음성은 얼마나 학습시키는게 좋을까요? 3분짜리 곡 7개정도만 해도 괜찮을까요?
보통 10분정도의 학습파일을 100~150 epoch 수치로 학습하는 것을 권장합니다
3분짜리 곡 7개에서 보컬부분이 얼마나 나올진 모르겠지만
8분 정도만 되어도 충분할거라 생각합니다
양보단 품질이 좋아야 완성했을때 그럴듯해요
참고하세요
목소리 코랩 세팅 궁금한 부분이 생겼는데요.
학습된 남자목소리를
여자노래를 남자 목소리로 바꾸고싶은데
꿀팁있나여?
설정하는방법
결국에 피치조절을 해야 하는데
(±7 정도의 피치 조절)
저는 쉽지 않아서
여자노래라도 남자가 부른 음원을 가져다와서
제작하는 방식을 이용합니다
@@세이리아 감사합니다.
드라이브에 연결후 튕겨서 다시 링크를 통해 들어갔더니 연결 t4눌러도 드라이브 연결이 안 나오는데 그냥 Run me first! 누르면 되는건가요
튕긴후 런타임이 끊겼다면 처음부터 다시 해야합니다
@@세이리아 아하 감사합니다 다시 해볼게용
@@세이리아혹시 런타임 연결할 때 GPU없이 연결해도 제작이 가능한가용
@@노넴씨
아뇨, GPU는 필수입니다!
잘가다 마지막에 No module named 'fairseq' 에러가 떴는데 어떻게 해야 하는지 모르겠습니다
영상 어떤 부분에서 발생했는지
자세히 알려주세요!
코랩 연결이 런타임오류라고하면서 안되는데 해결방법을 아시나요?ㅠㅠ
이것만 가지고 어디에서 오류가 발생한건지 모르겠어요. 영상에서 오류가 발생한 지점이
어디인지 알려주세요!
@@세이리아 12초부분 연결T4 부터 안됩니다!
@@mango-wp1bu 링크가 문제였네요ㅜㅜ 고정 링크로 다시 접속해주세요
@@세이리아 확인했습니다!
일본인 가수를 모델로 사용했는데 한국어 노래를 커버시키면 발음이 뭉개지는데 이건 어쩔 방법이 없겠죠? ㅜㅜ
발음이 어색할 수 있으나,
단순히 발음이 뭉개지는거면
음원 분리가 잘 안 된것 같습니다.
갑자기 궁금해서 연락드립니다.
기존에 있는 학습된 파일은 수정해서 추가 학습은 어떻게 해야하나요?
추가 학습할 파일 변경후
(그냥 추가 학습할 파일을 올리면 됩니다)
고정댓글에 있는 추가 학습 방법을 참고해주세요
목소리가 너무 저음이라 저음에서 고음으로 좀 높이고 싶은데 어떻게 학습을 시켜야할까요
1. 학습에 사용된 음성파일이 대체로 저음인 경우
2. 학습 수(epoch)를 너무 많이 잡은 경우
3. 음성변환을 진행할 노래 보컬이 저음인 경우
4. 데이터가 잡음이 많을 경우
등등 여러가지 원인이 있습니다
해결법으로는
1. 음성변환을 진행할때 피치(pitch)를 높이기
2. EQ 같은 프로그램을 사용하기
등등
여러가지가 있겠지만, 근본적인 원인을
찾아서 해결하는것을 추천드립니다
만약 모델 자체가 저음으로 학습된 것이라면
모델을 조금 다른 변수로 다시 만들어 보는걸 추천합니다
(사실 원인을 찾기가 어렵고, 저도 모델이 이상한거 같으면 다시 만들었습니다.)
학습시 사용했던 파일 특징이나 훈련 변수 설정등 정보를 적어주시면 좋을거 같아요!
@@세이리아 세팅들은 영상이랑 똑같은데 처음에는 목소리파일을 사이트에서 다운받은걸로 하다가 이상해서 봇치목소리를 노래에서 따로 추출해서 필요없는 부분 자르고 다시 만들어도 똑같네요 이게 남자목소리 노래라 이상한건지 봇치목소리가 다루기 어려운건지 감이 안잡히는데... 여자목소리로 남자가수노래 씌울때 따로 세팅이 다른가요?
@@그렇_다
여자 목소리로 학습된 모델로 남자 목소리 보컬을 변환하려고 하면 당연히 저음으로 나옵니다!
가능하면 여자 보컬을 사용해주세요.
변환할 남자 보컬의 피치나 키를 +7 정도 올려도 된다고는 하는데 쉽지 않습니다.
@@세이리아 여러개 건들여봐야겠네요 감사합니다
pth 확장자 파일이 생기지 않는 이유는 무엇일까요? index 확장자 파일은 있는데 뭐가 좀 없이 추출이 되네요. 단순 코랩 오류인가요?
4:00 에 보이는 셀을 실행해야 모델이름.pth 파일이 구글드라이브에 저장됩니다
혹시 과정에 누락이 있었는지, 훈련이 정상적으로 진행되었는지 확인해보세요
+
각각의 셀이 영상과 같은(변수이름 빼고) 영어로 출력되었는지도 확인해보세요
@@세이리아 GPU 연결이 끊겨서 중간에 중단된 거였네요. 답변 감사합니다
선생님 모델 저장했는데 pth파일이 안보여요ㅜㅜ 도와주세요
[설정한이름].pth, .index 파일 말고
폴더에 어떤파일이 있나요?
@@세이리아 인덱스 파일이랑 다른 파일 2개가 있었어요.
@@이민지-e8e
지금 정보만으로는 뭐가 문제인지 모르겠네요
혹시 놓치고 있는 부분은 없는지 확인해보세요
계속 시도해봐도 Index Training 과 Training 에서 실행이 안되고 실행버튼만 빨간색으로 뜨는데, 어떻게 해야 할까요?ㅠ 파일이 wav인 게 문제일까요?
각각 순서대로 인덱스 트레이닝이랑 트레이닝에서 뜬 문구인데 무슨 말인지 잘 모르겠어요ㅠ
Exception: No features exist for this model yet. Did you run Feature Extraction
AssertionError: You need to download a pretrain! Please run the "Download Pretrained Model" cell before continuing.
@@서영고-m9p
코랩이 업데이트 되어서 영상과 다른 추가 설정을 하셔야 합니다
1:02 부분 아래에 'Download Pretrained Model' 셀이 있습니다
(업뎃 전 영상이기 때문에 영상에는 보이지 않습니다)
1:02 먼저 기존 방식으로 실행 하시고 추가로
Download Pretrained Model 셀을 실행하시면 됩니다
(설정은 아무것도 건들지 말기!)
그래도 이상이 있다면 다시 말씀해주세요 :)
@@세이리아 해봤는데 Index Training은 안되더라구요..ㅠ 대체 뭐가 문제인지..ㅠㅠㅠ 혹시 밑에 save_extra_files_to_drive 랑 force_mbkm 은 체크하지 않아도 될까요?ㅠ 영상에는 force_mbkm 가 없어보이더라구요
@@서영고-m9p
방금 테스트 해봤는데 모두 정상작동합니다
다른건 건들지 마시고, 영상처럼 하되
Download Pretrained Model 셀만 추가로 실행해주세요
0:12 부분 마우스 옆 삼각형 모양을 클릭하시면
'런타임 연결 해제 삭제' 가 있습니다
클릭하신 후 '다시연결' 을 클릭해 처음부터 다시 진행할 수 있습니다
순서 (설정은 영상처럼)
1. Dependencies
2. Set Training Variables
3. Download Pretrained Model
4. Load Dataset
5. Preprocessing and Feature Extraction
6. Index Training
7. Training
8. Export Model from Notebook to Drive
그래도 안되시면 편하게 말해주세요!
될 때까지 답장해 드리겠습니다!
+
Preprocessing and Feature Extraction
이거 실행을 안 하신 거 같습니다
확인해 보세요!
@@세이리아 마지막에 말씀해주신 것도 실행하고 해봤는데 안되네요ㅠ 어제부터 코랩 껐다 다시 열고 하면서 반복해봤는데도 안된거라.. 저는 코딩쪽에 아는 게 전혀 없어서 인덱스 트레이닝이 뭔지도 모르니 어떤게 잘못된 건지 모르겠네요ㅠ 이대로 포기해봐야 할까요?ㅠ
추출한 ai 보컬이랑 기존 음원은 어떻게 합치나요?
Studio One 같은 음원 편집 프로그램을 사용하셔야 합니다
원곡 가사를 바꾸는영상들은 어떻게한건지 아신가요??
@@신쿠-j1b
원곡 가사를 바꿔서 부르는 노래를
사용한것 같습니다
자체적으로 가사를 수정하는건 어렵습니다
안녕하세요 영상 너무 감사합니다 혹시 유튜버 목소리도 학습이 가능한가요??
어떤 목소리든 목소리만 깔끔하게 추출할 수 있다면 가능합니다
@세이리아 감사합니다 잘 보고 따라해보겠습니다 혹시 또 궁금한 거 있으면 여쭤봐도될까요ㅜ
@@승민-r9r
네 당연하죠!
또 궁금한 게 있다면 언제든지 말해주세요
@@세이리아 너무 감사해요🙏
유튜브 영상을 파일로 변환해서 목소리 학습하려는데 처음에 학습할 목소리 파일은 목소리랑 배경음악 분리해야 하나요? 아니면 유튜브 영상 파일 그대로 사용하나요?
UVR을 설치해도 실행이 안 되는데 이 문제는 어떻게 해결할 수 있는지 알 수 있을까요?
@@Dda잇
설치 경로 문제인거 같습니다
영어로만 적힌 곳에(C드라이브)
설치해보세요
답변해주셔서 감사합니다. 말씀해주신 대로 해볼게요 ㅎㅎ@@세이리아
혹시 c드라이브에 있는 다운로드 파일에 설치하는데 실행이 안되는건 어떤 문제인지 아시는 게 있으실까요?@@세이리아
@@Dda잇
다운로드 폴더 말고 C드라이브에 영어 폴더를 만들고 거기서 설치해보세요
@@세이리아 아이고 알람이 안 떠서 이제 봤네요. 답변 감사합니다. 조만간 해볼게요
index_rate 조절하면 뭐가 달라지나여?
학습된 모델의 특성을 얼마나 참고할지(가중치) 정도로 알면 됩니다
따라서 숫자가 커질수록 모델의 특성(목소리 특성)등을 더 반영하지만
기계소리가 심할 수 있고,
숫자를 낮추면 상대적으로 모델의 특성 참고 비율이 낮아집니다
기본값이 0.75 인데 (0.4 ~ 0.8) 정도의 값을 입력해서 비교해보고
가장 마음에 드는 숫자를 선택해서 하면 되는데
그냥 0.75 하셔도 무방합니다 :)
(사실 큰 차이는 없거든요
진짜 조금 달라지는 정도?)
윗 답글 읽었습니다! 마지막으로 추가 학습할 때 zip파일의 내용물이 바껴도 상관없을까요?
처음 학습땐 1,2 wav파일이 있다가 추가 학습 땐 3,4 wav 파일이 있는 식으로요. 물론 압축파일의 이름은 똑같이 해서 드라이브에 넣고 기입하고요
(번거롭게 답글 달고 질문 하는데에 친절히 대답해주셔서 정말 감사합니다😂😂)
네 가능합니다
실제로 내용을 바꿔서도 학습하기도 하거든요
훈련변수랑 기타 변수만 같게 하시면 됩니다
:)
@@세이리아 답변 정말 감사합니다 ㅠㅠ 노래 올리신 것도 잘 듣고 있슴다!
여러번 하니까 코랩에서 돈 내고 GPU 쓰라고 하는데... 채널주님도 그러시나여?? 갑자기 되던 것도 안 되고 그러더라구요!ㅠ
GPU 사용 할당량이 있습니다. 굳이 결제는 하지 마시고 며칠 지나고 다시 시도해보거나 다른 구글계정을 사용해주세요
@@세이리아 아!! 감사합니다ㅏㅏ👍👍👍👍👍👍
한 개 녹음파일 당 훈련 시간이 얼마나 걸리죠?
@@frog.j9056 배치사이즈,데이터셋의 크기에따라 달라집니다 보통 10분 데이터셋,배치8~12일경우 평균1에포크당 약20~40초정도 걸립니다
save_frequency:
50
total_epochs:
500
batch_size:8 기본으로 설정하면어떄요?
batch size : 16
epoch : 300 (250,150,80)
epoch 수치를 조절해 여러개의 모델을 만들어보고, 가장 만족스러운 모델을
선택해야 합니다
(500은 너무 많아요! 300은 넘기지 말기!!)
+ 9:50
Index rate : 0.4 또는 0.6
이것도 비교해보세요
@@세이리아 학습을 1시간 하나 하는게 좋을까요 여러개 1분짜리 하는게 좋을까요
@@너를바라보는니가
여러개로 쪼개서 2~3분 정도로 준비해주시고,
1시간정도의 파일이면 50~100 epoch 로 해주세요
(파일용량이 너무 크거나 많으면 오류가 날 수 있으니
조절 해보면서 하기!)
@@세이리아 GPU를 연결 할수없고 더이상 사용할수 없다는데 어떻게 해야할까요
@@너를바라보는니가
GPU 할당량을 모두 사용했습니다
며칠 지나면 정상적으로 이용 가능합니다
2시간이면 트레이닝 설정을 어캐하면좋을까요?
학습데이터 2시간은 너무 많습니다.
2시간중 저음,고음 등을 다양하게 골라,
15분 데이터로 맞추고 150 epoch
정도로 해주세요
(2시간은 RVC 용도가 아닌 VITS 용도 같습니다)
@@세이리아 고음만 하면 부자연스러워 그런데 어캐 해야좋을까요
@@너를바라보는니가
목소리에는 보통 여러 음역대가 있습니다
비교적 낮게 들리는 음과 높게 들리는 음이 있죠,
이러한 음역대를 적절하게 섞어서 15분 정도로 맞추면
좋은 모델이 나올거라고 생각합니다
아니면 2시간짜리 파일 중에서
랜덤으로 15분정도의 파일을 구해서
학습해보세요
추가로
여자 목소리를 학습시킨후 모델 A를 만들었다면
모델 A는 특별한 경우가 아니라면 무조건 여자 목소리만 변환할 수 있습니다
(여자목소리로 학습시킨 모델을 남자 목소리 변환에 쓰일 수 없다는 뜻입니다)
참고하세요!
@@세이리아 아 남자 목소리로 여자 노래 시키면 안되는군요
코랩 설치가 안되용
목소리 변환 코랩에선 피치 조절 안 되려나요?
피치 조절이라면 UVR5 에서 가능합니다
코랩에서 하는건 쉽지 않아요
@@세이리아 에고 피시라고 오타났었는데 알아봐주셔서 감사해요 ㅠㅠ UVR5에서도 가능했군요
죄송스럽지만 혹시 어떤 옵션인지 알려주실 수 있을까요?
@@dollaya2020
1. UVR5 ->
2. CHOOSE PROCESS METHOD 여기서 Audio Tools 선택 ->
3. CHOOSE AUDIO TOOL 여기서 Change Pitch 선택 ->
4. 적절한 SEMITONES 선택 (피치 조절 옵션 같습니다) ->
5. 오디오 파일을 넣고 실행
@@세이리아 와 정말 감사합니다! 구독도 꼭 누르고 갑니다, 선생님!
1:30 초 부터 Load Dataset 여기서xception Traceback (most recent call last)
in ()
47
48 if not os.path.exists(dataset_path):
---> 49 raise Exception(f'I can\'t find {dataset} in {os.path.dirname(dataset_path)}.')
50
51 os.makedirs(final_directory, exist_ok=True)
Exception: I can't find eumseong-cv-munyujeong-dolpa-gyeolx in /content/drive/MyDrive/rvcDisconnected. 이라면서 오류가 납니다 이유가 뭘까요?
데이터셋을 올바른 경로(rvcDisconnected)에 넣지 않았거나
데이터셋 이름이 잘못 설정되었을 경우 발생 하는 것 처럼 보입니다
혹시 모르니
데이터셋 이름을 간단한 영어
예를들어 mydataset
이런식으로 변경하고
실행해보세요
mr 넣는방법은 없 나여/
믹싱이라면 음원 편집 프로그램으로
직접하셔야 합니다