Как сделать AI cover? Полный гайд (Ultimate Vocal Remover + RVC)
Вставка
- Опубліковано 1 лип 2023
- Добро пожаловать на мой канал! В этом видео я поделюсь подробной инструкцией по созданию AI кавер-версии песни, тренировке модели голоса на вашем компьютере и отделении инструментала от акапеллы.
Вы узнаете, как использовать программу RVC (Realtime Voice Conversion) для создания потрясающего AI кавера песни. Я покажу вам шаг за шагом, как загрузить и обработать аудиофайл, применить алгоритмы голосового преобразования и получить потрясающий результат.
Кроме того, вы узнаете, как тренировать модель голоса на вашем компьютере. Я расскажу о необходимых инструментах, данных и процессе обучения модели, чтобы вы смогли достичь максимального качества и достоверности голосового вывода.
В видео также будет продемонстрировано, как использовать программу UVR (ultimate vocal remover), чтобы отделить инструментал от акапеллы. Я расскажу о принципе работы программы и покажу вам, как легко и быстро получить инструментальную версию песни для дополнительного творчества и монтажа.
Не пропустите этот увлекательный урок, полный ценной информации и основанный на проверенных практических методах. Присоединяйтесь ко мне прямо сейчас и освойте современные возможности AI для музыкального творчества!
Не забудьте подписаться на мой канал, чтобы быть в курсе новых уроков и интересных тем. Оставляйте комментарии с вопросами и отзывами, и я с радостью на них отвечу.
Спасибо за просмотр!
Ссылки из видео:
RVC - huggingface.co/lj1995/VoiceCo...
Ultimate Vocal Remover - ultimatevocalremover.com/
Отделение голоса и акапеллы онлайн - vocalremover.org/ru/
Ссылка на telegram канал: t.me/ba1yya
Можете поддержать мой контент тут: boosty.to/ba1yya
теги-
ai cover, ai, so vits svc, cover, ai cover tutorial, how to ai cover, kanye west, нейросеть, how to make an ai cover, make ai cover, how to make ai cover, artificial, tutorial, how to make an ai cover tutorial, how to make a cover with ai, intelligence, how to make a song with ai, so-vits-svc, tutorial how to make an ai cover, ai voice, sovitssvc, модель голоса, vits svc, делаем модель голоса, как сделать голос colab, so-vits-svc 4.0, модель голоса google colab, делаем ai cover, своя модель голоса, mashup, so-vits-svc туториал, sovitssvc tutorial, so vits svc туториал, so-vits-svc google colab, so vits svc на андроид, мешап, как сделать модель голоса, so-vits-svc модель, so-vits, so-vits-svc как сделать свою модель, модель голоса сделать, мэшап, как сделать свою модель голоса, how to make kanye's voice, как сделать ai cover, how to make ai cover songs, кавер, ии, tinybunny, нейромэшап, aicover, нейрокавер, remix, искусственный интеллект, ai music, mashup.hk, mashup hk, lil t4k, music, #mashup, ai song tutorial, ai cover songs, how to ai cover tutorial, how to ai voice cover, ремикс, so vits svc tutorial, soviets svc tutorial, ai vocal tutorial, lil uzi vert ai, diff svc, sovits, how to use so vits svc, rvc, rvc tutorial, rvc ai, how to use rvc, new ai, how, bts, rvc ai cover, ghost, gotye, to, create, make, error google colab ai, спела, поет, за деньги да, кавер куплинов, ai нейросеть, винни пух, курт кобеин, kuplinov, best ai voice generator, аи кавер, как сделать кавер, ai мэшапы, как делать нейромэшапы?! / как сделать голос моргенштерна? | ai cover, musicfy ai, ai cover song, голоса знаменитостей, голос моргенштерна, как делать мэшапы, нейромешапы, как делать нейромэшапы, как, голоса артистов, remov, ai cover songs drake, rap, chatgpt, open ai, хип хоп, ai art, миджорни, нейросети, канье уэст, ai covers, ai generated music, скам, trends, ai rap, моргенштерн мэшап, мэшапы это, как сделать кавер найросетью, где взять модели для ai cover?, что сейчас популярно на ютубе, anighost, анигост, нейросеть моргенштерн, моргенштерн нейросеть слив трека, , оксимирон мэшапы, мэшапы, мэшап с нейросетью, мэшапы слушать, оксимирон нейросеть, трек с нейросетью, куплинов cover, нейросеть поет, нейросеть - за деньги да (слив трека), ai cover kai angel, ai cover morgenstern, how make ai cover, нейронные сети, канал, что делать если нету файла config.json?, ai voice changer, best ai voice changer, best ai voice clone, ai voice clone tutorial, ai voice cloning, best ai music generator 2023, best ai music tools, ai music michael jackson, ai music cover, ai music how to, ai music how to make, best ai music generator, ai voice cloning software, how to, ai generated vocals, ai generated cover song, voice to voice, ai voice to voice, quick, best ai cover tutorial, ai tutorial, how to make ai kanye, drake, rihow - Розваги
Автор делится полезной информацией, без воды и лишней духоты.
Так-же автор поясняет за каждый ползунок, каждое поле в каждой программе.
Рекомендую к просмотру
подскажи за что отвечает ползунок searcj feature ratio и куда его крутить что меняеться если не 0.75 а допустим 0.10 ?
автор говна пожрал, вместо того чтобы показать куда кидать уже готовые модели, мусолит какую-то хуйню про каверы из своих моделей,
Это очень круто! Спасибо за видео)
Просто огромное спасибо за гайд
СТАС АЙ КАК ПРОСТО УЧИТЬ ДЕЛАТЬ AI COVER 😱😱😱
Стас Ай Как Кавер
Стас Ай как узко
Тоже так подумал)) только без каламбурчиков)
Зеленского
что делать, если я вставляю путь и ничего не выходит?
блин я в восторге от этого парня очень понятно все объясняет и все получается, уже который гайд смотрю
Спасибо мужик, от всего сердца.
Это бомба, очень рад что встретил ваш канал!)
Вау, я думал это намного сложнее, спасибо
Низкий поклон за такую инфу. Очень понятная подача.
Спасибо, всё получилось)
Ты просто лучший! Не знаю как и описать мои эмоции, целый день убил на способы других блогеров, зашел к тебе и с первого раза получилось. Спасибо тебе огромное!
Плюсую
11:50 что делать, если я вставляю путь и ничего не выходит?
Чувак, ты реально крут) Очень классный гайд!
на самом деле, спасибо огромное за гайд, было очень полезно.
Спасибо большое) У меня всё получилось) Теперь Ариана Гранде будет петь песни, которые я захочу)
Один из лучших гайдов, мне например больше всего помог блок с настройкой пресетов в UVR, спасибо большое!
А насчет создания самого аи кавера скажу что лучше поставить в дополнение mangio-crepe, по мне он гораздо лучше и реалистичнее конвертит голос нежели pm или harvest
11:50 что делать, если я вставляю путь и ничего не выходит?
8:52 Вы можете переименовать файл с названием RU по пути RVC-beta0717\i18n в en_US и тогда весь интерфейс будет на русском
Привет. Что делать если при дообучении модели почему то время тренировки каждой эпохи увеличилось в 2.5 раза?
Что делать, если загрузил аудиофайл формата mp3 весом 14 мегабайт в RVC (сайт Gradio) и при нажатии Process Data аутпут окно пустует или выдаёт ошибку (рамка загорается)? В кодовой строке выписывает в конце Failed. Feature Extraction также пустует, но рамка горит и в кодовой строке происходит нарезка. При нажатии на Train Model также выдаёт ошибку. Перезагружать пробовал, менять расположение файла, а также избавлялся разным путём от кириллицы в пути к файлу.
Привет, вот мучаюсь уже два дня на своем не самом мощном компьютере. Какие облачные сервисы можешь посоветовать для тренировки?
На шаге 2а в RVC переработка файлов сначала стартует, затем завершается и сразу же возникает Error: Connection errored out. Соответственно, во всех последующих шагах то же самое. RVC скачивал по всем приведённым ссылкам.
у меня почему-то во время тренировки модели загружено только 10-12% видеокарты, можно как-то увеличить нагрузку, чтобы видеокарта не простаивала и процесс ускорить? Одна эпоха занимает 25-30 секунд, но видеокарта может быстрее
У меня есть готовая модель, я жму рефреш и ничего не происходит . Что я делаю не так? В модели есть pth и index файлы, а в списке моделей ее не видно. Я может где-то путь не указал? Или эта нейронка видит модели, тренированные только непосредственно внутри нее?
а как разделить несколько дорожок. например басс или гитара. на uvr5
Привет, а если хочешь наложить свой голос, на определённую песню, т.е. есть возможность записать голос, определённым образом, есть ли какие то советы какой должна быть запись? Нужно ли напевать прям текст песни, на которую потом хочешь наложить голос, или наоборот это может навредить только? Если песня будет на английском, есть ли смысл начитывать текст или напевать на английском? Если нет музыкальных данных, нужно ли записывать специально низкий голос и высокий, или тихий и громкий, даже если это будет неумело?
Голос должен быть как написал, и высокий и низкий и тихий и громкий, как можно более широкий диапазон. Можно и попеть, можно и по английски, если будешь на нем песни делать потом, в русском некоторых звуков нет. Что в английском есть. В общем как можно разнообразнее все делай
четкий вопрос
Возможно ли поделиться своей моделью с другими людьми? Если да, то где можно найти файлы своей модели?
А сколько примерно памяти нужно для программ?
Привет, после конвертации вместо голоса какие-то чисто странные звуки появляются)) Что при 20, что при 200 эпохах. Как быть?
Спасибо что объяснил
Привет, слушай, подскажи пожалуйста, это нормально что у меня каждая эпоха по минуте создается?
Спасибо большое, а где лежит ptx и index файлы?
Что делать, если после нажатия "train model" выскакивает вот этот текст "训练结束, 您可查看控制台训练日志或实验文件夹下的train.log" и дальше ничего больше не происходит?
Пните, пожалуйста, когда найдете ответ...
У вас в консоли (которая черное окно в самом начале запуска программы) пишется ошибка, но скорее всего вам не нужно ее читать и там банальное - вы попробовали дважды обработать проект с одинаковым название. Нужно удалить в папке программы logs все кроме папки mute и заново проделать все шаги. Если не поможет - смотреть что выводит в консоли и гуглить.
Здравствуйте , нашли причину?
@@user-fy9fv3oj2d Нет, использовал другую нейронку
@@user-fy9fv3oj2d Причиной оказалась видеокарта. До этого у меня была rx 5600 xt, сейчас rtx 4070 ti и все заработало. амд не подходит для работы, они заточены исключительно под игры
Отличный гайд,спасибо что научили делать ai каверы!!!
Тестил в сервисе, качество поразило просто, искусственный интеллект делает свое дело, честно в одном вокале я даже услышал чуточку больше, чем с музыкой. Эта же программа так же качественно все делает?
Спасибо за гайд! Если кто-то сталкивался, подскажите, пожалуйста, для каверов на песни обучать лучше по спокойному голосу или так же по пению?
Часа 3 ушла разобраться, потому что иногда вылезали какие-то ошибки, но я смог, гайд хороший, спасибо!
А что если я не извлек и не продублировал папку с голосом, модель все равно куда нибудь сохранится?
Тоесть полезный видос)
Спасибо вам за уроки! Обьясняете кратко и понятно) Возникла одна проблема в UVR - при создании акапеллы при помощи метода MDX-Net появляется неприятный шум. Пробовал много чего, но итог такой же. Не подскажете, как исправить эту проблему?
Есть видео на канале с обновленной инструкцией отделения
Верно ли я понимаю, что radeon (TM) RX 480 graphics не тянет тренировку, если в информации о видеокарте написано "К сожалению у вас нету видеокарты, которая поддерживает тренировку модели."?
Спасибо за видео. Скажите, я правильно понимаю, что модель сохраняется на пк под своим id? Я смогу через три месяца (к примеру) не обучая заново её юзать?
Автор, здравствуйте. А если я уже загрузил готовые модели голоса(например, певца), у меня два файла: файл1.index и файл2.pth. Как мне сразу начать обработку "вокала" песни без тренировки ? Возможно, я пропустил это в видео, спасибо.
В каком формате и какой длины загружать файлы аудио для тренировки?
Спасибо за видео. Подскажите, а обязательно закачивать нарезанные куски голоса или можно одной дорожкой длинной загружать?
Можно одной длинной. rvc сам нарежет все равно как ему надо
@@ba1yya а сильно ли это влияет на время? У меня просто около 50 файлов разной длинны(но не более 40 секунд) и 1 эпоха проходит в течении 4 с лишним минут...
@@Multiki228 на время только влияет твой датасет. Чем он больше, тем дольше будет одна эпоха делаться. 15 минут датасета 30 секунд эпоха. Дальше по аналогии можешь посчитать сколько у тебя эпоха +- будет делаться
Здравствуйте, подскажите пожалуйста, аудиофайлы только в вав формате грузить или мр3 тоже подойдут, и можно ли использовать две видеокарты в сли режиме для ускорения обработки, заранее спасибо.
ValueError: 40000 SR doesn't match target 48000 SR в чем проблема может быть кто знает??
вчерa 2 чaсa не мог рaзобрaться, a сегодня после роликa нa изи сделaл) спaсибо!
Подскажите, пожалуйста! Есть старая музыка с плохим качеством. Можно ли обработать AI Cover и улучшить качество?
Хотел бы вернуться с обратной связью по гайду: это действительно самая понятная и подробная инструкция на русском языке!
В качестве датасета использовал два альбома моего любимого исполнителя, вырезал вокал с помощью uvr и ещё вручную через Audacity почистил каждую запись от остатков инструментала - чтобы нейросеть не училась на музыке. На выходе получил свыше получаса чистого вокала. Поставил обучение на 250 эпох, но у меня на 4060ti одна эпоха занимала 3-5 минут: то ли я что-то не так настроил, то ли дело в датасете, то ли для моей видеокарты это было тяжеловато. В итоге после 12 часов тренировки я не выдержал и прекратил на 210 эпохе. Тем не менее, результат поражает - модель действительно реалистичная и почти идентична оригиналу. Дорожки сводил при помощи вышеупомянутого Audacity, там это делается в 2 нажатия. Хочу дотренировать модель до 250 эпох и сравнить результат. Но он и так потрясающий! С меня лайк и подписка на канал. Спасибо, Андрей!
Большое спасибо за развернутую обратную связь. Да, время обработки зависит от длинны датасета, чем его больше чем дольше обработка)
Кстати реально странно, у меня на 2060 Super одна эпоха проходит за 35 сек.
p.s. перепроверил, с 25 эпохи сейчас за 25 секунд проходит, пока что я на 29, посмотрим как будет.
Я кажется понял, может дело в том, что у меня файлов меньше чем у автора? Скорее всего..
@@hagaroma3D да, чем меньше длительность файлов для тренировки. Тем она быстрее. 10-15 минут оптимально, и чтобы качество норм было и чтобы не так долго тренилось)
@@ba1yya Речь о длительности каждого файла? У меня всего 30 файлов гс. примерно от нескольких секунд до пару минут.
Дружище, ты - лучший, спасибо тебе большое! Настройка пресетов в UVR - это вообще золото!
Спасибо ☺️
Скоро по нему дополнение выйдет. Чтобы еще лучше голос отделить, новые фишки откапал)
Буду тоже ждать@@ba1yya
@@ba1yya топ!!!
@@ba1yya Классно, классный!!!:))).
11:50 что делать, если я вставляю путь и ничего не выходит?
что делать если при тренировке на сохранении пишет RuntimeError: File ./logs\кава\G_2333333.pth cannot be opened.
А если готовые паки голосов (pth.) кидать в папку weights получится? Или обязательно тренить самому? Пробовал готовые модели голосов подставлять, что-то не вышло...
Да pth в вейтс, а индекс файл в logs/папка как модель называется
Как лучше делать семпл. Я делаю в видеостудии один фаил мр3 с паузами в 1сек. между фраз, монологов. И программа его сама не разбивает на эти фрагменты ,в лучшем случае на 5-6 делит. Видел что с помощью команды всё таки сперва делят чтобы фрагментов в папке датасет было не один файл на 30минут а много файлов на каждую фразу. Что порекомендуете?
А куда все эти эпохи сохраняются я не понял, и что делать если я захочу таким же способом сделать кавер потом? Например я вот сделал 500 эпох всё сохранилось и я всё позакрывал, через время опять всё открываю и всё что сохранилось где будет находится и получится у меня таким же способом сделать другой кавер?
Спасибо огромное за подробный разбор! А в какой из программ лучше получится изменить голос по обученной модели? Сделать convert в RVC, либо загрузить модель в AI Voice Changer и там сделать преобразование?
Разобрался) В RVC у меня качественней выходная запись получилась. Если я правильно понял, то Voice Changer больше подходит для разговоров в прямом эфире и сохранение готовой записи в нем проблематичнее. А в RVC с сохранением проблем нет. К тому же прослушивать варианты с разными настройками также лучше в RVC.
В общем, в моем случае, когда нужен именно измененный аудио файл, а не прямой эфир, то лучше RVC. Может быть я что-то и упустил в настройках Voice Changer, но пока остановился на RVC.
Здоров! Слушай вот эта настройка в обработке - Resample output audio in post_processinh.... это что за настройка? её нужно выкручивать? если в максимум например выкрутить? что изменится? да и по другим настройкам бы понять что это и нужно ли их шевелить, это - search feature ratio и project voiceless constants
очень подробный и понятный гайд, спасибо!
Здравствуйте, спасибо , что помогли разобраться давно хотел попробовать это , но есть один вопрос , я записал аудио на секунду этот бот же не сможет обучится по такому материалу? Если это так то , скажите пожалуйста 🙏)
у меня каждый раз после загрузки файлов выходит Connection errored out., как это исправить? подскажите, пожалуйста
Без nvidia видеокарты, только на ЦП можно тренить голоса?
PTH файлы создаются, а индекс файл нет. Только с pth файлом голос получается не соответствующий модели.
На 1050 не получиться прогоны делать? У меня не выходит, хотя все этапы до этого удалось сделать.
Я почему-то не вижу модели в Inferencing Timbre, хотя все сделал правильно в Train. Как это исправить? Обновлял всеравно ничего нет.
Вылетает ошибка - Connection errored out и на этом всё. P.S. Отвечаю сам себе - ошибку вызывает Касперский, пока не отключишь так и будет глючить.
в uvr когда выбрал пресет 123 там другие модули выбрались, так что лучше какие выбрать в итоге?
Сколько минут записей должно быть в папке, когда мы указываем путь на эту самую папку с голосовыми записями нужного мне голоса?
Почему то когда нажимаю Process Data чтобы загрузить файлы то начинает грузить вроде и потом не че не происходит, в пути к папке с аудио файлами нет русских букв, формат wav все вроде верно, но не не грузит
если по незнанию сделал 300 эпох, а они обрабатываются по 5 минут каждая, можно ли прервать процесс скажем на 20 эпохе, есть атвосейв каждые 5, мне будет доступен уже синтезированный за эти 20 эпох голос? карта 2060, датасет 14 минут.
хороший гайд, ставьте 250 эпох и 5 голосовых для тренировки
Спасибо за гайд! а как делают металл версии каверов щас чуть ли ни у каждого такие есть, неужели они сами музыку пишут?
Сколько примерно минут голоса друга тебе потребовалось для 200 эпох?
Добрый день, отличное видео, подскажите как остановить тренировку чтобы сохранилась модель последняя эпоха сохранённая
Она сама останавливается и сохраняет конечную версию, когда все эпохи пройдут
Видео здоровское. Всё сработало, уже какой месяц пользуюсь. Будет ли что-то похожее с TTS?
а что делать если нажимаешь process data в командной строке вылезает это runtime\python.exe trainset_preprocess_pipeline_print.py D:\RVC data\1248 40000 4 D:\RVC-beta0717/logs/max False
Traceback (most recent call last):
File "D:\RVC-beta0717\trainset_preprocess_pipeline_print.py", line 8, in
sr = int(sys.argv[2])
ValueError: invalid literal for int() with base 10: 'data\\1248'
При отделении вокала, добавляется эхо, как этого можно избежать? может другой метод какой брать в UVR5 ?
а что делать если у меня уже есть скачанный pth файл и я хочу его туда загрузить как мне это сделать?
Здравствуйте. Спасибо. А как добавить уже натренированную (чужую) модель, не подскажите?
Всем привет. Хочу озвучить книгу (текст) голосом определенного человека. Как это сделать, подскажите.
забыл сказать какой битрейт оптимальный? Что лучше высокий битрейт и меньше по времени голоса или низкий битрейт но больше времени голоса.
здравствуйте, потребушил настройки для обучения по разному, но не удалось добиться скорости обучения как у других. Что делать, в чем дело? Недостаточно мощная видеокарта? У меня RTX 2060, 6 Гб видеопамяти. ОЗУ 32 гб. Делал настройки как у вас, одна эпоха отнимает по 4 минуты. Такими темпами моя модель будет обучаться 8 часов. Меньше 2х минут добиться не удалось, а у вас вовсе 20 сек на эпоху уходит.
Длительность датасета 8 мин
Спасибо, объяснил все без воды и по факту! Хороший гайд, лайк однозначно!
что делать? как нажимаю тренировку модели выдает ошибку мол памяти нет
Подскажите почему нету ничего в inferencing voice?
Камрад, а что делать, если он эти модели на вкладке Трэйн модел не подгружает? могу скрин покзаать, он начинает процесс и потом выдает атрибут эрор
Бог храни тебя! Мне седня счетчик времени на Кагле сбросили, шикааарно !
Здраствуйте, а что делать если при установке выдает "системе не удается найти указаный путь"?
Здравствуйте, подскажите пожалуйста, что делать, если при шаге 2a пишется что неверно задано имя папки, хотя путь я копирую правильно, и чём вообще проблема?
Благодарю!
здравствуйте! подскажите, пожалуйста, что делать, если после запуска тренировки появляется в окошке надпись с окончанием лог, и дальше ничего не происходит? в консоли ничего не происходит и на сайте тоже. как решить проблему?
У меня во вкладке train не определяет видеокарту. Пишет,что нет ничего подходящего и поэтому не могу обучить. Также у меня отделение голоса от музыки велось через процессор,так как галочку нельзя было поставить,чтоб через видюху грузилось. Видюха AMD Radeon 580 8gb. Как быть то в итоге?
Не писал ничего в строке где видюху нужно указать,оставил поле пустым,вроде написал,что через процессор прогрузил,но в итоге всё равно не смог обучение, файл ЛОГ вышел через несколько секунд...
Если поставить Max Spec/ Max Spec будет лучше результат?
А что если скачал уже натренированную модель? Можно ли её как-то вставить в model inference?
Индекс файл в папку логс/папка как модель называется
Pth в вейтинг
8:34 Подскажите пожалуйста, как на Маке открыть файл расширения Bat ????
поставь CrossOver он эмулирует винду и в нем запусти этот файл
Будет ли программа на видеокарте амд работать (rx 6600)?
Вроде как нет. Там просто процессор будет в сотку долбиться вместо видеокарты. Через кагл или колаб делать разве только
У меня на моменте кнопки process data пишет error в правом диалоговом окне на двух компах такая проблема , в чем дело кто в курсе ?
А что бы дообучить модель, действия с выгрузкой файла, разделением его на несколько vav`ов не нужны? в том случае просто пишем нужную модель, и кол-вл эпох и начинаем процесс?
Чтобы дотренировать только имя пишем и количество эпох да. И он по старым все параметрам будет тренировать
@@ba1yya а где именно писать имя?
@@Multiki228 где модель тренировал
Спасибо!
Нужно ли выдёргивать полные фразы из речи для модели, или можно обрывать предложения на середине? Делаю модель на основе голоса из старого ситкома, и там 40% фраз перебивает закадровый смех.
привет, спасибо за гайд. у меня модель натренировалась, но после того как начинаю заменять голос у меня выдает такую ошибку if data.dtype in [np.float64, np.float32, np.float16]:
AttributeError: 'NoneType' object has no attribute 'dtype'. подскажи пожалуйста, что можно сделать? я пробовал менять файл из mp3 в wav - не помогло, пробовал ставить .wav в путь к аудио, тоже не помогло, будто тупо какого-то файла не хватает
Получил решить проблему???
@vvitchwest с толкнулся с такой же проблемой (
а в чём проблема если при запуске rvc браузер на мгновение открывается и тут же пропадает?
Ребят, подскажите, как использовать уже готовую модель в Градио? Ее куда-то нужно поместить в корень папки?
Супер! Хотел всегда скопировать голос "Человека в черном" - Уильяма - персонажа из сериала мир дикого запада, которого озвучивает Станислав Концевич. Вот бы научиться