LoRA SDXL локально на ПК/Установка/Настройка/Тест готовых моделей. Kohya_ss
Вставка
- Опубліковано 5 лют 2025
- В этом видео я покажу, как локально установить среду для тренировки LoRA на ПК (Kohya_ss), выполнить все необходимые настройки, запустить процесс обучения и протестировать готовые варианты моделей.
Пошаговый Чек-лист, где прописаны все пункты настройки Kohya_ss можно скачать у меня на Boosty: boosty.to/iren...
__________________________________________________________
🔗Ресурсы:
страница разработчика Kohya_ss): github.com/bma...
🔹 МОДЕЛИ:
базовая модель SDXL: huggingface.co...
модель чекпоинт "BetterThanWords": civitai.com/mo...
модель LoRa (для катаны): civitai.com/mo...
___________________________________________________________
В поле "Optimizer extra arguments" выражение:
scale_parameter=False relative_step=False warmup_init=False
Если вам понравилась моя работа, вы можете поддержать меня вот здесь: boosty.to/iren...
❗ВАЖНО❗ В названии папок не должно быть КИРИЛЛИЦЫ и ПРОБЕЛОВ.
как раз только что на этом прогорел и хотел дополнить, но чуть чуть опоздал)
я в видео увидел что у вас стоит видеокарта RTX A4500, что это за видеокарта, я не помню таких?
Огромное вам спасибо. Без мата, лишней "воды" и прочего мусора, максимально понятный гайд. По вашему руководству делал лору, получилась просто идеальная лора. Epoch ставил не 10 только, а 1, поскольку это сумма всех операций, производимых при тренировке - зачем комп мучить и прогонять проверку 10 и более раз - не понятно. Я бы тут уточнил, что важно найти грамотно сделанный под ваши желания базовый чекпоинт, на основе которого вы тренируете. И ещё, рекомендую, чтобы Чекпоинт и готовящаяся вами лора совпадали по формату\версии: 1, 5; 2.0; Pony; SDXL итд... Сам делаю под SDXL, ибо на 1,5 вышло не совсем то, что хотел, а XL - идеально все скомпилировал и понял (потому что чекпоинт был хороший и формат лоры был такой же, как у чекпоинта). Ещё, маленькая, но очень важная деталь: проверяйте, чтобы формат ваших картинок был одинаковый: JPG или PNG, а то из- за формата некоторых картинок в HTML у меня слетала тренировка.
В общем, добра вам И спасибо огромное.
Спасибо за хорошие слова и ценные дополнения!🤗 Уточню только по поводу нескольких лор: мне нравится выбирать и сравнивать, словно детектив с лупой рассматривает неочевидные различия:)... к тому же под разные задачи порой нужны разные лоры: недообученные\переобученные. К примеру, недотренированные лоры, мне кажется, более гибкие в настройках. Но тут сплошной компромисс между богатством выбора и мощностью железа🤔
Спасибо вам! И удачи!😊
Спасибо! У вас талант делать понятные уроки!
Спасибо!🤗
Девушка, вы космос ) Очень толковый урок, огромное спасибо Вам )
огромное спасибо автору за его работу над этим видео! примечание: у меня была проблема после переноса файлов в папку lora, они не отображались в stable diffusion, у кого может быть так же, вот решение. stable видит только те Lora которые соответствуют выбранной модели либо SDXL или SD, все остальные скрывает. Можно отобразить все, зайди в stable diffusion
Settings\Extra Networks\Always show all networks on the Lora page
Поставь галочку и сохрани настройку, перегрузи интерфейс, все появится.
Благодарю за толковый гайд , то что надо для первого раза чтобы не читая ни чего запустить обучение лора.
Спасибо большое :)
6:56 тренировал модель для 1.5 SD и галку не ставил, так как негде и всё получилось
Ты лучшая❤❤❤❤❤❤❤❤
У тебя количество эпох 7 получилось, потому что в Max train steps у тебя стоит 1600 шагов, сколько kohya уместила эпох в эти шаги, столько и выдала. Поставь там 0 и будут тренироваться все шаги исходя из того, сколько повторов ты выставила раньше.
Здравствуйте, а почему вы пропустили установку CUDA Toolkit ?
Спасибо!
В других туториалах никогда не говорили что нужно нажимать на промежуточные кнопки вроде Print training и т.д, не знаю в этом ли была причина, но у меня ничего не работало в итоге, а в вашем видео все учтено и у меня запустилось! ❤
Супер! Рада, что у вас всё получилось!😊👍
@@irinabondareva1 кстати, я ставил epoch 10, но у меня тренирует только две модели и останавливается 🤷♂
На азиатах можно лоры не делать) И так нормально получается)) Пример не удачный, надо было взять кого-то из известных людей, например Питта, нарезать из какого нибудь фильма, проапскейлить и потом скормить кохья.
А так контент годный.
При вводе первой команды пишет error: RPC failed; curl 92 HTTP/2 stream 5 was not closed cleanly: CANCEL (err 8)
error: 5314 bytes of body are still expected . не знаете как исправить?
Спасибо большое за гайд! Очень адекватно и актуально, выражаю респект!
Спасибо за респект!😊
прекрасный гайд, очень хотелось бы понимать, какая у Вас видоеокарта?
в консоле увидел, у автора nvidia a4500
Здравствуйте Ирина что делать если появляется надпись Training has ended. при тренировке своей модели, я уже все перепробовал может я что то упускаю, подскажите пожалуйста
привет, у меня такая же проблема, может ты уже нашел решение? (комп ртх3090)
Здравствуйте! Спасибо за рассказ о процессе. А что было целью обучения лоры? И что получается без обучения?
Пожалуйста:) Обученная LoRA позволяет сгенерированным изображениям придать черты объекта (или нескольких объектов) или воспроизвести какой-либо стиль или сочетание стилей. Есть другие способы добиться этого, лора - один из способов - удобный, гибкий и хорошо настраиваемый.
вроде сделал всё как у тебя, но когда нажимаю старт, в консольки что-то пробегает и через пару секунд завершает работу. Подскажи пожалуйста из-за чего такое может быть
Тоже самое, как-то решили проблему?
Учитесь читать
flux лоры прокатит через Kohya учить? Все-таки SDXL модели уже отходят далеко на задний план.
В общем вещь интересная, но если у вас карта хотя бы не от 20гб смысла нет возиться. Не тратьте время, оно того не стоит, а если прям так надо, лучше арендовать сервер с мощной картой тогда уж. Я на 4070 с 12гб - 7 эпох часов 9 делал на 11 фотках КАРЛ, на ночь оставил. Результат не впечатлил. Переделывать снова желания не было. А вот для Flux тренирую лоры с теми же картинками, с большими эпохами и шагами. От 30 минут до трех часов и результат шикарный. Делаю через Pinokio - fluxgym. Делал по фоткам жены, 24 фотки, 10 эпох 4160 шагов за 3 часа и 26 минут. Вот вам разница. А результат на Flux сами понимаете. максимальная реалистичность )
как писал разработчик kohya, не стоит использовать с базовой SDXL bf16
Спасибо огромнейшее за толковое объяснение!
До этого натыкался на видео по 40мин или по 1.5 часа, куча воды, ничего дельного, да и результат оставлял желать лучшего. Низкий поклон.
Однако есть вопрос: сталкивались ли вы с тем, чтобы персонаж был всегда в одной и той же одежде ?
Например, у меня есть несколько артов, где персонаж в более менее похожем наряде.
Как я могу обучить лору так, чтобы при ее использовании он всегда использовал один и тот же костюм ?
Везде говорят о том, чтобы персонаж был в разной одежде, но мне нужно совсем наоборот, чтобы образ всегда был одинаковый. Заранее благодарю!
Спасибо за слова!🤗 По поводу одежды персонажа: разнообразная одежда дает большую вариативность различных комбинаций при генерации. Если персонаж должен быть, к примеру, одет в серый камзол с золотым шитьем, то в текстовых описаниях к фото нужно как можно более точно указать это. Чтобы нейросеть понимала, что именно изображено на фото. Тогда с бОльшей вероятностью при описании одежды в промте она выдаст именно такое сочетание деталей одежды. Но, думаю, это не основной вариант. Лучше использовать IP-Adapter, где мы с детальной точностью показываем ту одежду, которая должна быть на персонаже. И, меняя вес ip-adaptera добиваемся большей или меньшей похожести. У меня на канале есть урок, где я одеваю персонажа в одежду "с вешалки из магазина".😊
@@irinabondareva1 Спасибо вам большое! Я пробовал использовать IP-Adapter, но, увы, почти никогда не получалось достигнуть 100% сходства. Видео обязательно посмотрю, может что-то упустил.
Большое спасибо за понятный гайд!
здравствуйте, а что делать если python более поздней версии? у меня 11.9
спасибо за урок! я последнее время исползую adamw8bit он более быстрый чем Adafactor.
Добрый день, Ирина. Спасибо за обзор. Возможно, у вас есть опыт создания Lora на стиль? Буду очень рад, если вы сделаете обзор на эту тему. Много читал про стили и часто советуют тренировать Lora на стиле той модели, которая больше подходит к тому стилю, который вы хотите получить.
Пожалуйста:) Я сейчас занимаюсь другим, но если будет время - обязательно запишу, у меня тоже возникают такие мысли)
Спасибо большое за очень полезную информацию. Это самое толковое видео на эту тему.Обучал lora на своё лицо, с параметрами из видео есть небольшое сходство, подскажите пожалуйста как повысить результат?
Спасибо за хорошие слова!🤗 Чтобы сходство было максимальным, в промте в начале нужно указывать тот самый уникальный токен, который вы придумали для этой модели и класс. К примеру, "rtyfgh man", и уже далее описывать персонажа. Эти два слова можно посмотреть либо во вкладке Lora, кликнув по значку настроек на конкретной Лоре, либо в текстовых файлах, которые автоматически создались для каждого фото😊
@@irinabondareva1 Большое спасибо. Успехов в Вашем творчестве.
@@ВладимирБондарь-т8ь Спасибо, и Вам желаю удачи!😊
@@irinabondareva1 Здравствуйте Ирина! Хочу ещё раз выразить Вам благодарность за подробный урок по созданию LoRA. После Вашего совета по корректировки промта результат превзошел все ожидания, некоторые генерации моя жена спутала с реальной фотографией, задав вопрос "А где ты сделал эту фотографию?"правдо перед этим я сделал пару штрихов а Фотошопе и сходство близко к 100 %. Если Вас не затруднит можите подсказать ещё модель XL для обучения LoRA в реалистичном стиле. Спасибо.
@@ВладимирБондарь-т8ь Очень рада, что вам удалось добиться впечатляющего результата - женщины в своих фотках разглядят малейшую черточку, невидимую невооруженным взглядом, и реакция вашей жены - лучший индикатор успеха!😁👍 По поводу модели... мне нравится вот эти две модели, хотя, конечно, во многом тут дело вкуса:)
civitai.com/models/133005/juggernaut-xl?modelVersionId=782002
civitai.com/models/122822/crystal-clear-xl?modelVersionId=133832
Модель создана, а где искать эту вкладку txt2img не сказано ее нет..
Спасибо, получилось!
Ура! Я очень рада👏
Подскажите плиз, любой тип модели на базе SDXL подойдет? На сайте Civitai не вижу моделей на "голом" SDXL. Есть, например "SDXL 1.0", "SDXL Turbo". Спасибо за видео! UPD: "SDXL 1.0" подошла, процесс запустился. За 20 минут у меня натренилась 3% первой эпохи, поэтому все скипнула. Кажется, это не для моей видюхи
sdxl 1.0 и есть голая модель, базовая.
Ирина добрый вечер!Процесс обучения у меня запустился.Убрал кирилицу из названия папок.Появилась первая лора.Взял 12 фото друга.Но на выходе получился не очень хороший результат.Промпт был такой: а sci-fi boy, и лора первая. в итоге лицо какбы узнаваемое но почему никакго сайфая. и еще текст в панеле:A tensor with all NaNs was produced in VAE.
Web UI will now convert VAE into 32-bit float and retry.
To disable this behavior, disable the 'Automatically revert VAE to 32-bit floats' setting.
To always start with 32-bit VAE, use --no-half-vae commandline flag.
Рада, что получилось!😊
1. По поводу схожести: чтобы схожесть была максимальной, нужно в промте написать тот уникальный токен, который вы указывали в настройках (тот самый рандомный набор символов и class promt (слово "man"). В промте это будет выглядеть вот так (к примеру, у меня): "rgnhm man", а дальше "а sci-fi boy" и т.д.
2. Вы взяли первую лору - она может быть недообучена, но гибкая. Последние могут перетренированы. Для масиксимального сходства попробуйте взять лору из середины или чуть за середину. Но это неточно, тут нужно тестировать.
3. Сообщение о VAE выдается, скорее всего, потому, что вы забыли поставить галку "No half VAE".
RuntimeError: PytorchStreamReader failed reading zip archive: failed finding central directory у меня такая ошибка.
hi, could you also make a tutorial on how to create a pony checkpoint?
Max train steps 1600, когда выставляешь, не работает, а когда просто пустое поле, то работает. Как быть, что не так? Пишет total optimization steps 0, и всё, ничего не происходит!
все заработало оставил поле Max train epoch пустым и все заработало а в поле Max train steps поставил 1600 и все начло работать надеюсь кому то помог...просто если ставить 0 в первом поле и во втором 1600 то как и описывал не чего не работает...!
только вот теперь не одна шкала а вот так по порядку идет так должно быть? steps: 0%| | 2/1600 [01:23
на 4070 с 12ю гигабайтами видео . начинает кушать 15 . и под это дело берет место с ОЗУ . Из за чего время на трейн уходит за 2 часа .
Есть ли способ не давать утечку в ОЗУ ?
D:\Kohya_training\kohya_ss>.\setup.bat
".\setup.bat" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом. Что делать в такой ситуации?
У вас, видимо, не установлена программа Git, поэтому ваш компьютер не понимает эту команду.
Прекрасно! Как это сделать на АМД?
Никак, пока не видел способов запуска кохи, и сам пробовал, не получалось. У амдшки нет cuda ядер, как это есть у nvidia.
Спасибо за видео! подскажите а обязательно тренировать на оригинальной модели или можно взять любую модель на базе sdxl
Думаю, что результат на основе базовой модели будет "чище" и только ваш. Ведь если брать модель, которая уже была предварительно натренирована, то она уже несет в себе какие-то данные, и смешавшись с вашими, эффект может быть не совсем тот, что вы ожидали. Но попробовать интересно. Я не пробовала)) Поделитесь потом впечатлениями🤔
@@irinabondareva1 Я так на 1.5 тренировал модели, брал делиберате, прям супер получалось на 1.5 оригинальной, качество не то...
На какой видеокарте вы делаете 10 Epoch, на 4090 или у вас облачная тесла??? Тогда так и говорите. У меня 4070super на 12 гб, не самая медленная карта, стандартное время генерации для нее на SDXL 1024 на 1024 - 6.5 секунды, так вот, расчетное время для 10 Epoch она показывает около 5 часов!!! Плюс к тому же вы некорректно считаете эти эпоки, чтобы у вас делались все десять, а не 7 и не 5, вам нужно не 1600 указывать, а совсем другое значение.
4070super - ок, но 12 гб - это маловато. У меня RTX A4500, 28 GB RAM. Одна лора тренируется примерно 10 мин.
@@irinabondareva1 кстати, насколько я понял, один эпок это 320 степов, если делать 10 эпоков, то нужно 3200 ставить.
но видь самураи все на одно лицо?
хм, а у меня Кохая почему то обновилась до версии 24.1.4 и весь интерфейс изменился: теперь непонятно что, где и как
Добрый вечер Ирина. У меня почему-то не возникает файл с расширением "safetensors" только joson и TOML на 3-4 килобайта. Хотя я повторил все действия в видео.
Здравствуйте) А у вас программа не пишет среди массива текста сообщение об ошибке...что-то типа "не хватает мощности видеокарты"? Если программа не дошла до строчки "epoch 1... steps", значит обучение не началось. И в массиве текста должно быть сообщение о причине этого. Поищите строчку: "torch.cuda.OutOfMemoryError: CUDA out of memory." Модель SDXL достаточно тяжеловесна и требует много ресурсов. Попробуйте изменить тип модели с sdxl на sd15, чтобы проверить, что проблема не из-за нехватки мощностей. Остальные настройки не меняйте, только тип модели. Вот в этом ролике я рассказываю о тренировке лоры в сервисе RunPod,и на 13 :11 мин. как раз говорю о возможной ошибке. ua-cam.com/video/yZNIp6Bi-ow/v-deo.html
@@irinabondareva1 благодарю за ответ. Про нехватку видеопамяти панель не пишет, у меня RTX 3060 12 GB. Должно по идее хватать? Но я ещё раз попробую и еще раз почитаю логи.
Вот здесь, на странице разработчика есть обсуждения проблем, которые возникают в процессе настройки. Может, здесь есть ответ и на ваш вопрос:) github.com/bmaltais/kohya_ss/issues
Добрый день) спасибо за урок. У меня тренировка запустилась, но 27% 1-ой эпохи почти 4 часа обучалось. У меня эпох 3, а не 7 как у вас, хотя я все делала как в видео, только для тренировки 32 фото взяла. В чем может быть проблема? И еще gradio просит обновить до версии 45.29.0 это нужно делать? Если да, то как?
Параметры компа:
Процессор: Intel(R) Core(TM) i7-10700KF CPU @ 3,80GHz
ОЗУ: 32ГБ
Система: Windows 11 64-разряда
Видеокарта: Nivada GeForce RTX 4070
Корпус be quiet! Pure Base 500 BG035
Добрый день!:) А какой объем памяти у видеокарты? У меня RTX A4500 c 20ГБ. У вас видеокарта покруче, но вот какой объем памяти?🤔
32 фото для тренировки - это очень много. Здесь как раз тот случай, что больше - не значит лучше. Слишком большое количество фото может, наоборот, даже ухудшить итоговый результат. Для тренировки Лоры на базе модели SDXL лучше использовать 10-20, и, желательно, чтобы ракурс был разный.
Насчет gradio не могу дать совет, у меня версия 3.41.2
@@irinabondareva1 видеокарта 12Гб) Переделала с 12-ю фото, ушло почти 10 часов
вы чудо!
почемуто-то не возникает строка epoch 1/7 много текста и в конценадпись что тренировка закончена
-Проверьте, не пишет ли в этом тексте ошибку, что не хватает видеопамяти, что-то типа "torch.cudaOutOfMemoryError: CUDA out of memory."
-В названиях папок не должно быть кириллицы и пробелов.
Это самые распространенные моменты, почему тренировка заканчивается безрезультатно.
Как быстро у вас проводится обучение? (Скачал файл для современных видео карт) У меня gtx 3060, запустил процесс обучение, видео карта загружена на 99%, примерное время 6 часов..
3060 это очень слабая карта для тренировки.
У меня A4500, и одна модель обучается примерно 10 мин. На тренировку 7-ми эпох потребовалось чуть больше часа.
А какой объем видеопамяти у вашей 3060?
@@arimanmagnarov1815 12г
Поему в конце на тренинге Лоры нет? а есть файлы toml?
Видимо, обучение лоры не началось по какой-то причине. Одна из причин - недостаточно памяти видеокарты. Поищите среди массива текста строчку: "torch.cuda.OutOfMemoryError: CUDA out of memory".
Модель SDXL требует досточно мощной видеокарты. Попробуйте в настройках поменять имя модели с sdxl на sd15 и запустите обучение, чтобы исключить тот вариант, что kohya_ss не хватило мощности.
Если это не тот случай, поищите в тексте еще сообщения об ошибке, что-то со словом "error".
@@irinabondareva1 я на 1.5 тренировал. Ошибки как бы не было, но посмотрю внимательно, спасибо.
Вот страница разработчика с обсуждением проблем, которые возникают у людей, может, пригодится) github.com/bmaltais/kohya_ss/issues
@@irinabondareva1 благодарю вас
Забыли сказать, что по пути установки не должно быть кириллицы и пробелов в названиях папок.
Согласна с замечанием. Это как раз пример того, что порой нам просто не приходит в голову отметить какой-то момент, который нам кажется очевидным, но который не очевиден для других. Бывает...🤔
4060 на 8 гигов вообще сможет это чудо осилить?
Жёская!)
Вот такой текст в cmd панели: steps: 0%| | 0/1600 [00:00
Нашла такой же вопрос, как у вас. Человек пишет о проделанных шагах по отладке, и одним из пунктов пишет:
"Также я проверил папку: D:\訓練\log существует, это пустая папка."
Ему посоветовали изменить имя папки на английское. Вот ссылка по обсуждению такой ошибки: github.com/bmaltais/kohya_ss/issues/1850
А если у меня уже стоит пайтон 3.10 м git мне не нужно их скачивать снова? я в марте автоматик установил
Не нужно:)
@@irinabondareva1 спасибо за ответ), я вчера не дождался его и установил кохью повторяя ваши действия по видео! У вас хороший педагогический дар))).
@@arimanmagnarov1815 спасибо!😀Рада быть полезной))
@@irinabondareva1 Ирина у вас какая видеокарта стоит? Вы на каком "железе" тренируете Лоры? Или у вас облачный сервис какой нибудь?
Есть способ всё это в гугл колабе сделать?
Есть, мне попадался ролик, где автор именно там и запускал. Но, к сожалению, я не сохранила его, так как не пользуюсь колабом
Ты крута
Thanks😊
У меня на 4090 20 картинок 3 часа обучаются это смешно.
Что именно смешно? Здесь большое значение имеет не крутизна видеокарты, а объем ее оперативной памяти. У меня не самая мощная RTX A45000, но у нее 28 гигов. А если у вас 4090, но с 12-ю гигами, то обучение будет медленнее.
@@irinabondareva1 на 24гб, а смешно что такая видеокарта не вывозит какие-то картинки с разрешением 1024😪
@@СлесарьЛеха Поняла) Но если посмотреть на это с другой стороны🤔... какие-то три часа и у вас готовая модель(!), умеющая мимикрировать под определенную внешность с максимальной степенью сходства;))
у меня 500 картинок 9 часов.. если все как в настройках делать у автора...ртх3060 12гигов
При тренировке lora выдает такую ошибку, как ее исправить? CalledProcessError: Command '['D:\\Kohya-ss\\kohya_ss-master\\venv\\Scripts\\python.exe', 'D:/Kohya-ss/kohya_ss-master/sd-scripts/sdxl_train_network.py', '--config_file', 'D:\\lora\\Lora\\model/config_lora-20241012-175302.toml']' returned non-zero exit status 2.
Такая ошибка случается, если какой-то параметр выставлен неправильно. Проверьте, переключились ли на SDXL (возможно у вас стоит галка на sd1.5 или на v2.) Проверьте оптимайзер - должен быть "Adafactor". Названия папок должны быть на латинице и без пробелов. В общем, нужно проверить все параметры - где-то закралась ошибка.