Лучший гайд на SillyTavern и установку локальных LLM

Jofi

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 16 лис 2024

КОМЕНТАРІ • 137

@jofizcd 5 місяців тому ⁺⁵
Комментарий в поддержку автора канала... Ладно, просто попрошу вас подписаться на мой телеграм-канал, пожалуйста: t.me/+UOWReJ5WlTAwOTk6
P.S: С недавнего времени загружать отдельно SillyTavern Extra необязательно, так как теперь интерфейс поддерживает загрузку дополнений прямо у себя. Во вкладке расширений вы сможете найти кнопку с загрузкой новых модулей и выбрать из выпадающего списка нужное вам дополнение.
@jimmyster 5 місяців тому
А будет тутр по установки на линуксе?
@I_am_Nexus 5 місяців тому ⁺⁴²
Ну что могу сказать. Спасибо, Автор! Раньше мне приходилось ебаться с ИИ метафорически, а теперь буквально.
@acnologiaoff 5 місяців тому ⁺¹⁶
Комментарий в поддержку автора канала...
@owethaan3306 5 місяців тому ⁺¹¹
Грустно, что есть те самые 0.01% что не смогли сделать себе вайфу.
@ComeBack.041 5 місяців тому ⁺²⁸
ждём третий ролик где всё сведется к установке уже готового бота в 1 клик )
@happy-gq2kw 5 місяців тому ⁺²
Faraday (его переименовали в backyard ai) для этого и существует
@youzaks 25 днів тому
@@happy-gq2kw я и в нем заебался мальца дрочиться с разными моделями и их настройками
@dacorin.8645 5 місяців тому ⁺¹⁰
Во время запуска модели в KoboldCPP путь до файла с моделью не должен содержать кириллицу, иначе он выдаст ошибку.
@mitteos 3 місяці тому
Красава, от тебя узнал про SillyTavern и успешно все установил и запустил
@tchibux 5 місяців тому
Прекрасный гайд, искренне благодарим автора за проделанную работу
@katerina4762 19 днів тому
Автор, просто спасибо тебе большое и человеческое! Я даже не знала, что такое есть... Подскажи пожалуйста, моделька я так понимаю уже готовая под определённого персонажа? Есть ли какой то вариант настроить под своего героя или это надо уже осваивать создание моделей?
@sharenik7974 5 місяців тому
Харош, мужик. Делаешь великое дело. Всех благ тебе
@CF-yk8iu 4 місяці тому
До чего дошел прогресс боже!!!!!!!!!
Спасибо автор что разжевал и положил в рот.
@orcbol8066 4 місяці тому ⁺⁵
В SillyTavern Extras не могу найти файлик Start. Где искать-то его?
@MegaBigBright 5 місяців тому ⁺⁵
Главная беда всех современных ролплей AI- моделями в том что весь ролеплей строится от контекста который выстраивается в процессе "общения". То есть - АИ сам ничего не придумывает он лишь зеркалит запросы пользователя.
@LapaKotika 2 місяці тому ⁺¹
В чем проблема прописать в инструкции модели "выдумывай мне необычные ситуации/развитие сюжета" или что тебе надо?
@oxiiide_ 5 місяців тому
Спасибо. Теперь я смог. Осталось найти нужного персонажа и чатится с ним
@Человек-д8п4р 2 місяці тому
Хотелось бы про промты узнать куда и в какие, что пихать,как и в карте персонажа,заметки автора и скалирование...
@Diogen-m3u 5 місяців тому ⁺⁴
блин, видео конечно хорошее, но ничего нового я не узнал, видимо я уже давно обычный пользователь. Я вот все хочу добавить озвучку сообщений с голосом определенного персонажа как в character ai, но мне лень с xtts разбираться, думал тут наконец узнаю... придется работать самому аааа
@cutelunatic814 5 місяців тому
Alltalks tts и примеры голосов по 10-15 секунд. Устанавливается в два клика, туториал на Ютубе найти можно (он там один для таверны). Сам пользуюсь, результат для локальной ТТС нормальный
На xtts тоже есть, но там ковыряться дольше с настройками и установкой
@Diogen-m3u 5 місяців тому
@@cutelunatic814 спасибо, попробую, а то зациклился на xtts, не думал про альтернативы вообще
@Diogen-m3u 5 місяців тому
@@cutelunatic814 есть какие-нибудь советы по аудио? я ему даю файл, стараюсь чтобы он был более менее монотонным и плотным на 5-15 секунд, но он все равно выдает ломанный голос. Оригинальные голоса только работают более менее нормально, буду ещё экспериментировать, но видимо он просто плохо работает на русском
@Luna1heMoon 5 місяців тому
Гений, красава, ждем еще большего развития темы
@kuroniti 5 місяців тому ⁺⁸
"Запускаем файл start.bat." А его нету! что делать?
@mipouuk 5 місяців тому
запустить файл start
@whatcoster7325 4 місяці тому
Вы наверное забыли скачать node js
@I_am_Nexus 4 місяці тому ⁺²
Автор Экстрас, нехороший человек, тупо выпилил файлик .bat. Я запускаю .sh через VS Code. Да, костыль, но рабочий костыль!
@CF-yk8iu 4 місяці тому
@@I_am_Nexus поподробнее пожалуйста, как сделать костыль? Скачал VS Code в нем открывал .sh не помогло, возможно запустить его надо но как ?))
@foxx6092 11 днів тому
Вопрос, а как ты запихал vtube модель персонажа в st?
@Trendish_channel 21 день тому
А можно вщять характер персонажа с Character AI и загрузить его в LLM?
Но даже ведь после такого голос натренированный на звонки и общение реал тайм неполучится повторить?
@AizarkLizard 21 день тому
Автор прости нуба, но стоило при выборе модели уточнить какие модели нужны для разной оперативки. У кого то больше чем твои 16 у кого то меньше, приходиться отвлекаться от твоего видео гайда, и гуглить инфу. НО спасибо за видос, очень мало видео по данной теме.
@nw_art 5 місяців тому
Я прям вчера об этом думала..
@speedwagon39 4 місяці тому
лучший
@Neurothreat 5 місяців тому
до чего дошел прогресс
@alexp5626 5 місяців тому ⁺²
Теперь осталось создать единую программу, чтобы нужно было только нажать setup.exe😁
@fakejade2818 22 дні тому
10:02 Там кроме Серафины, вроде никого и нет, по дефолту (покрайней мере у меня). Неплохой персонаж, мне понравился. Даже удалось развести её, на всякое....... Единственное что, через какое-то время, она перестала мне отвечать. Хз, почему - то ли настройки цензуры не позволяли ей ответить, то ли токены для ответа закончились.☹☹☹
@roman_zubrilin_88 4 місяці тому
У меня одного висит на этапе установки Visual Studio после запуска NodeJS?
@kerfurnya 5 місяців тому ⁺¹
Очень сочный гайд, спасибо большое, и как думаешь, на 3050 с 4гб виртуальной пойдёт лама3 или лучше мистрал юзать?
@happy-gq2kw 5 місяців тому
А как это связано лол? Смотри на размеры (7-8b)
@I_am_Nexus 5 місяців тому
На 8 Гб +32 ОЗУ летает, на 4 ± должно пойти, но лучше что полегче поискать
@kerfurnya 5 місяців тому
@@happy-gq2kw Я новый в нейронках, везде писали что главное врама
@kerfurnya 5 місяців тому
@@I_am_Nexus Спасибо
@Kinjeiro 4 місяці тому
@@I_am_Nexus подскажите, пожалуйста, тоже 32 ОЗУ и 8 от 3070 вы какую для себя в итоге модель выбрали?
@alexeyfilipovich1238 5 місяців тому ⁺²
вот всё установил, но спустя небольшое время (порой уже через 10 сообщений), ИИ начинает зацикливаться и каждый раз генерировать одно и то же сообщение, либо 3-4 повторяющиеся по кругу фразы. скачивал разные модели, встретил это на всех скачанных, так что полагаю, что проблема не в этом.
сталкивались? подскажите как исправить :)
@jofizcd 5 місяців тому ⁺¹
Скачай последнюю версию SillyTavern и если у тебя модель Llama 3, то во вкладке форматирования поставь пресет Llama 3 Instruct и поставь галочку на режиме Instruct
@alexeyfilipovich1238 5 місяців тому
@@jofizcd спасибо. опробую, потом отпишу о результате
@hugosoffc Місяць тому
на 3080 TI типы, подскажите, с каким токеном у вас генерит?
@saltysenpai9136 5 місяців тому ⁺¹
Уважаемые, застрял на этапе с KoboldCPP, когда вставляю туда модель L3-8B-Stheno, пишет Unknown Model, cannot load. Load Model OK: False, после чего KoboldCPP самопроизвольно закрывается. Кто-нибудь сталкивался с таким?
@kadzuto6 5 місяців тому
У меня таже проблема, сейчас с ней разбираюсь
@Chief_Inspector 5 місяців тому ⁺¹
Возможно путь до модели на кириллице. Создай папку подписанную латинскими буквами и проверь.
@UkraineThankYou 7 днів тому
Увы. Хоть ты тресни нет подключения. Работает чат через интерфейс кобольдссп - открывается автоматически. Но я хз, использует ли он при этом собственно рес компа. Таки на компе едет. А вот за конфиденциальность я не уверен. Кроме того почему-то не загружаются тяжелые модели. 🙄И тоже разобрался. Пытался ставить модели для которых надо было более 32Гб ОП -_- И на последок, просмотр англоязычного редит дает надежду что использование локальной модели на kobold cpp, без kobold hord конфиденциальна, но гарантировать это я не буду.
@alexeytsvigune6230 День тому
отключаешь интернет и если работает твоя модель и не ругается на отсутствие интернета, значит конфиденциально )) А вот перевод через гугл не может быть конфиденциальным ) надо ставить еще и переводчик локальный или искать модели для русского языка. Ну если тебе не нужен НСФВ контент, то какой-нибудь L3-8B-Stheno-v3.2-IQ3_M-imat может общаться на русском.
@Kinjeiro 4 місяці тому
Спасибо, здорово и подробно
Подскажите, а знаете пусть и платные сайты у которых апи без цензуры? (На моём 32 ОЗУ и 8 3070 боюсь ничего достойного не запустить)
Или сайты которые дают возможность в одной сцене использовать несколько персонажей? Говорят character ai прикрыли свои комнаты
@LapaKotika 2 місяці тому
Есть awanllm (200 бесплатных сообщений в день/50токенов сек)
Алсо, в самой таверне есть "комнаты", жмешь на три полоски рядом с чатом и там делаешь из текущего чата групповой с любым другим персонажем. Или ты можешь совместить карточки двух в одного, но тогда токенов будет жрать, соответственно, на двоих.
@yaku___ 5 місяців тому ⁺²
Ура, амодей рилизнули ирл
@IMedzon 2 місяці тому
С температурой 1.15-1.27 , как указано на хаггинфейсе, он совсем уж горячку всякую несет бессвязную, на разных языках и т.п. (Я про модель stheno) ...даже не знаю что не так. До единички в целом хорошо справляется
@LapaKotika 2 місяці тому
Это значит что у тебя другие настройки не в порядке. Попробуй сбросить все семплеры и оставить только температуру. Посмотри подходит ли токенайзер и шаблон.
@IMedzon 2 місяці тому
@@LapaKotika Да, ты прав, Top P был 0.5...видимо влияло. и токенайзер на лламу поменял
@LapaKotika 2 місяці тому
@@IMedzon Топ Р так не влияет, у меня сфено работает на темп 1.2 и топ Р 0.7. Скорее всего это был лишний семлер, неправильный их порядок или токенайзер. Хотя таверна всегда ставит ламу 1/2. Третья лама вообще чувствительная к настройкам семлера.
@Falkonar 5 місяців тому ⁺¹
Что такое квантованая модель?
@mipouuk 5 місяців тому
возможно проглядел, где подскажешь где лучше брать персонажей?
@jofizcd 5 місяців тому ⁺¹
смотри прошлый гайд, там я говорю про это
@Dark_Johnny_Games 5 місяців тому
Крутая штука. Жаль что комп у меня слабый.
@solinvictus4381 5 місяців тому
купи себе какой-нибудь апишник с доступом к условному myphomax (на том же венусе за 5 баксов) и сиди себе, вроде бы не слишком дорого за такую штуку
@roman_zubrilin_88 4 місяці тому
А можно такое же видео, но для Android и локальной языковой моделью? С Termux не знаком.
@lord_romzess_v 4 місяці тому
Про локальную тут сказано, на сайте SillyTavern в русской вики можно найти инструкцию, в т.ч. инструкцию по установке и настройке Termux. Да на всеобщем, но пошаговую и подробнейшую. У меня ушло 30 минут на настройку, затуп был только в моменте, когда при подключении API в SillyTavern надо было указывать не внутренний адрес компа (127.0.0.1), а его IPv4 адрес из сети. Что вообще-то логично.
@БольшойОтец 5 місяців тому
Грусно што не охватил момент с GPTQ моделями. У кого хотя бы 8 гиговая карта есть могли бы запускать мелкие модели на сверхсветовой скорости.
@crystal3627 5 місяців тому
Kobold жалуется на отсутствие dynlib/dll, как пофиксить можно?
@lerikc91 2 місяці тому
Да, на линукс тот еще секс, особенно с установкой расширений. (ну для человека который не шарит)
@Homie_ch 5 місяців тому ⁺¹
Подскажите пожалуйсто, как у вас текст генерируется прямов в чате. Мне нужно ждать пока он прогрузиться и его пришлют как сообщение, а увас будто текст набирают.
@katyaefremova5079 4 місяці тому
В настройках ответ под ответом (в токенах) есть стриминг текста это оно.
@WawaCat259 Місяць тому
Нету файла start.bat в SillyTavern Extras. Как это исправить?
@biwer41 25 днів тому
пофиксил? у меня та же проблема
@WawaCat259 25 днів тому
@@biwer41 экстрас уже встроен в силлитаверн
@kadzuto6 3 місяці тому
Что делать, если персонаж пишет фразы от моего лица, вместо меня. Как отключить?
@ZigomëtNavalny 2 місяці тому ⁺¹
Обычно это можно исправить написав персонажу нужный промт, в строках с описанием личности, или сценарии. Добавляется что то типа: {char}/{character} никогда не будет писать от имени {user} и так далее. Ты можешь найти это у других персонажей, и скопировать от них.
@kadzuto6 2 місяці тому
@@ZigomëtNavalny большое спасибо!
@ПаблоАрсабло 5 місяців тому ⁺¹
15:09 разве в таком случае гугл не спиздит все твои сакральные диалоги, спрятанные на локалке? У них же там 200% переводы сохраняются где-нибудь(, как и фотка твоего гуся, которую ты почти сразу же удалил, но которая осталась валяться в анналах гугла, ожидая нужного момента). Конфиденциальность, епт.
(Или переводчик тож локальный?)
@Алексей-д7ы2п 5 місяців тому
Ну, в списке у таверны есть libre translate, который можно и заселфхостить. Но перевод там, конечно, хуже, чем у даже гугла.
@Хамбакер-е8о 5 місяців тому
Жду модель ♂Билли♂
@zer0275 4 місяці тому
У меня вопрос. А что с памятью? Персонаж будет запоминать прямо всё или будут забывать через время?
@jofizcd 4 місяці тому
Будет запоминать всё, покуда есть свободное место в контекстном окне
@foxx6092 11 днів тому
Если есть необходимость чтобы персонаж запомнил какой-то факт всегда можно записать эту информацию в лорбук
@ПростоАртур-ь2ы 5 місяців тому ⁺¹
Как называется игра на фоне?
@MairanTV 5 місяців тому
Хз, всё как надо, пробовал по разному настраивать, по инструкции модели, а она у меня повторяется.
И такая тупость, типа
Я: "мне нравятся мармеладные конфеты. А тебе?"
она: "Мне нравятся карамельные конфеты. А тебе?"
@MairanTV 5 місяців тому
в принципе я поубирал некоторую оптимизацию и вроде теперь нормально разговаривает.
@noname_yopta 5 місяців тому
Автор, как у тебя так получилось, что версия Таверны новая, а перевод со старой? Это ноасс? Я знаю, что он вроде заменяет часть файлов и из-за этого портится локализация.
@jofizcd 5 місяців тому
В гайде старая версия, но от новой в принципе не отличается, так что можешь не париться
@noname_yopta 5 місяців тому
@@jofizcd Понял, благодарю.
@Falkonar 5 місяців тому
Я юзаю мистрал эротик на 130млрд мне кажется идеальная
@zer0275 4 місяці тому
А какие у тебя характеристики?
@Falkonar 4 місяці тому
@@zer0275 24гб vram Mixtral Erotic 13Bx2_MOE22B q6 .но она только по английски норм говорит.не нашел кто по русски говорит без фильтра
@emptybot5534 2 місяці тому
Я не понимаю откуда автор видео батник для допов взял? Сам запилил или что? Может поделишься тем как ты это сделал?
@Фильмы2024-д1п 5 місяців тому
На сколько памяти хватает?
@dapolgi9467 Місяць тому
Все на самом деле просто, даже дебил с этим справится, ну там это так, потом так, ну потом типа тыкаешл туда, ну не скажу куда,и потом тыкаешь ещё сюда, и потом ну туда сюда, потом качаешь это, потом спаиваешь это, ну загружаешь, потом короче ну там то-та, потом ну все готово, дело за 5 минут!
@dapolgi9467 Місяць тому
Люди могут делать это в первый раз, поэтому ничего не понял, сходи туда, потом туда, потом это, потом то, потом там, потом другое
@Slavius84 4 місяці тому
Я так понял что голос для персонажа вставить нельзя??
@Edgy_will1 4 місяці тому
Привет,24 гб видеопамяти и 32 гб озу за глаза?
@jofizcd 4 місяці тому
Да
@ИванИванов-б6у2д 4 місяці тому
А могу ли я познакомиться с настоящей тянкой, а то это сложновато?
@jofizcd 4 місяці тому
@@ИванИванов-б6у2д смотря, что сложней: следовать гайду или знакомиться с тянкой
@ИванИванов-б6у2д 4 місяці тому
@@jofizcd я познакомлюсь с тянкой, чтобы она установила мне это: легче от государства альтушку получить, чем в этих ваших кампурацхерах разбираться!
@enjiepop1955 4 місяці тому
бляяяяяять я не хочу быть тем самым 0.01 процентом, что делать если при запуске модели в кобальте ничего не происходит? Кирилицы в пути если что нету, плиз хелп
@S.M...... Місяць тому
может кто батник скинуть?
@BlackChaplin 5 місяців тому
Может кто-нибудь выложить модель на гугл диск, скорость загрузки с сайта, что-то очень сильно хромает...
@НиколайВолков-х5г 5 місяців тому
😢
@rpshnik 5 місяців тому
16 гб видео памяти а если у меня ноут на 12? Мне пиздец ?
@jofizcd 5 місяців тому
Да нормально должно быть, можно смело даже 13б запускать
@Nikita1358 2 місяці тому
в начале говоришь что к концу ролика обычный юзернейм будет понимать программу. по итогу все равно наговорил столько всего чт ничего не понять. держу в курсе, видос должен показывать что скачивать и куда тыкать. чтобы весь процесс был :скачал - вставил и так повторить по нескольку раз. все.
а у тебя куда ни ткни в ролике непонятно к чему это объясняется..
@jofizcd 2 місяці тому
@@Nikita1358 Ну не судьба значит, бывает(
@Nikita1358 2 місяці тому
@@jofizcd ага.. не судьба когда сама судьба по железу благоволит, Intel Core i9-13900K, Nvidia RTX 4090, 64 GB 5600 MHz DDR5 RAM, 16 TB SATA SSD
@jofizcd 2 місяці тому
@@Nikita1358 ну я тогда хз, всем понятно, а тебе нет. попробуй несколько раз видео посмотреть
@Nikita1358 2 місяці тому
@@jofizcd запустить то все запускается. проблема в том как импортировать сценарий без персонажа.
и почему после нескольких кинутых фраз в какой-то момент начнет словно сам с собой чат разговаривать.
в целом проблема кобольда в не точности, lm studio всегда четко именно что отвечает, т.е не получается как adventure, или диалог подключить; и еще лагает..
да и не понятно какая конкретно модель нужна. ну типо есть те где обучался в том числе и на русском языке. как тот же Mistral-Nemo-Instruct-2407-Q8_0
в некоторых пак файлов по 4 или около того гб, общий вес под 20 или 30 гб. как такое запустить?
@LapaKotika 2 місяці тому
@@Nikita1358 Облизываюсь на твое железо, чел. Бросай Shteno и переходи на c4ai-command-r. Сценарий можно скоприровать\вставить. Если имеешь ввиду что хочешь не разговор а формат рассказа, то просто попроси модель. Есть сайт с шаблонами как у данжеон аи.
На ответы ии не влияет кобольд, лм или другая если ты работаешь через таверну. Есть модели которые поддерживают русский: комманд и роз например. Тебе нужно смотреть для этого большие модели 20B и более, либо искать модель которая обучалась на русских блоках данных, (на хагинфейс есть поиск по русскому языку) но ты сам можешь понять что их значительно меньше.)
Пак файлов это и есть модель, просто неквантованная или это другой формат как exl2.
@xeleos 5 місяців тому
Жду когда эти модели научатся нормально говорить на русском.. пока что с переводчиком не интересно.
@GameNavigatorsDaJ 5 місяців тому
КобольдАИ по сравнению с ОпенАИ кнешно смотрится вообще не очен
@jofizcd 5 місяців тому
В плане?
@MrCans94 5 місяців тому
Почти сутки общался с моделью. До адурения.. Скажи пожалуйста, @Jofi1492, тебе что-нибудь известно об инкрементальном обучении моделей? Это вообще возможно или существует при мощностях наших пк? Просто обратил внимание, что файл модели изменяется при закрытии командной строки, но наверняка это просто кэшированные данные, связанные с последним сеансом общения и не более. Задался вопросом, короче и загрузился :))
@ГеоргийКозик 5 місяців тому
Комментарий в поддержку автора канала...

Наступне

Автоматичне відтворення

Qwen Just Casually Started the Local AI Revolution