Строим свой ИИ чатбот на основе кастомных данных используя OpenAI API и GPT Index
Вставка
- Опубліковано 26 вер 2024
- Туториал по созданию ИИ с пользовательской базой знаний с использованием OpenAI API, GPTIndex и Langchain.
Техника была описана Dan Shipper www.lennysnews...
Код из видео: colab.research...
Хотите стать UX/UI дизайнером? Проходите курс: stepik.org/z/1...
#UXDesign #UX #UIдизайн #UXUIдизайн #вебдизайн
Видно что этот урок написал очень опытный Senior или Middle разработчик. Как новичок скажу, спасибо что разобрались за нас и публиковали этот видеоролик
Спасибо за информацию. То что я долго искала. У Вас подробно, без лишней воды.❤
Спасибо! Очень полезный урок.
Спасибо за видео! Вас очень приятно слушать
Как всегда топ контент! Не хотел программировать, но после этого видео, кажется придётся делать свой ИИ. Лайк, подписка, колокольчик!
свой ИИ всегда лучше чем чей-то чужой 😉
гуд идея, только делать ИИ с нуля тот еще гемор, просто посмотри у веритасиум разбор по тому как работает ИИ и машинное обучение, а так желаю всего самого лучшего!
Ну это просто бомба информация! Спасибо!
Круто! Придется в этом разбираться))) Жду еще роликов!
Спасибо) В планах сделать видео на актуальные темы
спасибо за видео! супер контент!!!
Рада, что вам полезна эта информация. ИИ может стать помощником и взять на себя значительную долю рутинной работы. Я планирую серию роликов по работе с ИИ, буду рада обратной связи)
Спасибо за классный контент! Взял себе на заметку
Спасибо большое, пойду обучать своего )
у вас такой приятный голос 🤤
Спасибо! Возьметесь ли Вы за работу по созданию и интеграции чата ИИ на сайт?
Thank you!
Душка 😇
Спасибо
Слава тебе хорошая женщина. Записала отличное видео
правильно ли я понял, что вопросы которые мы можем задать ИИ, нужно прописывать заранее. Нельзя будет задать какой-нибудь вопрос, который не прописан в коде. Все правильно понимаю?
конечно можно, тут просто для примера заранее прописано
❤
Index gpt должен постоянно должен включен ?!
Ирина, ты можешь обновить код Construct an index? я не могу исправить ошибки которые там возникают из-за недостатка компетенций
Как обойти ошибку openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens, however you requested 4222 tokens?
Хотя даю обычный запрос, не особо длинный
так в API есть поле для установки лимита токенов, что-то вроде maxTokens=100
Здравствуйте, не подскажете, как исправить ошибку
InvalidRequestError: The model `text-davinci-003` has been deprecated
?
Можно ли «скормить» ему несколько книг, и чтобы он давал ответы основываясь на идеях из этих книг ?
Можно
Спасибо большое! Можно у Вас купить консультацию?
Сейчас уже используется новый API. Нужно использовать либо старый либо обновлять код под новый. Под новый у меня пока обновить не получилось, а вот откатился к старому API и код выполнился, индекс создался
Ирина, подскажите, у вас не возникала проблема, с тем, что ответ возвращается не полным, обрезанным?
НАДО ПРОЛИСТНУТЬ в право,там стрелочка такая треугольничек перевернутый на бок,и на вторую страницу перейдет,есть у них такой заскок
я так понимаю gpt_inndex теперь фсё? И вместо него трудится llama_index.
Функции из этого примера уже не работает, быстро устаревают. Приходится заменять новыми.
Возможно ли у вас заказать такой чатбот?
Подскажите пожалуйста, какой Максимальный объем данных он может проанализировать?
Тут нужно понять принцип работы, нельзя однозначно ответить на этот вопрос. Как базу знаний ему можно задать неограниченный объем, но сам чатгпт не имеет доступ к этим данным, и не видит картину целиком. В момент вопроса к нему, в базе знаний находятся несколько параграфов, которые скорее всего имеют отношение к вопросу. Далее эти параграфы отправляются самому чату вместе с вопросом пользователя. И на основе этой информации он даёт ответ. Как много нужной информации (параграфов из базы) можно отправить чату зависит от версии модели, но в целом не много.
@@KonsatntinPetrov ну вот я загрузила большой объём, около 50 000 токенов, проанализировать не получилось нормально, он отвечал неправильно на вопросы по документу
я не понял, как это вчат бот запустить?
Очень круто! Но тяжело понять без знаний разработчика. Есть кто-то, кто мог бы помочь (не бесплатно) разобраться как самому создать этот бот на основе своих данных?
Вы серьезно? Я не знаю пайтон совершенно но пиши программы на пайтон, так как пишет их за меня ГПТ, а я только ТЗ ему выдаю.
добрый день, может быть нашли кого-то? мне тоже актуально)
@@anisia26вы нашли?
Вы можете разобрать голосового бота на ии и его этап обучение?
Подкрути другую нейронку для генерации голоса на основе текста
И что дальше
Спасибо за видео. А как лучше это применять для данных на русском языке. Переводить на английский, потом в индекс? Или есть инструменты для создания индекса на русском?
С русским языком не экспериментировала ) по идее GPT должен и русский понимать, хоть и хуже. Попробуйте сначала без перевода, посмотрите что получится
Здравствуйте, пробовали работать с данными на русском языке? GPT корректно работает?
не работает скрипт
А для использования API тоже надо использовать заграничный IP?
Нет
Нет
Насколько большой объем своих данных можно задействовать? Скажем, у нас кастомный текст на 1 Гб, потянет?
По логике, должен потянуть и больший объем. Просто он должен быть разбит на небольшие части в рамках установленного объема токенов для GPT. Просто смотрите по образцу - как там нужно делить большой файл и какого объема должны быть эти файлики
@@masterbiz100 как его разделить не совсем поняла
@@Лисица-й6цвот именно, что значит разделить, если ответ должен парситься по всем данным сразу.
Добрый день, Подскажите, удалось вам реализовать?
@@RedpaX ответ не даётся по всем данным сразу, в этом и суть. Чату можно дать только маленькие кусочки информации, для этого ваш текст сначала разбивается на маленькие кусочки, а в момент вопроса к чату, ему в добавок с самим вопросом отправляется несколько кусочков, которые подходят скорее всего по логике.
Я правильно понимаю, что каждый запрос для ГПТ будет добавлять данные из index файла и как следствие пожирать токены? То есть если у меня в index 400 символов то каждый раз к ГПТ будет идти «символы запроса пользователя+символы из index файла»? Если так то это бессмысленно абсолютно, мы всегда будем - 1 упираться в ограничение по символам в index файле, -2 сжигать деньги с бешеной скоростью так, как каждый наш запрос даже их 5 символов будет дополняться символами из index файла. Тогда получается что городить это смысла нет и проще действовать по старинке, отправлять нужные данные базы для ГПТ через первое сообщение и после уже не тратить токены в рамках одной сессии нового чата.
Вы понимаете смысл "индекс базы данных"? Из всего вашего файла он и отправляет только нужный кусок, по индексу. Ну если у Вас книга на 300 страниц с данными Вы в жизнь не не отправите через прост. Поэтому все норм
Подарите мне предобученную модель ChatGPT 3.5-turbo! Куплю видяху и ОЗУ больше и у меня будет личный ии!
кхе. посмотри на цены видяхи на 256Гб. дешевле будет обучать в облаке.
@@_bigbro Я лучше один раз заплачу
Турта В.Г., 58 лет, автор научного открытия, мировой лидер в создании Промышленного ИИ. Первый в мире кибер-технолог, способный выполнять работу специалиста СЧПУ уже готов и выводится на рынок, пока, как обучалка. Рынок обучения СЧПУ по прогнозу чатГПТ более 5 миллиардов к 2025г. Дальше будет осваиваться рынок мелких собственников и затемм крупных компаний. В результате за 5-7 лет планируется создать компанию-триллионера. Как мне может помочь чатГПТ в маркетинге обучалки?
Научиться формулировать вопросы понятно
Добрый день, я могу интегрировать этот чат бот в инстаграм, телеграм или вотсап?
Спасибо, но пока все же не ясно как его интегрировать в качестве тех.поддержки в мой телеграм бот на PHP чтоб клиенты спрашивали про мои услуги к примеру, а Ai давал ответы на основе загруженной базы данных. В этой задаче ваш пример поможет?
Все правильно сделано .организованно .