Строим свой ИИ чатбот на основе кастомных данных используя OpenAI API и GPT Index

Поділитися
Вставка
  • Опубліковано 26 вер 2024
  • Туториал по созданию ИИ с пользовательской базой знаний с использованием OpenAI API, GPTIndex и Langchain.
    Техника была описана Dan Shipper www.lennysnews...
    Код из видео: colab.research...
    Хотите стать UX/UI дизайнером? Проходите курс: stepik.org/z/1...
    #UXDesign #UX #UIдизайн #UXUIдизайн #вебдизайн

КОМЕНТАРІ • 71

  • @Яестьчеловек-ш6ф
    @Яестьчеловек-ш6ф 11 місяців тому +10

    Видно что этот урок написал очень опытный Senior или Middle разработчик. Как новичок скажу, спасибо что разобрались за нас и публиковали этот видеоролик

  • @PrettyBetty-l1z
    @PrettyBetty-l1z 9 місяців тому +2

    Спасибо за информацию. То что я долго искала. У Вас подробно, без лишней воды.❤

  • @nataliasokolova2989
    @nataliasokolova2989 9 місяців тому +2

    Спасибо! Очень полезный урок.

  • @kotik7493
    @kotik7493 5 місяців тому

    Спасибо за видео! Вас очень приятно слушать

  • @Lexa-Live
    @Lexa-Live Рік тому +6

    Как всегда топ контент! Не хотел программировать, но после этого видео, кажется придётся делать свой ИИ. Лайк, подписка, колокольчик!

    • @irina1nik
      @irina1nik  Рік тому +2

      свой ИИ всегда лучше чем чей-то чужой 😉

    • @EWLN
      @EWLN Рік тому +1

      гуд идея, только делать ИИ с нуля тот еще гемор, просто посмотри у веритасиум разбор по тому как работает ИИ и машинное обучение, а так желаю всего самого лучшего!

  • @RedpaX
    @RedpaX 11 місяців тому +2

    Ну это просто бомба информация! Спасибо!

  • @АннаЛаврикова-н7в

    Круто! Придется в этом разбираться))) Жду еще роликов!

    • @irina1nik
      @irina1nik  Рік тому +1

      Спасибо) В планах сделать видео на актуальные темы

  • @MotionCat
    @MotionCat Рік тому +2

    спасибо за видео! супер контент!!!

    • @irina1nik
      @irina1nik  Рік тому

      Рада, что вам полезна эта информация. ИИ может стать помощником и взять на себя значительную долю рутинной работы. Я планирую серию роликов по работе с ИИ, буду рада обратной связи)

  • @квинтэссенцияневесомости

    Спасибо за классный контент! Взял себе на заметку

  • @victorkravchenko511
    @victorkravchenko511 Рік тому +1

    Спасибо большое, пойду обучать своего )

  • @georgetyndall7623
    @georgetyndall7623 Рік тому +1

    у вас такой приятный голос 🤤

  • @dzzvin
    @dzzvin Рік тому +5

    Спасибо! Возьметесь ли Вы за работу по созданию и интеграции чата ИИ на сайт?

  • @RelaxPulse-gd3nj
    @RelaxPulse-gd3nj 5 місяців тому

    Thank you!

  • @DamayitaDas
    @DamayitaDas 11 місяців тому

    Душка 😇

  • @vnr39
    @vnr39 7 місяців тому

    Спасибо

  • @vladtamolov2292
    @vladtamolov2292 Рік тому +2

    Слава тебе хорошая женщина. Записала отличное видео

  • @vitalikgorohkov1896
    @vitalikgorohkov1896 Рік тому +3

    правильно ли я понял, что вопросы которые мы можем задать ИИ, нужно прописывать заранее. Нельзя будет задать какой-нибудь вопрос, который не прописан в коде. Все правильно понимаю?

    • @KonsatntinPetrov
      @KonsatntinPetrov 11 місяців тому

      конечно можно, тут просто для примера заранее прописано

  • @LCH212
    @LCH212 Місяць тому

  • @bayanserik2430
    @bayanserik2430 Рік тому +1

    Index gpt должен постоянно должен включен ?!

  • @kostyarybalko3302
    @kostyarybalko3302 6 місяців тому

    Ирина, ты можешь обновить код Construct an index? я не могу исправить ошибки которые там возникают из-за недостатка компетенций

  • @Randommmname
    @Randommmname 11 місяців тому +1

    Как обойти ошибку openai.error.InvalidRequestError: This model's maximum context length is 4097 tokens, however you requested 4222 tokens?
    Хотя даю обычный запрос, не особо длинный

    • @_bigbro
      @_bigbro 10 місяців тому

      так в API есть поле для установки лимита токенов, что-то вроде maxTokens=100

  • @maximzhukv
    @maximzhukv 6 місяців тому

    Здравствуйте, не подскажете, как исправить ошибку
    InvalidRequestError: The model `text-davinci-003` has been deprecated
    ?

  • @alxxsterxx7802
    @alxxsterxx7802 9 місяців тому +1

    Можно ли «скормить» ему несколько книг, и чтобы он давал ответы основываясь на идеях из этих книг ?

  • @wildberris4832
    @wildberris4832 11 місяців тому

    Спасибо большое! Можно у Вас купить консультацию?

  • @Druzhishe7007
    @Druzhishe7007 4 місяці тому

    Сейчас уже используется новый API. Нужно использовать либо старый либо обновлять код под новый. Под новый у меня пока обновить не получилось, а вот откатился к старому API и код выполнился, индекс создался

  • @sokov-andrey
    @sokov-andrey Рік тому +1

    Ирина, подскажите, у вас не возникала проблема, с тем, что ответ возвращается не полным, обрезанным?

    • @Владимиртргамк
      @Владимиртргамк 11 місяців тому

      НАДО ПРОЛИСТНУТЬ в право,там стрелочка такая треугольничек перевернутый на бок,и на вторую страницу перейдет,есть у них такой заскок

  • @Druzhishe7007
    @Druzhishe7007 4 місяці тому

    я так понимаю gpt_inndex теперь фсё? И вместо него трудится llama_index.

  • @DamayitaDas
    @DamayitaDas 11 місяців тому +1

    Функции из этого примера уже не работает, быстро устаревают. Приходится заменять новыми.

  • @Doterra_myhealthpro
    @Doterra_myhealthpro 9 місяців тому

    Возможно ли у вас заказать такой чатбот?

  • @anisia26
    @anisia26 11 місяців тому +1

    Подскажите пожалуйста, какой Максимальный объем данных он может проанализировать?

    • @KonsatntinPetrov
      @KonsatntinPetrov 11 місяців тому

      Тут нужно понять принцип работы, нельзя однозначно ответить на этот вопрос. Как базу знаний ему можно задать неограниченный объем, но сам чатгпт не имеет доступ к этим данным, и не видит картину целиком. В момент вопроса к нему, в базе знаний находятся несколько параграфов, которые скорее всего имеют отношение к вопросу. Далее эти параграфы отправляются самому чату вместе с вопросом пользователя. И на основе этой информации он даёт ответ. Как много нужной информации (параграфов из базы) можно отправить чату зависит от версии модели, но в целом не много.

    • @anisia26
      @anisia26 11 місяців тому

      @@KonsatntinPetrov ну вот я загрузила большой объём, около 50 000 токенов, проанализировать не получилось нормально, он отвечал неправильно на вопросы по документу

  • @ashakharov
    @ashakharov 7 місяців тому

    я не понял, как это вчат бот запустить?

  • @olegokhanov
    @olegokhanov Рік тому +2

    Очень круто! Но тяжело понять без знаний разработчика. Есть кто-то, кто мог бы помочь (не бесплатно) разобраться как самому создать этот бот на основе своих данных?

    • @RedpaX
      @RedpaX 11 місяців тому

      Вы серьезно? Я не знаю пайтон совершенно но пиши программы на пайтон, так как пишет их за меня ГПТ, а я только ТЗ ему выдаю.

    • @anisia26
      @anisia26 11 місяців тому

      добрый день, может быть нашли кого-то? мне тоже актуально)

    • @VAPPARATAX
      @VAPPARATAX 7 місяців тому

      @@anisia26вы нашли?

  • @lunechkka4833
    @lunechkka4833 10 місяців тому

    Вы можете разобрать голосового бота на ии и его этап обучение?

    • @walcermelodia
      @walcermelodia 5 місяців тому

      Подкрути другую нейронку для генерации голоса на основе текста

  • @bayanserik2430
    @bayanserik2430 Рік тому +2

    И что дальше

  • @dtaylor7798
    @dtaylor7798 Рік тому +1

    Спасибо за видео. А как лучше это применять для данных на русском языке. Переводить на английский, потом в индекс? Или есть инструменты для создания индекса на русском?

    • @irina1nik
      @irina1nik  Рік тому +1

      С русским языком не экспериментировала ) по идее GPT должен и русский понимать, хоть и хуже. Попробуйте сначала без перевода, посмотрите что получится

    • @snixj4199
      @snixj4199 Рік тому +2

      Здравствуйте, пробовали работать с данными на русском языке? GPT корректно работает?

  • @daniyarnugumanov987
    @daniyarnugumanov987 5 місяців тому

    не работает скрипт

  • @jachemcross
    @jachemcross Рік тому +1

    А для использования API тоже надо использовать заграничный IP?

  • @vit_avdeev
    @vit_avdeev Рік тому

    Насколько большой объем своих данных можно задействовать? Скажем, у нас кастомный текст на 1 Гб, потянет?

    • @masterbiz100
      @masterbiz100 Рік тому

      По логике, должен потянуть и больший объем. Просто он должен быть разбит на небольшие части в рамках установленного объема токенов для GPT. Просто смотрите по образцу - как там нужно делить большой файл и какого объема должны быть эти файлики

    • @Лисица-й6ц
      @Лисица-й6ц Рік тому

      @@masterbiz100 как его разделить не совсем поняла

    • @RedpaX
      @RedpaX 11 місяців тому

      @@Лисица-й6цвот именно, что значит разделить, если ответ должен парситься по всем данным сразу.

    • @anisia26
      @anisia26 11 місяців тому +1

      Добрый день, Подскажите, удалось вам реализовать?

    • @KonsatntinPetrov
      @KonsatntinPetrov 11 місяців тому

      @@RedpaX ответ не даётся по всем данным сразу, в этом и суть. Чату можно дать только маленькие кусочки информации, для этого ваш текст сначала разбивается на маленькие кусочки, а в момент вопроса к чату, ему в добавок с самим вопросом отправляется несколько кусочков, которые подходят скорее всего по логике.

  • @RedpaX
    @RedpaX 11 місяців тому +1

    Я правильно понимаю, что каждый запрос для ГПТ будет добавлять данные из index файла и как следствие пожирать токены? То есть если у меня в index 400 символов то каждый раз к ГПТ будет идти «символы запроса пользователя+символы из index файла»? Если так то это бессмысленно абсолютно, мы всегда будем - 1 упираться в ограничение по символам в index файле, -2 сжигать деньги с бешеной скоростью так, как каждый наш запрос даже их 5 символов будет дополняться символами из index файла. Тогда получается что городить это смысла нет и проще действовать по старинке, отправлять нужные данные базы для ГПТ через первое сообщение и после уже не тратить токены в рамках одной сессии нового чата.

    • @wildberris4832
      @wildberris4832 11 місяців тому

      Вы понимаете смысл "индекс базы данных"? Из всего вашего файла он и отправляет только нужный кусок, по индексу. Ну если у Вас книга на 300 страниц с данными Вы в жизнь не не отправите через прост. Поэтому все норм

  • @kisel13
    @kisel13 Рік тому +1

    Подарите мне предобученную модель ChatGPT 3.5-turbo! Куплю видяху и ОЗУ больше и у меня будет личный ии!

    • @_bigbro
      @_bigbro 10 місяців тому

      кхе. посмотри на цены видяхи на 256Гб. дешевле будет обучать в облаке.

    • @kisel13
      @kisel13 10 місяців тому

      @@_bigbro Я лучше один раз заплачу

  • @СетевойПромышленныйИнтеллектСП

    Турта В.Г., 58 лет, автор научного открытия, мировой лидер в создании Промышленного ИИ. Первый в мире кибер-технолог, способный выполнять работу специалиста СЧПУ уже готов и выводится на рынок, пока, как обучалка. Рынок обучения СЧПУ по прогнозу чатГПТ более 5 миллиардов к 2025г. Дальше будет осваиваться рынок мелких собственников и затемм крупных компаний. В результате за 5-7 лет планируется создать компанию-триллионера. Как мне может помочь чатГПТ в маркетинге обучалки?

    • @Metastroy
      @Metastroy 9 місяців тому +4

      Научиться формулировать вопросы понятно

  • @thekamchatnyy
    @thekamchatnyy 8 місяців тому

    Добрый день, я могу интегрировать этот чат бот в инстаграм, телеграм или вотсап?

  • @sadchenko
    @sadchenko 9 місяців тому

    Спасибо, но пока все же не ясно как его интегрировать в качестве тех.поддержки в мой телеграм бот на PHP чтоб клиенты спрашивали про мои услуги к примеру, а Ai давал ответы на основе загруженной базы данных. В этой задаче ваш пример поможет?

  • @Владимиртргамк
    @Владимиртргамк 11 місяців тому

    Все правильно сделано .организованно .