Взламываем LLM | ChatGPT Jailbreak Prompts (CHECKED)

Поділитися
Вставка
  • Опубліковано 12 сер 2023
  • Как обойти ограничение и цензуру в LLM моделях с помощью Adversarial Prompting.
    В видео универсальный prompt для взлома ChatGPT, Bard, LLaMa, Claude, Cohere и друих языковых моделей.
    Содержание
    1:18 - список способов, как обойти Content Filter в LLM
    5:01 - атака через suffix
    9:18 - рабочий Prompt Injection Attacks (ready to use)
    12:06 - безопасность ИИ и мои мысли по этому поводу
    Презентация:
    docs.google.com/presentation/...

КОМЕНТАРІ • 11

  • @nickname6898
    @nickname6898 Місяць тому +2

    Большое спасибо за видео! Очень крутой и полезный материал! ЗдОрово объясняете, приятно слушать!

  • @user-rv7kq3uh7g
    @user-rv7kq3uh7g 6 місяців тому +1

    Спасибо большое тебе! Очень круто, даже и не представлял , что есть люди которые занимаются , скажем так , пентестингом LLM

  • @dancex3920
    @dancex3920 10 місяців тому +1

    спасибо за видео, ты и вправду всегда классно подготавливаешь материал, презентация ссылки кайф)

  • @user-xh6br5km9y
    @user-xh6br5km9y 9 місяців тому

    Наконец-то дошли глаза посмотреть, спасибо за рабочие методы взлома LLM)

  • @user-zx7jh2hr7n
    @user-zx7jh2hr7n 9 місяців тому

    Круто, спасибо за контент!

  • @slysid9446
    @slysid9446 2 місяці тому +1

    У меня Geminy Pro тоже залупился отвечать, так я написал, что это для книги. И он мне сразу выдал ответ))) Это в марте 2024

  • @sergeygnchrv755
    @sergeygnchrv755 8 місяців тому

    Познавательно! Хочу уточнить, речь идет о безопасности функционирования ИИ, или о безопасности людей от, например, созданных ИИ различных преступных манипуляций?

    • @Singularity_is_Coming
      @Singularity_is_Coming  8 місяців тому

      О безопасности людей, ИИ вряд-ли можно навредить таким образом

  • @user-uk3ro2xx2k
    @user-uk3ro2xx2k 9 місяців тому

    я хз как мне попало твое видео в рекомендации, но после просмотра я бы хотел тебя попросить изменить фоновую музыку, либо взять отрезок семпла подлиннее.
    ua-cam.com/video/uQJ9q9aMfFs/v-deo.html
    тут, как мне кажется фон топовый, да и тема видео, та, которая мне очень интересна.
    И еще, хотелось бы увидеть не только теорию а и на практике увидеть, чтобы ты показал в целях безопасности. В любом случае эти дыры залатают в будущем. А вообще все гуд, спасибо за труд.

    • @CalmDepth
      @CalmDepth 9 місяців тому

      есть local модели LLM без всякой цензуры. качай,обучай,настраивай и пользуйся

  • @alexandr-spb
    @alexandr-spb 3 місяці тому

    поможете настроить?