Антон Емельянов "Методы для обнаружения утечек данных в LLM" (19.09.2024)
Вставка
- Опубліковано 4 жов 2024
- Доклад посвящен разбору современных методов детекции утечек данных в LLM.
Статьи:
DETECTING PRETRAINING DATA FROM LARGE LANGUAGE MODELS (arxiv.org/pdf/...)
Min-K%++: Improved Baseline for Detecting Pre-Training Data from Large Language Models (arxiv.org/pdf/...)
Generalization or Memorization: Data Contamination and Trustworthy
Evaluation for Large Language Models (arxiv.org/pdf/...)
Слайды clck.ru/3DPyoA