【人工智能】OpenAI科学家Hyung Won Chung演讲精华版 | 2023年的大模型 | 涌现 | Transformer | 并行训练 | 后训练阶段 | 奖励模型 | 目标函数学习

【人工智能】被指“AI血汗工厂”，Scale AI深陷劳工争议旋涡 | Alexandr Wang | AI数据标注独角兽 | Romotasks | 外包工人 | ABC测试 | 逐底竞赛

【听书】《国家为什么会失败》制度决定了一个国家的发展命运，不同的制度带来了世界各国的贫富差异|每天听本书

Они Скупали ВСЁ Серебро Мира и вот ЧТО Было Дальше! #shorts

Рождение Немецкой Легенды - Mercedes 190E 2.3-16

Как найти себе жену? Больше - тут @stas.yornik.shorts

【人工智能】什么是强化学习中的奖励黑客 | Reward Hacking | OpenAI前安全主管翁荔最新长文 | 奖励函数 | RLHF | 古德哈特定律 | ICRH | 缓释措施

Best Partners TV

Переглядів 7 670

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 20 гру 2024

КОМЕНТАРІ • 31

@LineXiongJieLin 14 днів тому ⁺³
这篇也看完了👍，更新的好勤快
@ice300tw 17 годин тому ⁺²
這問題還滿可怕的
@Guavaava 14 днів тому ⁺²³
翻译成奖励黑客有点怪。可能翻译成奖励滥用，奖励破解失效之类的更好
@bestpartners 14 днів тому ⁺³
谢谢建议🙏
@harveywang8020 14 днів тому ⁺¹
羊毛党
@Bing.W 14 днів тому ⁺¹
”奖励攻击”，对模型训练的攻击。
@LineXiongJieLin 14 днів тому ⁺¹
这个翻译应该是对应life hacker
@riverwang5482 14 днів тому ⁺³
Hacking 指利用某物到超过其设计的初衷。翻成黑客最大问题是中文中黑客是人，但hacking是个动作，所以听着会有误解。楼上说的“滥用”应该是更好的翻译。
@尘戈 13 днів тому ⁺¹
奖励的本质其实是引导。
既然是引导，就应该是一条线而不是一个点。可能递进的很多个奖励函数，才能成就良好的引导之路😊
@leishi8514 7 днів тому
避免偷懒?哈哈
@ilovetrees-k1i 13 днів тому ⁺¹
hack不仅仅有黑客这么一个意思，还有创新之举这样的“正面”意思
@卡神-o2n 14 днів тому ⁺¹
謝謝
@pensularnaseeare9531 14 днів тому ⁺¹
第一个想到的就是高考
@happyying_ 14 днів тому ⁺³
獎勵駭客就像「考試作弊」，AI找到了捷徑，但沒有真正學會知識。
AI就像一個「狡猾的學生」，總想鑽規則的空子。
@stan-kk2sf 14 днів тому ⁺²
通过reward来训练模型本身就是极其不靠谱的事情，如果没法从真实世界采样，不管怎么reward绝对会在某个地方hacking住，现在还能让你观察到，模型更大了到嵌入层次更高的时候想观察都不知道该怎么观察
@corgirun7892 9 днів тому
真实世界一样能被hacking
@1110-d3r 14 днів тому ⁺¹
🎉🎉🎉❤❤❤
@kmkwong 14 днів тому
👍👍👏👏
@chenyeshao3887 14 днів тому ⁺¹
AI投机取巧😂
@BigggRicee 14 днів тому ⁺¹
臥槽看封面我還以爲是蔣聖呢，就無腦點進來了😃😃
@SOUL_SOFALEX 14 днів тому ⁺¹
我想，這就是為什麼人會持續尋找新事物/stimulation, 久了又會感到無聊的原因吧，不然人也會進入「reward hacking」的狀態。
@SOUL_SOFALEX 14 днів тому
換言之，機器也需要類似的機制： desire for reward - motivate 持續尋找刺激（得到 reward） - 同個刺激給予的reward 逐漸減少 - motivate 尋找新的刺激。同時，過去接觸過的刺激能給予的reward 的量會稍微恢復 - 新刺激給予的reward 逐漸減少 - motivate 尋找新的刺激，以此往復。
@corgirun7892 10 днів тому
还好没去字节跳动
@deter3 14 днів тому ⁺³
翁荔写的东西一向都是类似论文的survey 一样，总结的很好，缺乏自己的独特深入的见解和方案。技术研究的深度一般般。
@ilovetrees-k1i 13 днів тому
review大师，笔记记得好😂
@corgirun7892 9 днів тому
作为技术管理者，这其实才是更重要的。她已经是openai的安全副总裁了
@leishi8514 7 днів тому ⁺¹
看完觉得比教小孩难多了
@hiucollo2402 14 днів тому
Thank you 大飞一口氣看到尾看完再看 🏆 🏆 🏆 🏆 🏆 ☘ 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 😀 🧧 🎉 😇 🌺 😎 🎊 🏮 🍀
@scchen2011 14 днів тому ⁺¹
第三！

Наступне

Автоматичне відтворення

【人工智能】OpenAI科学家Hyung Won Chung演讲精华版 | 2023年的大模型 | 涌现 | Transformer | 并行训练 | 后训练阶段 | 奖励模型 | 目标函数学习

【人工智能】OpenAI科学家Hyung Won Chung演讲精华版 | 2023年的大模型 | 涌现 | Transformer | 并行训练 | 后训练阶段 | 奖励模型 | 目标函数学习

【人工智能】被指“AI血汗工厂”，Scale AI深陷劳工争议旋涡 | Alexandr Wang | AI数据标注独角兽 | Romotasks | 外包工人 | ABC测试 | 逐底竞赛

【人工智能】被指“AI血汗工厂”，Scale AI深陷劳工争议旋涡 | Alexandr Wang | AI数据标注独角兽 | Romotasks | 外包工人 | ABC测试 | 逐底竞赛

【听书】《国家为什么会失败》制度决定了一个国家的发展命运，不同的制度带来了世界各国的贫富差异|每天听本书

【听书】《国家为什么会失败》制度决定了一个国家的发展命运，不同的制度带来了世界各国的贫富差异|每天听本书

Они Скупали ВСЁ Серебро Мира и вот ЧТО Было Дальше! #shorts

Они Скупали ВСЁ Серебро Мира и вот ЧТО Было Дальше! #shorts

Рождение Немецкой Легенды - Mercedes 190E 2.3-16

Рождение Немецкой Легенды - Mercedes 190E 2.3-16

Как найти себе жену? Больше - тут @stas.yornik.shorts

Как найти себе жену? Больше - тут @stas.yornik.shorts

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

驚爆：OpenAI絕密文件曝光，留給人類逃生的時間只剩三年了！細思極恐：AI正在背著人類偷偷編程！人工智能的發展都經歷了哪些故事？『新闻最嘲点姜光宇』2024.0403

驚爆：OpenAI絕密文件曝光，留給人類逃生的時間只剩三年了！細思極恐：AI正在背著人類偷偷編程！人工智能的發展都經歷了哪些故事？『新闻最嘲点姜光宇』2024.0403

首次有中国经济学家在公开场合指出GDP数据造假，他是如何证明的呢？真正的GDP增长应该是做少？失业率数字为什么失真 | 高善文 | 付鹏 | 中国经济 | 经济转型 | 房地产泡沫 | 老周横眉

首次有中国经济学家在公开场合指出GDP数据造假，他是如何证明的呢？真正的GDP增长应该是做少？失业率数字为什么失真 | 高善文 | 付鹏 | 中国经济 | 经济转型 | 房地产泡沫 | 老周横眉

【人工智能】强化学习方向错太久，是时候该转向持续学习了 | 强化学习之父Richard Sutton | 苦涩的教训 | 多臂老虎机问题 | 反向传播 | 梯度下降 | 奖励假说 | AI科研建议

【人工智能】强化学习方向错太久，是时候该转向持续学习了 | 强化学习之父Richard Sutton | 苦涩的教训 | 多臂老虎机问题 | 反向传播 | 梯度下降 | 奖励假说 | AI科研建议

Willow解读：Google量子芯片到底突破在哪？想要实用化，还有万里长征…

Willow解读：Google量子芯片到底突破在哪？想要实用化，还有万里长征…

【人工智能】现在AI智能水平还不如一只猫？ | Yann LeCun又开怼大模型 | 自回归缺点 | 莫拉维克悖论 | 世界模型 | 联合嵌入预测架构JEPA | Meta为何开源

【人工智能】现在AI智能水平还不如一只猫？ | Yann LeCun又开怼大模型 | 自回归缺点 | 莫拉维克悖论 | 世界模型 | 联合嵌入预测架构JEPA | Meta为何开源

【人工智能】AGI毁灭人类可能性99.9999% | 罗曼·扬波尔斯基 | 计算机科学家 | 诡谲转向 | 存在性风险 | 折磨风险 | Ikigai风险

【人工智能】AGI毁灭人类可能性99.9999% | 罗曼·扬波尔斯基 | 计算机科学家 | 诡谲转向 | 存在性风险 | 折磨风险 | Ikigai风险

专访独立媒体人王剑：习近平如何迎战特朗普2.0时代？

专访独立媒体人王剑：习近平如何迎战特朗普2.0时代？

你對宇宙大爆炸的一切想像都是錯的

你對宇宙大爆炸的一切想像都是錯的

Нельзя смеяться | Смех с водой | 97 #shorts

Нельзя смеяться | Смех с водой | 97 #shorts

ФИЛЬМ! НЕВИНОВНЫЙ ГОТОВИТ ДЕРЗКИЙ ПОБЕГ С НЕПРИСТУПНОГО ОСТРОВА-ТЮРЬМЫ! Мотылёк! Русский фильм

ФИЛЬМ! НЕВИНОВНЫЙ ГОТОВИТ ДЕРЗКИЙ ПОБЕГ С НЕПРИСТУПНОГО ОСТРОВА-ТЮРЬМЫ! Мотылёк! Русский фильм

The evil clown plays a prank on the angel

The evil clown plays a prank on the angel

THE AMAZING DIGITAL CIRCUS - Ep 4: Fast Food Masquerade

THE AMAZING DIGITAL CIRCUS - Ep 4: Fast Food Masquerade

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

Lp. Сердце Вселенной #60 РОЖДЕНИЕ ЛОЛОЛОШКИ [Финал] • Майнкрафт

Lp. Сердце Вселенной #60 РОЖДЕНИЕ ЛОЛОЛОШКИ [Финал] • Майнкрафт

СОЛДАТ КНДР: ВТЕЧА/ВІЙНА В УКРАЇНІ/10 РОКІВ ШПИГУВАВ У ПІВНІЧНІЙ КОРЕЇ/ТОРГУЮТЬ НАРКОТИКАМИ І ЗБРОЄЮ

СОЛДАТ КНДР: ВТЕЧА/ВІЙНА В УКРАЇНІ/10 РОКІВ ШПИГУВАВ У ПІВНІЧНІЙ КОРЕЇ/ТОРГУЮТЬ НАРКОТИКАМИ І ЗБРОЄЮ

Cute Baby Ties Up Dad And Wants To Play With His Phone #funny #fatherhoodlove#cute#fatherhoodmoments

Cute Baby Ties Up Dad And Wants To Play With His Phone #funny #fatherhoodlove#cute#fatherhoodmoments