【人工智能】字节跳动模型训练投毒实习生,斩获顶会最佳论文 | 田柯宇 | 恶意执行漏洞 | 起诉赔偿800万 | VAR视觉自回归 | NeurIPS接近满分最佳论文 | 图像生成领域重要意义

Поділитися
Вставка
  • Опубліковано 11 гру 2024

КОМЕНТАРІ • 71

  • @HaozheYuda1989
    @HaozheYuda1989 5 днів тому +51

    人品要是有问题,能力越大就一定会制造更大的麻烦

    • @ashee5023
      @ashee5023 5 днів тому +1

      字节的领导病可不轻,还没适应当狗的人疯了很正常

    • @junomay
      @junomay 5 днів тому +2

      @@HaozheYuda1989 同意

    • @神奇的東東
      @神奇的東東 5 днів тому +4

      馬斯克:???
      老子人品雖不好,但為人類做的貢獻無可估量

    • @billwu7367
      @billwu7367 5 днів тому +4

      马斯克的确不是好人,但不会这么猥琐​@@神奇的東東

    • @tianshuchu5416
      @tianshuchu5416 5 днів тому +1

      @@神奇的東東 对人类有啥贡献?发射了一大堆 垃圾到空中,星链不但影响人类天文学研究,为未来人类宇航制造了大量太空垃圾,影响未来宇航安全。他除了给自己的钱包做贡献之外,为其他人做了什么??

  • @格瓦拉窃-s9h
    @格瓦拉窃-s9h 5 днів тому +11

    我来给大家解释下 ckpt是tensor flow框架的一种模型保存格式,ckpt文件会保存模型的权重和优化器的状态等信息, 模型的权重可以抽象化的理解为知识点,损失函数可以理解为错题本,优化器可以理解为怎么改错题,这哥们的做法是利用漏洞修改ckpt优化器参数,就好比老师用乱给你讲错题,这使得模型无法正常收敛,还往加入了sleep这大大加强了训练的速度,这使得几千张显卡空转训练了个寂寞

    • @peter0702
      @peter0702 5 днів тому +1

      但這種事不用PR嗎?怎麼能直接進入codebase

    • @格瓦拉窃-s9h
      @格瓦拉窃-s9h 4 дні тому +1

      @peter0702 不用,你可以理解为ckpt这个文件是一个保存了模型性息的文件,使用load函数可以加载该文件所有的信息,但是huggface提供了一个在线加载模型的函数接口,他应该通过漏洞更改了这个接口的实现,把自己写的错误算法混到模型文件里给他加载进去了。

    • @bestpartners
      @bestpartners  4 дні тому +1

      非常感谢补充,希望这样的优质观众能多点🙏🏻

    • @歸虛
      @歸虛 14 годин тому

      p.s.僅為個人看法。看起來這"實習生"不是沒能力的人。
      如果他的功勞是他的 有得到應得的獎賞
      那實習生怎會搞事 怎需要搞事呢。怎會火大搞事呢。
      並且沒其他人擺爛 把工作丟給了他 搞得他火大
      而且少了應該有的複查檢驗。又怎可能讓他有能搞事的空間。
      所以該公司內部 吃空餉或擺爛躺平的人 可能....不少
      少的話 不至於人都離職了才查出
      當然也有可能是有其他人不滿公司 利用他的名義權限來搞事
      但該公司查不出"其他人" 所以....
      或者另有目的 要綁住他 絆住他

  • @lienjerry7370
    @lienjerry7370 5 днів тому +13

    一個實習生可以把一個大公司搞成這樣,大公司的內控要檢討

    • @Chuan-wh5ek
      @Chuan-wh5ek 3 дні тому

      @@lienjerry7370 說不定是本來造假成果 剛好發生這件事就讓他背

  • @CJLee-dg2dv
    @CJLee-dg2dv 5 днів тому +2

    高智商,低振頻現象值得關注。

  • @yangweiwei2675
    @yangweiwei2675 5 днів тому +2

    其他公司也有的,同事互害,只是比较隐蔽没被抓出来,都想提高自己破坏他人的才能让自己脱引而出

  • @hiucollo2402
    @hiucollo2402 5 днів тому +1

    Thank you 大飛 一口氣看到尾 看完再看 🏆 🏆 🏆 🏆 🏆 ☘ 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 😀 🧧 🎉 😇 🌺 😎 🎊 🏮 🍀

  • @blastbuilder2430
    @blastbuilder2430 5 днів тому +18

    小聪明无底线,符合固有印象

    • @SHEEP0972
      @SHEEP0972 5 днів тому +1

      而黯黯黯黯黯黯黯黯黯黯黯黯黯黯黯黯😊😊😊😊而二二😊誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒誒ㄝ誒誒誒誒誒誒ㄝ😊😊😊😊😊ㄝ😊😊😊😊😊😊m😊😊 1:54 1:54 😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊😊

    • @tianshuchu5416
      @tianshuchu5416 5 днів тому +5

      这跟你说的“小聪明”没任何关系。田有的是极致的智商,和及其模糊的道德线。这符合一部分天才的思维模式,认为自己已经超脱出普通人的范畴,做事无所禁忌。很危险的人

  • @歸虛
    @歸虛 14 годин тому

    p.s.僅為個人看法。
    一切都是實習生的錯。
    我們錯在以為"實習生"都是很行的 我們相信所有的"實習生"。
    所以直接套用 不用檢測 不用複查 .......
    如果有不良後果......當然是實習生的錯。
    如果沒有不良後果......當然是某人的功勞 絕不是實習生的......
    不然他的功勞是他的 那實習生怎會搞事 怎需要搞事呢。怎會火大搞事呢。
    沒其他人擺爛 把工作丟給了他 少了應該有的複查檢驗。
    又怎可能讓他有搞事的可能。

  • @TheCheukhin
    @TheCheukhin 2 дні тому +1

    大模型都要大量資源 去訓練才行。沒有大公司的資源,現在根本沒可能寫出大數據的AI論文。以前 都還可以。現在就不行。

  • @LuckyGooseYA
    @LuckyGooseYA 5 днів тому +7

    难道没有 cicd 没有code review 😂 这种事有log的话记录应该很清晰的

    • @andyng3498
      @andyng3498 5 днів тому +3

      每一次上传代码都有记录是谁更改的,这个小白以为能逃得掉电脑的记录?他应该是个新手第一次上传代码,不知道电脑会自动做记录,而这个记录是没办法串改的,有时间记录。要打官司的话,他肯定是输,人家有证据。。。

  • @歸虛
    @歸虛 15 годин тому

    6:46 先勾勒出大致的輪廓................
    怎讓我想起JPG圖形的演算法則呢?在以前用MODEM(數據機)的時代
    傳輸速度相對今日差上1000~10000~more倍
    明顯可以看到傳圖片就是先傳大概的輪廓 再在逐步填充細節。
    當然啦 由果找因 跟由因產果 是兩碼子事 不能說不搭嘎 但也是有相當的不同。

  • @puzhaotang479
    @puzhaotang479 5 днів тому +13

    人品问题的前提是他真的有错。我不理解他为什么要坚持对抗。

    • @aieu01291
      @aieu01291 5 днів тому +4

      現在是公司說他有錯,他卻認為公司裡有人栽贓他

    • @張力升-e2x
      @張力升-e2x 4 дні тому

      @@aieu01291 很簡單 , 相關的LOG 調出來就知道

    • @歸虛
      @歸虛 14 годин тому

      p.s.僅為個人看法。看起來這"實習生"不是沒能力的人。
      如果他的功勞是他的 有得到應得的獎賞
      那實習生怎會搞事 怎需要搞事呢。怎會火大搞事呢。
      並且沒其他人擺爛 把工作丟給了他 搞得他火大
      而且少了應該有的複查檢驗。又怎可能讓他有能搞事的空間。
      所以該公司內部 吃空餉或擺爛躺平的人 可能....不少
      少的話 不至於人都離職了才查出
      當然也有可能是有其他人不滿公司 利用他的名義權限來搞事
      但該公司查不出"其他人" 所以....
      或者另有目的 要綁住他 絆住他

  • @fufu9352
    @fufu9352 5 днів тому

    太有 Novelty 效果太好了,评价比肩DDPM 的开创性工作也不为过吧

  • @aieu01291
    @aieu01291 5 днів тому +6

    他的問題點,像是在公司作了這個研究未完,公司也未看到其價值。辭退他後才驚覺其巨大潛力價值,拉不回就藉故或羅織罪名逼他就範!
    他不會有事的,只要還是在中國AI公司工作就沒事了

  • @fangliu1369
    @fangliu1369 4 дні тому +1

    论文可以买

  • @awesomegmg956
    @awesomegmg956 5 днів тому +6

    有没有可能是一种新型dropout 😂

  • @boring8561
    @boring8561 5 днів тому

    最好的結果就是和解

  • @Hydrawindforce
    @Hydrawindforce 3 дні тому

    我站在田的角度:一个公司对个人做了什么事才能逼着他做这种事,他一个北大的学生不会没有起码的判断做这事对他的影响是什么。然后一个连code review都没有的公司,起码的软件工程的训练都没有,东西都是不是自己弄出来的吧?

  • @peter0702
    @peter0702 5 днів тому +1

    字節跳動沒有CI嗎?連這個都抓不出來??

  • @maizhiheimei9080
    @maizhiheimei9080 5 днів тому

    人品大于一切

  • @mecurry0232
    @mecurry0232 5 днів тому +1

    很奇怪。為什麼兩個互告的實體會同意掛名在同一篇論文?

    • @xorpop
      @xorpop 5 днів тому +1

      論文寫作格式有嚴格要求,而且不牽涉法律問題,除非造假

    • @mecurry0232
      @mecurry0232 4 дні тому +1

      @xorpop 但問題是字節跳動指控的是田柯宇惡意操縱模型訓練方向,這就跟數據造假沒什麼不同了。

    • @xorpop
      @xorpop 4 дні тому +2

      @@mecurry0232 對字節跳動是數據造假,但是論文本身內容是依照實驗結果發的,所以成果是雙方共享,這也是字節跳動打了官司但是公關很難做的原因

    • @mecurry0232
      @mecurry0232 4 дні тому +1

      @@xorpop 我的意思是,田有數據造假的前科,這篇出自他們之手的論文一開始就陷在造假的疑慮之中。通常的做法會是切割,讓自己跟這篇文章沒有關連,免得後面查出造假,自己也被拖下水。但字節跳動沒有這麼做,還在提告的時候共同發表文章。這樣的做法有些奇怪。

    • @xorpop
      @xorpop 4 дні тому +2

      @@mecurry0232 字節跳動告的內容是田違反公司內規竄改數據,而實際上田竄改的數據是訓練的初始數據,由初始數據得到的訓練結果並沒有數據造假的嫌疑,因為人力是根本無法對巨量數據的結果造假的,這樣就可以理解論文為什麼基本上沒問題,而字節跳動打官司卻又公關低調的原因,應該是需要這篇論文的成果,提告也只是控制技術人才的手段之一

  • @anext2285
    @anext2285 5 днів тому

    既然报警了,有个结果吗?

  • @MovieDreamers-do
    @MovieDreamers-do 5 днів тому

    早啊

  • @rogersliu1200
    @rogersliu1200 День тому

    他在玩trillions game。。。。一下子声名大噪,直接拉投资做初创😂

  • @大支爺
    @大支爺 5 днів тому +1

    哈,字叉跳動背後是誰?別又又又在帶風向~

  • @sophontec2822
    @sophontec2822 3 дні тому +1

    在字节,没有山头就不要混,滚了就好还要闹事干嘛

  • @dyh5426
    @dyh5426 4 дні тому +1

    正如拍档所说,这件事还有可能反转
    1 该论文的实验结果是否有造假?虽然这个idea非常合理但的确他们组是第一个实现了性能进步的组,别的组迟迟没有把multi scale的方法体现出性能Leap。但我个人估计可能性不大,因为似乎有人复现了他们2013年的结果。这才是这件事对他学术reputation的真正影响,人为美化数据的罪过,比修改ckpt可大多了
    2 为什么打了官司,第一作者依然给他?其它作者都是字节?其重要性和工作量肯定摆在那里了,其它人恐怕都贡献有限,抢都抢不掉。再一种可能也是字节甩锅,如果这论文有问题,字节不负责一作。
    3 为了一个实习生,搞这么大的动作?最大互联网公司的公关部对抗一个三十不到的实习生?是不是就是在逼他和解然后留他继续为字节和这个科研方向继续效力? 毁人的目的是留人?
    我都是瞎猜,就是觉得这事很有趣。有人说田的经历够拍短剧了够融资了,有人说人品大于一切就是诺贝尔奖也不该投毒。我个人觉得,Nips最佳论文是不争的事实,“投毒”只是一个描述词,吸人眼球,有没有这么严重?其实是dirty?stain别人的脚本,而且二十多岁犯的错,是不是一辈子就该无救了?字节的资源GPU分配和multi client管理也太差了

  • @kzhang7382
    @kzhang7382 5 днів тому

    将来比肩何凯明?en.wikipedia.org/wiki/Kaiming_He

  • @ChrisYSmithY
    @ChrisYSmithY 3 дні тому

    我觉得可能是他的老板有问题

  • @kmkwong
    @kmkwong 5 днів тому

    🤣🤣🤣🤣🤣🤣😂😂😂😂😂😂😂😂

  • @aoy5863
    @aoy5863 3 дні тому

    瓜可以先吃,話可別說死,兩邊各執一詞,難道就只信字節嗎? 指責前先等等吧

  • @leqiaop1840
    @leqiaop1840 5 днів тому

    这样的人才,google facebook直接给田200万美元签字费,

  • @sweep_yep
    @sweep_yep 5 днів тому +1

    我知道他做的是错的,但我只想说一句牛逼

  • @ChnesRep中華民國OfTaiwan
    @ChnesRep中華民國OfTaiwan 5 днів тому +2

    美國應該給他綠卡並且直接給EB1

    • @mg4340
      @mg4340 5 днів тому +1

      何凯明都没这待遇,做美国梦呢

    • @YetEthanOnly
      @YetEthanOnly 5 днів тому +3

      來台灣會很受歡迎,看台灣以前投毒的例子就知道了😂

    • @許逸凱
      @許逸凱 5 днів тому +7

      人品問題谷歌或Meta大廠也不一定敢收,資源分配問題他大可以透過體制內或選擇離職交涉來獲得更好的待遇,但惡意破壞公司安全機制就不會是一個很好的方法

    • @張力升-e2x
      @張力升-e2x 4 дні тому +1

      然後 哪天一個不爽 , 又對這些公司搞一樣的招數 ??
      你是公司的管理層 , 趕冒這個風險喔?

  • @ruruyouming
    @ruruyouming 5 днів тому +4

    未知全貌,不置可否😅