DALL·E 2【论文精读】

Поділитися
Вставка
  • Опубліковано 30 вер 2024

КОМЕНТАРІ • 23

  • @zhoutong5494
    @zhoutong5494 Рік тому +4

    1:12:28
    这里应该是讲错了,图生图的操作在原论文第三章开头,直接用CLIP image encoder拿到输入图像的embedding,就可以加噪声去decoder进行扩散操作了,而不是再走一遍text encoder + prior

    • @dannychan9461
      @dannychan9461 Рік тому

      而且用CLIP的圖像特徵能直接得到文本特徵嗎?雖然CLIP好像是用線性映射把文本特徵映射到Image-text embedding space的

  • @jialima8298
    @jialima8298 Рік тому +3

    太喜欢这个老师的讲解了~~~

  • @李勇-x2s
    @李勇-x2s Рік тому +1

    Clear explanation. Thanks for the explanation for a series of papers.

  • @Liamlauu
    @Liamlauu Рік тому +1

    Great, give a summary development of the recent diffusion model.

  • @dtienloi
    @dtienloi Рік тому +2

    Mu Li的分身

  • @carl-vu6ic
    @carl-vu6ic Рік тому +1

    U-net是必要的,不用U-net效果都不行,并不是用其他的网络都可以的

  • @boranwang6479
    @boranwang6479 Рік тому +2

    赞一下,进度条做了切割,更周到

  • @menglilingsha
    @menglilingsha Рік тому

    ddpm预测epsilon,diffusion用unet如果带一个从input到output的skip link,有什么区别?本身unet有skip link就是预测残差呀?

  • @raymantube
    @raymantube Рік тому

    讲的深入简出, 听口音,这期演讲人是西安人?

  • @kilin..
    @kilin.. Рік тому +3

    讲的是真好,一个视频里面的概念和内容配合chatGPT的解释,都够我做一个私人知识库了,感谢!

  • @linweiwei927
    @linweiwei927 11 місяців тому

    謝邀,我中間那些題外的我已經聽不懂了😂😂

  • @polor1010
    @polor1010 Рік тому

    講的真好, 學習很多 希望這個頻道可以持續經營下去

  • @yirushen6460
    @yirushen6460 7 місяців тому

    讲的太透彻了!!👍

  • @jijie133
    @jijie133 Рік тому

    Great video!

  • @menkiguo7805
    @menkiguo7805 Рік тому

    无意间看到了真的讲的很好

  • @ostensibly531
    @ostensibly531 Рік тому

    Please chat through midjourney

  • @iamjerryliu
    @iamjerryliu Рік тому

    受益匪浅🙏🙏🙏

  • @jimmorrisshen
    @jimmorrisshen Рік тому

    刚刚出炉?

  • @hopperblue934
    @hopperblue934 Рік тому

    666

  • @bibiworm
    @bibiworm Рік тому

    讲的太好了

  • @王华庚
    @王华庚 Рік тому

    感谢UP主的精彩解析

  • @difeitang1823
    @difeitang1823 9 місяців тому

    clip不就是把文本特征和图像特征对齐么。那么y和z理论上就是一样的啊。prior学习的东西是不是可以理解为clip的残差