【生成式AI導論 2024】第11講：大型語言模型在「想」什麼呢？ - 淺談大型語言模型的可解釋性

【生成式AI導論 2024】第9講：以大型語言模型打造的AI Agent (14:50 教你怎麼打造芙莉蓮一級魔法使考試中出現的泥人哥列姆)

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

ВОЛКОВА: хочу поїхати в РЕХАБ. Мене ДОМАГАВСЯ викладач. Після СМЕРТІ чоловіка відчула ПОЛЕГШЕННЯ

КАК СПРЯТАТЬ КОНФЕТЫ

Sigma Girl Education #sigma #viral #comedy

【生成式AI導論 2024】第10講：今日的語言模型是如何做文字接龍的 - 淺談Transformer (已經熟悉 Transformer 的同學可略過本講)

Hung-yi Lee

Переглядів 16 845

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 2 тра 2024
投影片：drive.google.com/file/d/1KeNA...
為了能讓第一次學習Transformer的同學可以更容易了解其內容，本課程對 Transformer 的說明進行了部分簡化
19:10 計算關聯性的模型內部運作如下：先把兩個輸入分別乘上兩個不同的 Matrix (這兩個 Matrix 是透過訓練資料學得) 得到兩個向量 (也就是得到文獻上常常提到的 query q 和 key k)，再把這兩個向量做內積得到 Attention Weight
20:40 此處省略了文獻上常常提到的 value v
22:30 根據上述Attention Weight的計算過程，Attention Matrix 不一定是對稱的，自己對自己做 Attention 算出來的 Attention Weight 也不一定是最高的
23:00 因為 Causal Attention 的原因，Attention Matrix 其實是一個 Triangular Matrix
延伸閱讀
• 【機器學習2021】Transformer (上)
• 【機器學習2021】Transformer (下)
Наука та технологія

КОМЕНТАРІ • 27

@hankdonald7812 21 день тому ⁺⁶
0:40 大语言模型所做的事情，就是文字接龙
3:15 大语言模型所用类神经网络之一Transformer概述
4:53 1，Tokenization 文字转为Token
9:18 2，Input Layer 理解Token，该阶段会将Token转为Vector(Embedding)，LLM并不理解单纯的Token的意思，而可以理解每个Embedding的意思。Positional Embedding是加了位置信息的Embedding。
15:47 3，Attention 理解上下文，将Positional Embedding转为 Contextualized Token Embedding。
26:02 4，Feed Forward 整合、思考
28:07 5，Output Layer 得到输出
29:01 大语言模型运作过程，chatGPT只考虑左边已经输入的文字，无需考虑右边文字。
33:16 为什么处理超长文本是挑战，因为计算Attention的次数是与文本长度的平方成正比的，所以增加文本长度后，计算量的增加是非常大的。
@sunnynie4290 28 днів тому ⁺¹⁷
您真是天生的好老师，我一直没换台，居然能听得津津有味
@NickHuang 28 днів тому ⁺⁷
謝謝老師分享，很棒的教程和內容，很喜歡說明的條理和安排方式。
@mengyuge3369 26 днів тому ⁺⁴
大爱李老师，我现在工作了，但是还是爱听老师讲课
@user-gh2bl7ly4y 28 днів тому ⁺¹
感謝老師的更新❤
@danpoo007 28 днів тому ⁺⁴
謝謝老師~趕緊配午餐看XD
@Harvey-ov3pe 24 дні тому
谢谢老师！介绍得太清晰了
@Patricia_Liu 27 днів тому
謝謝老師!
@Terry0319 26 днів тому
謝謝老師
@JiangwenQvQ 27 днів тому
每一节课都在追
@HungHsunHuang 28 днів тому ⁺⁵
想請問老師，BERT的"Bidirectional"，是否可以理解為 "會判斷token以及其右邊(下文)相關性" 的attention模組呢?
@deskeyi 27 днів тому ⁺⁶
本來就是這個意思，這是BERT和GPT的主要區別之一
@philyu1117 12 днів тому
感謝老師講解，想請教在理解每個Token位置做Positional embedding時是根據token在句子不同位置的不同意思做embedding嗎？這時候不會有attention考慮上下文嗎？
@fortunaarcheryn6365 19 днів тому
这支影片讲得不错，终于明白了nn和transformer和attention的亿点点关系
@dashunwang6267 28 днів тому ⁺¹
老师能不能讲下RWKV 哈哈 😊
@user-hr3dg7yt6b 9 днів тому
沒有考慮到rwkv的架構比Mamba更準確也在不斷地迭代中
@810602jay 27 днів тому
輸入的文字長度不一定，之後長度也會越來越長 (auto-regressive)，所以 Input Layer 餵進去的 token 長度是可變的嗎?
@xaviertsai4063 25 днів тому
上課啦～開始進入需要長考的內容了😢
@fanwu-kd1nr 27 днів тому
老师这个 “如何快速进行attention”的视频在哪看？链接好像挂了
@HungyiLeeNTU 21 день тому
在這裡: ua-cam.com/video/yHoAq1IT_og/v-deo.htmlsi=2ZqqelyCYrt8l7DT
@dxwinux 27 днів тому
反复思考（transformer block层数）这个过程的（固定）次数背后的现在的思考是什么呢？为什么不是类似于pagerank，说你看，我继续思考已经不产生新的significant的思路了，咱们可以停止思考了。。。
@fanwu-kd1nr 27 днів тому
老师什么时候讲讲mamba\jamba
@gilberthsu6306 11 днів тому
mamba out了
@user-tp4ys2re5m 25 днів тому
为什么要这样拆
@user-yc6tf9mw7o 28 днів тому ⁺²
第一
@user-tp4ys2re5m 25 днів тому
😂ye s
@k3el07 28 днів тому
我觉得这些网民经常把自己放在警察、法官和裁判的角色，甚至是村头大妈的角色。这个悲伤的故事其实就是因为意外的疾病导致的灾难而已。如果不是这样，他们也是和美幸福的一家人。夫妻同命鸟，所有的幸福和灾难都是两个人一起承担的。人家自己没有意见别人根本没有任何立场胡乱评判的。

Наступне

Автоматичне відтворення

【生成式AI導論 2024】第11講：大型語言模型在「想」什麼呢？ - 淺談大型語言模型的可解釋性

【生成式AI導論 2024】第11講：大型語言模型在「想」什麼呢？ — 淺談大型語言模型的可解釋性

【生成式AI導論 2024】第9講：以大型語言模型打造的AI Agent (14:50 教你怎麼打造芙莉蓮一級魔法使考試中出現的泥人哥列姆)

【生成式AI導論 2024】第9講：以大型語言模型打造的AI Agent (14:50 教你怎麼打造芙莉蓮一級魔法使考試中出現的泥人哥列姆)

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

ВОЛКОВА: хочу поїхати в РЕХАБ. Мене ДОМАГАВСЯ викладач. Після СМЕРТІ чоловіка відчула ПОЛЕГШЕННЯ

ВОЛКОВА: хочу поїхати в РЕХАБ. Мене ДОМАГАВСЯ викладач. Після СМЕРТІ чоловіка відчула ПОЛЕГШЕННЯ

КАК СПРЯТАТЬ КОНФЕТЫ

КАК СПРЯТАТЬ КОНФЕТЫ

Sigma Girl Education #sigma #viral #comedy

Sigma Girl Education #sigma #viral #comedy

«Не знаю свою зарплату»: працівниця митниці з пустою декларацією #україна #митниця #гроші

«Не знаю свою зарплату»: працівниця митниці з пустою декларацією #україна #митниця #гроші

【生成式AI導論 2024】第15講：為什麼語言模型用文字接龍，圖片生成不用像素接龍呢？- 淺談生成式人工智慧的生成策略

【生成式AI導論 2024】第15講：為什麼語言模型用文字接龍，圖片生成不用像素接龍呢？— 淺談生成式人工智慧的生成策略

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

大模型解决不了英伟达的难题，AI新范式必将出现：专访安克创新CEO阳萌

大模型解决不了英伟达的难题，AI新范式必将出现：专访安克创新CEO阳萌

⁉️ 年薪百萬的工程師，有什麼節稅的方式？｜請看置頂留言 #工程師 #會計師 #報稅 #綜合所得稅 @abby_cpa

⁉️ 年薪百萬的工程師，有什麼節稅的方式？｜請看置頂留言 #工程師 #會計師 #報稅 #綜合所得稅 @abby_cpa

ChatGPT-4o重磅登場，如果一切都是真的，不能再說沒出國學不好英文了 / 現在，好想學英文啊!!!!!!

ChatGPT-4o重磅登場，如果一切都是真的，不能再說沒出國學不好英文了 / 現在，好想學英文啊!!!!!!

【生成式AI導論 2024】第12講：淺談檢定大型語言模型能力的各種方式

【生成式AI導論 2024】第12講：淺談檢定大型語言模型能力的各種方式

用AI給人生開掛的正確方式: AI比人进化快的时代，學什麼才不落伍?

用AI給人生開掛的正確方式: AI比人进化快的时代，學什麼才不落伍?

為什麼別人家的 ChatGPT 這麼聰明，我們家的整天跟我雞同鴨講？？搞懂「提示工程」讓你成為專業的 AI 溝通師！

為什麼別人家的 ChatGPT 這麼聰明，我們家的整天跟我雞同鴨講？？搞懂「提示工程」讓你成為專業的 AI 溝通師！

😱НОУТБУК СОСЕДКИ😱

😱НОУТБУК СОСЕДКИ😱

Размер не имеет значения! DDR Переходник за 400 рублей с OZON! 😅

Размер не имеет значения! DDR Переходник за 400 рублей с OZON! 😅

От него отказались ВСЕ! Редкий HP ZBook без схем, запчастей и надежд на ремонт

От него отказались ВСЕ! Редкий HP ZBook без схем, запчастей и надежд на ремонт

14 most AWKWARD Tech Fails of all time

14 most AWKWARD Tech Fails of all time

Nokia 3310 versus Red Hot Ball

Nokia 3310 versus Red Hot Ball

Какие мобильные телефоны изобрели в разных странах мира ?📱

Какие мобильные телефоны изобрели в разных странах мира ?📱

Xiaomi Note 13 Pro по безумной цене в России

Xiaomi Note 13 Pro по безумной цене в России