台大資訊深度學習之應用 | ADL 5.2 BERT 進擊的芝麻街巨人

台大資訊深度學習之應用 | ADL 3.1: Word Representations 用機器看得懂的方式表示詞彙

台大資訊深度學習之應用 | ADL 1.1: What is ML? 甚麼是機器學習?

Олександр Мацієвський з роду городових козаків. Ростислав Мартинюк у Інструкція.Смисл

АНАЛИЗЫ (смешное видео, поржать, юмор, прикол, смех)

А что бы ты сделал? @LimbLossBoss

台大資訊深度學習之應用 | ADL 5.1: BPE (Byte-Pair Encoding) Tokenization 如何將字詞切成小單元

陳縕儂 Vivian NTU MiuLab

Переглядів 2 697

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 23 жов 2024
2023/10/12 Applied Deep Learning
Lectured by Yun-Nung Vivian Chen 陳縕儂 @ NTU CSIE

КОМЕНТАРІ • 3

@shuaishao6114 2 місяці тому
感谢老师的分享，great talk！
@wangjohn9224 Місяць тому
您說的問題確實存在，一方面開源的大模型在做多語言，但是除了英語之外的其他語言的語料佔比非常少，所以在其他語言上面的無論是tokenizer 還是模型推理，性能都不好，另一個方面我們是否可以在model的輸入端和輸出端加入制定語言的翻譯model呢？當然時延會上升，語言翻譯也會丟失原生語言的一些含義。如果直接在繁體中文上面做tokenizer，之後在做model訓練，但是擔心的是繁體中文的語料規模小於英文，所以模型訓練的語料是不是應該使用中文加英文的方式呢？或者是使用在英文語料庫爲主的開源模型上面微調,呢? 我想問一下微調的時候，我們增加新的token到 tokenizer裡面, 這樣好點嗎？
@lollipop030-pv2kw Місяць тому
gpt 4o 的tokenizer可以處理中文了 "工作"會是同一個token

Наступне

Автоматичне відтворення

台大資訊深度學習之應用 | ADL 5.2 BERT 進擊的芝麻街巨人

台大資訊深度學習之應用 | ADL 5.2 BERT 進擊的芝麻街巨人

台大資訊深度學習之應用 | ADL 3.1: Word Representations 用機器看得懂的方式表示詞彙

台大資訊深度學習之應用 | ADL 3.1: Word Representations 用機器看得懂的方式表示詞彙

台大資訊深度學習之應用 | ADL 1.1: What is ML? 甚麼是機器學習?

台大資訊深度學習之應用 | ADL 1.1: What is ML? 甚麼是機器學習?

Олександр Мацієвський з роду городових козаків. Ростислав Мартинюк у Інструкція.Смисл

Олександр Мацієвський з роду городових козаків. Ростислав Мартинюк у Інструкція.Смисл

АНАЛИЗЫ (смешное видео, поржать, юмор, прикол, смех)

АНАЛИЗЫ (смешное видео, поржать, юмор, прикол, смех)

А что бы ты сделал? @LimbLossBoss

А что бы ты сделал? @LimbLossBoss

Как не носить с собой вещи

Как не носить с собой вещи

台大資訊深度學習之應用 | ADL 8.3: InstructGPT 將GPT社會化變成ChatGPT

台大資訊深度學習之應用 | ADL 8.3: InstructGPT 將GPT社會化變成ChatGPT

【機器學習】該如何訓練 AI 模型？揭秘 Model 訓練步驟 💡

【機器學習】該如何訓練 AI 模型？揭秘 Model 訓練步驟 💡

急性子毁掉生活！沉不住气的人过得实在太惨，快来看看长见识！#窦文涛 #梁文道 #马未都 #周轶君 #马家辉 #许子东 #圆桌派 #圆桌派第七季

急性子毁掉生活！沉不住气的人过得实在太惨，快来看看长见识！#窦文涛 #梁文道 #马未都 #周轶君 #马家辉 #许子东 #圆桌派 #圆桌派第七季

台大資訊深度學習之應用 | ADL 8.1: LLM Adaptation 如何改變(洗腦?)語言模型

台大資訊深度學習之應用 | ADL 8.1: LLM Adaptation 如何改變(洗腦?)語言模型

台大資訊深度學習之應用 | ADL 1.2: What is DL? 甚麼是深度學習?

台大資訊深度學習之應用 | ADL 1.2: What is DL? 甚麼是深度學習?

台大資訊深度學習之應用 | ADL 4.1: Attention Mechanism 注意力機制

台大資訊深度學習之應用 | ADL 4.1: Attention Mechanism 注意力機制

台大資訊深度學習之應用 | ADL 0: Course Misc QA

台大資訊深度學習之應用 | ADL 0: Course Misc QA

不懂「兩字」別玩股票！台灣巴菲特慘賠兩千萬超痛領悟！00940存股變存骨股東跑了？想提早退休ETF怎麼買？【新聞挖挖哇】

不懂「兩字」別玩股票！台灣巴菲特慘賠兩千萬超痛領悟！00940存股變存骨股東跑了？想提早退休ETF怎麼買？【新聞挖挖哇】

😆 Забыла как закрывается багажник и удивила мужа! | Новостничок

😆 Забыла как закрывается багажник и удивила мужа! | Новостничок

Сюрприз для Златы на день рождения

Сюрприз для Златы на день рождения

ПРЕМЬЕРА ШИКАРНОГО ДЕТЕКТИВА 2024! ТРУП В ШКАФУ НА АУКЦИОНЕ! УБИЙСТВО В НАНСИ. Лучшие Фильмы

ПРЕМЬЕРА ШИКАРНОГО ДЕТЕКТИВА 2024! ТРУП В ШКАФУ НА АУКЦИОНЕ! УБИЙСТВО В НАНСИ. Лучшие Фильмы

«Легкий способ бросить курить»

«Легкий способ бросить курить»

ДОМИК в КАМНЕ! МЫ придумали ЛОВУШКУ "НА ТРУБЕ" РАСТ/RUST

ДОМИК в КАМНЕ! МЫ придумали ЛОВУШКУ "НА ТРУБЕ" РАСТ/RUST

Угадай Настоящего Экстрасенса! Взрослые Угадывают (Сатир, Хазяева, DK, Sqwoz Bab, Кокошка, Данон)

Угадай Настоящего Экстрасенса! Взрослые Угадывают (Сатир, Хазяева, DK, Sqwoz Bab, Кокошка, Данон)