535
57 934

Inference Scaling for Long Context Retrieval Augmented GenerationGoogle 2024

27:43

NeuralFeels with neural fields Visuotactile perception for in hand manipulation（CMU & Meta 2024）

18:28

VISRAG VISION BASED RETRIEVAL AUGMENTED GENERATION ON MULTI MODALITY DOCUMENTSTsinghua 2024

13:10

BENCHMARKING MULTIMODAL RETRIEVAL AUG MENTED GENERATION WITH DYNAMIC VQA DATASET AND SELF ADAPTIVE

23:59

MULTI AGENT COLLABORATIVE DATA SELECTION FOR EFFICIENT LLM PRETRAINING（HKUST 2024）

19:44

UNDERSTANDING ALIGNMENT IN MULTIMODAL LLMS A COMPREHENSIVE STUDYApple 2024

30:12

Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster LevelHuawei 2024

Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level(Huawei 2024)

Відео

Inference Scaling for Long Context Retrieval Augmented GenerationGoogle 2024

27:43

Inference Scaling for Long Context Retrieval Augmented GenerationGoogle 2024

Переглядів 13День тому

Inference Scaling for Long-Context Retrieval Augmented Generation(Google 2024)

NeuralFeels with neural fields Visuotactile perception for in hand manipulation（CMU & Meta 2024）

18:28

NeuralFeels with neural fields Visuotactile perception for in hand manipulation（CMU & Meta 2024）

Переглядів 22День тому

NeuralFeels with neural fields- Visuotactile perception for in-hand manipulation（CMU & Meta 2024）

VISRAG VISION BASED RETRIEVAL AUGMENTED GENERATION ON MULTI MODALITY DOCUMENTSTsinghua 2024

13:10

VISRAG VISION BASED RETRIEVAL AUGMENTED GENERATION ON MULTI MODALITY DOCUMENTSTsinghua 2024

Переглядів 8День тому

VISRAG- VISION-BASED RETRIEVAL-AUGMENTED GENERATION ON MULTI-MODALITY DOCUMENTS(Tsinghua 2024)

BENCHMARKING MULTIMODAL RETRIEVAL AUG MENTED GENERATION WITH DYNAMIC VQA DATASET AND SELF ADAPTIVE

23:59

BENCHMARKING MULTIMODAL RETRIEVAL AUG MENTED GENERATION WITH DYNAMIC VQA DATASET AND SELF ADAPTIVE

Переглядів 24День тому

BENCHMARKING MULTIMODAL RETRIEVAL AUG- MENTED GENERATION WITH DYNAMIC VQA DATASET AND SELF-ADAPTIVE PLANNING AGENT(Alibaba 2025)

MULTI AGENT COLLABORATIVE DATA SELECTION FOR EFFICIENT LLM PRETRAINING（HKUST 2024）

19:44

MULTI AGENT COLLABORATIVE DATA SELECTION FOR EFFICIENT LLM PRETRAINING（HKUST 2024）

Переглядів 92День тому

MULTI-AGENT COLLABORATIVE DATA SELECTION FOR EFFICIENT LLM PRETRAINING（HKUST 2024）

UNDERSTANDING ALIGNMENT IN MULTIMODAL LLMS A COMPREHENSIVE STUDYApple 2024

30:12

UNDERSTANDING ALIGNMENT IN MULTIMODAL LLMS A COMPREHENSIVE STUDYApple 2024

Переглядів 34День тому

UNDERSTANDING ALIGNMENT IN MULTIMODAL LLMS- A COMPREHENSIVE STUDY(Apple 2024)

Data Selection via Optimal Control for Language ModelsCOAI, Tsinghua 2024

55:21

Data Selection via Optimal Control for Language ModelsCOAI, Tsinghua 2024

Переглядів 41День тому

Data Selection via Optimal Control for Language Models(COAI, Tsinghua 2024)

RULE Reliable Multimodal RAG for Factuality in Medical Vision Language ModelsUNC 2024

41:54

RULE Reliable Multimodal RAG for Factuality in Medical Vision Language ModelsUNC 2024

Переглядів 3614 днів тому

RULE- Reliable Multimodal RAG for Factuality in Medical Vision Language Models(UNC 2024)

Discovery of the Hidden World with Large Language Models（TMLR 2024）

25:05

Discovery of the Hidden World with Large Language Models（TMLR 2024）

Переглядів 2614 днів тому

Discovery of the Hidden World with Large Language Models（TMLR 2024）

Retrieval enhanced Knowledge Editing in Language Models for Multi Hop Question AnsweringUGA 2024

20:46

Retrieval enhanced Knowledge Editing in Language Models for Multi Hop Question AnsweringUGA 2024

Переглядів 4021 день тому

Retrieval-enhanced Knowledge Editing in Language Models for Multi-Hop Question Answering(UGA 2024)

γ−MOD EXPLORING MIXTURE OF DEPTH ADAPTA TION FOR MULTIMODAL LARGE LANGUAGE MODELSTUD 2024

28:11

γ−MOD EXPLORING MIXTURE OF DEPTH ADAPTA TION FOR MULTIMODAL LARGE LANGUAGE MODELSTUD 2024

Переглядів 2521 день тому

γ−MOD EXPLORING MIXTURE OF DEPTH ADAPTA TION FOR MULTIMODAL LARGE LANGUAGE MODELSTUD 2024

Probing RAG Self Probing to Guide Language Models in Selective Document Retrieval（CAU， Seoul 2024）

20:28

Probing RAG Self Probing to Guide Language Models in Selective Document Retrieval（CAU， Seoul 2024）

Переглядів 6928 днів тому

Probing-RAG- Self-Probing to Guide Language Models in Selective Document Retrieval（CAU， Seoul 2024）

PATIENT Ψ Using Large Language Models to Simulate Patients for Training Mental Health Professionals

22:52

PATIENT Ψ Using Large Language Models to Simulate Patients for Training Mental Health Professionals

Переглядів 42Місяць тому

PATIENT-Ψ- Using Large Language Models to Simulate Patients for Training Mental Health Professionals（CMU 2024）

Grounding Partially Defined Events in Multimodal Data（JHU 2024）

17:09

Grounding Partially Defined Events in Multimodal Data（JHU 2024）

Переглядів 26Місяць тому

Grounding Partially-Defined Events in Multimodal Data（JHU 2024）

Scaling Proprioceptive Visual Learning with Heterogeneous Pre trained Transformers（MIT 2024）

26:19

Scaling Proprioceptive Visual Learning with Heterogeneous Pre trained Transformers（MIT 2024）

Переглядів 170Місяць тому

Scaling Proprioceptive Visual Learning with Heterogeneous Pre trained Transformers（MIT 2024）

AutoTimes Autogressive Time Series Forecasters via Large Language Models Tsinghua 2024

27:59

AutoTimes Autogressive Time Series Forecasters via Large Language Models Tsinghua 2024

Переглядів 85Місяць тому

AutoTimes Autogressive Time Series Forecasters via Large Language Models Tsinghua 2024

LogicPro Improving Complex Logical Reasoning via Program Guided LearningPKU 2024

18:49

LogicPro Improving Complex Logical Reasoning via Program Guided LearningPKU 2024

Переглядів 32Місяць тому

LogicPro Improving Complex Logical Reasoning via Program Guided LearningPKU 2024

Q* Improving Multi step Reasoning for LLMs with Deliberative Planning（Skywork AI & NTU 2024）

39:46

Q* Improving Multi step Reasoning for LLMs with Deliberative Planning（Skywork AI & NTU 2024）

Переглядів 101Місяць тому

Q* Improving Multi step Reasoning for LLMs with Deliberative Planning（Skywork AI & NTU 2024）

Molmo and PixMo Open Weights and Open Data for State of the Art Multimodal Models（Allen AI & UW 202

18:50

Molmo and PixMo Open Weights and Open Data for State of the Art Multimodal Models（Allen AI & UW 202

Переглядів 67Місяць тому

Molmo and PixMo Open Weights and Open Data for State of the Art Multimodal Models（Allen AI & UW 202

RuleAlign Making Large Language Models Better Physicians with Diagnostic Rule Alignment（ZJU 2024）

21:59

RuleAlign Making Large Language Models Better Physicians with Diagnostic Rule Alignment（ZJU 2024）

Переглядів 43Місяць тому

RuleAlign Making Large Language Models Better Physicians with Diagnostic Rule Alignment（ZJU 2024）

DALK Dynamic Co Augmentation of LLMs and KG to answer Alzheimer’s Disease Questions with Scientific

30:41

DALK Dynamic Co Augmentation of LLMs and KG to answer Alzheimer’s Disease Questions with Scientific

Переглядів 85Місяць тому

DALK Dynamic Co Augmentation of LLMs and KG to answer Alzheimer’s Disease Questions with Scientific

General OCR Theory Towards OCR 2 0 via a Unified End to end Model（StepFun 2024）

20:23

General OCR Theory Towards OCR 2 0 via a Unified End to end Model（StepFun 2024）

Переглядів 97Місяць тому

General OCR Theory Towards OCR 2 0 via a Unified End to end Model（StepFun 2024）

On the Diagram of Thought（Tsinghua 2024）

10:05

On the Diagram of Thought（Tsinghua 2024）

Переглядів 552 місяці тому

On the Diagram of Thought（Tsinghua 2024）

Quiet STaR Language Models Can Teach Themselves to Think Before Speaking（Stanford 2024）

31:38

Quiet STaR Language Models Can Teach Themselves to Think Before Speaking（Stanford 2024）

Переглядів 1072 місяці тому

Quiet STaR Language Models Can Teach Themselves to Think Before Speaking（Stanford 2024）

Source2Synth SyntheticDataGenerationandCuration Grounded in Real Data Sources（Meta 2024）

15:51

Source2Synth SyntheticDataGenerationandCuration Grounded in Real Data Sources（Meta 2024）

Переглядів 102 місяці тому

Source2Synth SyntheticDataGenerationandCuration Grounded in Real Data Sources（Meta 2024）

ReKep Spatio Temporal Reasoning of Relational Keypoint Constraints for Robotic ManipulationStanford

15:13

ReKep Spatio Temporal Reasoning of Relational Keypoint Constraints for Robotic ManipulationStanford

Переглядів 602 місяці тому

ReKep Spatio Temporal Reasoning of Relational Keypoint Constraints for Robotic ManipulationStanford

Teaching Small Language Models to Reason for Knowledge Intensive Multi Hop Question AnsweringCAS 202

17:56

Teaching Small Language Models to Reason for Knowledge Intensive Multi Hop Question AnsweringCAS 202

Переглядів 612 місяці тому

Teaching Small Language Models to Reason for Knowledge Intensive Multi Hop Question AnsweringCAS 202

Conditional generative adversarial network assisted system for radiation free evaluation of scoliosi

10:29

Conditional generative adversarial network assisted system for radiation free evaluation of scoliosi

Переглядів 132 місяці тому

Conditional generative adversarial network assisted system for radiation free evaluation of scoliosi

In Defense of RAG in the Era of Long Context Language Models（Nvidia 2024）

8:52

In Defense of RAG in the Era of Long Context Language Models（Nvidia 2024）

Переглядів 252 місяці тому

In Defense of RAG in the Era of Long Context Language Models（Nvidia 2024）

КОМЕНТАРІ

@gateci 9 днів тому
数据集，程序在github上有吗
@piercezhou5454 15 днів тому
学生讲的很好，老师太笨了
@justintech3941 24 дні тому
可否给个ppt
@QichaoYingCN 29 днів тому
hi~想问下贵实验室也在研究医疗影像模型么~后续有计划定期更新医疗影响方面的论文么~thanks
@mardinmardin7108 29 днів тому
我们的主要工作方向
@chicagogirl9862 Місяць тому
if u make content in English you would get better impression
@krisman2503 Місяць тому
Thanks Dalao
@xray1111able Місяць тому
ppbklu 机u😊u p n n j😮lnlulmu aha z❤❤aa z za z❤aa z za z z z❤a az za z z z z aa❤a❤a z z❤❤a z a❤哇哇哇😊文盲mwkqaamaszjhaaaaaaasqjmajpaaaaqaqaaaquappppjjaaāaaaqajwwqaqsaaaqaj j mjj m w q w pa a aj j m w q w pa a a s w w w a e a❤alla w ai a a q a a sa ww wwq
@yu-siangwang1818 2 місяці тому
這篇文章的結構真的很混亂，圖也畫得很差
@jiaminghu5738 2 місяці тому
接下来又是一堆人来玩弄gpt-4o的时候了。🥲
@tjxln-5862 2 місяці тому
Hello, do you have the code for this paper? thank you!
@nealmenhinick 3 місяці тому
Hello im an avid blender 3d user, I’m very interested in working with you on a project
@dylantao 3 місяці тому
很精彩的report，感谢大佬🙏
@SurajPrasad-bf9qn 4 місяці тому
Can you please explain in English
@thebestchannel7736 4 місяці тому
could you please provide any guidance using it with a custom dataset
@yjack-nycu 4 місяці тому
蠻好奇報告過程中的問答，希望也可以在影片中
@yjack-nycu 4 місяці тому
感謝分享！
@wns-v9c 4 місяці тому
请问2分20秒左右提到的上一篇论文，是把attention维度和time维度倒置，是指的哪篇论文？谢谢
@BestSK-iy1ed Місяць тому
iTransformer？
@nathanjacob5231 4 місяці тому
English sub atleast?
@给我看沉默了什么白子 4 місяці тому
很有深度的解读。爱来自广东🥰
@bennebulous4421 4 місяці тому
这是把组里论文分享meeting发油管了吗）关注了
@xuanren5716 4 місяці тому
这篇文章不错
@19781026stanley 5 місяців тому
😊
@jodiecomer9460 5 місяців тому
在开组会吗
@kunalsingh-vi1mv 5 місяців тому
Hi, I am unable to find the dataset link? Is it opensource ?
@keyin5569 5 місяців тому
这个提问题的人好牛逼啊，哪位大佬？
@yangliu5075 5 місяців тому
浙大的组内分享么？
@gracegoce5295 5 місяців тому
good work !!
@nightknght 6 місяців тому
ni hao world!
@anghuynhnguyen9625 6 місяців тому
I wish I knew Chinese
@leyele9415 8 місяців тому
请问有代码吗
@胡华彦 8 місяців тому
假如model那块使用qwen14b这样小一点的模型，也能做到吗？
@volotat 8 місяців тому
Thank you for your amazing research. It is so hard to find fast and reliable ways to get embeddings for music. Your work is a real savior.
@abc123634 8 місяців тому
These presentations you uploaded are super helpful, thank you and please keep it up!
@faizahmed8015 9 місяців тому
Hey can make video in English
@MaxZhang-i3n 9 місяців тому
Good summary. Thank you for posting
@astudent8885 10 місяців тому
可能是因为刚刚开始msc 比较菜的缘故吧超级讨厌读paper，读着读着就困了（。超级高兴找到了这个channel，现在读paper 像看剧一样愉快了hhhh
@mardinmardin7108 10 місяців тому
@astudent8885 10 місяців тому
所以低级别到底是什么意思呢？像local edge / corner / intensity change 而不是object level 的理解吗？
@zyxwvutsrqponmlkh 11 місяців тому
嘿，小祖宗，标题为啥非得整成洋文呢？就像中国的饺子一样，馅儿香喷喷的全是肉，却偏偏取个“法式吐司”的名儿，这不是白白让人摸不着头脑吗？看视频的人，大多数是说中文的，你说中文标题，亲切又地道，才好吸引他们点进来嘛。举个例子，你要是刷英文视频，看到一个全是英文的标题，是不是也会觉得别扭，心里嘀咕一句“这到底是哪国风味？” 再说了，用中文标题，还能顺便秀一把咱大中华的文化底蕴。来个四字成语，一两句诗词，吊足胃口，让大家伙儿都好奇得不行，非点进来一探究竟不可。听老头的，下次做视频，标题可得跟内容配一脸，用中文说中文故事，才是正经路子！
@JosephLiaw 10 місяців тому
論文名稱 + 發表機構 + 年份資訊，清楚的讓點進這影片的人知道是在講哪一篇文章，且可以讓對這篇文章有興趣的人可以快速搜尋到我覺得沒啥毛病。
@zyxwvutsrqponmlkh 10 місяців тому
@@JosephLiaw 是的，但你看，我只会说英语，当我搜索这篇论文时，我看到一个英文标题的视频。然后当我试图观看时，每个人都在说一些来自月球的难以理解的语言，就像是点击诱饵，或者大口喝了一大口可口可乐后发现原来是酱油一样。令人不快的惊喜是不愉快的。
@TravelAsLocal 11 місяців тому
这跟finetune有本质区别么。文章有没有跟finetune的方法做比较？感觉包装得很晦涩
@李云鑫-w3g 11 місяців тому
🥰🥰🥰🥰
@poaceae1999 Рік тому
GPTs 跟assistant API 一出爐真的是搞的人仰馬翻😂
@mardinmardin7108 Рік тому
是……
@YangFan-e5t Рік тому
讲的挺清晰的很棒
@SultanAhmed-jx9md Рік тому
Can I have the slide ?
@keeshrolling107 Рік тому
谢谢大佬收获良多！！
@ruksharalam173 Рік тому
It would be great if you could please make this video in English.
@cuiyaojun-ue5cr Рік тому
我觉得这里并行计算的意思，应该是o的输出是并行计算的。就是o1、o2、o3的计算是并行的(只需要根据前面的k,v就可以计算出来，k,v的计算同样是并行的)。然而rnn中的隐变量不是并行计算的，其需要计算出前一个hn-1才能计算hn，是串行的
@cuiyaojun-ue5cr Рік тому
hhh学长也说了，不好意思刚没看完就评论了
@albiboi420 Рік тому
really helpful content. Thanks!
@松松-p6j Рік тому
你好，请教下Indicator里的Reward score是如何计算的，是使用OpenAssistant模型直接打分的吗？是用的比如 OpenAssistant/reward-model-deberta-v3-base 但是这个模型好像智能对QA场景进行打分
@jielu4321 Рік тому
这是开讨论班么？小朋友被挂黑板了，哈哈哈。。。
@gtalckmin Рік тому
Would you have your presentation in an english version? Or could you enable the autotranslate option on your videos?

mardin mardin

КОМЕНТАРІ