- 27
- 32 120
Coggle Data Science
Hong Kong
Приєднався 6 бер 2024
"Coggle Data Science" is the largest Chinese Kaggle community globally, focusing on case studies of data mining, Kaggle, and large-scale models.
WeChat Official Account: Coggle Data Science
Competition Forum: discussion.coggle.club/
Competition Open Source: github.com/datawhalechina/competition-baseline
Competition Assistant WeChat: coggle101
WeChat Official Account: Coggle Data Science
Competition Forum: discussion.coggle.club/
Competition Open Source: github.com/datawhalechina/competition-baseline
Competition Assistant WeChat: coggle101
向量数据库选择指南:Forrester报告解读
本视频深入探讨了大模型时代下知识表示与存储的重要性,特别强调了向量数据库在其中的关键作用。我们首先展示了向量如何有效地捕捉和存储多维信息,以及它们在非结构化数据处理中的应用,如人脸识别和RAG(Retrieval-Augmented Generation)。然后分析了《The Forrester Wave™: Vector Databases, Q3 2024》报告,提供了选择向量数据库的评估框架,并展示了如何在Zilliz云端服务中创建数据库和执行向量检索的实际操作。
Переглядів: 46
Відео
Kaggle全球Deepfake攻防挑战赛:Ch1 赛题介绍
Переглядів 554 місяці тому
赛题链接:www.atecup.cn/deepfake 学习资料:discussion.coggle.club/t/topic/354
科大讯飞AI大赛:热力学定律的电池材料生产参数动态调控 baseline
Переглядів 434 місяці тому
比赛链接:challenge.xfyun.cn/topic/info?type=battery-material&option=ssgy&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/
Kaggle 图像分类比赛:3D 皮肤癌识别
Переглядів 434 місяці тому
竞赛助手微信:coggle101 比赛链接:www.kaggle.com/competitions/isic-2024-challenge/
科大讯飞AI大赛:轻度认知障碍疾病预测挑战赛 baseline
Переглядів 374 місяці тому
比赛报名链接:challenge.xfyun.cn/topic/info?type=mild-cognitive-impairment&option=phb&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/
科大讯飞AI大赛:分子性质AI预测挑战赛 baseline
Переглядів 645 місяців тому
赛题链接:challenge.xfyun.cn/topic/info?type=molecular-properties&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/tree/master/competition/科大讯飞AI开发者大赛2024
科大讯飞AI大赛:心理健康辅助诊断挑战赛 baseline
Переглядів 645 місяців тому
比赛报名链接:challenge.xfyun.cn/topic/info?type=mental-health&option=ssgy&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/tree/master/competition/科大讯飞AI开发者大赛2024
动手学NLP:Part2 意图识别数据读取
Переглядів 1726 місяців тому
在线资料:discussion.coggle.club/t/topic/222 打榜地址:competition.coggle.club/
动手学NLP:Part01 什么是意图识别?
Переглядів 1716 місяців тому
在线资料:discussion.coggle.club/t/topic/222 打榜地址:competition.coggle.club/
查看Forrester完整报告:zilliz.com.cn/resources?tag=4?
很棒的视频
有对应的JavaScript库嘛
非常受用!感謝! 另外請問您會提供影片中使用的jupyter notebook嗎?
求资料分享
Es 是啥技术?
elasticsearch
@@Coggle-Club 多谢哈🙏
求资料分享
讲的挺好的
感谢你的认可
博主您好,本地实操用mbp,m3pro 可以跑起来吗?
可以
獲益良多,感謝分享!
太棒了,正是我想学习的内容🤓感谢博主的无私奉献,加油!
我是新手只邊睡邊開聽了一次,就是不太懂是不是意思用別人大模型,再自己入資料,然後問問題,找答案。 (1)那自己設幾百條問題,有沒有AI幫設? (2)用大模型要錢嗎? (3)日後大模型網址/API不能用了怎麼辦? (4)弄了的成品是自己用/內部人用,還是可以當商品賣給別人? p.s. 完全不懂RAG及看第一次不太懂的新手提問
这里的几百条提问和回答是ai帮助生成的。大模型api一般收费。可以本地部署更加方便。成熟的可以做商业化产品
K 值是会根据训练数据变化而变化吗?
可以设置为一个常数
请问能共享一下代码吗?谢谢
你可以通过微信 coggle101 与我联系
想问一下如果输入的问题和入库的数据是怎样匹配的?就像中文语境下有可能是同一个意思,但是不是同一个文字的内容,那像这种的话也能匹配上吗?还是说需要一些微调之类的在用户之前就把他们做好关联。
可以通过语义相似度进行匹配
@@Coggle-Club 还有一个问题想请教一下:在coggle 中 汽车问答系统里的 question里有一道问题是:“请问这些汽车技术缩略语和术语主要用于哪些品牌的车型?” 像这种问题是需要从数据集是里取得车型是 MR6453DCHEV02,但这个实际是 领克的 01 车型,数据集中没有提及的。像这种有额外需要优化数据,是否仅能补完数据集来完善?
@@kenshinhu2823 这个提问可能从给定的pdf中无法回答,可以回答无法回答。也可以补充数据集再完善。
请问 有基础课嘛?!
你好,你想要什么类型的基础课,后续我们可以考虑重新录制一下。
現在那幾個主流的LLM也支持各類文檔的直接上傳(在我的賬號下),他們是不是背後也做了類似LANGCHAIN和RAG的事情,所以才能學習我上傳的文檔?如果以後主流大模型都支持個性文檔的上傳,那LANGCHAIN的價值何在呢?
雲端的LLM沒有管理上傳文檔的功能。個性檔案基於管理和安全的原因感覺可以在本地的Vector數據庫保存。以後的的更新更容易。查詢后的prompt再送雲端?當然如果本地運行Llama2或者下個月出的Llama3,通過LangChain來集成,可以作爲一個中間層接口降低代碼相互的依賴性,需要換模型也容易。
你说的前面的是的 gpt4上传文件应该有rag的逻辑。langchian是面向开发者的 也可以实现这功能
@@md96573 你们有遇到过本地ollama embedding doc特别慢的情况吗? 本地只有CPU来run,但是32 cores, 很短的一段话需要满负荷跑10来分钟。 有没有什么替代方案,doc embedding的工作放在一些online service完成?将结果保存在本地的vdb中?
A very helpful video to learn RAG, thanks. 然後我有個問題請假下:如果使用RAG技術做垂直領域的chatbot,比如視頻中的汽車保養吧,那最後的chatbot背後的知識庫應該是LLM的知識庫+汽車保養的知識庫,對吧。也就是說,如果我在chatbot中問了一個和汽車保養無關的問題,但是LLM是知道的,比如中國的首都是哪裏,那chatbot應該也可以給出答案吧?
你这个问题可以通过提示词模块来解决
是的, 不过这个也有可能即使你有了知识库,它也跳过知识库去对应的LLM本身的知识库去回答,个人理解这个是最大痛点,并且即使你refine你的prompt,也有可能无法按理想的方式去知识库回答
您好。想学习。
这么好的东东,没人点赞可惜了
谢谢你的支持
如果pdf為掃描檔可以用這方法嗎
先做ocr 再继续后面的流程
講得真仔細。真的很好。有接案嗎?
没有哈,个人爱好
謝謝你的影片,能不能請你用ollama在本地使用LLM和streamlit的案例呢?謝謝。
这个肯定可以的,不限制的