Coggle Data Science
Coggle Data Science
  • 27
  • 32 120
向量数据库选择指南:Forrester报告解读
本视频深入探讨了大模型时代下知识表示与存储的重要性,特别强调了向量数据库在其中的关键作用。我们首先展示了向量如何有效地捕捉和存储多维信息,以及它们在非结构化数据处理中的应用,如人脸识别和RAG(Retrieval-Augmented Generation)。然后分析了《The Forrester Wave™: Vector Databases, Q3 2024》报告,提供了选择向量数据库的评估框架,并展示了如何在Zilliz云端服务中创建数据库和执行向量检索的实际操作。
Переглядів: 46

Відео

2024 全球AI攻防挑战赛:大模型生图安全疫苗注入
Переглядів 3814 днів тому
2024 全球AI攻防挑战赛:大模型生图安全疫苗注入
动手学 NLP:KeyBERT 中英文关键词提取
Переглядів 1043 місяці тому
学习资料:discussion.coggle.club/t/topic/405
动手学 NLP:文本聚类方法介绍(关键词 / 语义聚类)
Переглядів 1123 місяці тому
学习资料:discussion.coggle.club/t/topic/405
Kaggle全球Deepfake攻防挑战赛:Ch1 赛题介绍
Переглядів 554 місяці тому
赛题链接:www.atecup.cn/deepfake 学习资料:discussion.coggle.club/t/topic/354
科大讯飞AI大赛:热力学定律的电池材料生产参数动态调控 baseline
Переглядів 434 місяці тому
比赛链接:challenge.xfyun.cn/topic/info?type=battery-material&option=ssgy&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/
Kaggle 图像分类比赛:3D 皮肤癌识别
Переглядів 434 місяці тому
竞赛助手微信:coggle101 比赛链接:www.kaggle.com/competitions/isic-2024-challenge/
科大讯飞AI大赛:轻度认知障碍疾病预测挑战赛 baseline
Переглядів 374 місяці тому
比赛报名链接:challenge.xfyun.cn/topic/info?type=mild-cognitive-impairment&option=phb&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/
科大讯飞AI大赛:分子性质AI预测挑战赛 baseline
Переглядів 645 місяців тому
赛题链接:challenge.xfyun.cn/topic/info?type=molecular-properties&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/tree/master/competition/科大讯飞AI开发者大赛2024
科大讯飞AI大赛:心理健康辅助诊断挑战赛 baseline
Переглядів 645 місяців тому
比赛报名链接:challenge.xfyun.cn/topic/info?type=mental-health&option=ssgy&ch=dw24_AtTCK9 代码分享:github.com/datawhalechina/competition-baseline/tree/master/competition/科大讯飞AI开发者大赛2024
GPU算力平台测评
Переглядів 2095 місяців тому
注册链接:www.compshare.cn/?ytag=GPU_bl74984098_Lbl_blkol
动手学NLP:Part2 意图识别数据读取
Переглядів 1726 місяців тому
在线资料:discussion.coggle.club/t/topic/222 打榜地址:competition.coggle.club/
动手学NLP:Part01 什么是意图识别?
Переглядів 1716 місяців тому
在线资料:discussion.coggle.club/t/topic/222 打榜地址:competition.coggle.club/
动手学RAG:Part11 三种提问聚类方法
Переглядів 5156 місяців тому
动手学RAG:Part11 三种提问聚类方法
动手学RAG:Part10 多模态图文问答
Переглядів 5736 місяців тому
动手学RAG:Part10 多模态图文问答
KDD Cup 2024:亚马逊LLMs购物挑战
Переглядів 1127 місяців тому
KDD Cup 2024:亚马逊LLMs购物挑战
动手学RAG:Part9 离线解析与在线问答
Переглядів 3827 місяців тому
动手学RAG:Part9 离线解析与在线问答
动手学RAG:Part8 意图识别/关键词/扩展词
Переглядів 5597 місяців тому
动手学RAG:Part8 意图识别/关键词/扩展词
动手学RAG:Part7 文本问答Promopt优化
Переглядів 8798 місяців тому
动手学RAG:Part7 文本问答Promopt优化
动手学RAG:Part5 文本嵌入与向量检索
Переглядів 1,7 тис.8 місяців тому
动手学RAG:Part5 文本嵌入与向量检索
动手学RAG:Part6 文本多路召回与重排序
Переглядів 1,3 тис.8 місяців тому
动手学RAG:Part6 文本多路召回与重排序
动手学RAG:Part4 文本索引与检索
Переглядів 2,2 тис.8 місяців тому
动手学RAG:Part4 文本索引与检索
动手学RAG:Part2 ChatGPT/GLM API
Переглядів 4,1 тис.8 місяців тому
动手学RAG:Part2 ChatGPT/GLM API
动手学RAG:Part3 数据集读取与评测方法
Переглядів 2,2 тис.8 місяців тому
动手学RAG:Part3 数据集读取与评测方法
搭建Chat2Pandas快速数据分析
Переглядів 808 місяців тому
搭建Chat2Pandas快速数据分析
100行代码搭建大模型网页客户端
Переглядів 1598 місяців тому
100行代码搭建大模型网页客户端
动手学RAG:Part1 什么是RAG?
Переглядів 16 тис.8 місяців тому
动手学RAG:Part1 什么是RAG?

КОМЕНТАРІ

  • @Coggle-Club
    @Coggle-Club 22 години тому

    查看Forrester完整报告:zilliz.com.cn/resources?tag=4?

  • @CDworthwatching
    @CDworthwatching Місяць тому

    很棒的视频

  • @尼古拉丝土豆
    @尼古拉丝土豆 3 місяці тому

    有对应的JavaScript库嘛

  • @k2358966
    @k2358966 3 місяці тому

    非常受用!感謝! 另外請問您會提供影片中使用的jupyter notebook嗎?

  • @haironglu
    @haironglu 4 місяці тому

    求资料分享

  • @simonwu6992
    @simonwu6992 4 місяці тому

    Es 是啥技术?

  • @linlinsun-il2yf
    @linlinsun-il2yf 4 місяці тому

    求资料分享

  • @haironglu
    @haironglu 5 місяців тому

    讲的挺好的

  • @wentaojiang-n3c
    @wentaojiang-n3c 5 місяців тому

    博主您好,本地实操用mbp,m3pro 可以跑起来吗?

  • @tmduncan60
    @tmduncan60 5 місяців тому

    獲益良多,感謝分享!

  • @wentaojiang-n3c
    @wentaojiang-n3c 5 місяців тому

    太棒了,正是我想学习的内容🤓感谢博主的无私奉献,加油!

  • @teamteam9515
    @teamteam9515 6 місяців тому

    我是新手只邊睡邊開聽了一次,就是不太懂是不是意思用別人大模型,再自己入資料,然後問問題,找答案。 (1)那自己設幾百條問題,有沒有AI幫設? (2)用大模型要錢嗎? (3)日後大模型網址/API不能用了怎麼辦? (4)弄了的成品是自己用/內部人用,還是可以當商品賣給別人? p.s. 完全不懂RAG及看第一次不太懂的新手提問

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      这里的几百条提问和回答是ai帮助生成的。大模型api一般收费。可以本地部署更加方便。成熟的可以做商业化产品

  • @kenshinhu2823
    @kenshinhu2823 6 місяців тому

    K 值是会根据训练数据变化而变化吗?

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      可以设置为一个常数

  • @LiJack-h2x
    @LiJack-h2x 6 місяців тому

    请问能共享一下代码吗?谢谢

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      你可以通过微信 coggle101 与我联系

  • @kenshinhu2823
    @kenshinhu2823 6 місяців тому

    想问一下如果输入的问题和入库的数据是怎样匹配的?就像中文语境下有可能是同一个意思,但是不是同一个文字的内容,那像这种的话也能匹配上吗?还是说需要一些微调之类的在用户之前就把他们做好关联。

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      可以通过语义相似度进行匹配

    • @kenshinhu2823
      @kenshinhu2823 6 місяців тому

      @@Coggle-Club 还有一个问题想请教一下:在coggle 中 汽车问答系统里的 question里有一道问题是:“请问这些汽车技术缩略语和术语主要用于哪些品牌的车型?” 像这种问题是需要从数据集是里取得车型是 MR6453DCHEV02,但这个实际是 领克的 01 车型,数据集中没有提及的。像这种有额外需要优化数据,是否仅能补完数据集来完善?

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      @@kenshinhu2823 这个提问可能从给定的pdf中无法回答,可以回答无法回答。也可以补充数据集再完善。

  • @calm214
    @calm214 6 місяців тому

    请问 有基础课嘛?!

    • @Coggle-Club
      @Coggle-Club 6 місяців тому

      你好,你想要什么类型的基础课,后续我们可以考虑重新录制一下。

  • @panfeng2879
    @panfeng2879 7 місяців тому

    現在那幾個主流的LLM也支持各類文檔的直接上傳(在我的賬號下),他們是不是背後也做了類似LANGCHAIN和RAG的事情,所以才能學習我上傳的文檔?如果以後主流大模型都支持個性文檔的上傳,那LANGCHAIN的價值何在呢?

    • @md96573
      @md96573 7 місяців тому

      雲端的LLM沒有管理上傳文檔的功能。個性檔案基於管理和安全的原因感覺可以在本地的Vector數據庫保存。以後的的更新更容易。查詢后的prompt再送雲端?當然如果本地運行Llama2或者下個月出的Llama3,通過LangChain來集成,可以作爲一個中間層接口降低代碼相互的依賴性,需要換模型也容易。

    • @Coggle-Club
      @Coggle-Club 7 місяців тому

      你说的前面的是的 gpt4上传文件应该有rag的逻辑。langchian是面向开发者的 也可以实现这功能

    • @yanggao5961
      @yanggao5961 3 місяці тому

      @@md96573 你们有遇到过本地ollama embedding doc特别慢的情况吗? 本地只有CPU来run,但是32 cores, 很短的一段话需要满负荷跑10来分钟。 有没有什么替代方案,doc embedding的工作放在一些online service完成?将结果保存在本地的vdb中?

  • @panfeng2879
    @panfeng2879 7 місяців тому

    A very helpful video to learn RAG, thanks. 然後我有個問題請假下:如果使用RAG技術做垂直領域的chatbot,比如視頻中的汽車保養吧,那最後的chatbot背後的知識庫應該是LLM的知識庫+汽車保養的知識庫,對吧。也就是說,如果我在chatbot中問了一個和汽車保養無關的問題,但是LLM是知道的,比如中國的首都是哪裏,那chatbot應該也可以給出答案吧?

    • @freeluo22
      @freeluo22 7 місяців тому

      你这个问题可以通过提示词模块来解决

    • @李凯峰
      @李凯峰 Місяць тому

      是的, 不过这个也有可能即使你有了知识库,它也跳过知识库去对应的LLM本身的知识库去回答,个人理解这个是最大痛点,并且即使你refine你的prompt,也有可能无法按理想的方式去知识库回答

  • @蘇会謙
    @蘇会謙 7 місяців тому

    您好。想学习。

  • @xinwang2670
    @xinwang2670 7 місяців тому

    这么好的东东,没人点赞可惜了

  • @jz1818
    @jz1818 7 місяців тому

    如果pdf為掃描檔可以用這方法嗎

    • @Coggle-Club
      @Coggle-Club 7 місяців тому

      先做ocr 再继续后面的流程

  • @whoopeerobottech638
    @whoopeerobottech638 7 місяців тому

    講得真仔細。真的很好。有接案嗎?

    • @Coggle-Club
      @Coggle-Club 7 місяців тому

      没有哈,个人爱好

  • @elleryleungnews
    @elleryleungnews 7 місяців тому

    謝謝你的影片,能不能請你用ollama在本地使用LLM和streamlit的案例呢?謝謝。

    • @Coggle-Club
      @Coggle-Club 7 місяців тому

      这个肯定可以的,不限制的