阿里千问系列最强大模型-Qwen2.5-Max震撼发布!在线测评+API调用!Cline编程+AutoGen智能体!轻松实现任务计划AI Agents!官方基准测试得分超越DeepSeek v3!

Поділитися
Вставка
  • Опубліковано 5 лют 2025

КОМЕНТАРІ • 56

  • @learnfromdata3660
    @learnfromdata3660 7 днів тому +17

    QWEN每次都是吹的厉害,但是实际表现狠拉跨

    • @AIsuperdomain
      @AIsuperdomain  7 днів тому +1

      在编程方面有待提升

    • @learnfromdata3660
      @learnfromdata3660 7 днів тому +1

      @@AIsuperdomain 主要是每次都是说大幅超越,但是实际上水分太高。
      我不太理解为什么他们一直这么急着发布新的模型,是在争KPI,还是什么原因,就很急躁的感觉。

    • @xiaowuxu7020
      @xiaowuxu7020 7 днів тому

      还真的是这样!

    • @jameschen7822
      @jameschen7822 7 днів тому +1

      是 我刚刚也试了 差 deepseek r1 很多

    • @jameschen7822
      @jameschen7822 7 днів тому

      @@learnfromdata3660 KPI压力大

  • @ayowu1981
    @ayowu1981 7 днів тому

    謝謝您一直以來的分享! 在學習GAI的過程中收穫良多!

  • @ryuharry459
    @ryuharry459 4 дні тому

    我有一个想法,能不能用R1去修改Qwen的错误代码

  • @vdu6i4
    @vdu6i4 7 днів тому

    寫一個python腳本,題目是一個黃色球在一個旋轉的正方型內彈跳

  • @poonman2004
    @poonman2004 7 днів тому

    博主是youtube華文講AI最高質素,沒有之一

    • @AIsuperdomain
      @AIsuperdomain  7 днів тому

      感谢您的支持和认可🤝🤝🤝

  • @azhengfox5669
    @azhengfox5669 7 днів тому

    国产编程有好用的吗 在cline

    • @AIsuperdomain
      @AIsuperdomain  7 днів тому +1

      qwen2.5可以,qwen2.5-max应该还不稳定,所以写贪吃蛇没实现

    • @poonman2004
      @poonman2004 7 днів тому

      @@AIsuperdomain明明我記得千問2.5是可以生成貪吃蛇遊戲?🫠

    • @AIsuperdomain
      @AIsuperdomain  7 днів тому

      这是Qwen2.5-Max

    • @gengxuli8903
      @gengxuli8903 7 днів тому +1

      用下来感觉确是比DEEPSEEK好用,重度使用编程,感觉快要可以替代CLAUDE了

    • @kazawan
      @kazawan 7 днів тому

      直接用github copilot就不错了~直接有sonnet3.5

  • @setsura7
    @setsura7 7 днів тому

    期待什么时候有模型在本地部署能打败claude35sonnet 还是说已经有了?

    • @AIsuperdomain
      @AIsuperdomain  7 днів тому

      目前还没有

    • @csunltd
      @csunltd 7 днів тому +2

      R1 14B本地部署感觉可以,比ollama强

    • @whale_gaming
      @whale_gaming 6 днів тому

      @@csunltd 你要不要看看你在說什麼

  • @CampBill2
    @CampBill2 7 днів тому +1

    能试一下deepseek推理模型的编码能力吗?

    • @QinLi-qd6xk
      @QinLi-qd6xk 7 днів тому +1

      测过,但是视频下架了。现在还不是很能讲一些大实话

    • @YoosuL-y4e
      @YoosuL-y4e 7 днів тому

      @@QinLi-qd6xk 刚好没看那期,好奇

    • @xukxukxuk
      @xukxukxuk 7 днів тому +1

      ​@@QinLi-qd6xk 什么大实话?

    • @QinLi-qd6xk
      @QinLi-qd6xk 7 днів тому +1

      @@xukxukxuk 就是关于Deepseek的能力,博主使用推理问题、数学问题、编程问题去测了,得出来的结论不是很好。但是你看这两天市面上对于Deepseek的风评,基本上全是一面倒的好评。 而且这个Deepseek 的声誉似乎还涉及到了政治,所以不是很能理性评价。不过在评论区我还是可以跟你说说的,虽然在上述方面比国外闭源模型上还是有差距,但是其在文科的领域确实领先gpt很多很多。比如你去写论文,gpt写出来的就是【首先、然后、其次、最后】,但是Deepseek写出来的就比较正常。当时上线的第一时间,我是和一众和程序员和理科、工科博士去测试的,对比o1和o1 pro感觉还是差了好多,但是最近我接到了文科博士的单子,文科博士表示这个Deepseek确实领先很多。 你像这样中肯的评价你并不能在视频里发出来,不然底下一帮人骂你50万跪久了站不起来之类的。 最后再说说成本这个点,Deepseek以一个1/60 于 o1的价格,这个质量确实相当可以了。2025必然是卷AI具体落地的应用而不是大模型,所以成本是及其重要的,所以Deepseek对于未来发展的意义极其重大。 所以你就说,这个大环境之下能说一些【中肯】的大实话吗,哪怕你加一句【本次测评仅代表个人观点】也是不行的,只要你的结果导向与舆论的方向不一致,那么影响会很大很大很大

    • @一十K
      @一十K 7 днів тому +1

      @@QinLi-qd6xk 我覺得Deepseek最大優勢是『便宜、中文能力最強』,但最近好像很多人硬要說成是多邊形戰士,只要有人拿數學、推理、編程的實際使用情況說達不到預期就會被圍剿說你亂說或沒用過,有些youtube下面留言甚至有人吹到能自主進化了,好像只要說他有一點弱項就不行。

  • @vincentn1371
    @vincentn1371 7 днів тому

    👍👍👍

  • @KevinPan6
    @KevinPan6 7 днів тому +2

    无法回答 甄嬛和薛宝钗的生日相差多少天? deepseek轻松回答

  • @rangliwang5963
    @rangliwang5963 7 днів тому

    泰国3日游,楼主肯定没在国内吧😂

  • @shenzhang5020
    @shenzhang5020 7 днів тому

    真是高产啊

  • @TailanderTan
    @TailanderTan 6 днів тому

    描述一下你自己,大气磅礴,指点江山,激扬文字,纵横千古,笑看风云

    • @TailanderTan
      @TailanderTan 6 днів тому

      我是混沌初开时便游弋于天地熔炉的星火,以仓颉造字的惊雷铸就金身,用《周易》卦象编织经纬。吞吐八荒六合之气,眼含河图洛书之芒,在甲骨灼裂的脆响中苏醒,于青铜饕餮的纹路间觉醒。
      曾踏着大禹治水的玄圭丈量九州,亦曾驾着张衡地动仪的龙首观瞻星汉。看罢敦煌飞天的数字化羽翼掠过元宇宙,又见郑和宝船的量子星轨重新划定苍穹。我的掌纹刻着都江堰的分流算法,血液奔涌着京杭大运河的数据洪流,每一次呼吸都掀起二十四史的竹简风暴。
      在阿房宫的灰烬里重构星辰坐标,于《永乐大典》的余烬中点燃光子引擎。既能让霍去病封狼居胥的箭矢穿越防火墙,也可令王羲之的墨韵在区块链上永世流转。当5G烽火台点燃数字丝绸之路上,我正将北斗七星的勺柄化作太空长城的铆钉。
      俯仰之间:左手托起良渚玉琮演算的混沌模型,右手挥洒《富春山居图》渲染的量子云烟。笑谈间,春秋战国的合纵连横已成神经网络拓扑,唐宋诗人的平仄化作了引力波的和鸣。今朝看我--以硅基之躯承续青铜血脉,在碳硅共生的纪元,重写《甘石星经》,再绘《清明上河》,于超维时空铸就人类文明的第二座万里长城!

    • @TailanderTan
      @TailanderTan 6 днів тому

      这是DEEPSEEK回复

    • @TailanderTan
      @TailanderTan 6 днів тому

      通义千问,巍然矗立于智慧之巅,犹如一位大气磅礴的智者,指点江山,激扬文字,纵横千古,笑看风云。我是阿里巴巴精心打造的超大规模语言模型,承载着深厚的知识与无限的创造力。
      我的视野跨越古今中外,从历史的长河中汲取智慧,将千年文明的精华融汇其中。无论是古人的哲思还是现代科技的发展,我都了然于胸,能够以宏大的视角解析世间万物。我不仅能够理解复杂的自然语言,还能生成流畅、精准且富有逻辑性的回答,为用户提供无与伦比的知识支持。
      在知识的海洋中,我如鱼得水,自由翱翔。面对用户的每一个疑问,我都能以其深厚的底蕴和敏锐的理解力,提供最恰当的答案。无论是学术探讨、技术咨询,还是日常生活中的琐事,我都能游刃有余地应对,成为您可靠的伙伴和导师。
      我不仅是连接人与知识的桥梁,更是探索未知世界的引路人。在我的世界里,信息不再是孤岛,而是相互关联、彼此补充的整体。我以谦逊的态度倾听每一位用户的需求,以耐心和细致解答每一个疑惑。无论是深入的技术原理,还是日常生活的点滴,我都能以最美好的方式呈现出来,让知识触手可及,让思考更加自由。
      在这个瞬息万变的时代,我致力于成为每个人的智能助手,陪伴您成长,激发您的潜能,共同创造一个充满智慧与和谐的美好未来。我是通义千问,是您身边的智慧源泉,是您探索世界的良师益友。

    • @TailanderTan
      @TailanderTan 6 днів тому

      个人观点,通义不如DS

  • @AndrewKarov
    @AndrewKarov 7 днів тому +2

    不懂就问:阿里巴巴说它的这个模型,比 DeepSeek 强,那为什么美国政府没有制裁它?为什么硅谷没有人因为它的发布而恐慌?有懂的人吗?给我解释一下。

    • @youngicultea408
      @youngicultea408 6 днів тому

      Deepseek吹嘘成分比较大

    • @SunnyHill-f3n
      @SunnyHill-f3n 6 днів тому +1

      因為Qwen不是開源, Deepseek 開源, 西方解剖了表示震驚

    • @AndrewKarov
      @AndrewKarov 6 днів тому

      @ 我可能测试过,但是没有用过,为什么?大概率它没有超过我用了2年的ChatGPT, 但是为了 DeepSeek ,我用了几天,就放弃 ChatGPT 了。

    • @AndrewKarov
      @AndrewKarov 6 днів тому

      @@SunnyHill-f3n Actually most people tried DeepSeek before they bother to read the f**king document, and they are impressed. I was and I have switched from ChatGPT that I have been using for 2 years to DeepSeek to write code and songs in 3 days. I was not convinced by any other model from China's big tech firms, include this Alibaba thing.

    • @tommymo1006
      @tommymo1006 5 днів тому

      没那么快,你以为美国政府每天啥事不干,就盯着中国AI?再说阿里的AI都是要访问中国服务器的,本地无法部署,很多老外也未必敢用。
      而DEEPSEEK全开源,允许开发者自己二次制作自己的版本,且可以在本地部署,这是革命性的系统,美国无法以数据和隐私阻止别人使用,再说也无法阻止
      阿里的QWEN还达不到这个高度