【人工智能】DeepSeek开源推理模型R1 | R1-Zero | 蒸馏小模型 | 绕过监督微调直接强化学习 | 媲美o1 | 顿悟时刻 | GRPO | 奖励设计 | 冷启动 | 再现价格屠夫

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 ม.ค. 2025

ความคิดเห็น • 118

  • @Leopoldo-hk
    @Leopoldo-hk วันที่ผ่านมา +2

    一如既往的高質量 讚

  • @minggai8582
    @minggai8582 4 ชั่วโมงที่ผ่านมา +1

    上个版本出来之后就从openai换过来了,我没用api就是工作上写代码,问问题,我没感觉有什么问题,反正对我来说看不出来个chatgpt有啥区别,比Gemini 好用不少。

  • @taijistar9052
    @taijistar9052 วันที่ผ่านมา +3

    大飞介说简捷准确!谢谢!

  • @martindu9083
    @martindu9083 วันที่ผ่านมา

    我从他们网站api试了一下r1,它不支持function call. 等于它只能作为一个tool被agent使用,没法作为控制器。和openai的模型没法比. {'message': 'deepseek-reasoner does not support Function Calling', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_request_error'}}

  • @mightylakers
    @mightylakers 6 ชั่วโมงที่ผ่านมา +1

    Oops! DeepSeek is experiencing high traffic at the moment. Please check back in a little while.

  • @mightylakers
    @mightylakers 6 ชั่วโมงที่ผ่านมา +1

    严重怀疑这些benchmark test 的分数。我让R1 做一个简单的stock trading backtest 程序。一直出错。到现在干脆连线都连不上了。

    • @mikecheng6010
      @mikecheng6010 4 ชั่วโมงที่ผ่านมา +1

      用API会比官方网站靠谱很多 实测。 官网端口确实不太行,不知道具体的原因是什么

    • @mightylakers
      @mightylakers 3 ชั่วโมงที่ผ่านมา +1

      @@mikecheng6010 我看google ai studio 上用 Gemini 2.0 flash thinking experimental 挺不错

  • @tat4340
    @tat4340 2 วันที่ผ่านมา +12

    現在是不是全世界人都會AI只有我不會啊
    我感覺自己好像山頂洞人

    • @chahale8530
      @chahale8530 2 วันที่ผ่านมา +1

      只要你能跟别人交流,你就会了,只不过现在AI还比较傻

    • @周柏宇-g4e
      @周柏宇-g4e วันที่ผ่านมา +1

      ML要實際寫程式碼、看論文,只是看影片了解可能比較有限。多數會ML的都是從業人士,一般人其實不會的,就想想其實沒多少人會寫程式就知道了。

    • @nwohocan
      @nwohocan วันที่ผ่านมา +1

      並不會,基本上不是智識輸出行業別怕

    • @afonsode419
      @afonsode419 วันที่ผ่านมา +1

      別怕 很好玩的 只要一直去跟他說

    • @chunliangde
      @chunliangde วันที่ผ่านมา

      山顶洞人也在山洞顶安装了大模型😂

  • @weiwei861
    @weiwei861 4 ชั่วโมงที่ผ่านมา

    只要控制住含印量,问题不大
    至于那几个自行测试的,其结果没有任何参考价值。这事还得交给专业的去做

  • @austinsu5838
    @austinsu5838 2 วันที่ผ่านมา +7

    Deepseek還不錯,可以作為我產品的openai替代方案,只可惜目前api的function call 有問題,還無法上線使用😢

    • @zhbo2430
      @zhbo2430 2 วันที่ผ่านมา +1

      非常赞同,我也发现function call 有問題

    • @senpow
      @senpow วันที่ผ่านมา

      能用OpenRouter选择deepseek来替代吗?

  • @paulzhu7694
    @paulzhu7694 2 วันที่ผ่านมา +44

    Deepseek r1用下来就…………一言难尽,可以作为具体任务的,ai做题家。但是面对真正工作复杂问题,需要跨领域多学科专业知识推理的时候,直接扑街了,甚至不如claude3.5,比o1差一大截。泛用性还是老问题,而且R1价格并不便宜,所以总的来说,我还是会选择o1,个人用户,o1还是挺划算的

    • @zxwxz
      @zxwxz 2 วันที่ผ่านมา +15

      O1的知識豐富與完整度是非常恐怖的,你甚至一般日常使用比如法律 醫療都可以用得上,OpenAI的model這麼大又貴是有原因的,不是只為了衝分而已,但我必須說Open Source的推進與普及也可以讓OpenAI不擠牙膏

    • @stivenhxm
      @stivenhxm 2 วันที่ผ่านมา +8

      我自己搞了一些测试集,o1都能推理准确,deepseek完全不行。然后还发现deekseek经常出现推理过程和结果不一致的情况

    • @zxwxz
      @zxwxz 2 วันที่ผ่านมา +5

      @@stivenhxm RL on LLM的方向是沒錯的,但他們可能缺乏廣泛優良的dataset,非數學程式相關的dataset很難整理很花算力跟資源,再者記憶型的知識很難壓縮,model變太大也難以訓練,這還是回到資源匱乏的問題

    • @nwohocan
      @nwohocan วันที่ผ่านมา

      沒有硬體資料去訓練大模型,不然open ai真的危險

    • @zsh5376
      @zsh5376 วันที่ผ่านมา +3

      拜託 性能先不說 價格怎麼可能更貴 這個是deepseek輾壓的優點

  • @hiucollo2402
    @hiucollo2402 วันที่ผ่านมา +1

    Thank you 大 飞 一口氣看到尾 看完再看 🏆 🏆 🏆 🏆 🏆☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🏆 🏆 🏆 🏆 🏆

  • @hojonglin1261
    @hojonglin1261 5 ชั่วโมงที่ผ่านมา

    隨手丟一個邏輯問題給 DeepSeek R1 70b,卻引發了 LLM psychosis。一頁又一頁的推理、論證,沒完沒了,最後半途終止,也沒有結論。

  • @SimonNgai-d3u
    @SimonNgai-d3u 2 วันที่ผ่านมา +1

    They let it cook.

  • @chencao-y5k
    @chencao-y5k วันที่ผ่านมา

    scale ai 瑟瑟发抖

  • @freealpha8964
    @freealpha8964 วันที่ผ่านมา +3

    它现在还认为自己是chatgpt吗😂

    • @yinyiwang
      @yinyiwang วันที่ผ่านมา +1

      是的

  • @xz1597
    @xz1597 2 วันที่ผ่านมา +1

    真不知道发展这么快是不是好事,还自我进化,听着太可怕了😂,感觉open AI发展遇到瓶颈了,慢一点更安心

    • @christopherqwan8471
      @christopherqwan8471 18 ชั่วโมงที่ผ่านมา

      @@xz1597 放心目前这个阶段的AI逻辑是统计学算概率,所以必然存在有一个极值,达到这个极值附近就会出现提供n次方算力但是准确率提升快速下降

  • @jihualiu5721
    @jihualiu5721 9 ชั่วโมงที่ผ่านมา

    如果讓deepseeck 分析資本主義和社會主義的優越性,它會得出科學結論嗎,會被共產黨接受嗎

    • @Alex-shi-i3z
      @Alex-shi-i3z 9 ชั่วโมงที่ผ่านมา

      @@jihualiu5721 你这种是听了什么敏感词就应激了

  • @hipqi119
    @hipqi119 วันที่ผ่านมา

    用来测试r1 通过,同期只有claude35通过,没有试过o1。答案是b
    题目
    衣架与衣钩一块衣板上有6个挂衣钩,从左至右分别编号为1~6号。现有红、黄、蓝绿、紫5种颜色的衣架,可分别挂在6个挂衣钩下。但无论如何挂,总会有一个挂衣钩空余。现在,衣架必须按照以下条件挂在衣钩上:1.绿衣架必须离蓝衣架远,离红衣架近。2.黄衣架必须挂在紧挨着蓝衣架旁边的衣钩上。3.紫衣架不能和蓝衣架挨着。4.红衣架不能挂在1号衣钩上。请找出下列不符合要求的一组衣架排列方式:A.绿衣架、红衣架、紫衣架、空衣钩、黄衣架、蓝衣架B.绿衣架、红衣架、空衣钩、黄衣架、蓝衣架、紫衣架C.绿衣架、紫衣架、红衣架、黄衣架、蓝衣架、空衣钩D.紫衣架、空衣钩、黄衣架、蓝衣架、红衣架、绿衣架

  • @jackshi7613
    @jackshi7613 วันที่ผ่านมา

    实测超过o1

    • @YG8877
      @YG8877 วันที่ผ่านมา +2

      怎么测的?

    • @蘇維明
      @蘇維明 21 ชั่วโมงที่ผ่านมา +1

      不覺得

  • @hanhan-it5dp
    @hanhan-it5dp วันที่ผ่านมา

    大飞,你多测试一下,你会发现它给的答案不能说跟chatgpt一模一样吧,标点符号啥的都一样,呵呵

    • @xingzou1540
      @xingzou1540 8 ชั่วโมงที่ผ่านมา +2

      @hanhan-it5dp 建议先下载用一下

  • @randomrandom63663
    @randomrandom63663 10 ชั่วโมงที่ผ่านมา

    字节跳动的产品,敬谢不敏

    • @jianxu573
      @jianxu573 21 นาทีที่ผ่านมา

      你们殖人真心你妈的低智商,有时候感觉跟你们不是同一物种,这是杭州深度探索的ai,不是字节跳动

  • @StevenHHH
    @StevenHHH วันที่ผ่านมา +3

    DeepSeek 不錯用,可用google登入,只要不問到"中國敏感詞"問題,他是個滿好用的AI ,我的了解任何中國的AI ,是有監管的,所以AI的公司會把對話適當的存放著。抱歉修正了, 不是政治,是"中國敏感詞"。

    • @MarcBester
      @MarcBester วันที่ผ่านมา +5

      AI不是用来问政治的

    • @freealpha8964
      @freealpha8964 วันที่ผ่านมา +4

      ​@MarcBester为什么不可以?我想了解一下为啥不行?它们在害怕什么😂

    • @leftyliarbreaker6860
      @leftyliarbreaker6860 วันที่ผ่านมา +6

      @@freealpha8964你不能在llm政治观点和你一致的时候才同意😂

    • @leftyliarbreaker6860
      @leftyliarbreaker6860 วันที่ผ่านมา

      @@freealpha8964明明是你自己破防吧😂

    • @chunliangde
      @chunliangde วันที่ผ่านมา

      这个模型确实不适合岛内某些🐸用,脑里只有政治,没有常识😂

  • @kusogod
    @kusogod วันที่ผ่านมา +3

    大模型界的拼多多…
    聽起來不是什麼好形容

    • @ray911abc
      @ray911abc วันที่ผ่านมา +3

      拼多多是一家极好的公司。网上的无脑黑大多是对这家公司不够了解的

    • @ayao95
      @ayao95 วันที่ผ่านมา

      @@ray911abc 垃圾

    • @fool9111z
      @fool9111z วันที่ผ่านมา

      非常脑残又懒惰的一种描述

    • @kusogod
      @kusogod วันที่ผ่านมา +1

      @ray911abc 真假?拼多多不是常常被抱怨把賣家獲利壓到最低嗎?
      怎麼會被你形容成極好的程度?

    • @qiupingliLiwaing
      @qiupingliLiwaing วันที่ผ่านมา +1

      @@kusogod 有货物没渠道,卖不出去。供应商多一个选择不是很好吗?你不喜欢可以不用它,不要那么圣母婊。

  • @freealpha8964
    @freealpha8964 วันที่ผ่านมา +6

    测了一下,让这model打印hello world 150遍,直接crash了😂
    别来碰瓷o1了好吧

    • @bestpartners
      @bestpartners  วันที่ผ่านมา +2

      我这没问题啊,用时9秒,深度思考并且写出了对应的python程序

    • @freealpha8964
      @freealpha8964 วันที่ผ่านมา +3

      ​@@bestpartners 不是写程序,是真正打印

    • @freealpha8964
      @freealpha8964 วันที่ผ่านมา

      ​@@bestpartnerstry this one
      Print "hello world" for 150 times with a white space in between, don't write code, don't omit anything

    • @freealpha8964
      @freealpha8964 วันที่ผ่านมา

      ​@@bestpartners精确计数对所有LLM都是极具挑战性的任务,因为模型很难在保持精确的状态来控制在恰当的地方停止。通俗来说,长程精确推理对所有LLM 都很难,在这方面chatgpt 断崖式领先

    • @職業馬桶鑑定師
      @職業馬桶鑑定師 วันที่ผ่านมา

      @@freealpha8964 我也發現針對重複的數字或者文字他會直接卡bug

  • @proud_chinese_traitor
    @proud_chinese_traitor 2 วันที่ผ่านมา +25

    山路十里,1989,蜂蜜,6亿人均收入不到1000,我输入这些,DeepSeek马上关闭网页,这东西太智能了

    • @ching5614
      @ching5614 2 วันที่ผ่านมา +4

      😂

    • @100starship2
      @100starship2 2 วันที่ผ่านมา +1

      蜂蜜为啥也是敏感词?

    • @chahale8530
      @chahale8530 2 วันที่ผ่านมา

      山路十里是什么意思

    • @chongyayayayayayayayaya
      @chongyayayayayayayayaya 2 วันที่ผ่านมา +4

      Copilot 一讲到宗教问题就关闭网页,还不是一样的

    • @Sulzbach-dk7ov
      @Sulzbach-dk7ov 2 วันที่ผ่านมา

      @@chahale8530 google it XDD