【人工智能】DeepSeek开源推理模型R1 | R1-Zero | 蒸馏小模型 | 绕过监督微调直接强化学习 | 媲美o1 | 顿悟时刻 | GRPO | 奖励设计 | 冷启动 | 再现价格屠夫

Best Partners TV

มุมมอง 17 750

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 23 ม.ค. 2025

ความคิดเห็น • 118

@Leopoldo-hk วันที่ผ่านมา ⁺²
一如既往的高質量讚
@minggai8582 4 ชั่วโมงที่ผ่านมา ⁺¹
上个版本出来之后就从openai换过来了，我没用api就是工作上写代码，问问题，我没感觉有什么问题，反正对我来说看不出来个chatgpt有啥区别，比Gemini 好用不少。
@taijistar9052 วันที่ผ่านมา ⁺³
大飞介说简捷准确！谢谢！
@martindu9083 วันที่ผ่านมา
我从他们网站api试了一下r1，它不支持function call. 等于它只能作为一个tool被agent使用，没法作为控制器。和openai的模型没法比. {'message': 'deepseek-reasoner does not support Function Calling', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_request_error'}}
@mightylakers 6 ชั่วโมงที่ผ่านมา ⁺¹
Oops! DeepSeek is experiencing high traffic at the moment. Please check back in a little while.
@mightylakers 6 ชั่วโมงที่ผ่านมา ⁺¹
严重怀疑这些benchmark test 的分数。我让R1 做一个简单的stock trading backtest 程序。一直出错。到现在干脆连线都连不上了。
@mikecheng6010 4 ชั่วโมงที่ผ่านมา ⁺¹
用API会比官方网站靠谱很多实测。官网端口确实不太行，不知道具体的原因是什么
@mightylakers 3 ชั่วโมงที่ผ่านมา ⁺¹
@@mikecheng6010 我看google ai studio 上用 Gemini 2.0 flash thinking experimental 挺不错
@tat4340 2 วันที่ผ่านมา ⁺¹²
現在是不是全世界人都會AI只有我不會啊
我感覺自己好像山頂洞人
@chahale8530 2 วันที่ผ่านมา ⁺¹
只要你能跟别人交流，你就会了，只不过现在AI还比较傻
@周柏宇-g4e วันที่ผ่านมา ⁺¹
ML要實際寫程式碼、看論文，只是看影片了解可能比較有限。多數會ML的都是從業人士，一般人其實不會的，就想想其實沒多少人會寫程式就知道了。
@nwohocan วันที่ผ่านมา ⁺¹
並不會，基本上不是智識輸出行業別怕
@afonsode419 วันที่ผ่านมา ⁺¹
別怕很好玩的只要一直去跟他說
@chunliangde วันที่ผ่านมา
山顶洞人也在山洞顶安装了大模型😂
@weiwei861 4 ชั่วโมงที่ผ่านมา
只要控制住含印量，问题不大
至于那几个自行测试的，其结果没有任何参考价值。这事还得交给专业的去做
@austinsu5838 2 วันที่ผ่านมา ⁺⁷
Deepseek還不錯，可以作為我產品的openai替代方案，只可惜目前api的function call 有問題，還無法上線使用😢
@zhbo2430 2 วันที่ผ่านมา ⁺¹
非常赞同，我也发现function call 有問題
@senpow วันที่ผ่านมา
能用OpenRouter选择deepseek来替代吗？
@paulzhu7694 2 วันที่ผ่านมา ⁺⁴⁴
Deepseek r1用下来就…………一言难尽，可以作为具体任务的，ai做题家。但是面对真正工作复杂问题，需要跨领域多学科专业知识推理的时候，直接扑街了，甚至不如claude3.5，比o1差一大截。泛用性还是老问题，而且R1价格并不便宜，所以总的来说，我还是会选择o1，个人用户，o1还是挺划算的
@zxwxz 2 วันที่ผ่านมา ⁺¹⁵
O1的知識豐富與完整度是非常恐怖的,你甚至一般日常使用比如法律醫療都可以用得上,OpenAI的model這麼大又貴是有原因的,不是只為了衝分而已,但我必須說Open Source的推進與普及也可以讓OpenAI不擠牙膏
@stivenhxm 2 วันที่ผ่านมา ⁺⁸
我自己搞了一些测试集，o1都能推理准确，deepseek完全不行。然后还发现deekseek经常出现推理过程和结果不一致的情况
@zxwxz 2 วันที่ผ่านมา ⁺⁵
@@stivenhxm RL on LLM的方向是沒錯的，但他們可能缺乏廣泛優良的dataset,非數學程式相關的dataset很難整理很花算力跟資源，再者記憶型的知識很難壓縮，model變太大也難以訓練，這還是回到資源匱乏的問題
@nwohocan วันที่ผ่านมา
沒有硬體資料去訓練大模型，不然open ai真的危險
@zsh5376 วันที่ผ่านมา ⁺³
拜託性能先不說價格怎麼可能更貴這個是deepseek輾壓的優點
@hiucollo2402 วันที่ผ่านมา ⁺¹
Thank you 大飞一口氣看到尾看完再看 🏆 🏆 🏆 🏆 🏆☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🏆 🏆 🏆 🏆 🏆
@hojonglin1261 5 ชั่วโมงที่ผ่านมา
隨手丟一個邏輯問題給 DeepSeek R1 70b，卻引發了 LLM psychosis。一頁又一頁的推理、論證，沒完沒了，最後半途終止，也沒有結論。
@SimonNgai-d3u 2 วันที่ผ่านมา ⁺¹
They let it cook.
@chencao-y5k วันที่ผ่านมา
scale ai 瑟瑟发抖
@freealpha8964 วันที่ผ่านมา ⁺³
它现在还认为自己是chatgpt吗😂
@yinyiwang วันที่ผ่านมา ⁺¹
是的
@xz1597 2 วันที่ผ่านมา ⁺¹
真不知道发展这么快是不是好事，还自我进化，听着太可怕了😂,感觉open AI发展遇到瓶颈了，慢一点更安心
@christopherqwan8471 18 ชั่วโมงที่ผ่านมา
@@xz1597 放心目前这个阶段的AI逻辑是统计学算概率，所以必然存在有一个极值，达到这个极值附近就会出现提供n次方算力但是准确率提升快速下降
@jihualiu5721 9 ชั่วโมงที่ผ่านมา
如果讓deepseeck 分析資本主義和社會主義的優越性，它會得出科學結論嗎，會被共產黨接受嗎
@Alex-shi-i3z 9 ชั่วโมงที่ผ่านมา
@@jihualiu5721 你这种是听了什么敏感词就应激了
@hipqi119 วันที่ผ่านมา
用来测试r1 通过，同期只有claude35通过，没有试过o1。答案是b
题目
衣架与衣钩一块衣板上有6个挂衣钩，从左至右分别编号为1~6号。现有红、黄、蓝绿、紫5种颜色的衣架，可分别挂在6个挂衣钩下。但无论如何挂，总会有一个挂衣钩空余。现在，衣架必须按照以下条件挂在衣钩上：1.绿衣架必须离蓝衣架远，离红衣架近。2.黄衣架必须挂在紧挨着蓝衣架旁边的衣钩上。3.紫衣架不能和蓝衣架挨着。4.红衣架不能挂在1号衣钩上。请找出下列不符合要求的一组衣架排列方式：A.绿衣架、红衣架、紫衣架、空衣钩、黄衣架、蓝衣架B.绿衣架、红衣架、空衣钩、黄衣架、蓝衣架、紫衣架C.绿衣架、紫衣架、红衣架、黄衣架、蓝衣架、空衣钩D.紫衣架、空衣钩、黄衣架、蓝衣架、红衣架、绿衣架
@jackshi7613 วันที่ผ่านมา
实测超过o1
@YG8877 วันที่ผ่านมา ⁺²
怎么测的？
@蘇維明 21 ชั่วโมงที่ผ่านมา ⁺¹
不覺得
@hanhan-it5dp วันที่ผ่านมา
大飞，你多测试一下，你会发现它给的答案不能说跟chatgpt一模一样吧，标点符号啥的都一样，呵呵
@xingzou1540 8 ชั่วโมงที่ผ่านมา ⁺²
@hanhan-it5dp 建议先下载用一下
@randomrandom63663 10 ชั่วโมงที่ผ่านมา
字节跳动的产品，敬谢不敏
@jianxu573 21 นาทีที่ผ่านมา
你们殖人真心你妈的低智商，有时候感觉跟你们不是同一物种，这是杭州深度探索的ai，不是字节跳动
@StevenHHH วันที่ผ่านมา ⁺³
DeepSeek 不錯用，可用google登入，只要不問到"中國敏感詞"問題，他是個滿好用的AI ，我的了解任何中國的AI ，是有監管的，所以AI的公司會把對話適當的存放著。抱歉修正了，不是政治，是"中國敏感詞"。
@MarcBester วันที่ผ่านมา ⁺⁵
AI不是用来问政治的
@freealpha8964 วันที่ผ่านมา ⁺⁴
@MarcBester为什么不可以？我想了解一下为啥不行？它们在害怕什么😂
@leftyliarbreaker6860 วันที่ผ่านมา ⁺⁶
@@freealpha8964你不能在llm政治观点和你一致的时候才同意😂
@leftyliarbreaker6860 วันที่ผ่านมา
@@freealpha8964明明是你自己破防吧😂
@chunliangde วันที่ผ่านมา
这个模型确实不适合岛内某些🐸用，脑里只有政治，没有常识😂
@kusogod วันที่ผ่านมา ⁺³
大模型界的拼多多…
聽起來不是什麼好形容
@ray911abc วันที่ผ่านมา ⁺³
拼多多是一家极好的公司。网上的无脑黑大多是对这家公司不够了解的
@ayao95 วันที่ผ่านมา
@@ray911abc 垃圾
@fool9111z วันที่ผ่านมา
非常脑残又懒惰的一种描述
@kusogod วันที่ผ่านมา ⁺¹
@ray911abc 真假？拼多多不是常常被抱怨把賣家獲利壓到最低嗎？
怎麼會被你形容成極好的程度？
@qiupingliLiwaing วันที่ผ่านมา ⁺¹
@@kusogod 有货物没渠道，卖不出去。供应商多一个选择不是很好吗？你不喜欢可以不用它，不要那么圣母婊。
@freealpha8964 วันที่ผ่านมา ⁺⁶
测了一下，让这model打印hello world 150遍，直接crash了😂
别来碰瓷o1了好吧
@bestpartners วันที่ผ่านมา ⁺²
我这没问题啊，用时9秒，深度思考并且写出了对应的python程序
@freealpha8964 วันที่ผ่านมา ⁺³
@@bestpartners 不是写程序，是真正打印
@freealpha8964 วันที่ผ่านมา
@@bestpartnerstry this one
Print "hello world" for 150 times with a white space in between, don't write code, don't omit anything
@freealpha8964 วันที่ผ่านมา
@@bestpartners精确计数对所有LLM都是极具挑战性的任务，因为模型很难在保持精确的状态来控制在恰当的地方停止。通俗来说，长程精确推理对所有LLM 都很难，在这方面chatgpt 断崖式领先
@職業馬桶鑑定師 วันที่ผ่านมา
@@freealpha8964 我也發現針對重複的數字或者文字他會直接卡bug
@proud_chinese_traitor 2 วันที่ผ่านมา ⁺²⁵
山路十里，1989，蜂蜜，6亿人均收入不到1000，我输入这些，DeepSeek马上关闭网页，这东西太智能了
@ching5614 2 วันที่ผ่านมา ⁺⁴
😂
@100starship2 2 วันที่ผ่านมา ⁺¹
蜂蜜为啥也是敏感词？
@chahale8530 2 วันที่ผ่านมา
山路十里是什么意思
@chongyayayayayayayayaya 2 วันที่ผ่านมา ⁺⁴
Copilot 一讲到宗教问题就关闭网页，还不是一样的
@Sulzbach-dk7ov 2 วันที่ผ่านมา
@@chahale8530 google it XDD

ต่อไป

เล่นอัตโนมัติ