ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
一如既往的高質量 讚
上个版本出来之后就从openai换过来了,我没用api就是工作上写代码,问问题,我没感觉有什么问题,反正对我来说看不出来个chatgpt有啥区别,比Gemini 好用不少。
大飞介说简捷准确!谢谢!
我从他们网站api试了一下r1,它不支持function call. 等于它只能作为一个tool被agent使用,没法作为控制器。和openai的模型没法比. {'message': 'deepseek-reasoner does not support Function Calling', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_request_error'}}
Oops! DeepSeek is experiencing high traffic at the moment. Please check back in a little while.
严重怀疑这些benchmark test 的分数。我让R1 做一个简单的stock trading backtest 程序。一直出错。到现在干脆连线都连不上了。
用API会比官方网站靠谱很多 实测。 官网端口确实不太行,不知道具体的原因是什么
@@mikecheng6010 我看google ai studio 上用 Gemini 2.0 flash thinking experimental 挺不错
現在是不是全世界人都會AI只有我不會啊我感覺自己好像山頂洞人
只要你能跟别人交流,你就会了,只不过现在AI还比较傻
ML要實際寫程式碼、看論文,只是看影片了解可能比較有限。多數會ML的都是從業人士,一般人其實不會的,就想想其實沒多少人會寫程式就知道了。
並不會,基本上不是智識輸出行業別怕
別怕 很好玩的 只要一直去跟他說
山顶洞人也在山洞顶安装了大模型😂
只要控制住含印量,问题不大至于那几个自行测试的,其结果没有任何参考价值。这事还得交给专业的去做
Deepseek還不錯,可以作為我產品的openai替代方案,只可惜目前api的function call 有問題,還無法上線使用😢
非常赞同,我也发现function call 有問題
能用OpenRouter选择deepseek来替代吗?
Deepseek r1用下来就…………一言难尽,可以作为具体任务的,ai做题家。但是面对真正工作复杂问题,需要跨领域多学科专业知识推理的时候,直接扑街了,甚至不如claude3.5,比o1差一大截。泛用性还是老问题,而且R1价格并不便宜,所以总的来说,我还是会选择o1,个人用户,o1还是挺划算的
O1的知識豐富與完整度是非常恐怖的,你甚至一般日常使用比如法律 醫療都可以用得上,OpenAI的model這麼大又貴是有原因的,不是只為了衝分而已,但我必須說Open Source的推進與普及也可以讓OpenAI不擠牙膏
我自己搞了一些测试集,o1都能推理准确,deepseek完全不行。然后还发现deekseek经常出现推理过程和结果不一致的情况
@@stivenhxm RL on LLM的方向是沒錯的,但他們可能缺乏廣泛優良的dataset,非數學程式相關的dataset很難整理很花算力跟資源,再者記憶型的知識很難壓縮,model變太大也難以訓練,這還是回到資源匱乏的問題
沒有硬體資料去訓練大模型,不然open ai真的危險
拜託 性能先不說 價格怎麼可能更貴 這個是deepseek輾壓的優點
Thank you 大 飞 一口氣看到尾 看完再看 🏆 🏆 🏆 🏆 🏆☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🏆 🏆 🏆 🏆 🏆
隨手丟一個邏輯問題給 DeepSeek R1 70b,卻引發了 LLM psychosis。一頁又一頁的推理、論證,沒完沒了,最後半途終止,也沒有結論。
They let it cook.
scale ai 瑟瑟发抖
它现在还认为自己是chatgpt吗😂
是的
真不知道发展这么快是不是好事,还自我进化,听着太可怕了😂,感觉open AI发展遇到瓶颈了,慢一点更安心
@@xz1597 放心目前这个阶段的AI逻辑是统计学算概率,所以必然存在有一个极值,达到这个极值附近就会出现提供n次方算力但是准确率提升快速下降
如果讓deepseeck 分析資本主義和社會主義的優越性,它會得出科學結論嗎,會被共產黨接受嗎
@@jihualiu5721 你这种是听了什么敏感词就应激了
用来测试r1 通过,同期只有claude35通过,没有试过o1。答案是b题目衣架与衣钩一块衣板上有6个挂衣钩,从左至右分别编号为1~6号。现有红、黄、蓝绿、紫5种颜色的衣架,可分别挂在6个挂衣钩下。但无论如何挂,总会有一个挂衣钩空余。现在,衣架必须按照以下条件挂在衣钩上:1.绿衣架必须离蓝衣架远,离红衣架近。2.黄衣架必须挂在紧挨着蓝衣架旁边的衣钩上。3.紫衣架不能和蓝衣架挨着。4.红衣架不能挂在1号衣钩上。请找出下列不符合要求的一组衣架排列方式:A.绿衣架、红衣架、紫衣架、空衣钩、黄衣架、蓝衣架B.绿衣架、红衣架、空衣钩、黄衣架、蓝衣架、紫衣架C.绿衣架、紫衣架、红衣架、黄衣架、蓝衣架、空衣钩D.紫衣架、空衣钩、黄衣架、蓝衣架、红衣架、绿衣架
实测超过o1
怎么测的?
不覺得
大飞,你多测试一下,你会发现它给的答案不能说跟chatgpt一模一样吧,标点符号啥的都一样,呵呵
@hanhan-it5dp 建议先下载用一下
字节跳动的产品,敬谢不敏
你们殖人真心你妈的低智商,有时候感觉跟你们不是同一物种,这是杭州深度探索的ai,不是字节跳动
DeepSeek 不錯用,可用google登入,只要不問到"中國敏感詞"問題,他是個滿好用的AI ,我的了解任何中國的AI ,是有監管的,所以AI的公司會把對話適當的存放著。抱歉修正了, 不是政治,是"中國敏感詞"。
AI不是用来问政治的
@MarcBester为什么不可以?我想了解一下为啥不行?它们在害怕什么😂
@@freealpha8964你不能在llm政治观点和你一致的时候才同意😂
@@freealpha8964明明是你自己破防吧😂
这个模型确实不适合岛内某些🐸用,脑里只有政治,没有常识😂
大模型界的拼多多…聽起來不是什麼好形容
拼多多是一家极好的公司。网上的无脑黑大多是对这家公司不够了解的
@@ray911abc 垃圾
非常脑残又懒惰的一种描述
@ray911abc 真假?拼多多不是常常被抱怨把賣家獲利壓到最低嗎?怎麼會被你形容成極好的程度?
@@kusogod 有货物没渠道,卖不出去。供应商多一个选择不是很好吗?你不喜欢可以不用它,不要那么圣母婊。
测了一下,让这model打印hello world 150遍,直接crash了😂别来碰瓷o1了好吧
我这没问题啊,用时9秒,深度思考并且写出了对应的python程序
@@bestpartners 不是写程序,是真正打印
@@bestpartnerstry this onePrint "hello world" for 150 times with a white space in between, don't write code, don't omit anything
@@bestpartners精确计数对所有LLM都是极具挑战性的任务,因为模型很难在保持精确的状态来控制在恰当的地方停止。通俗来说,长程精确推理对所有LLM 都很难,在这方面chatgpt 断崖式领先
@@freealpha8964 我也發現針對重複的數字或者文字他會直接卡bug
山路十里,1989,蜂蜜,6亿人均收入不到1000,我输入这些,DeepSeek马上关闭网页,这东西太智能了
😂
蜂蜜为啥也是敏感词?
山路十里是什么意思
Copilot 一讲到宗教问题就关闭网页,还不是一样的
@@chahale8530 google it XDD
一如既往的高質量 讚
上个版本出来之后就从openai换过来了,我没用api就是工作上写代码,问问题,我没感觉有什么问题,反正对我来说看不出来个chatgpt有啥区别,比Gemini 好用不少。
大飞介说简捷准确!谢谢!
我从他们网站api试了一下r1,它不支持function call. 等于它只能作为一个tool被agent使用,没法作为控制器。和openai的模型没法比. {'message': 'deepseek-reasoner does not support Function Calling', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_request_error'}}
Oops! DeepSeek is experiencing high traffic at the moment. Please check back in a little while.
严重怀疑这些benchmark test 的分数。我让R1 做一个简单的stock trading backtest 程序。一直出错。到现在干脆连线都连不上了。
用API会比官方网站靠谱很多 实测。 官网端口确实不太行,不知道具体的原因是什么
@@mikecheng6010 我看google ai studio 上用 Gemini 2.0 flash thinking experimental 挺不错
現在是不是全世界人都會AI只有我不會啊
我感覺自己好像山頂洞人
只要你能跟别人交流,你就会了,只不过现在AI还比较傻
ML要實際寫程式碼、看論文,只是看影片了解可能比較有限。多數會ML的都是從業人士,一般人其實不會的,就想想其實沒多少人會寫程式就知道了。
並不會,基本上不是智識輸出行業別怕
別怕 很好玩的 只要一直去跟他說
山顶洞人也在山洞顶安装了大模型😂
只要控制住含印量,问题不大
至于那几个自行测试的,其结果没有任何参考价值。这事还得交给专业的去做
Deepseek還不錯,可以作為我產品的openai替代方案,只可惜目前api的function call 有問題,還無法上線使用😢
非常赞同,我也发现function call 有問題
能用OpenRouter选择deepseek来替代吗?
Deepseek r1用下来就…………一言难尽,可以作为具体任务的,ai做题家。但是面对真正工作复杂问题,需要跨领域多学科专业知识推理的时候,直接扑街了,甚至不如claude3.5,比o1差一大截。泛用性还是老问题,而且R1价格并不便宜,所以总的来说,我还是会选择o1,个人用户,o1还是挺划算的
O1的知識豐富與完整度是非常恐怖的,你甚至一般日常使用比如法律 醫療都可以用得上,OpenAI的model這麼大又貴是有原因的,不是只為了衝分而已,但我必須說Open Source的推進與普及也可以讓OpenAI不擠牙膏
我自己搞了一些测试集,o1都能推理准确,deepseek完全不行。然后还发现deekseek经常出现推理过程和结果不一致的情况
@@stivenhxm RL on LLM的方向是沒錯的,但他們可能缺乏廣泛優良的dataset,非數學程式相關的dataset很難整理很花算力跟資源,再者記憶型的知識很難壓縮,model變太大也難以訓練,這還是回到資源匱乏的問題
沒有硬體資料去訓練大模型,不然open ai真的危險
拜託 性能先不說 價格怎麼可能更貴 這個是deepseek輾壓的優點
Thank you 大 飞 一口氣看到尾 看完再看 🏆 🏆 🏆 🏆 🏆☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🏆 🏆 🏆 🏆 🏆
隨手丟一個邏輯問題給 DeepSeek R1 70b,卻引發了 LLM psychosis。一頁又一頁的推理、論證,沒完沒了,最後半途終止,也沒有結論。
They let it cook.
scale ai 瑟瑟发抖
它现在还认为自己是chatgpt吗😂
是的
真不知道发展这么快是不是好事,还自我进化,听着太可怕了😂,感觉open AI发展遇到瓶颈了,慢一点更安心
@@xz1597 放心目前这个阶段的AI逻辑是统计学算概率,所以必然存在有一个极值,达到这个极值附近就会出现提供n次方算力但是准确率提升快速下降
如果讓deepseeck 分析資本主義和社會主義的優越性,它會得出科學結論嗎,會被共產黨接受嗎
@@jihualiu5721 你这种是听了什么敏感词就应激了
用来测试r1 通过,同期只有claude35通过,没有试过o1。答案是b
题目
衣架与衣钩一块衣板上有6个挂衣钩,从左至右分别编号为1~6号。现有红、黄、蓝绿、紫5种颜色的衣架,可分别挂在6个挂衣钩下。但无论如何挂,总会有一个挂衣钩空余。现在,衣架必须按照以下条件挂在衣钩上:1.绿衣架必须离蓝衣架远,离红衣架近。2.黄衣架必须挂在紧挨着蓝衣架旁边的衣钩上。3.紫衣架不能和蓝衣架挨着。4.红衣架不能挂在1号衣钩上。请找出下列不符合要求的一组衣架排列方式:A.绿衣架、红衣架、紫衣架、空衣钩、黄衣架、蓝衣架B.绿衣架、红衣架、空衣钩、黄衣架、蓝衣架、紫衣架C.绿衣架、紫衣架、红衣架、黄衣架、蓝衣架、空衣钩D.紫衣架、空衣钩、黄衣架、蓝衣架、红衣架、绿衣架
实测超过o1
怎么测的?
不覺得
大飞,你多测试一下,你会发现它给的答案不能说跟chatgpt一模一样吧,标点符号啥的都一样,呵呵
@hanhan-it5dp 建议先下载用一下
字节跳动的产品,敬谢不敏
你们殖人真心你妈的低智商,有时候感觉跟你们不是同一物种,这是杭州深度探索的ai,不是字节跳动
DeepSeek 不錯用,可用google登入,只要不問到"中國敏感詞"問題,他是個滿好用的AI ,我的了解任何中國的AI ,是有監管的,所以AI的公司會把對話適當的存放著。抱歉修正了, 不是政治,是"中國敏感詞"。
AI不是用来问政治的
@MarcBester为什么不可以?我想了解一下为啥不行?它们在害怕什么😂
@@freealpha8964你不能在llm政治观点和你一致的时候才同意😂
@@freealpha8964明明是你自己破防吧😂
这个模型确实不适合岛内某些🐸用,脑里只有政治,没有常识😂
大模型界的拼多多…
聽起來不是什麼好形容
拼多多是一家极好的公司。网上的无脑黑大多是对这家公司不够了解的
@@ray911abc 垃圾
非常脑残又懒惰的一种描述
@ray911abc 真假?拼多多不是常常被抱怨把賣家獲利壓到最低嗎?
怎麼會被你形容成極好的程度?
@@kusogod 有货物没渠道,卖不出去。供应商多一个选择不是很好吗?你不喜欢可以不用它,不要那么圣母婊。
测了一下,让这model打印hello world 150遍,直接crash了😂
别来碰瓷o1了好吧
我这没问题啊,用时9秒,深度思考并且写出了对应的python程序
@@bestpartners 不是写程序,是真正打印
@@bestpartnerstry this one
Print "hello world" for 150 times with a white space in between, don't write code, don't omit anything
@@bestpartners精确计数对所有LLM都是极具挑战性的任务,因为模型很难在保持精确的状态来控制在恰当的地方停止。通俗来说,长程精确推理对所有LLM 都很难,在这方面chatgpt 断崖式领先
@@freealpha8964 我也發現針對重複的數字或者文字他會直接卡bug
山路十里,1989,蜂蜜,6亿人均收入不到1000,我输入这些,DeepSeek马上关闭网页,这东西太智能了
😂
蜂蜜为啥也是敏感词?
山路十里是什么意思
Copilot 一讲到宗教问题就关闭网页,还不是一样的
@@chahale8530 google it XDD