ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
掌握 AI 时代的必备技能,加入「AI 精英学院」 👉 axtonliu.ai ▶ 「AI 实战派」Prompt Engineering 提示工程超值早鸟价课程 👉 axtonliu.ai/ai ▶ 「AI 自动化」教程 ChatGPT + Make + Zapier + 高效Notion模版 👉 axtonliu.ai/autoai
o1 经过与 GPT-4o 的对比之后,感受是 Claude 真强
准确的说,大部分的人都用不到o1中擅长的数学、物理、生物。我测试了一些高中、大学的数学题(使用latex),o1直接吊打任何其它大模型,准确率吓到我了。测试代码,和Claude差不多,但相同提示词下,结果需要越多步骤的,o1强。
應該是說都只是語言模型,就能做到這種程度,都已經是相當嚇人的成就,從前AI發展了30年,相比之下從前似乎都白忙一場...
我拿奧林匹克的數學去問 5題答對4題 很多我連題目是什麼也不知道. AI 的發展太快了
可是克劳德,给钱都封
终于知道4.9大于4.11了。
我是一直听老师的课。有时一些难度理解不了,但是总能收到最前沿的信息。
在数字化时代,科技竞争已成为大国博弈的新战场,谁能率先掌握核心技术,谁就掌握了未来发展的主动权。
一周三十条. . 刚刚一下用了好多🤣
o1 其实不是给普通人用的,4o 足够了。给科学家的工具。【数学】是现在限制科技发展的一个很重要因素,这个人群的学习和筛选成本巨大,个小孩从出生到博士,研究研究才能出一点东西,这个时间要 20-30几年才可能学完。学习的过程也扼杀创造力,人的大脑也不是读了大量信息和文献就有创新。等等。现在有了 o1 的帮助,这些问题中的一部份就可以解决了。不再需要严格的筛选,漫长的学习,更多的人可以进来科学创造,这个才是整个的【科技大爆发】。
怎么学数学就扼杀创造力了?你有证据?
不给普通人用,为什么还要给免费用户使用的机会?
其实不是给普通人用的?你在OpenAI产品部工作?真的很好笑。
拔苗助长, 空中楼阁, 连基础都没有就想飞,连走都不会就想跑,另外 「【数学】是现在限制科技发展的一个很重要因素」 这是什么暴论?你确定限制科技发展的是【数学】???别说数学了,数学物理现在是理论走的很远,实验完全跟不上,设备,材料,能源,等等才是限制科技发展的当前障碍
重要的不是数学,是理解并能运用数学形式的工具语言是投入群体性智力工作的必要能力。
简单的问题区别不大,问一些强逻辑推理的问题和比较难的计算题,Claude全翻车,o1全对。
太可惡了,我的等級才在level 4還不能使用這個模型
记得之前一个Aidan Gomes的采访里提到过,目前的ai缺乏的是逻辑推理过程,因为从网络获取的信息是结果,ai是通过对结果概率的推算进行反馈的,现在这个版本就是ai在自己整理记录自己的推理过程,实际是ai在一步一步自我学习逻辑学习推理的进程。啊,人类越来越无用了,matrix on load
Claude 的新opus还没出来呢
请问一下这个视频里的网页高亮用的是什么插件
一做新题目就露馅😂旧题目早就喂一大堆参考答案了😂
😄 能分享下新题目吗? 我也试试?
編碼能力Claude應該是最強的
no
能不能让perplexity生成一下你那个代码,看看怎么样
perplexity后端模型也是GPT、Claude, 应该不会有太大差别
想請問影片中使用的瀏覽器是哪一家的 ? 左側的 TABS 上方還有 ICONS 感覺滿好用的
是 Arc
您好,请问一下,你这个划词翻译是什么插件
bob
@@axtonliu 没有搜到这个呢?
@@axtonliu PC有没有类似的翻译软件呢?
@@jackunfilteredmoments bob加翻译就能搜出来
@@jackunfilteredmoments Mac的
这个现在手机端可以使用吗,我手机上面没找到
可以
感觉就是加了一层agent
你好,请问gpt会员的高级语音全面开放了吗?我之前没有所以退订了,打算等全面开放的时候订阅回来。目前的o1还是能用api测试一下的
有没有全面开放这我还真没法知道,您不如直接问问OpenAI客服
還沒全部開放
@@HipsterScent 感谢😀,看来得等秋天结束彻底开放才好续订
@@zyz9878 放心,開放您會知道的,很多人都在關注,可以節省您的關注時間
现在开放了
想了解 08:07時使用的翻譯軟體是什麼
bob , Mac
为什么拿来分析股票,彩票。一点都不准
這些東西是隨時變動跟機率的 跟硬理論又不一樣 😅
o1要钱才能用
翻译没什么可谈的。 比如说中文: 我吃饭了,饭我吃了,我吃了饭,我饭吃了。 怎么翻译,都不影响阅读理解其含义。
AI 大學畢業了,他現在是博士了!!
还有博士后
ai读博士都读的比人快😂😂😂
试过了,好像比较强
测试评论
不认可最后的结论。文明的特征就是盖茨和你喝的可乐是一样的。
人家这就是在贩卖焦虑而已😅
既然已经是博士生水平了,是不是意味着要涨价了
感觉以后真的大部分人都要失业了,不知道该何去何从。
使用Ai
😂又不能逃避,当然要利用。
每人大機率是專屬垂直領域的頭部。
過去有個說法,叫做雜家。但首先,他的前提是,有那麼一些科目,您如果把多個科目攪在一塊兒,那叫雜家。但現在的情況是,每個人都是一個「科目」…並非將人進行物化或異化:因為在傳統的感覺中,科目是個大詞,專家是個小詞。當然可能有異化嫌疑,但這裡並不是把一個高中生說成一個博士後,因為如果每個人都是那種存在的話,博士後亦如K12的感覺就出來了。那就看您只是做題家,還是真的喜歡把玩甚麼東西了。說那只是一個感覺,是因為如果大模型若咻的一下沒了,那您也就可以回到本來的狀態了,不過如此,也挺好,就當是報夢的那種有趣的夢。您得慶倖大模型沒有在夢中把您給吞吃了,醒過來還是得提防著大模型的,不然後果就難說了。
不可能的
堆砌如山的知识也永远不会有思考能力
说实话,感觉OpenAI有点儿黔驴技穷了,用强化学习加强推理不是一个什么不得了的新东西,其实大家都在这样做,只是OpenAI先把产品拿出来了,而且目前效果来讲其实不怎么样。费这么大劲去数strawberry有几个r...
关键是, Claude能数对😅
@@axtonliu claude 3.5 sonnet数不对strawberry有几个r,o1-preview和o1-mini能数对。奇怪的是o1-mini竟然思考的时间比o1-preview长。
Claude 更数不对 现在出错更多
@@selfhosted-lover 哈哈,看来是发挥不稳定,我试过Claude他答对了
不是老弟,你有没有用它测过数学题啊😂
你可别吹牛了,还博士生水平了。一道初中数学题,都算不出来。题目如下:“三角形abc,从bc上取一点d,从d到a画一条直线.已知角dab60度,角abc40度,ab=cd,求角c度数“。GPT的答案都是胡蒙乱造,你提示一下它某处的推理错误,它会认错,然后又会给你编造一个不同的答案,就在认错跟编造错误答案中循环。
不要问几何,不要问几何,不要问几何
@@happyculater2923沒事,就讓這些不會問的人下去
我api试下来,Sonnet 3.5从来没比4o强过!!!
我测试也是API调用 没有claude官网效果好
寫代碼明顯要比4o強,4o寫代碼還沒4強呢
8.11和8.8哪个大都分不清
ChatGPT o1-preview您说:8.11和8.8哪个大ChatGPT思考 4 秒8.11 比 8.8 大。
加上思考过程,疯掉了要:ChatGPT o1-preview您说:8.11和8.8哪个大ChatGPT思考 4 秒比较数值大小稍微看看,8.11 和 8.8 的比较。8.11 等于 8 加 0.11,8.8 等于 8 加 0.8。显然 0.8 大于 0.11,所以 8.8 大于 8.11。8.11 比 8.8 大。
答对了,但是思考时莫名其妙的用了韩语
应用版本来说8.11大于8.8,你问小数8.11与8.8哪个大,就不会犯错了
o1 超过 claude3.5 sonnetopenai 重回地球第一
一直是第一呀
有點爛啊
openai正在训练的全新大模型都还没出来呢,大招还在后面
掌握 AI 时代的必备技能,加入「AI 精英学院」 👉 axtonliu.ai
▶ 「AI 实战派」Prompt Engineering 提示工程超值早鸟价课程 👉 axtonliu.ai/ai
▶ 「AI 自动化」教程 ChatGPT + Make + Zapier + 高效Notion模版 👉 axtonliu.ai/autoai
o1 经过与 GPT-4o 的对比之后,感受是 Claude 真强
准确的说,大部分的人都用不到o1中擅长的数学、物理、生物。
我测试了一些高中、大学的数学题(使用latex),o1直接吊打任何其它大模型,准确率吓到我了。
测试代码,和Claude差不多,但相同提示词下,结果需要越多步骤的,o1强。
應該是說都只是語言模型,就能做到這種程度,都已經是相當嚇人的成就,從前AI發展了30年,相比之下從前似乎都白忙一場...
應該是說都只是語言模型,就能做到這種程度,都已經是相當嚇人的成就,從前AI發展了30年,相比之下從前似乎都白忙一場...
我拿奧林匹克的數學去問 5題答對4題 很多我連題目是什麼也不知道. AI 的發展太快了
可是克劳德,给钱都封
终于知道4.9大于4.11了。
我是一直听老师的课。有时一些难度理解不了,但是总能收到最前沿的信息。
在数字化时代,科技竞争已成为大国博弈的新战场,谁能率先掌握核心技术,谁就掌握了未来发展的主动权。
一周三十条. . 刚刚一下用了好多🤣
o1 其实不是给普通人用的,4o 足够了。给科学家的工具。【数学】是现在限制科技发展的一个很重要因素,这个人群的学习和筛选成本巨大,个小孩从出生到博士,研究研究才能出一点东西,这个时间要 20-30几年才可能学完。学习的过程也扼杀创造力,人的大脑也不是读了大量信息和文献就有创新。等等。现在有了 o1 的帮助,这些问题中的一部份就可以解决了。不再需要严格的筛选,漫长的学习,更多的人可以进来科学创造,这个才是整个的【科技大爆发】。
怎么学数学就扼杀创造力了?你有证据?
不给普通人用,为什么还要给免费用户使用的机会?
其实不是给普通人用的?你在OpenAI产品部工作?真的很好笑。
拔苗助长, 空中楼阁, 连基础都没有就想飞,连走都不会就想跑,
另外 「【数学】是现在限制科技发展的一个很重要因素」 这是什么暴论?
你确定限制科技发展的是【数学】???
别说数学了,数学物理现在是理论走的很远,实验完全跟不上,设备,材料,能源,等等才是限制科技发展的当前障碍
重要的不是数学,是理解并能运用数学形式的工具语言是投入群体性智力工作的必要能力。
简单的问题区别不大,问一些强逻辑推理的问题和比较难的计算题,Claude全翻车,o1全对。
太可惡了,我的等級才在level 4還不能使用這個模型
记得之前一个Aidan Gomes的采访里提到过,目前的ai缺乏的是逻辑推理过程,因为从网络获取的信息是结果,ai是通过对结果概率的推算进行反馈的,现在这个版本就是ai在自己整理记录自己的推理过程,实际是ai在一步一步自我学习逻辑学习推理的进程。啊,人类越来越无用了,matrix on load
Claude 的新opus还没出来呢
请问一下这个视频里的网页高亮用的是什么插件
一做新题目就露馅😂旧题目早就喂一大堆参考答案了😂
😄 能分享下新题目吗? 我也试试?
編碼能力Claude應該是最強的
no
能不能让perplexity生成一下你那个代码,看看怎么样
perplexity后端模型也是GPT、Claude, 应该不会有太大差别
想請問影片中使用的瀏覽器是哪一家的 ? 左側的 TABS 上方還有 ICONS 感覺滿好用的
是 Arc
您好,请问一下,你这个划词翻译是什么插件
bob
@@axtonliu 没有搜到这个呢?
@@axtonliu PC有没有类似的翻译软件呢?
@@jackunfilteredmoments bob加翻译就能搜出来
@@jackunfilteredmoments Mac的
这个现在手机端可以使用吗,我手机上面没找到
可以
感觉就是加了一层agent
你好,请问gpt会员的高级语音全面开放了吗?我之前没有所以退订了,打算等全面开放的时候订阅回来。目前的o1还是能用api测试一下的
有没有全面开放这我还真没法知道,您不如直接问问OpenAI客服
還沒全部開放
@@HipsterScent 感谢😀,看来得等秋天结束彻底开放才好续订
@@zyz9878 放心,開放您會知道的,很多人都在關注,可以節省您的關注時間
现在开放了
想了解 08:07時使用的翻譯軟體是什麼
bob , Mac
为什么拿来分析股票,彩票。一点都不准
這些東西是隨時變動跟機率的 跟硬理論又不一樣 😅
o1要钱才能用
翻译没什么可谈的。 比如说中文: 我吃饭了,饭我吃了,我吃了饭,我饭吃了。 怎么翻译,都不影响阅读理解其含义。
AI 大學畢業了,他現在是博士了!!
还有博士后
ai读博士都读的比人快😂😂😂
试过了,好像比较强
测试评论
不认可最后的结论。文明的特征就是盖茨和你喝的可乐是一样的。
人家这就是在贩卖焦虑而已😅
既然已经是博士生水平了,是不是意味着要涨价了
感觉以后真的大部分人都要失业了,不知道该何去何从。
使用Ai
😂又不能逃避,当然要利用。
每人大機率是專屬垂直領域的頭部。
過去有個說法,叫做雜家。但首先,他的前提是,有那麼一些科目,您如果把多個科目攪在一塊兒,那叫雜家。但現在的情況是,每個人都是一個「科目」…並非將人進行物化或異化:因為在傳統的感覺中,科目是個大詞,專家是個小詞。當然可能有異化嫌疑,但這裡並不是把一個高中生說成一個博士後,因為如果每個人都是那種存在的話,博士後亦如K12的感覺就出來了。那就看您只是做題家,還是真的喜歡把玩甚麼東西了。說那只是一個感覺,是因為如果大模型若咻的一下沒了,那您也就可以回到本來的狀態了,不過如此,也挺好,就當是報夢的那種有趣的夢。您得慶倖大模型沒有在夢中把您給吞吃了,醒過來還是得提防著大模型的,不然後果就難說了。
不可能的
堆砌如山的知识也永远不会有思考能力
说实话,感觉OpenAI有点儿黔驴技穷了,用强化学习加强推理不是一个什么不得了的新东西,其实大家都在这样做,只是OpenAI先把产品拿出来了,而且目前效果来讲其实不怎么样。费这么大劲去数strawberry有几个r...
关键是, Claude能数对😅
@@axtonliu claude 3.5 sonnet数不对strawberry有几个r,o1-preview和o1-mini能数对。奇怪的是o1-mini竟然思考的时间比o1-preview长。
Claude 更数不对 现在出错更多
@@selfhosted-lover 哈哈,看来是发挥不稳定,我试过Claude他答对了
不是老弟,你有没有用它测过数学题啊😂
你可别吹牛了,还博士生水平了。一道初中数学题,都算不出来。题目如下:“三角形abc,从bc上取一点d,从d到a画一条直线.已知角dab60度,角abc40度,ab=cd,求角c度数“。GPT的答案都是胡蒙乱造,你提示一下它某处的推理错误,它会认错,然后又会给你编造一个不同的答案,就在认错跟编造错误答案中循环。
不要问几何,不要问几何,不要问几何
@@happyculater2923沒事,就讓這些不會問的人下去
我api试下来,Sonnet 3.5从来没比4o强过!!!
我测试也是API调用 没有claude官网效果好
寫代碼明顯要比4o強,4o寫代碼還沒4強呢
8.11和8.8哪个大都分不清
ChatGPT o1-preview
您说:
8.11和8.8哪个大
ChatGPT
思考 4 秒
8.11 比 8.8 大。
加上思考过程,疯掉了要:ChatGPT o1-preview
您说:
8.11和8.8哪个大
ChatGPT
思考 4 秒
比较数值大小
稍微看看,8.11 和 8.8 的比较。8.11 等于 8 加 0.11,8.8 等于 8 加 0.8。显然 0.8 大于 0.11,所以 8.8 大于 8.11。
8.11 比 8.8 大。
答对了,但是思考时莫名其妙的用了韩语
应用版本来说8.11大于8.8,你问小数8.11与8.8哪个大,就不会犯错了
o1 超过 claude3.5 sonnet
openai 重回地球第一
一直是第一呀
有點爛啊
openai正在训练的全新大模型都还没出来呢,大招还在后面