EP-134 王维嘉:DeepSeek对中美AI竞争意味着什么? | Open AI | 大模型 | 人工智能 | chatGPT | 深度求索 | 英伟达 | 芯片 | 举国体制 | 贸易战
ฝัง
- เผยแพร่เมื่อ 7 ก.พ. 2025
- 春节期间,DeepSeek成为全球关注的焦点。有人认为它改变了中国的国运,而争议也在随后出现,DeepSeek被指违规获取了英伟达芯片,通过“蒸馏”的方法使用Open AI数据,美国、意大利、荷兰等多个国家先后对DeepSeek做出了下架、禁用、调查等限制。
DeepSeek带来的是颠覆性的技术创新,还是抄了Open AI的作业?它的出现是否证明了美国对中国技术封锁的失败?DeepSeek代表的是中国模式的优越性,还是说只是一个特例?中美两国的AI技术差距更近了吗?
本期不明白播客请来王维嘉先生,他在硅谷有30多年的创业和投资经历,长期关注科技领域的创新项目,曾出版过一本专门讨论人工智能的著作《暗知识:机器认知如何颠覆商业和社会》。
最后,祝听众朋友们春节快乐,感谢大家一路同行!
文字版:bit.ly/bmb-134...
时间轴:
03:07 DeepSeek是在“蒸馏”Open AI的大模型吗?
06:56 低成本训练路线能帮助中国AI追上美国吗?
08:24 为什么说DeepSeek的成功是开源的胜利?
15:59 英伟达的股价暴跌是否说明AI算力的需求是泡沫?
21:28 美国的芯片出口管制政策失效了吗?
23:09 DeepSeek是中国模式的成功还是特例?
26:23 中国学生到美国留学还有意义吗?
31:41 假如人被AI取代,我们可以做什么?
36:23 嘉宾推荐
嘉宾推荐:
《消失的真实》金观涛
book.douban.co...
《真实与虚拟》金观涛
book.douban.co...
《The Sovereign Individual》( 《主权个人》)James Dale Davidson / William Rees-Mogg
book.douban.co...
为了让不明白播客更加持久地做下去,我们再次呼吁听众朋友们加入捐赠的队伍,请点击我们的捐赠页面( bit.ly/bmb-donate ),或直接加入不明白播客的TH-cam会员(th-cam.com/channels/Af2O_wWu1YCS9YLUqnyqDA.htmljoin iPhone用户可能不会显示“加入”按钮,请使用TH-cam网页版),每个月5美元,可以优先参与我们的线上线下活动,非常感谢大家的支持!这是一个漫长的事业,希望我们一路同行,活得更久,活得更健康。
这才哪到哪?未来来自中国的创新会大爆发的,科教兴国30周年,一世之功,成果逐年显现而已
@@bumingbai捐款能否简单一点?太复杂了。
开源、节能、高效的算法而不是堆叠硬件是Ai的最优发展方向--正常工程师都是非常清楚的,更何况那些硅谷的技术大神们,这也是美国Ai先驱们的最初理念。但是在傲慢的美国资本绑架了ai产业后,理想主义的硅谷工程师们失去了对ai发展路线的掌控,他们不得不向资本低头,于是open ai 变成了close ai。美国资本妄图把ai发展路线锁死在高投入高耗能这条路上,用超高的投入门槛和先发技术优势壁垒挡住所有后来者,建立一个类似《黑客帝国》中的超级Ai,然后靠垄断算力,继续收割全世界。从黄金美元、石油美元,变成算力美元。
注意美国在Ai这件事上要封锁的不单单是中国,美国商务部长最近刚刚推出了一项新的AI扩散框架,除了18个核心盟国可以自由买卖Ai芯片,美国政府将决定其他国家可以购买多少芯片,即便是以色列、瑞士、墨西哥这些传统盟友也无法随心所欲地购买AI芯片。deep seek的开源,如同给全世界的每个Ai工程师都发了一把挖墙的铲子,这让美国耗资数千亿美元搭建的Ai壁垒摇摇欲坠!封禁deep seek继续堆叠硬件,强迫全世界继续使用close ai的昂贵算力?还是拆掉之前的数千亿美元构建的护城河,重新开源?美国资本现在有点儿左右为难。有人觉得deep seek是大卫投向哥利亚的石标会一击致命,有人说让子弹再飞一会儿。
至于deep seek是否抄袭了,蒸馏违法了还是违反道德了,这些重要吗……这种国运级的竞争,谁还在考虑道德、法律、协议,太天真了!CIA窃听默克尔手机的时候考虑过会侵犯人家隐私吗?摩萨德在bp机里装炸药的时候讨论过会伤及无辜吗?这种时候只有道德婊和吃瓜的媒体、群众才会考虑这些问题。现在全世界的ai工程师们都在夜以继日的研究ds的论文、代码,忙着在自己的服务器上部署复现ds的大模型!美国的投资家们的焦虑根本不是蒸馏不蒸馏,抄袭不抄袭,他们根本不care这些,他们关心的是这样一个价值万亿美元级别的技术,如果这么容易被复制的话,即便那是抄袭,那这个投资是不是愚蠢的?他们现在要重新评估当美国不能垄断ai技术和算力的时候,这东西还残存多少价值。
有朋友跟我争,说算力就应该掌握在那群文明人手里。我不想跟你争文明的定义,那是意识形态的问题,每个人的屁股决定了他对文明世界的定义。我只想说如果每个人的手机里都装着一个AGI的世界,一定比那个只有一帮文明人掌握着唯一一个超级AGI的世界更加公平!因为那时候你可以让你的AGI帮你分析一下,他们高举的那本我们大部分人都看不懂的《通往奴役之路》是否就是通向文明世界的唯一红宝书!
开源、节能、高效的算法而不是堆叠硬件是Ai的最优发展方向--正常工程师都是非常清楚的,更何况那些硅谷的技术大神们,这也是美国Ai先驱们的最初理念。但是在傲慢的美国资本绑架了ai产业后,理想主义的硅谷工程师们失去了对ai发展路线的掌控,他们不得不向资本低头,于是open ai 变成了close ai。美国资本妄图把ai发展路线锁死在高投入高耗能这条路上,用超高的投入门槛和先发技术优势壁垒挡住所有后来者,建立一个类似《黑客帝国》中的超级Ai,然后靠垄断算力,继续收割全世界。从黄金美元、石油美元,变成算力美元。
注意美国在Ai这件事上要封锁的不单单是中国,美国商务部长最近刚刚推出了一项新的AI扩散框架,除了18个核心盟国可以自由买卖Ai芯片,美国政府将决定其他国家可以购买多少芯片,即便是以色列、瑞士、墨西哥这些传统盟友也无法随心所欲地购买AI芯片。deep seek的开源,如同给全世界的每个Ai工程师都发了一把挖墙的铲子,这让美国耗资数千亿美元搭建的Ai壁垒摇摇欲坠!封禁deep seek继续堆叠硬件,强迫全世界继续使用close ai的昂贵算力?还是拆掉之前的数千亿美元构建的护城河,重新开源?美国资本现在有点儿左右为难。有人觉得deep seek是大卫投向哥利亚的石标会一击致命,有人说让子弹再飞一会儿。
至于deep seek是否抄袭了,蒸馏违法了还是违反道德了,这些重要吗……这种国运级的竞争,谁还在考虑道德、法律、协议,太天真了!CIA窃听默克尔手机的时候考虑过会侵犯人家隐私吗?摩萨德在bp机里装炸药的时候讨论过会伤及无辜吗?这种时候只有道德婊和吃瓜的媒体、群众才会考虑这些问题。现在全世界的ai工程师们都在夜以继日的研究ds的论文、代码,忙着在自己的服务器上部署复现ds的大模型!美国的投资家们的焦虑根本不是蒸馏不蒸馏,抄袭不抄袭,他们根本不care这些,他们关心的是这样一个价值万亿美元级别的技术,如果这么容易被复制的话,即便那是抄袭,那这个投资是不是愚蠢的?他们现在要重新评估当美国不能垄断ai技术和算力的时候,这东西还残存多少价值。
有朋友跟我争,说算力就应该掌握在那群文明人手里。我不想跟你争文明的定义,那是意识形态的问题,每个人的屁股决定了他对文明世界的定义。我只想说如果每个人的手机里都装着一个AGI的世界,一定比那个只有一帮文明人掌握着唯一一个超级AGI的世界更加公平!因为那时候你可以让你的AGI帮你分析一下,他们高举的那本我们大部分人都看不懂的《通往奴役之路》是否就是通向文明世界的唯一红宝书!
开源、节能、高效的算法而不是堆叠硬件是Ai的最优发展方向--正常工程师都是非常清楚的,更何况那些硅谷的技术大神们,这也是美国Ai先驱们的最初理念。但是在傲慢的美国资本绑架了ai产业后,理想主义的硅谷工程师们失去了对ai发展路线的掌控,他们不得不向资本低头,于是open ai 变成了close ai。美国资本妄图把ai发展路线锁死在高投入高耗能这条路上,用超高的投入门槛和先发技术优势壁垒挡住所有后来者,建立一个类似《黑客帝国》中的超级Ai,然后靠垄断算力,继续收割全世界。从黄金美元、石油美元,变成算力美元。
注意美国在Ai这件事上要封锁的不单单是中国,美国商务部长最近刚刚推出了一项新的AI扩散框架,除了18个核心盟国可以自由买卖Ai芯片,美国政府将决定其他国家可以购买多少芯片,即便是以色列、瑞士、墨西哥这些传统盟友也无法随心所欲地购买AI芯片。deep seek的开源,如同给全世界的每个Ai工程师都发了一把挖墙的铲子,这让美国耗资数千亿美元搭建的Ai壁垒摇摇欲坠!封禁deep seek继续堆叠硬件,强迫全世界继续使用close ai的昂贵算力?还是拆掉之前的数千亿美元构建的护城河,重新开源?美国资本现在有点儿左右为难。有人觉得deep seek是大卫投向哥利亚的石标会一击致命,有人说让子弹再飞一会儿。
至于deep seek是否抄袭了,蒸馏违法了还是违反道德了,这些重要吗……这种国运级的竞争,谁还在考虑道德、法律、协议,太天真了!CIA窃听默克尔手机的时候考虑过会侵犯人家隐私吗?摩萨德在bp机里装炸药的时候讨论过会伤及无辜吗?这种时候只有道德婊和吃瓜的媒体、群众才会考虑这些问题。现在全世界的ai工程师们都在夜以继日的研究ds的论文、代码,忙着在自己的服务器上部署复现ds的大模型!美国的投资家们的焦虑根本不是蒸馏不蒸馏,抄袭不抄袭,他们根本不care这些,他们关心的是这样一个价值万亿美元级别的技术,如果这么容易被复制的话,即便那是抄袭,那这个投资是不是愚蠢的?他们现在要重新评估当美国不能垄断ai技术和算力的时候,这东西还残存多少价值。
有朋友跟我争,说算力就应该掌握在那群文明人手里。我不想跟你争文明的定义,那是意识形态的问题,每个人的屁股决定了他对文明世界的定义。我只想说如果每个人的手机里都装着一个AGI的世界,一定比那个只有一帮文明人掌握着唯一一个超级AGI的世界更加公平!因为那时候你可以让你的AGI帮你分析一下,他们高举的那本我们大部分人都看不懂的《通往奴役之路》是否就是通向文明世界的唯一红宝书!
非常喜欢今天的talk! 非常同意另一位评论的观点,嘉宾是技术出身又懂资本,观点有逻辑,客观中肯!希望有更多像这样的talk! 现在只是学生,希望可以顺利找到工作后继续支持不明白博客。感谢袁莉❤
感谢这期内容的分享!我做个简单的summary:1. DeepSeek性能强大毋庸置疑,但是这不是举国体制的胜利,而是开源社区文化的胜利。2. 参考Jevons paradox,对高性能芯片的需求只会越来越大。3. 学好基础学科,技术会被替代,理念和思维框架的更新才是人类的核心竞争力。
为什么又要扯举国体制呢?如果真如你所说那样,有没有一种可能,中国不用举国体制也能取得成功?而且中国不只是举国体制才能取得成功?
@@erikanz1.这是对嘉宾的表达的总结,不代表这位朋友的个人观点,你无需对着他提问;2.中美科技战一定程度上也是制度之间的竞争,所以举国体制是否也能成就科技创新就很重要;3.如果中国不使用举国体制得到成果,那可太好了。希望中国能少用这个举国体制。
@@erikanz其实抄作业可以用举国体制,写作业不行。
@@erikanz 你看deep seek后面会不会被中共毁掉就知道了,我觉得从此以后deepseek都不会有创新了,只会沦为中共的工具。即使是像中国这样的民主洼地,私有制度依然可以带来创新。可是创新之后必然被中共给糟蹋掉。你再等五年看看
@@chenguanglu这个比喻很形象
受采访嘉宾的思路和表达能力太重要了,今天王维嘉先生的表述清晰连贯,而且非常专业,没有预设立场,非常感谢!
少有的,这次质量高
有很高的水平,又不吹不黑,非常好的嘉宾
你前同胞這麼說:th-cam.com/video/04D5-GZtSzY/w-d-xo.html
兼聽則明:th-cam.com/video/ohM5aiPB-qM/w-d-xo.html
我笑了没听出是一个门外汉还说抄中国算法有先进芯片就先进这挺搞笑的。😅
非常非常非常棒的一期!很难不对嘉宾和制作团队充满敬意。❤
我就喜欢这种技术出身,但又懂资本,同时具有中美视角,不吹不黑,讲的理性中肯的专家评论。
文昭談古論今:th-cam.com/video/ZxX4LRqgK2U/w-d-xo.html
每次面臨國運轉折點時,中國總是莫名其妙地做出最壞的選擇://th-cam.com/video/uGrFaZn3wB8/w-d-xo.html
听轮媒 就不要秀智商了
@@玉心-t5l 如果你覺得文昭的水準很好的話,那我覺得東風壓倒西風真是必然可期的事
@@玉心-t5l 文昭是纯反中媒体,光是这点就没必要看啊,就和中天,民视一样
非常好的內容,受益良多,謝謝
客观
公正
专业的评论。
这是我听到最好的有关deepseek的评论。
《不明白播客》犹如黑夜里的明灯
思想启迪的火种
感谢主持人,感谢嘉宾,感谢《不明白播客团队》!
謝謝!
从逻辑出发:我当时也在想“那群有理想的小孩” 那一段,主持人为什么不去追问一下呢?不过后来想通了,主持人总是过完问题list,就好像一个球发出就结束了,没有一来一去。这很可惜。
第一,技术术理想主义,不是成功唯一的条件吧?创新条件,与资金、人才、环境都有很大关系,我觉得中国即便有技术理想主义,仍旧做不出来。相反,美国没有做出deepseek,难道是因为技术理想主义更差吗?
第二,被总理接见这一段,是这样吗?我不觉得贸贸然间,一个无名之辈就会被接见。忽略了过程中的“层层选送”,基层政府尤其杭州也是早早会观察和扶持一些企业的,这种用资金大户,做出一些成绩是很容易早早就被瞄上的。被接见的目的,至少我没有听出什么有说服力的说法。
第三,最近美股回调更像是市场需要一次回调。deepseek最无辜的可能,像是被点燃了一次美丽烟花。但是谁点燃的?为什么点燃?尚不可知。
我对记者的期待,我们还是希望能通过采访,通过扎实的工作(比如广告所说的几十个小时的准备),和逻辑理性,专业的采访技能,来帮助公众挖掘真相。不明白博客通过采访,能在比较长的时间有机会问出广泛的问题,了解一些嘉宾观点,这是对中文媒体的贡献。非常好。但缺点也有,就是采访的质量总是受制于嘉宾的质量。真心希望不明白2025更上一层楼。
你层次低,没资格谈了此话题。
非常同意,有些地方谈得很浅,嘉宾给出答案就算,两人互相赞同,这种回音壁式的互动很容易形成认知错觉。
ds所在的杭州对科技和创新研发的政策支持力度是很大的,还有是不是存在因为资源限制而倒逼出的frugal innovation呢?这些现实因素都没讨论到。
我不觉得他们的成功单纯依靠开源技术理想主义这种理念,嘉宾观点忽略了很多组织制度的因素,最后轻飘飘落脚到几个鼓吹美国的结论上。虽然单纯呈现不同的观点是好的,结论是美国更好也没问题,但是得出这个结论的过程太主观了,并不是很好的审视现实的方法。
袁确实是正职外兼职做播客很辛苦了,近几期节目很明显感觉到这种精力限制带来的提问对谈质量不稳定,很容易成为嘉宾自我宣传的舞台。
最后提一下,嘉宾总是用“小孩”来称呼ds团队,真的中式爹味很重啊。你试想换英文节目这么kiddo kiddo地叫人,能有多少人尊重你。
其实这类访谈很多都比较浅显,就是做给完全不懂的外行人看的,你看主持人问的问题很白痴,因为这就是用户客群的画像
是的,我也发现很多次主持人都缺乏深度的追问,于是很重要的问题放过去
正解
谢谢!
Thanks
这嘉宾真是在硅谷的吗?感觉就是个混子,根据双方论文,r1做增强训练,用了280万个机时,meta做Liama增强训练用了700多万机时,双方精度也不一样,ds是8位,meta是32位混合16位,光这个差距计算量就差一两倍。 蒸馏也不是从大模型里提取小模型,简单的讲是利用别人模型的答案,调试自己的模型参数步骤,使得参考学习的模型更快更容易的得出和被参考学习模型的一样的答案。
不要吹毛求疵。他基本上说得是对的。
@ 怎么对了,说模型训练只花了别人10/1-100/1的训练量,这显然不对,就算不考虑精度的差距,280万小时怎么也算不成700多万小时的10/1啊?
你行,应该请你😮
普通人能得到什么
工资三千,能有增加吗
微软脸书这些公司对芯片的大规模投入的原因可能并不是他们看到了这一块怎么怎么赚钱,而是他们恐惧,恐惧一旦落后,公司可能会迅速被淘汰掉,是这种恐惧迫使他们往里投钱。
謝謝袁莉,謝謝嘉賓,聽到斯坦福那段,說密集的交流活動,自由的思想碰撞,內心無比激動和鼓舞,本期節目做的特別好,祝福,新年好運。
那问题来了,为什么deepseek不是在美国硅谷或者Stanford出现反而是在中国出现?😂
@ 不要結果論,他們不止有這一個高科技,我們也不止差這一種高科技,respect 。
@@yaddu8233 不用结果论难道要唯心论?😂那行中共永远差美国一大截 永远落后,因为你总有角度证明😂,是这意思吧?
@@xiaoxia3383 這是你的意思,你隨意,我不care誰強,沒立場
@@xiaoxia3383沒有OpenAi沒可能憑空出現deepseek
袁莉和王维嘉还是活在八九十年代的老古董,对于新一代的中国人来说,这些老古董都是意识形态的产物,他们已经被时代彻底抛弃了~~
Thanks!
對於DeepSeek被OpenAI指控用ChatGPT做模型蒸餾這件事,其實中國有好幾個大語言模型,尤其那些知名的互聯網大公司都有自己開發的大語言模型,至少兩隻手十個指頭數才夠,而且他們大都是在DeepSeek第一個版本在2023年問世前就已經上市,像百度的ERNIE 1.0(文心一言)是跟OpenAI的第一個公開的LLM GPT-2同一年2019年上市公開的,DeepSeek要做模型蒸餾,大可以拿其他中國的各個不同版本的LLM,何必要冒著被指控作弊的風險去用ChatGPT? 道理和邏輯根本不通。
拿好的來挖 東西好嗎! 這招後來大家都會耍了 大家都這麽作 就你抄我 我抄他 跟以前在學校 寫作業一樣 越 越後面寫的 分數越高
@ 模型蒸餾跟抄作業所謂的“抄”根本是完全不相干的概念,而且主要是將較大模型優化成較小模型的方式,一些AI機器學習大神級的人物都站出來駁斥所謂的DS抄襲ChatGPT的説法。不懂別人云亦云跟風亂扯。
DeepSeek 蒸餾過的模型,應該不止ChatGPT吧,也不會僅限於美國的。百度、阿里的模型應該也在蒸餾範圍。
这个王维嘉没有英文简历,公司没有英文介绍,所有的信息就是针对中文的宣传,信他有鬼了。袁莉好好加强专业素养,别把自己也搞成针对简中的信息茧房,无论政治,技术。
🎉
你行你上?😂😂😂😂😂
不懂瞎BB
其实……是能搜到的,你以"Weijia Wang"、"Silicon Valley"和"Stanford University"为关键词顺藤摸瓜就能找到他的英文个人信息了。
翻墙出来了还是随地做爹呢 来宾介绍袁莉已经说的很清楚了,节目观点观众各取所需
最强的证据是全部开源,并提供详细的论文。任何人都可以免费下载然后自己在本地搭建去重现这个结果。
重现的是结果。不是过程和数据来源。
全部个屁,只是结果开源,球不懂
@@zhangjerry4521 真奇怪,解讀DS論文跟技術的影片也有不少,怎麼好像你們還有網路管制的樣子?
以為開源大家就看不懂你在幹嘛嗎..在串openAI當成寶?
@@peterwu2844
这才是真正技术流的中立观点,不在意任何意识形态和政治立场
你Stanford 的学生为什么没做出来呢? 中国留学生在硅谷科技公司得到重用吗?你们太小看中国留学生格局了,北大的学生不留学也有很多国际交流机会,从小学开始就有各种国际研学,要以发展的眼光看
很有价值的内容,感谢两位的分享
最近正在关注ds,没想到就做了一期!不明白真是紧跟时事,工作和生活都在用AI,切实体会到了便利性,越来越觉得未来AI如果真的发展更深入人类社会了,对思维活跃和情感敏锐的人还是利好的。
我了解到的信息
这个杭州公司,之前是搞量化基金的。他们最擅长使用的爬虫技术和数据分析。
然后他们的员工,全部是1-2年的小孩子,我记得拉里佩奇搞谷歌创新业务的时候全都是使用有经验的老部下。
所谓技术蒸馏是使用爬虫偷取别人的数据,然后反馈给用户,已经有很多证据显示了。
这个王维嘉,各种话里话外,罔顾事实,还想让这帮孩子到美国去留学,现在两国关系视同水火了,特别是在科技的领域。已经新冷战了。那么他还在抛出这种言论,我觉得他的背景,袁丽老师好好去考究一下。
我作为技术男,我不是很赞同的他的思维,当然我可能反共,但是他的思维跟我听到的社会共识,相去甚远。
偏执狂人家意见跟你不一样就是共党同路人,好笑书读傻了
给你站队111
说的好像open ai自己的数据全是自己生成的一样,每天在网络上爬虫偷取别人的数据恰恰是目前所有人工智能公司都会做的事情,技术男?什么技术?谷歌都被抓到过拿百度的文心一言来训练自己的模型,你是无知还是装着没看见?
你不懂什么是“蒸馏”
蒸馏是偷取别人数据?😮
哈哈哈😊
主持人和嘉宾谈论DS这个话题都比较客观理性,没有太多偏见,挺不错的。
其實此君都是從美國人的角度出發, 總有偏差的論點存在, 沒有百分百的所謂公正中立。
有黨性的中國AI:th-cam.com/video/ohM5aiPB-qM/w-d-xo.html
主持人和嘉宾都非常赞!
谢谢节目组。最近一直在关注DS讨论,这是我目前听到的最完整最逻辑的评论。
這期是我聽到最客觀的評論。謝謝
@@aliciajiang453
廢話!
这集嘉宾有点LOW
你别在这丢人现眼了
这次节目做的太好了。不止把deepseek 说明白了,而且把中美在科技各方面竞争的本质用动态的眼光解释的清清楚楚。可惜华尔街只看当下的财报,政客也只关心下次的选举。这也没错,但贤者一定会看的更远,做更高明的选择。
快拉倒吧 这人就不懂技术 都是道听途说 单纯就是在黑中国。不是黑中共 是黑中国。
第一次听,非常好!谢谢🙏❤🤝
The most significant impact of the DS is its extraordinarily low cost, but the disclosed cost is not that reliable.
对比openai的api价格不就行了,很难?国内第一波价格战,就是deepseek开始打起来的。 r1在海外出现后, 价格还用怀疑?
其实就是把蒸馏技术玩出了新高度,直接拿别人的大模型训练自己的小模型,“省去”了大模型训练成本。这的确是个重大突破,因为以后如果不能防别人蒸馏,那么谁投资大模型训练谁亏本,会严重打击算力投资热情,所以英伟达股价才大跌。
如果再出现一家公司,以50万美元来再蒸馏deepseek的模型呢。
@@asmr-66-d6zDS都开源了,而且在算法上不像openai一味堆算力,DS大大降低了成本,低阶芯片一样用
你懂PPO和GRPO吗?貌似你关注错了重点还很斩钉截铁的呢
你其实懂蒸馏吗
很客观,感谢王先生、感谢袁莉。
嘉宾水平真的高,相比主持人一直把问题朝狭隘的民族竞争、国家斗争上引导,显得好low
给嘉宾点赞。这是一期非常棒的节目。
喜欢维佳的讲解。谢谢🙏🎉🎉
新年快乐🎉🎉🎉❤
说的太棒了这位嘉宾🎉🎉🎉
好喜欢这一期。因为这期播客开始捐款
来宾对蒸馏的解释是不是有问题?师父带徒弟和在大模型中调用一部分专业模块明显是两回事
是的,蒸馏其实就是师傅教徒弟,甚至是偷师。
直接調用一部分專業模塊?都開源了,那怎麼不直接講是哪裡調用一槍斃命呢
传统的蒸馏是针对logits进行soft target的蒸馏,而openai没有开源,只能使用其输出或者使用其api构造的数据集进行hard target的训练,也算是一种广义的蒸馏吧
非常有深度的一期访谈 谢谢
这位嘉宾除了把Deepseek成本估计的过低以外,基本每个话题说得都是对的,也不知道评论区为什么这么多反对的。这次Deepseek的事情,让不动脑子的人--无论是支持中共还是反中共的,都现了原型。
他不懂机器学习领域“蒸馏”具体是什么
这问题问滴!中国的成功就是中共的成功(这一点就别拧巴啦,何必呢!),中共越成功,越显得某些生物之劣等之强龌龊
谢谢分享,嘉宾很深刻
推荐书这个环节很好,点赞👍
专家说的非常好👍
非常好 感谢分享
祝福你新春吉祥如意!❤❤❤
如果Deepseek真的是蒸馏的结果,那么Openai为什么不自己蒸馏自己,做出同样好的模型?为什么现在只能发布一个成本无法比肩deepseek的o3mini?
问得好
讲得真好👍谢谢
杰文斯互补定律我是在一本介绍城市规划的书中看到的,而且并不是作为重要知识点出现的。“杰文斯互补定律”就是那本书里的中文翻译,其实应该译作“杰文斯悖论”。这是我个人的经验,那就是像我们这样只是为了跟上时代发展而阅读的普通人,务求宽泛而非精专。很多知识会出现在意想不到的地方;这些知识对理解的帮助也会出现在意想不到的时刻。
有一个观点值得商榷,蒸汽机随着效率的提升使用量越来越多。Ai 的使用量也会越来越多,但 Ai 不是蒸汽机,不需要每个公司和个人都自己去训练大模型。一个好的大模型是可以让无数企业和个人同时使用的,我们没有必要也买那么多芯片去做重复的工作。
说的对,互联网企业有个特性,是赢家通吃,只有第一二名能存活。
very inspirational!
谢谢, 这个视频很好,不仅专业, 而且没有政治立场。
真的不专业啊,不懂技术
@@FusionC 所以哪裡有問題?
非常棒嘉宾 非常棒节目 感谢感恩
AI的情商很高啊。跟AI讨论问题,它不会骂你、鄙视你,非常耐心、鼓励。比大多数人好多多了。
是的,不过就是很快就有不真实感,因为所有的话都顺着你说,所以我觉得嘉宾想表达的可能不完全是情商,而是真实情感交流
我对DeepSeek没有偏见,但为啥不能让子弹飞一会再站队呢?毕竟从最初的热捧到OpenAI,微软等的声明,以及多国政府数据安全部门质疑,连一周都没过去,估计专业AI专家们还在紧锣密鼓地分析论文和模型中,王维嘉也不是做技术的,而是混迹风投圈,哪来的自信说DeepSeek是汽车相对于步行的飞跃呢?我觉得现在最好是专业的事让专业的人去跟进,静待后续发展,是王者迟早能冒头,是小偷也迟早会现行,用不着急吼吼地一周就站队,就像当初的姜萍一样,是骡子是马最后还是会现形的,急啥呢?
微软 亚马逊 英伟达火速在自己家云服务官网上放上DeepSeek的api服务,速度之快前所未有,出来也就三四天就放上去了,还不够说明问题?
Jiang Pingzhen is a secondary school student, a doctor from Qingbei with an annual salary of one million in deepseek. You deserve to know a secondary school student.
中国不关注利润的公司很多吧?有政府补贴,倒贴给用户也没有问题。说梁和政府没关系,那李强咋会去接见,也没听疯狂宣传李强去阿里ai ,百度ai
播主和王先生都极为聪慧,所以这是睿智的盛宴
專業啦!
这期节目很有启发。这几天网上论战,基本上都是预设立场的,大家在这场乌烟瘴气中看了个热闹,收获的往往只是一些惊讶与恼怒。这期节目给我最重要的讯息是--现在处于AI革命的前夜,AI会深刻改变当前的世界。如何在这场浪潮中活下去,对某些职业来说异常重要,而政治、立场这些东西已经显得微不足道了。
有黨性的中國AI:th-cam.com/video/ohM5aiPB-qM/w-d-xo.html
Deepseek 的测试结果可以达到 OpenAI 的同等结果,我特别去查如何测试 AI, 结果我发现 AI 测试为了公平,有标准5大题库,几十万个问题
任何人可以针对题库,训练AI 模型达到高性能低成本,可是不在题库的问题,就是一地鸡毛。我的问题都是小老百姓的问题,题库里面没有。
这些中国小年轻,充分发挥了中国联考精神弯道超车,利用几万个题库,最短时间,最低成本,达到 AI 测试最高结果
你用一下deepseek 和open ai ,再看你的上面评论
本期嘉宾不错
這就真外賓了啊,背後肯定有“神秘力量”的推動啊。
袁莉少点预设立场,节目还能看
中肯的,同感
這位先生的影片值得中國人借鑑:th-cam.com/video/Nk_O2i6aA4o/w-d-xo.html
主要是很多时候大家都在自己的同温层里,很多观点就很难改变,即便是非常不合理的。而这个话题是新的,这时候她的精英朋友圈所能够提供的信息,以及她自己的理性判断就能更好地找对方向
我倒是覺得越批評開源模型的人真是越能顯示自己被洗腦跟有預設立場多麼嚴重
怎么忍得住?怎么做得到
袁莉这次找的嘉宾超级的靠谱!思路非常清楚,表达也非常清晰。绝对是行内耕耘很多年的高人👍
他根本不懂行,不懂技术
蒸馏就是teacher-student架构。如果你不同意,请写具体意见来反驳
@@FusionC中科大本硕斯坦福博士
事出蹊跷必有妖!
在信息如此不透明的环境中,在鼓噪的技术大炼钢的时代下,嘉宾所说它的成本真如自己所说的那样低廉?鉴于电动车行业的研发生产与倾销的现状,这一样例上,个人存疑。
现在看起来确实不低,花了好几亿美金,大炼AI😂。
来源长远来看一定对这个行业发展有帮助,只是对行业中人利益分配会产生颠覆性影响。对Nvidia芯片的需求是利好
不一定,蒸馏技术对于模型训练投资收益是毁灭性打击,因为以后你投资模型训练花了巨额成本,但别人只要拿你的成果花1/30的成本蒸馏下就能跟你一样好。说白了,蒸馏就是ai界的侵权,蒸馏防不住的话,对ai发展是巨大打击,所以英伟达股价才暴跌。
冷知识:王维嘉从九几年开始,完美错过了中国和美国的移动互联网大潮,没有做成任何一个移动产品,没有任何一个成功成功案例,彻头彻尾的一loser。
人的成功面向多樣,就如人的長像甚至是獨一的,現實絕對不是衡量人生成敗榮辱的單一標準。
你有什么成就,你难道不是loser?
loser ? 啥时候不变成巨富就是loser了啊?
按这个逻辑,没有人有资格去评论马斯克的成就了,因为没有人做到他那样的成就。
主持人和來賓對於中國還存在粉紅泡泡般的幻想......在中國,連網路用詞都會被監控,做AI能不受中國政府的監管?
好节目
梁文峰肯定不是个只懂技术的小孩,但是梁文峰同时肯定不是你认为的“国家队”。实际上在deepseek发布之前,梁文峰和他的幻方量化在中国经营的相当不“愉快”--中国政府严控量化资本,各种扣帽子,幻方量化管理的资金规模一直在衰退,2024年的业绩也可谓是糟糕。另外幻方量化上次出现在中国的公众视野中,是因为内部两性关系混乱😂
幻方这家公司,和“根红苗正”不沾边。
心理平衡了???就这个???你可真埋汰
@meiguopapa7328 你哦再说什么?
梁文峰凭他“一只平凡的小猪”捐款1.38亿就是个有些情怀和理想的
嘉宾的讲述让小白懂了一点,看到有反对的言论,但看不懂,如果你们讲的明白,大家都进步
从这嘉宾开始聊的5分钟内容就能看出来这也是个门外汉😂
比普通人要好一些
三百六十行,行行能AI 嗎???😅 美國是服務業和金融佔了GDP絕大部分,短時間受AI 衝擊肯定最大, 像以製造業為主的國家還是會有很長的緩衝時間, 而不發達的貧窮國家,人類文盲問題還搞不定,就別提AI了
@@flatfish72 大家连AI的能力都认识的很浅,AI目前没用办法处理人类语言中的歧义,而人类非常擅长,就这点,就注定AI干不了什么高大上的活儿
@@zxwang5003他口头五分钟就错的很厉害,根本不明白“蒸馏”的具体是怎么样的。他就是个风投人,根本不懂技术
人家中科大本硕,斯坦福博士
维嘉技术角度的分析很棒,基本符合事实,但悲哀的是,受限于美国phd的招生政策和技术移民限制,梁文锋这些人(在领导deepseek之前)是很难申请到斯坦福的phd的,再者,技术移民排期也会影响到创业的意愿和视野
请问嘉宾说的那家赚了10亿的软件公司叫什么名字?
这期嘉宾就是给侃爷类型,听着爽但实际没任何gold nuggets
王维嘉老师讲的非常通俗易懂,非常感谢!
现在这个Deepseek好多内幕并不知道,让子弹再飞一会儿吧。现在下结论尚早。这期节目尔尔
你这评论,自己还没弄明白就评论,你既然让子弹飞一会,你就别指指点点,因为你也啥也不知道
不懂建议去看 paper
据消息,梁文锋过年回家被特警保护,听到这个消息我就放心了,deepseek开局即是巅峰。
幻方使用芯片数量应该有假, 有消息他们也有4万以上各种芯片, 这样成本就不是5~6百万, 而是上亿。 幻方近年收益很低, 支撑这类研发绝非自有资金,上线后继续开源也谈不上理想主义, 肯定存在战略考虑, 后期运维成本也不是幻方可以承受, 中共政府资金的支持是合理解释。 幻方采用蒸馏方式节省巨量训练成本来进行竞争, 这种模式是不可持续的。
非常赞同王维嘉关于语文+数学的观点。。。
这期节目没价值
价值就是把deepseek吹了一遍,艹
这号就没有啥有价值的内容
衹要不反共的就沒價值
人工智能只会部分改进临床医生的工作,因为生物学50%以上的内容, 是理、化丶数方法的盲区。
男嘉宾真棒!
Al就是强弩之末,可控核聚变才是未来关键的技术!
价格低 也有可能是国家补助导致的
不会的,国家一直在打击量化。deepseek的确是创造了新的仿制技术。
如果真有大量国家补助在财务上也会作为公司的收入入账,而不是直接消掉成本。收入和支出是两条线,基本会计常识,哥们!
@@lyttlebee 你没有看过这家公司的股权架构吗,非常复杂有一堆公司,现在主体公司交社保的人才4个人,怎么可能靠4个人研发AI,肯定有接收国家资助的附和公司的职能进行,为了隐藏才搞得很混乱
是的
这么快就被接见了,那必然有国资或者二代资金帮助。
很正常阿现在中美在拼
如果没有靠政府补贴才能把成本降那么低的话,那确实很厉害!
不足为奇。
换个角度说,deepseek开源是打破了美国的AI霸权。因为所有的国家都可以做顶尖ai,中国虽然受制裁但是其他国家没有受制裁,那么日本,印度,欧洲都可能很快建立国家级的ai。那美国怎么办?对所有国家实施AI芯片禁用吗?
說個笑話:來賓說梁文峰他們跟舉國體制八竿子打不著,就完全一幫小孩,有技術、理想。
他就不生活在中国
哈哈,没错,这个太下头出戏了
中国有这样的年轻人,不挺好😊
说个笑话,200亿点面线app
梁文峰一个村里的小孩,没有举国体制的教育,他现在可能最多在镇上搞点小生意。
不管是大疆,宇树,deepseek,游科,momenta等等,这些新一代中国创业公司的创始人都是没有去西方留学过的本土年轻人,本身都具备本行业的专业技术的理工男,对事情的理智,热情,勇敢执着,再加上国内资本和庞大市场的支持。另外,部分的爱国情怀和凭什么都是西方领先的不服精神,推动他们不断追求成为世界级领先企业。去西方顶级学校留学固然专业能力可以变得更强,但相对缺少让你作为主导者的土壤。
那不過是因為中美技術協定,如果10幾年前美國就有今天的認識水平,就不會有這些公司了
ai極致發展.必須有個世界大戰.重新分配地球的資源
人工智能只可以用已知的资料,分析和制作千万事物, 但不可在自然科学理论上创新, 也不存在重大技术创新。
不是斯坦福的学生, 也能做出重大理论或技术创新.。
中国模式不一定都是举国模式,可以看看浙江杭州是什么样的营商环境,能够培育出来ds公司这样的环境,也是能培育出六小龙,七金花等等争奇斗艳新技术公司的,这种中国模式,早就不是外面的人嘴里念念叨叨的单一举国模式。
关于AI之战,就是韭菜地里的韭菜大乱斗。
再怎么斗,还是韭菜。
跟举国体制还是有关系的,因为数据搜集不受限。
现在评论我觉得还是早
采访中提问的水平很高,嘉宾也很专业。感谢您精心制作的节目!
专家水平很高