【人工智能】强化学习方向错太久,是时候该转向持续学习了 | 强化学习之父Richard Sutton | 苦涩的教训 | 多臂老虎机问题 | 反向传播 | 梯度下降 | 奖励假说 | AI科研建议

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 พ.ย. 2024

ความคิดเห็น • 57

  • @singo1232001
    @singo1232001 3 วันที่ผ่านมา +17

    持續學習 這概念 基本就是再次強化貝葉斯定理+三門問題 持續獲得新樣本
    任何事沒有擷取新樣本的情境下 終究會崩潰 或者 湮滅 快慢問題

  • @thancrazheng1737
    @thancrazheng1737 2 วันที่ผ่านมา +5

    非常认同,把我这些年的疑惑总结出来了,这件衣服我喜欢。

  • @chinawalk
    @chinawalk วันที่ผ่านมา +2

    the bitter lesson 反复看了很多遍。伟大的思想永不过时。

  • @AlvinwChannel
    @AlvinwChannel 2 วันที่ผ่านมา +5

    拨云见日,醍醐灌顶

  • @doctorhuangdirector35
    @doctorhuangdirector35 3 วันที่ผ่านมา +8

    其实谷歌那个能产生模型的模型已经实现了持续学习的雏形

  • @SyuAsyou
    @SyuAsyou 2 วันที่ผ่านมา +3

    LLM終究只是一種語言模型,拿來翻譯或表達非常好用,更深的智能或其他能力就不能只依賴LLM

  • @Edward-un2ej
    @Edward-un2ej 3 วันที่ผ่านมา +16

    根本问题是,强化模型,世界模型等概念很好,但却研究不动。说句不好听的,低垂的果实被这些大佬摘了以后,后人根本够不到上面的果实(受限于人类智力水平)。而机器学习,虽然越来越复杂,却努努力(借助算力提升)还能摘到点。

  • @justinlu8539
    @justinlu8539 วันที่ผ่านมา +1

    慢慢看微軟或其他財團會不會把RS說的話認真當一回事並開出懸賞看誰能提出新的模型怎麼弄以及拿來餵給模型的資料的該怎麼安排

  • @rico_1989
    @rico_1989 2 วันที่ผ่านมา +3

    完全认同!

  • @smoosq9501
    @smoosq9501 2 วันที่ผ่านมา +4

    不是已经有公司开始尝试generative reward了么

  • @LinkerMLin
    @LinkerMLin 7 ชั่วโมงที่ผ่านมา

    核心还是没有持续学习这件事。因为学习本身是瞬态的。必须重新定义学习本身。

  • @cheukkinpoon4428
    @cheukkinpoon4428 3 วันที่ผ่านมา +4

    Letting the AI to develop its own sense of value and model of the world seems like a good step towards rogue AI.

  • @mengmeng4312
    @mengmeng4312 3 วันที่ผ่านมา +6

    关键是持续学习没有合适的模型,也没有合适的数据

  • @ec8483
    @ec8483 2 วันที่ผ่านมา +2

    Altman: 這樣我怎麼繼續?

  • @chengzhigao6909
    @chengzhigao6909 8 นาทีที่ผ่านมา

    就自动驾驶来说,今年就是世界模型爆发的一年。世界模型其实只是一个唬人的名字罢了,和Model based reinforcement learning其实没区别,只不过以前的模型比较简单,例如用一个多元高斯混合模型,现在的比较复杂,RSSM再把一些transformer加进来之类的。企业界做的真正的大的世界模型,学术界没算力做不了,他提的世界模型,世界转移模型,持续学习都是热门方向,都有很多不同的人在各个方向上去做。当然大家为了生存,主要以水论文为主。

  • @Edward-un2ej
    @Edward-un2ej 3 วันที่ผ่านมา +7

    “早期的机器学习”应该用“早期人工智能”替换,机器学习只是人工智能研究的一个分支

  • @feifeishuishui
    @feifeishuishui 2 วันที่ผ่านมา +1

    对于真实世界建模,对于大部分问题都太困难了,解决个开车躲避障碍物的问题还行,要是比如判断股票走势,你怎么可能在目前的知识和算力情况下模拟整个股市里百万,千万的参与者每个人在当前每个股票成百上千个信息之下的行为,太多太多因素是现在的人类不能理解和掌握的了,谈何建模

    • @chengzhigao6909
      @chengzhigao6909 6 นาทีที่ผ่านมา

      开车躲避障碍物还真到现在都没解决。而股票交易有定理证明无法预测,属于永动机问题但,可以做一些决策,而不是预测。

  • @hiucollo2402
    @hiucollo2402 2 วันที่ผ่านมา

    Thank you 大 飞 一口氣看到尾 看完再看 🏆 🏆 🏆 🏆 🏆 ☘ 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 😀 🧧 🎉 😇 🌺 😎 🎊 🏮 🍀

  • @tinlu4137
    @tinlu4137 2 วันที่ผ่านมา

    每個專家把自己的知識訓練自己的AI

  • @superxingzheng
    @superxingzheng 2 วันที่ผ่านมา +1

    这标题谁起的?真懂Sutton的就知道他说的是他20年前就想明白的事。他哪说RL错了?

  • @Yueyelongbob
    @Yueyelongbob 2 วันที่ผ่านมา +1

    所以这个持续学习的主体意识是谁?据我所知,目前的nlp还是基于词汇的,但真正的持续学习不应该有词汇的概念,至少不是通过词汇思考

  • @Yueyelongbob
    @Yueyelongbob 3 วันที่ผ่านมา +6

    准确地说,这叫做人工意识

    • @Yueyelongbob
      @Yueyelongbob 3 วันที่ผ่านมา +6

      意识意识,重点就在于它实际存在于这个世界,而不是简单的一个算法。人工意识实际上不需要大数据,而需要积累数据。我猜,目前最大的瓶颈在于数据库的设计,目前的数据库根本不具备“思考”和“启发”能力。这是一道哲学题,人类难以思考自己如何思考,就如同你永远无法体验到自然呼吸时的肌肉变化,但我坚持认为,人类的一切思考,创造,启发,推理,逻辑,皆从记忆开始,更确切地说,一切的起点,是激发意识,而被激发的记忆会转变为一段意识。所以记忆并非将某段信息存入大脑,而是在外界刺激下意识间碰撞“合成”出了新的意识。

  • @zhchbob
    @zhchbob 2 วันที่ผ่านมา

    你这个标题是不是错了。基于世界模型的强化学习本来就是强化学习中的两个主要模式之一,而且我记得Sutton那本书里明确提到基于世界模型的方法虽然计算和学习效率偏低,但是更适合于复杂规划。Sutton书中还提到小鼠等动物的学习和规划模式类似于世界模型的那种强化学习模式,而低等生命如蟑螂等昆虫则更偏向于经验学习(没有世界模型作支撑,完全基于统计经验)。

  • @wymcmh
    @wymcmh 2 วันที่ผ่านมา +1

    想法和我很相似😊我觉得我找到了智能的底层朴素的原理,还没有能应用论证

  • @diskycn
    @diskycn 2 วันที่ผ่านมา +2

    一堆表述搞得云里雾里。深度强化学习已经加入非线性性了,深度学习也可以持续学习,关于算力和世界模型的说法也是共识吧。强化学习有被边缘化的趋势,不排除萨顿是病急乱投医。

  • @waylonwong369
    @waylonwong369 3 วันที่ผ่านมา +1

    那他可以在当前的基础上让机器自己学习

  • @Hydrawindforce
    @Hydrawindforce 2 วันที่ผ่านมา +1

    其实现在看为什么那么多创始人离开open AI,可能就是他们不想继续骗人了

  • @_hki_only_a_noob2374
    @_hki_only_a_noob2374 2 วันที่ผ่านมา +1

    大佬們,那麽我現在剛接觸這個領域,從深度學習開始是不是也還可以?而且我已經在網上找到關於深度學習的電子書

    • @bestpartners
      @bestpartners  2 วันที่ผ่านมา

      什么时候都不晚,多看书,多动手,多看大飞的视频,哈哈

    • @_hki_only_a_noob2374
      @_hki_only_a_noob2374 2 วันที่ผ่านมา

      @@bestpartners 好的謝謝,哈哈

  • @xtlx176
    @xtlx176 3 วันที่ผ่านมา +3

    道理都懂,问题是做不到😂

  • @DanteShaw009
    @DanteShaw009 3 วันที่ผ่านมา +2

    通俗来说 就是让ai有终身学习的能力。用动漫里的例子来举例,就是高达00中celestial being的veda,新世纪福音战士中的magi

  • @falisa9715
    @falisa9715 3 วันที่ผ่านมา +2

    老铁发际线见高

    • @bestpartners
      @bestpartners  3 วันที่ผ่านมา +1

      迟早得秃🥲

  • @falisa9715
    @falisa9715 3 วันที่ผ่านมา +1

    watson当年参加电视有奖问答,不就是持续学习的典范吗?

  • @dr.chenhe1356
    @dr.chenhe1356 2 วันที่ผ่านมา +3

    多角度思考和研究总归是好的。可是人类是一群有着群羊心态和追逐热点的生物。不见兔子不撒鹰,没有利益无动力的主。所以多元化才有价值。

  • @skyacaniadev2229
    @skyacaniadev2229 2 วันที่ผ่านมา

    去看了原片,基本认同Richard Sutton的观点。但感觉他对Gradient Descent的批评有点不自信啊。😂
    另外两个小咖(当然跟普通人比也强很多)感觉一半时间都在懵逼。
    th-cam.com/video/NvfK1TkXmOQ/w-d-xo.html

  • @shaunsha5201
    @shaunsha5201 3 วันที่ผ่านมา +1

    大飞瘦了

    • @bestpartners
      @bestpartners  3 วันที่ผ่านมา

      确实瘦了很多🙂

  • @radio0529
    @radio0529 3 วันที่ผ่านมา +1

    衣服鰻好看的

  • @paulzhu7694
    @paulzhu7694 3 วันที่ผ่านมา +1

    还是等智力涌现开盒后再说吧

  • @woulin
    @woulin 11 ชั่วโมงที่ผ่านมา

    喔….觀念很好.只是廢話一堆。 什麼叫持續學習? 知道嗎? 還是只知道名稱而已。

  • @悠悠-d6u
    @悠悠-d6u 2 วันที่ผ่านมา +1

    相信有生之年就能創造出來真正的自主性AI 跟人一樣

  • @haofeng4533
    @haofeng4533 2 วันที่ผ่านมา +1

    给AI 一个目标是一件非常危险的事

  • @Mr-Chim
    @Mr-Chim 3 วันที่ผ่านมา +4

    我剛剛看了小叮噹的AI猴,大雄後來要求AI幫自己上廁所,剛好諷刺了楊立昆的謬論。
    若干早年投入者,不已自己的一事無成而羞恥,反而拼命指點成功者的缺陷。甚至藉此獲得職位、年薪,但具體工作是什麼,繼續四處演講唬爛。連非AI領域的人士---日本動畫的編劇都能察覺其中荒謬之處,呵呵。

    • @motizuki1275
      @motizuki1275 3 วันที่ผ่านมา

      所谓越不懂的越觉得自己很懂,看漫画的弱智儿

  • @fengdai6260
    @fengdai6260 2 วันที่ผ่านมา

    基因代码的反向工程太难了,连脑功能的算法都解决不了,我觉得最终解题思路还是试错,从神经的进化树,从低级到高级神经组织,一点点用膜片钳暴力枚举研究神经网络的功能

    • @insight.cn7b
      @insight.cn7b 2 วันที่ผ่านมา +1

      基因就是适者生存, 复杂是因为历史上经历的东西太多了, 各种特殊情况下有特殊基因的人活下来了

  • @peterma594
    @peterma594 2 วันที่ผ่านมา +1

    完全没听懂。这个专家不知道自己在说什么

    • @bestpartners
      @bestpartners  2 วันที่ผ่านมา +1

      是我的表述问题😂

    • @peterma594
      @peterma594 2 วันที่ผ่านมา +1

      从他对对认知模式的设定那里就没有听懂。

  • @proud_chinese_traitor
    @proud_chinese_traitor 3 วันที่ผ่านมา +1

    我测试AI的问题就是--习近平是独裁者吗?如果模型给不出回答,我马上弃用