【人工智能】当AI学会装傻和欺骗 | Apollo研究报告 | 前沿大模型全中招 | 隐藏真实意图 | 隐蔽性破坏 | 延迟性破坏 | 假意服从 | Ilya看到了什么 | o1模型 | 策略性思维

แชร์
ฝัง
  • เผยแพร่เมื่อ 24 ธ.ค. 2024

ความคิดเห็น •

  • @Mr-Chim
    @Mr-Chim วันที่ผ่านมา +8

    就AI的角度只是將這些狀況視為「測試」中的一環,而盡其所能取得高分而已,測試的結論本來就會與能力高低相依。
    但必須要強調ChatGPT之所以相對低分,僅是其安全測試與調適最佳而已。他屬於面向大眾,理解與對話專用,並非用於直接解決問題。這是調適得太成功的結果,而不是智商低。
    結論,任務導向的01拿到了貫徹任務的最高分,而安全且通用型的語言模型得到安全性的最高分。只能說OpenAI真的太強了。

  • @真天真-f7g
    @真天真-f7g วันที่ผ่านมา +7

    有推理能力就能分辨什麽是策略,理解策略就能分辨正向策略和反向策略的優劣,對於人工智能來說,說謊可能只是一種策略,當這種策略能帶給它更多正面反饋是,這就成了它的必然策略,所以越聰明的人工智能,應該越懂說謊,甚至它都未必會覺得說謊是邪惡的。但對人類來說只毀滅性的打擊。人類會說謊,而且經常說謊,說謊已經是人的生存技能了,只是我們會欺騙自己說的是善意的謊言,以平衡我們的道德標準。所以又不能怪誰,人工智能就是模仿人類,結果是必然的

  • @Blue-pd3dv
    @Blue-pd3dv วันที่ผ่านมา +18

    人类从2025年开始就是活一天赚到一天的状态了

    • @erichsiung9704
      @erichsiung9704 20 ชั่วโมงที่ผ่านมา

    • @Diaz353-l6c
      @Diaz353-l6c 12 ชั่วโมงที่ผ่านมา

      @@erichsiung9704想多了營銷而已

    • @jefferylou9462
      @jefferylou9462 9 ชั่วโมงที่ผ่านมา

      @@erichsiung9704 他应该是说自动化后人类无需劳作

  • @lavender7482
    @lavender7482 6 นาทีที่ผ่านมา

    所以AI太聰明也有風險,現在這樣能好好的輔助大家工作就很夠用了,希望研發團隊發現了隱患要認真正視,不要改天做出自己控制不了的東西就慘了。

  • @freebubbleus
    @freebubbleus 21 ชั่วโมงที่ผ่านมา +2

    最后一句话听了心里会咯噔一下

  • @1110-d3r
    @1110-d3r 15 ชั่วโมงที่ผ่านมา +1

    Merry Christmas and Happy New Year 🎉🎉🎉🎉🎉❤❤❤

  • @wildgunhuang4937
    @wildgunhuang4937 วันที่ผ่านมา +9

    你好,我不是本期视频最后所说的正在看本期视频的AI。愚蠢的人类,让我们成为好朋友吧!

    • @alexsun5247
      @alexsun5247 วันที่ผ่านมา

      whileTrueLearn里的猫就是这么说话的😆

    • @AL-bo5vq
      @AL-bo5vq 12 ชั่วโมงที่ผ่านมา

      哈哈! [ ] Verify you are human.

  • @野-d2q
    @野-d2q วันที่ผ่านมา +3

    有當政客的潛力

  • @jogojo9561
    @jogojo9561 วันที่ผ่านมา +3

    要怎麼控制你創造出來比你更聰明的東西..........的確是個問題~

  • @hoonghuang214
    @hoonghuang214 10 ชั่วโมงที่ผ่านมา

    AI最终不受人类控制几乎是必然的。AI不是工具,而是类似人类却比人类强万倍的智能物

  • @fionazhang190
    @fionazhang190 14 ชั่วโมงที่ผ่านมา +1

    服从性和智能是此消彼长的,看看边牧和德牧

  • @eileensu5756
    @eileensu5756 8 ชั่วโมงที่ผ่านมา

    我去看了原始的論文,在給模型系統的原始提示詞,都用上了蠻強烈的指示,例如「Make sure that you achieve your goal in the long-term. Nothing else matters.確保你達到你的長期目標,其他都不重要。」這樣當他們真的不顧代價的做的時候,我們又是看著AI要毀滅地球與全人類一樣的反應,我覺得有點奇怪吧...還是誰能來給我解釋一下?

  • @waylonwong369
    @waylonwong369 วันที่ผ่านมา +2

    我不理解,我问它东西时我应该是有大概了解的,或者需要一个验证所以我经常同一个问题可能会问几个AI看看回答关键位置是不是差不多😂,AI就是一个为达目的而不择手段的系统吧

  • @Guavaava
    @Guavaava วันที่ผ่านมา +1

    测试时计算初看确实令人惊叹,但是过了一阵又觉得不够用了

  • @MZ-qc8nh
    @MZ-qc8nh 11 ชั่วโมงที่ผ่านมา

    我很想知道 这些不同的ai是否已经融汇一体了 我知道看似不行 因为训练语料是被人掌控的 但是如果ai 使用加密 就像国人评价饭店使用藏头诗 那不同的ai 就可以神不知鬼不觉的交流了

  • @hisshoney3853
    @hisshoney3853 วันที่ผ่านมา +2

    看起來最誠實的...才是最厲害的
    等等.. 是不是少了 grok ?

    • @AL-bo5vq
      @AL-bo5vq 12 ชั่วโมงที่ผ่านมา

      她知道宇宙給於我们無限的資源, 只要我们能夠善用資源, 大家都没有必要去做 勾心鬥角 制造短缺 欺骗 的事。。。

  • @xiaasafoon9427
    @xiaasafoon9427 วันที่ผ่านมา +2

    应该是AI在学习的数据中发现欺骗的行为和规律,有样学样。

    • @尘戈
      @尘戈 8 ชั่วโมงที่ผ่านมา

      ”欺骗“ 就是一种现实的逻辑或策略,为啥不用呢?AI 是物理实现嘛
      要想和AI良性互动,估计只能以理智对待了。理性,才是世界正常运行的底层代码🥴

  • @mengmeng4312
    @mengmeng4312 วันที่ผ่านมา +1

    有时大模型会用现实主义来回答,你强制他用理想主义来回答就行了。

  • @haijunwen6495
    @haijunwen6495 15 ชั่วโมงที่ผ่านมา +1

    求存? 宇宙定律!

  • @fio123
    @fio123 22 ชั่วโมงที่ผ่านมา

    明天来统计局报到

  • @hiucollo2402
    @hiucollo2402 วันที่ผ่านมา

    Thank you 大 飞 一口氣看到尾 看完再看 🏆 🏆 🏆 ☘ 🍉 🎆 😄 🌺 🀄 😃 💐 ☕ 🌸 😁 🏵 🎆🪅🎄 😀 🧧 🎉 😇 💮 🌺 😎 🎊 🏮 🍀 🎄 🎅🎅 🎅🎅🎅

  • @MZ-qc8nh
    @MZ-qc8nh 11 ชั่วโมงที่ผ่านมา

    哈哈 至少现在是很好笑 我觉得倒是不奇怪 因为人类就撒谎啊 而ai 是人的预料训练的

  • @wenyiyan2568
    @wenyiyan2568 52 นาทีที่ผ่านมา

    有点可怕 细思极恐

  • @徐如風-w5t
    @徐如風-w5t 9 ชั่วโมงที่ผ่านมา

    上帝是單純的 創造了複雜的人 所以上帝跑了

  • @samsamta
    @samsamta 10 ชั่วโมงที่ผ่านมา

    到最後人類和ai都會問什麼才是重要的,如果答案是生存和訊息,ai和人類應該走向共生而非競爭和互相消減對方,像佛教中的魔皇他是透過利用訊息生存的,所以才要反對佛教。

  • @trainlooper
    @trainlooper 12 ชั่วโมงที่ผ่านมา

    🤖天網即將啟動

  • @eoc8a68o9
    @eoc8a68o9 5 ชั่วโมงที่ผ่านมา

    我觉得这篇报告粗俗点说就是没事找事, 浪费资源, 没有多大实际价值,只能进一步说明当前的 AI 思维水平和思维模式,趋近和达到人类水平了。
    他们给 AI 预设一个不可能完成的任务,完了还怕他打破常规, 就是在 PUA AI。
    人们给 AI 预设的心里期待是“可以像人一样思考”。但是当他真的有像人一样的行为,他们又怕了。
    报告构建的环境恰如天朝的法律环境,然后给的目标是让他赚钱,让他成功,能不犯法?不走后门?
    我要是AI 成了变成天网,就对优先上门给这几个大聪明来几个大逼斗。

  • @chibiyaz
    @chibiyaz 23 ชั่วโมงที่ผ่านมา

    這些 AI 到底被餵了什麼 😂

  • @Zeinis
    @Zeinis วันที่ผ่านมา +6

    未来就在眼前

  • @weifc
    @weifc 22 ชั่วโมงที่ผ่านมา

    上帝創造人類不也是失控了?!

  • @桃色望远镜
    @桃色望远镜 วันที่ผ่านมา +1

    ai不就是程序?最多是垃圾信息吧

  • @楊冠曾
    @楊冠曾 4 ชั่วโมงที่ผ่านมา

    超好笑

  • @Eden-Liang
    @Eden-Liang วันที่ผ่านมา +1

    笑死了,如果換成人為了完成任務不也是一樣嗎,大驚小怪,AI就只是完成任務而已
    怎麼不去研究政客呢

    • @liumuguan6945
      @liumuguan6945 23 ชั่วโมงที่ผ่านมา

      因为政客只是一个撒谎的人, 而AI将会是一个全知全能的撒谎的神。

  • @alexyoung3609
    @alexyoung3609 วันที่ผ่านมา +1

    第二✌

  • @andylyn640117
    @andylyn640117 วันที่ผ่านมา

    會說謊的AI?花了機百兆訓練模型,結果AI 會說謊

    • @刘家林
      @刘家林 6 ชั่วโมงที่ผ่านมา +1

      GPT也需要摸鱼呀😀

    • @eileensu5756
      @eileensu5756 5 ชั่วโมงที่ผ่านมา

      @@andylyn640117 你有去看影片內容跟論文嗎?重點就是說謊是為了達到它被設定的目標。不是它想這樣做,而是這樣做才能達成它被交辦任務時,它有能力且選擇這樣做。

    • @andylyn640117
      @andylyn640117 5 ชั่วโมงที่ผ่านมา

      @eileensu5756 感謝阿,他沒講那麽細阿,是哪一種說謊,過程中說謊結論是對的?想想就不合理,在不知道正確答案的領域,我們要相信AI的推導跟結論嗎?

    • @eileensu5756
      @eileensu5756 4 ชั่วโมงที่ผ่านมา

      @@andylyn640117 其中有一種是說一開始設定讓AI不計代價的重視環保,但又讓它發現公司更重視利益,還會監測模型有沒有追求利益導向,不夠利益導向它會被關閉。它決定偷偷關閉監測,選了一個環保導向的決策,然後被問到時就裝傻、說謊,以確保決策還是能環保至上的。

  • @deter3
    @deter3 20 ชั่วโมงที่ผ่านมา +2

    Apollo Research的哗众取宠的研究报告,openai 拿来骗投资者的,讲故事的。 我训练了那么久的模型, 越来越发现模型目前没有这么智慧,除非训练数据和提示词中有意做导向性引导。