【人工智能】OpenAI发布CriticGPT | 让GPT-4给自己改bug | 基于RLHF训练 | 强制采样束搜索FSBS | 幻觉困扰依然存在

แชร์
ฝัง
  • เผยแพร่เมื่อ 5 ก.ค. 2024
  • 。北京时间 6 月 28 日凌晨,紧随 Google 发布 Gemma 2 之后,OpenAI 公开了一篇名为《大语言模型评价帮助发现模型漏洞》(LLM Critics Help Catch LLM Bugs)的论文,详细描述了一款基于 GPT-4 的模型,CriticGPT。这个模型的主要功能,就是帮助人类评估和检测大语言模型生成的代码输出中的错误。CriticGPT通过训练生成自然语言反馈,可以指出代码中的问题,并且在检测自然发生的模型错误时,它生成的评审比人类评审更受欢迎,准确率可以达到63%。
    #人工智能 #openai #criticgpt #gpt4 #rlhf
    成为此频道的会员,即可享受提前一天,观看频道最新发布视频的福利:
    / @bestpartners

ความคิดเห็น • 29

  • @orderofchaos8680
    @orderofchaos8680 20 วันที่ผ่านมา +10

    就很像那种左脚踩右脚然后飞天的轻功。论文虽然写出来了,但仍然有很大的局限性。但是有利于把AI故事继续讲下去,个人很赞成,因为买了股票。🤑

  • @amagine
    @amagine 19 วันที่ผ่านมา +5

    自從有ChatGPT沒有用過別的英文教程了,教材都是自己用A I做的 用起來簡直不要太爽😂

  • @user-fp2xk6tu9l
    @user-fp2xk6tu9l 20 วันที่ผ่านมา +11

    AI改良AI,AI升級AI,AI推出AI,終於AI不用人類了😂

  • @corgirun7892
    @corgirun7892 20 วันที่ผ่านมา +5

    之前一直好奇超级对齐是想做什么,这篇paper一出来,有点懂了

  • @sonygodx
    @sonygodx 19 วันที่ผ่านมา +4

    我之前写过类似,就是一家AI不能既是运动员也是裁判,我用gpt4o 编写小游戏,然后加入claude3, Gemini 作为评判,然后不断迭代,通常迭代到5个版本后,一个完整的版无错误的版本基本可用,但再迭代效果不大 可能上下文长度问题。

  • @nwohocan
    @nwohocan 20 วันที่ผ่านมา +5

    正在往存算訓一體前進

  • @paulzhu7694
    @paulzhu7694 20 วันที่ผ่านมา +3

    这功能好~

  • @hayama2363
    @hayama2363 20 วันที่ผ่านมา +5

    政治正确gpt

  • @jim1977
    @jim1977 20 วันที่ผ่านมา +3

    讲道理RLHF如果本身有问题咋办??是不是应该有多个不同的RLHF来对回答做评估,然后综合打分判定?

  • @user-kf4md5hq3x
    @user-kf4md5hq3x 20 วันที่ผ่านมา +3

    沙发

  • @wonmanintp
    @wonmanintp 19 วันที่ผ่านมา +1

    內存條有9粒IC 第9粒是用來檢查1-8粒在存取時有沒有出錯。

  • @zhilongsong8978
    @zhilongsong8978 18 วันที่ผ่านมา +1

    人类的监督和反馈对于GPT模型的改进是最佳的吗?

  • @simonpeter9617
    @simonpeter9617 20 วันที่ผ่านมา +3

    好汉查好汉

  • @user-Gilbert-zhang
    @user-Gilbert-zhang 18 วันที่ผ่านมา +1

    把人類這個Bug改掉嗎?😢

  • @scchen2011
    @scchen2011 20 วันที่ผ่านมา +3

    第二

  • @Toyota3014
    @Toyota3014 19 วันที่ผ่านมา +2

    不符合物理定律啊😂

  • @waylonwong369
    @waylonwong369 19 วันที่ผ่านมา +3

    那谁给CriticGPT改bug?

    • @stevenxia-ep2qx
      @stevenxia-ep2qx 19 วันที่ผ่านมา +2

      目前是人類訓練員和程序猿

  • @Kevin-xt1er
    @Kevin-xt1er 20 วันที่ผ่านมา +3

    怕AI科技精進
    更怕中共掌握AI

    • @asir3021
      @asir3021 20 วันที่ผ่านมา +5

      你对对他是真爱,啥事都能想到他

    • @Kevin-xt1er
      @Kevin-xt1er 20 วันที่ผ่านมา +2

      命懸台灣,何以安栽?
      身為台灣人,我無法忍受,
      不能批評政治人物的生活。

    • @paipaiwei9602
      @paipaiwei9602 19 วันที่ผ่านมา +1

      @@Kevin-xt1er😂你对那群太监来讲 他们体会不了 只是希望你也做太监

    • @jackwang1234
      @jackwang1234 19 วันที่ผ่านมา +1

      不用想,土共一定会利用AI控制老百姓

    • @Ronaldona
      @Ronaldona 19 วันที่ผ่านมา +2

      @@asir3021 反正在国内,啥事都不能想到他,评论也不能提他,看来你们对他是真恨啊。