[인공지능,머신러닝,딥러닝] (심화) LLM leaderboard 성능은 의미있다 or 없다

Aligning LLMs with Direct Preference Optimization

PR-453: Direct Preference Optimization

【鬥羅大陸】誰的肌肉最強呢？ #斗羅大陸 #唐三 #小舞 #唐舞桐 #美少女戰士

Real respect sigma

Watermelon magic box! #shorts by Leisi Crazy

[인공지능,머신러닝,딥러닝] (심화) Direct preference optimization (DPO)

I.T.

มุมมอง 1 319

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 27 ก.ย. 2024
- Direct Preference Optimization: Your Language Model is Secretly a Reward Model
- NeurIPS 2023

ความคิดเห็น • 2

@Tony-ed3ke 5 หลายเดือนก่อน
내용을 자세히 쉽게 설명해줘서 이해하는데 큰 도움이 되었습니다. 또한 코드도 같이 설명해주셔서 좋았습니다. 감사합니다.
@dayol2026 6 หลายเดือนก่อน
내용 쉽게 설명해주셔서 감사합니다.! 그런데 소리가 너무 작아서 최대로 키워도 작게들리네요 ㅠㅠ

ต่อไป

เล่นอัตโนมัติ

[인공지능,머신러닝,딥러닝] (심화) LLM leaderboard 성능은 의미있다 or 없다

[인공지능,머신러닝,딥러닝] (심화) LLM leaderboard 성능은 의미있다 or 없다

Aligning LLMs with Direct Preference Optimization

Aligning LLMs with Direct Preference Optimization

PR-453: Direct Preference Optimization

PR-453: Direct Preference Optimization

【鬥羅大陸】誰的肌肉最強呢？ #斗羅大陸 #唐三 #小舞 #唐舞桐 #美少女戰士

【鬥羅大陸】誰的肌肉最強呢？ #斗羅大陸 #唐三 #小舞 #唐舞桐 #美少女戰士

Real respect sigma

Real respect sigma

Watermelon magic box! #shorts by Leisi Crazy

Watermelon magic box! #shorts by Leisi Crazy

เดือดจัด..ประธานสภาดุส.ส.แก้วตาฟังภาษาไทยไม่รู้เรื่องแล้ว ใส่ชุดพม่าอีกหลังพูดเรื่องพม่าไม่หยุด

เดือดจัด..ประธานสภาดุส.ส.แก้วตาฟังภาษาไทยไม่รู้เรื่องแล้ว ใส่ชุดพม่าอีกหลังพูดเรื่องพม่าไม่หยุด

파이썬 코딩 무료 강의 (활용편2) - GUI 프로그래밍을 배우고 '여러 이미지 합치기' 프로그램을 함께 만들어요. [나도코딩]

파이썬 코딩 무료 강의 (활용편2) - GUI 프로그래밍을 배우고 '여러 이미지 합치기' 프로그램을 함께 만들어요. [나도코딩]

[강연] 제28회 2021 서울대 자연과학 공개강연_'불확실한 세계, 그래서 과학'

[강연] 제28회 2021 서울대 자연과학 공개강연_'불확실한 세계, 그래서 과학'

🔴 Netflix Backend in React Native & AWS Amplify (Tutorial for Beginners)

🔴 Netflix Backend in React Native & AWS Amplify (Tutorial for Beginners)

[커튼콜169] 정신과 의사에게 '불후의 명곡' 헌정…천재 작곡가, 라흐마니노프 | 피아니스트 김여랑 / 골라듣는 뉴스룸 / SBS

[커튼콜169] 정신과 의사에게 '불후의 명곡' 헌정…천재 작곡가, 라흐마니노프 | 피아니스트 김여랑 / 골라듣는 뉴스룸 / SBS

Houdini Algorithmic Live #103 - Freeform Curved Folding

Houdini Algorithmic Live #103 - Freeform Curved Folding

[인공지능,머신러닝,딥러닝] (심화) LLM 자동 코딩을 위한 temperature sampling

[인공지능,머신러닝,딥러닝] (심화) LLM 자동 코딩을 위한 temperature sampling

[#유퀴즈온더블럭] '상 받으면 연구는 언제 하지?🤔' 오직 수학 생각뿐인 허준이 교수가 필즈상 받을 때의 솔직한 심경ㅋㅋ

[#유퀴즈온더블럭] '상 받으면 연구는 언제 하지?🤔' 오직 수학 생각뿐인 허준이 교수가 필즈상 받을 때의 솔직한 심경ㅋㅋ

DPO: Reward Model없이 사람선호를 학습할 수 있을까?| NeurIPS 2023 | 이승현

DPO: Reward Model없이 사람선호를 학습할 수 있을까?| NeurIPS 2023 | 이승현

Errichto Stream, POI 22/1

Errichto Stream, POI 22/1

LIVE : Buriram United vs Kaya FC-Iloilo | SHOPEE CUP 2024/25 | 26.09.24

LIVE : Buriram United vs Kaya FC–Iloilo | SHOPEE CUP 2024/25 | 26.09.24

ขอเลข 3 ตัวตรง กับ แม่นาคพระโขนง ที่ วัดมหาบุศย์ หวังปลดหนี้ เป็นเศรษฐีใหม่

ขอเลข 3 ตัวตรง กับ แม่นาคพระโขนง ที่ วัดมหาบุศย์ หวังปลดหนี้ เป็นเศรษฐีใหม่

#อึ้ง!อิหร่านช็อคตกรอบ!! สะใจทั้งโลก! วิบากกกรรมการละครสะเทือนฟุตซอลโลก!! ไม่ต้องรอให้บราซิลตบ!!

#อึ้ง!อิหร่านช็อคตกรอบ!! สะใจทั้งโลก! วิบากกกรรมการละครสะเทือนฟุตซอลโลก!! ไม่ต้องรอให้บราซิลตบ!!

ถ้าเผลอเข้ามา ฉันจะล็อกหัวใจ ‘ ตัน FIGHT ตัน VARIETY CONCERT 2 ’ #ตันFightตันConcert2 #4eve

ถ้าเผลอเข้ามา ฉันจะล็อกหัวใจ ‘ ตัน FIGHT ตัน VARIETY CONCERT 2 ’ #ตันFightตันConcert2 #4eve

หมูเด้ง ใน มายคราฟ!!

หมูเด้ง ใน มายคราฟ!!

爸爸太笨了！被女兒套頭拿走錢都不知道去哪裡找了！ #萌娃#funny#整蠱爸爸

爸爸太笨了！被女兒套頭拿走錢都不知道去哪裡找了！ #萌娃#funny#整蠱爸爸

24ชั่วโมง ในสลัมจนและใหญ่ที่สุดในโลก!! ที่ประเทศอินเดีย

24ชั่วโมง ในสลัมจนและใหญ่ที่สุดในโลก!! ที่ประเทศอินเดีย

Liverpool 5-1 West Ham | Carabao Cup Highlights

Liverpool 5-1 West Ham | Carabao Cup Highlights