@@SsSs-vx1pl 벤치마크라고 하는 것은 일단 모두가 공통적으로 할 수 있는 "verified" 프레임워크입니다. 만약 벤치마크가 없다면 뭘로 이 알고리즘과 성능을 실험할 수 있을까요? 벤치마크가 없다면 이 알고리즘을 사람들이 믿으면서 쓸까요? 벤치마크가 지표가 안된다면 SOTA (State-of-the-art)는 필요가 없겠죠. Nature와 같은 논문들도 Benchmark를 기준으로 테스트한 논문이 많은데 거기 가서도 이거 왜 benchmark로 했냐고 해보시죠. 특히나 LLM 또는 LMM 모델 같은 경우 대규모 모델에다가 RLHF같은 feedback을 통해서 개선을 합니다. 이와 같은 얘기로 chatgpt에게 이건 매우 중요한 정보야 등등의 상세한 정보를 줄수록 더 잘하는것도 사실입니다만.
💡 AI x 노코드 x 콘텐츠 온라인 수익화의 모든 것, 지금 확인하세요 👉 www.successwiki.io/ainocodelab
빨리 정리해서 올려주셨네요~ 궁금했는데 덕분에 잘 봤습니다
참 좋아요 ^^
인간형 로봇에 심어서, 현실 데이터를 추가로 학습하면 또 한단계 올라갈듯
Ai의 발전속도를 보면 선형이 아니라 기하급수적으로 오르는게 보이네요 ㄷㄷ
진짜 특이점이 올 수도 있겠습니다.
4o하고 03는 다른것이겠조!???
네 4o < o1 < o3 입니다
한 5년만 지나면 ai는 인류가 영생할수있는 방법을 알아내지 않을까..? 싶은생각이 드네요. 이정도 지능수준이면 아인슈타인보다 똑똑하다는건데 일론머스크 형님도 10년안에는 화성가실수도?
o2는 오데갔누?
코드포스 2700은 미친거 아님?
o3 프로 진짜 100만원가려나 ㅠ
1월말이 기다려집니다ㅋㅋ
o3는 개인용이 아니라 기업용이라서 싸야 몇 백만원대일듯.
님의 말은 O3로 해석해야 알아듣겄네!,,,,
@@bcj5581 고급유머네
와우
특 특 이 점이 왔다
구글한테 밀려서 긴급발표한건가 200달러받는 모델을 2주도 전에 발표해놓고
@@슬로모 그쵸 계획에없던거일듯
openai days 12의 마지막 12일차 피날레라서 공개한겁니다
미친 AI 시대
o2는 건너뛰고 o3?
네이밍을 바로 o3 로 했네요
ㅋㅋㅋㅋ 맨날 벤치마크는 폭발 ...... 실제 써보면 걍 쫌 좋아졌네 ....
질문의 수준이 GPT에게 못 미치는게 아닐까요
전문가나 수준이 높은 질문에 gpt가 더 높은 질의 대답을 해준대요😂😂
이 사람 말이 맞음. 벤치마크로 이렇게 하는게 맞는지 모르겠음. 죄다 벤치마크로도 훈련할텐데. 여기 비꼬는 댓글들 벤치마크 뭔지 찾아서 본 적이라도 있는 사람있음? ㅋㅋㅋ 떠먹여 주는 정보로 뭐 새로운거 못함
@@SsSs-vx1pl 벤치마크라고 하는 것은 일단 모두가 공통적으로 할 수 있는 "verified" 프레임워크입니다. 만약 벤치마크가 없다면 뭘로 이 알고리즘과 성능을 실험할 수 있을까요? 벤치마크가 없다면 이 알고리즘을 사람들이 믿으면서 쓸까요? 벤치마크가 지표가 안된다면 SOTA (State-of-the-art)는 필요가 없겠죠. Nature와 같은 논문들도 Benchmark를 기준으로 테스트한 논문이 많은데 거기 가서도 이거 왜 benchmark로 했냐고 해보시죠. 특히나 LLM 또는 LMM 모델 같은 경우 대규모 모델에다가 RLHF같은 feedback을 통해서 개선을 합니다. 이와 같은 얘기로 chatgpt에게 이건 매우 중요한 정보야 등등의 상세한 정보를 줄수록 더 잘하는것도 사실입니다만.
@@SsSs-vx1pl제대로 써 본적은 있음? 질의 조금만 하면 3일 밤낫 코딩할거 3분이면 뚝딱 해줌 심지어는 아예 내 머리로는 못 만들걸 만들 수 있음
구글과 앤트로픽이 잘하고 있어서 쫄렸나보네