딥씨크 공개한 기술대로 했더니... 30달러로 되더라 | 버클리 박사과정 학생이 증명한 딥씨크 알고리즘, 팩트체크

안될공학 - IT 테크 신기술

มุมมอง 299 201

5 500

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 8 ก.พ. 2025
딥씨크에서 공개한 테크니컬 리포트를 기반으로 버클리 박사과정 학생이 구현한 7B LLM TinyZero는 DeepSeek의 핵심 기능을 30달러로 재현하다는ㄱ ㅓㄹ 보여주는데요. 겉보기엔 저비용이지만, 실제로는 추가적인 비용과 복잡한 학습 과정이 숨어 있을 것으로 보이는데, 30달러라는 수치가 자극적으로 주목받습니다. 재현 개념(proof-of-concept)으로서 딥씨크의 강화학습 방식, 정확히는 DeepSeek-R1-Zero 에서 사용한 리워딩 방식으로 할 시 아하 모멘트 Aha Moment를 확인할 수 있다는 내용인데요.
딥시크 R1 모델 생성 방식을 다시 확인하면서 이러한 발견이 향후 테크 AI 연구개발에 어떤 영향을 미칠지 확인해봅니다.
Written by Error
Edited by Error
unrealtech2021@gmail.comㄷ

ความคิดเห็น • 642

@ALETHES 6 วันที่ผ่านมา ⁺³¹⁶
하수 - 물 들어오고 노를 젓고 항공모함 어쩌고
고수 - 허공에 노를 열심히 젓다보니 양력이 발생해 배틀크루저가 됨
@haim7512 6 วันที่ผ่านมา ⁺⁷
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
@user-shevfixyafrjfg 6 วันที่ผ่านมา ⁺⁹
명상하다 우화등선도 할듯
@aaaxxx5152 6 วันที่ผ่านมา ⁺⁵
ㅋㅋㅋㅋㅋㅋ 정확하다
@DavidLee-mq4fl 6 วันที่ผ่านมา ⁺¹
님 좀 치시네요~ ㅎㅎㅎ
@xaeha5926 6 วันที่ผ่านมา
이거아주미친넘아녀ㅋㅋㅋㅋㅋㅋㅋ
@kimss9988 6 วันที่ผ่านมา ⁺²²¹
명절에도 열심히 노젓다가 병나신 공학님 영상감사합니다
@taptap4734 6 วันที่ผ่านมา ⁺⁶
병나도 올리는 ...
@news_IT-my1610 6 วันที่ผ่านมา ⁺³
감기 에러난 에러
@Wowowow-e2t 6 วันที่ผ่านมา ⁺¹
바이러스 걸렸으면 전에 건강하실 때 백업 해놓은 체력 있으시면 백업하시지
@samkang9080 6 วันที่ผ่านมา ⁺²
@@hunter-2023 공학님은 중국인이 맞는 것같습니다 한국말은 잘 하지만 중국인 특유 발음
중국인이니까 아마도 탄핵을 찬성하겠죠 지금 대한민국에 오직 중국인이나 중국 피가 섞인
사람들 외에는 그러니까 97% 한국인들은 다 탄핵 반대고 윤석열 대통령 빨리 복귀하길 바라죠
@gkim6208 6 วันที่ผ่านมา
ㅌㅌㅋㅋㅋㅋㅋ 어쩌다 이채널에 정치병자들이...ㅜㅜㅜㅋㅋㅋㅋ
@onceuponatwice1 6 วันที่ผ่านมา ⁺²⁷
내가 유튜브 오랫동안 보면서 첨으로 들었다. 내게 "정신차리고 봐라"하는 유튜버를. 그래도 잠시 잠깐 내 정신이 여행가버리는 내용인듯.
@xaeha5926 6 วันที่ผ่านมา ⁺¹
ㄹㅇㅋㅋ
@LovScent 6 วันที่ผ่านมา ⁺⁶⁶
12:03 이건 사람이 아니다 AI 생성 음성이다
@tripleS1-S24 6 วันที่ผ่านมา ⁺¹³¹
아니 이 분 노젓는건 젓는건데, 영상 개수는 늘어났는데 조회수가 평소보다 더 잘 나오는게 ㅋㅋㅋㅋㅋㅋ
@anamnesis9575 6 วันที่ผ่านมา ⁺⁴
물 들어왔자나 ~
@minpeter2 6 วันที่ผ่านมา ⁺¹
조회수 보면 성능 확실하네여 ㅋㅋㅋ
@화양연화-b6p 6 วันที่ผ่านมา ⁺⁸
그래서 지금 노 젓는 걸 멈추지 못해서 감기몸살까지 났잖슴ㅋㅋㅋㅋㅋ
@honeylee7022 6 วันที่ผ่านมา
다들 몇층에 얼마나 쳐물린거여 ㅋㅋ
@joda1223 6 วันที่ผ่านมา ⁺³⁹
수고많으십니다.
@kokingstudio 6 วันที่ผ่านมา ⁺³
매일 이렇게 빠른 Ai정보를 주시다니 정말 레전드입니다.
@shcho1999 5 วันที่ผ่านมา
영상 퀄리티가 장난 아니네요 좋은 정보 감사합니다 ❤❤
@johnsmithkim 6 วันที่ผ่านมา ⁺⁶³
이모든 중심에 논란 을 떠나서 알고리즘 과 설계 를 이해하지 못하면, 절대로 재설계 가 불가능하다. 저 또한 대단한 가능성이다.
@이승준-b7c 4 วันที่ผ่านมา
그걸 가지고 대단하다기엔 ㅋㅋ 그건 개발자면 할 수 있는데
@안습탕면 6 วันที่ผ่านมา ⁺⁴⁸
포브스 선정 2025 누구보다 딥시크에 진심인 유튜버 1위
@user-sq4mwfioe 6 วันที่ผ่านมา ⁺¹⁰¹
융단폭격하시는구나
@김영현-e7z6k 6 วันที่ผ่านมา ⁺²⁹
아니 영상을 얼마나 쏟아내시는거예요 ㅋㅋㅋㅋ
@JOAHAEYO96 5 วันที่ผ่านมา ⁺⁵
중국의 유일한 순기능은 미국의 견제역할이었죠
세상일이라는게 참 재밌네요
그래픽 카드 수급이 제한적이었던 환경때문에 어쩌면 딥시크가 나올 수 있었겠지만
저는 중국 기업이라는 특수성도 한 몫 했다고 생각해요
지금 IT기술의 패권은 미국이 독점하고 있다시피 하니까
중국은 늘 앞지르고 싶어하고 목표는 완전독립을 지향하겠죠
독점 구도는 자연스레 시장을 폐쇄적으로 만들고
자리를 위협할만한 경쟁자의 출현은 새 트렌드를 만들고
그 흐름속에서 엔지니어들이 자신들의 행보를 다시 생각해볼만한 분위기로 환기 되어
또 다른 방향으로 나아지고 있는 모습 정리해주신 영상으로 참 재미있게 봤습니다.
한번에 몰아보면서 이런저런 생각 잡다하게 들면서 즐거웠어요.
@guccigang1269 4 วันที่ผ่านมา
좋은 해설 감사합니다~!
@gt2056 6 วันที่ผ่านมา ⁺⁷⁸
지난 일주일간 여러 영상을 보면서 느낀 것은 분명 중국이 큰 일을
한 것이 맞나 봅니다. 그 점을 인정하지만 결국 우리가 AGI로 가는 초입에 있는
것인데 뭔가 이제 이 산업이 끝났다는 식의 반응이 참 아이러니하네요.
저는 도리어 AGI로 가기 위한 중요한 한 단계의 문이 열린 것 같고 이 산업이
그저 꿈만 창대한 산업이 아니라 진짜라는 생각이 들었는데 말이죠.
하물며 고성능칩이 필요 없어진 것이 아니라 그 성능을 더 제대로 쓸 수
있는 방법이 생겼다고 생각하는데 시장의 반응과 대부분의 의견은
제 생각과 다르네요. 암튼 미래는 알 수 없으니 지켜봐야겠어요~
@gpt_rule_the_world 6 วันที่ผ่านมา ⁺⁶
저도 중국이 올라오는 모습을 보고 미국 빅테크들도 더 분발하겠지 하고 생각했는데 많은 사람들은 생각이 다르더군요.
@hobit-j4o 6 วันที่ผ่านมา ⁺³
agi로 가는길이 닫힌게 맞습니다. 안타깝지만..
까놓고 말해서 openai가 따라잡지 못할 정도로 빠른 속도로 성장했으면 이렇게 따라잡힐 일도 없었을 거잖아요?
다들 '싸게 만들었다', '따라잡았다'에만 집중하고 있는데 실은 '따라잡혔다' 라는 사실이 더 중요해요.
왜 따라잡혔을까요? ai를 빠른 속도로 발전시키는데 실패하고 있기 때문입니다. 그리고 많은 전문가들이 이야기하듯, 딥시크가 혁신적인 방법으로 저비용 ai의 길을 열었다. 라는 주장은 사실이 아니에요. 그러니 열린것은 없고, 닫히고 있다는 사실만 남게 되었습니다.
@웅캉캉-z3y 6 วันที่ผ่านมา ⁺¹
딥시크 때문에... 그간 ai분야 가장 큰 진입 장벽은 비용이였습니다
저비용 추론이 가능해 지면서 미국독점의 ai 발전 생태계에 균형 진행..
앞으로 많은 국가과 기업에서 ai 설비투자 개발에 뛰어 들것.. 수요폭발..
h800 2년전 출시한 다운그레이드 제품.. 이말은 다른업체들도 공급할 기술력이 된다... 엔디비아 독점이 꺠졋고 앞으로 80%육박하는 고마진 정책을 지속할수 없다는거...
@IIIlllIIlllIIII 6 วันที่ผ่านมา ⁺⁶
@@hobit-j4o중국이 ai에 투자하고 연구하는 규모도 고려해보셔야죠ㅎㅎ
어떻게 따라 잡았나?도 생각해보아야 합니다.
agi는 닫힐 수가 없어요 agi를 갖고 활성화 시키는 국가가 차세대 권력을 손에 쥐게 되는데요.. 핵개발과 과열과 ai가 비교되는 이유가 다 있겠죠ㅎ
@링2푸1 6 วันที่ผ่านมา ⁺²³
@@hobit-j4o 참 문과스러운 글이네요. 너무 정보 함량이 미달된 글이라 안타까울정도임
@JaKe-pm8tu 5 วันที่ผ่านมา
진짜 이 영상 올리시고 쓰러지셨나봐요. 건강하게 돌아오세욥!!
@HNKingfisher 6 วันที่ผ่านมา ⁺³⁴
밥먹고 오면 또 새 동영상이 올라와 있는 무서운 채널 ㄷㄷ
@youknowchoi8758 4 วันที่ผ่านมา
이 양반 연구 진짜 많이 하셨네...칭찬합니다...
@fexit-k7f 6 วันที่ผ่านมา ⁺⁶³
뭐지 계속올라오네요 ㅋㅋㅋㅋ
@hunter-2023 6 วันที่ผ่านมา
뭔가 이사람 중국인이거나 조선족인가?
@LinksArc 6 วันที่ผ่านมา ⁺²⁵
건강보다는 유튜브가 중요합니다. 조금 더 최선을 다하십시오.
@BBB-yn8wu 6 วันที่ผ่านมา ⁺¹
ㅎㅎㅎㅎㅎ 나쁜구독자들
@An철수-d9m 6 วันที่ผ่านมา
왜 나빠? 건강보단 영상이 우선이지? 1+1=2아냐?
@kimss9988 6 วันที่ผ่านมา ⁺⁵⁸
영상은 열심히 보는데 3분넘어가면 무슨말인지 모르는 1인 그래도 열심히 봅니다
@sgani-x3t 6 วันที่ผ่านมา ⁺¹
추천합니다.
@달러중독 6 วันที่ผ่านมา ⁺²
댓글보면 그나마 이해하는데 도움이 되더라고요
@낭만바다-h8y 6 วันที่ผ่านมา ⁺¹
난 1분
@구르미설 6 วันที่ผ่านมา ⁺¹⁴
ㅋㅋㅋㅋㅋㅋㅋ 아니 영상이 계속 올라와요ㅋㅋㅋㅋ
@야옹씨님 6 วันที่ผ่านมา ⁺²
큰 도움이 되었네요 😂
@acekwang 6 วันที่ผ่านมา ⁺⁴
갈수록 보는 재마가 늘어나네 ㅋㅋ
@austinclassjasontv9115 6 วันที่ผ่านมา ⁺⁴
확실히 딮씩은 잔잔한 호수에 돌을 던짐
@대나무숲-h3x 6 วันที่ผ่านมา ⁺¹³⁸
대한민국의 마지막기회다 부동산으로 망해가는 대한민국에 정말 마지막기회 제발 정부든 기업이든 오픈된 이 모델을이용해 최소한 예전의 패스트트랙전략처럼 따라가야한다 이미 AI분야에서 처참한수준인데 제발 이걸리용해서 조금이라도 날아보자
@ssems09 6 วันที่ผ่านมา ⁺⁷
부동산으로 망해가긴,
보는 바와 같이 기술격차 + 가격경쟁력 때문에 밀리는거지.
부동산 가스라이팅을 너무 많이 당했어
@ubuntu-hj5yi 6 วันที่ผ่านมา ⁺⁴
부산은 인구절벽에 있던 회사도 쫓아내고 아파트 수출할 기세인데 머
마지막 기회라고 생각하지말고 달러 바꿔서 미국에 투자해라
@sodll 6 วันที่ผ่านมา ⁺¹³
@@ssems09부동산때문은 아니지만 과정은 맞음. 내수박살 은행만 돈많이버는거. 주식시장 ㅈ망..(분할 주환원0 등)> 부동산만 투자원> 내수망함 저출산 노후자영업 똥꼬쇼 빈부격차 심해지고 그저 공부공부 학력주의 임금격차 하청구조 등 다 맞물리는거임
@행복하고싶어-y6u 6 วันที่ผ่านมา ⁺⁴⁰
@@ssems09 저기요 국내 자산 80퍼센트가 부동산에 묶인 상황입니다. 외국인 기술혁신, 기업에 투자하는데 한국은 부동산 살리려고 돈 쏟아부으면서 골든타임을 놓친 겁니다. 나라를 진심으로 생각한다면 그런 발언은 삼가셔야 합니다
@MrSeungseung 6 วันที่ผ่านมา ⁺¹
핵심은 정부든 기업이든 오픈된 이 모델을 이용해 최소한 예전의 패스트트랙 전략처럼 따라가도 돈은 커녕 밥도 못 먹여줌.
@cueole 6 วันที่ผ่านมา ⁺³⁰
중국이 대단한 이유는 가성비를 떠나 이런 논쟁거리를 만들수 있다는 것이 대단한거고 이것이 그들의 기술력이자 국력임~ 한국은 지금 철저하게 배제되고 있는것이 우리가 처한 현실이라 안타깝기 그지없는 상황임~
@user-guest1234 6 วันที่ผ่านมา
어차피 인구소멸로 망할 거..이래 망하나 저래 망하나 ㅎㅎ
@코끼리아저씨-p8u 6 วันที่ผ่านมา
@@user-guest1234살리보자 자스가
@PRAHADAM 6 วันที่ผ่านมา
현제 ai 인력의 대부분이 중국 사람들이 많다보니 좋은 인력이 큰일을 햇나보네요 우리나라도 좋은 모습 보이길...
@user-guest1234 6 วันที่ผ่านมา ⁺³
@@PRAHADAM 공학 계열은 수익성이 낮다는 인식이 널리 퍼져 있어, 우수한 인재들이 의학이나 법학 등 다른 분야로 빠져나가서 한국의 미래는 포기하는게 빠름 ㅎㅎ
@그래요-t6o 6 วันที่ผ่านมา
@@user-guest1234
우리의 주적은? 어디?
@user-gf6mr3dy5k 6 วันที่ผ่านมา ⁺¹
연휴내내 고생하셨습니다. 감사합니다
@anker-b9t 6 วันที่ผ่านมา ⁺¹
감사합니다❤
@enslow 6 วันที่ผ่านมา ⁺³
아하!
즉, 낼 검은 월요일이 될 가능성이 높아보이네요...
@SeopToT 6 วันที่ผ่านมา ⁺³
딥씨크 코리아 히어로...
@mowriow 5 วันที่ผ่านมา
이 정도로 영상을 올리시다니
안될공학은 이미 AI라는 게 학계의 정설
@ccc-jh6my 6 วันที่ผ่านมา ⁺⁶
12:04 여기 저만 미친듯이 빨리 말하나요? ㅋㅋㅋ
@MHS크립토채널 6 วันที่ผ่านมา ⁺⁴
엄청난 컨테츠 제작입니다 ai급이네요 ㅎㅎ
@TastyPrism 6 วันที่ผ่านมา ⁺¹⁸
하여간 한국 유튜브 댓글들은 한번 노젓는다 드립치면 좋아요 한번눌러 주면 될걸 ..
하나 하나 똑같은 댓글만 달린다네.
내용에 관련된 댓글은 찾을 수가 없네
@robeliauri 6 วันที่ผ่านมา ⁺⁸
수고하셨습니다. 어떻게 보면 기술적인 부분에서 우리가 무지한 부분이 있는게 확실합니다. 저런 언론과 기사들은 당연히 그 주식 시장을 흔들기 위해서 건드리기 위해서 자극적인 언어를 사용하기 마련이고 그러다 보니까 당연히 모르는 사람들은 아 이제 엔비디아가 끝났구나라고 생각할 수도 있는데 거죠. 정확한 판단을 할 수 있게 도와주시는 이런 영상 정말 좋습니다. 이렇게 자세하게 알려주시는 게 정말 많은 사람들이 알았으면 좋겠습니다. 정말 좋은 영상이라고 생각합니다
@p4rk5h 5 วันที่ผ่านมา ⁺³
솔직히 말하면 왜 떨어지는 지 모르겠음. 이번 CES 에서 fp4 지원 추가할 정도로 은근 Edge Inference 되게 신경 많이 쓰는거 NVIDIA 가 많이 보여줬는데
기존에는 리소스 제한때문에 LLM에 오버레이 좀 올려서 튜닝 하는 수준이었다면 이젠 CoT 모델을 회사 내부용으로 학습 시켜서 사용할 수 있다는 건데, 어떻게 보면 회사들에서 훨씬 Cost-Effective 하게 더욱 정확한 셀프호스트된 모델을 쓸 수 있게 된거임 (리소스도 적게드니까 로컬에서 돌릴만 할꺼고), API로 갖다 쓰는게 아니니까 외부로 아예 안나가서 보안적으로도 훨씬 안전하고. 이제 대기업들이 로컬로 구축해서 쓰는 경우들이 훨씬 많아질텐데...
회사들 입장에서는 OpenAI 에서 API 로 갖다 쓰는게 아니라 내부에 AI 툴을 구축하는 방향으로 들어갈텐데, 그럼 NVIDIA GPU나 기타 AI 가속기들은 더 팔리겠지;;; (한곳에서 대량 발주하는 대신, 많은 곳에서 좀 적게 발주하는 식으로... 어찌됐든 여태껏 "성능 좋은 모델" 을 (구축하자니 너무 비싸서) "로컬에서 못돌림" 이라는게 요즘 LLM의 문제였으니까)
이거로 진짜 피볼곳은 사실 OpenAI 얘 하나고 (비슷한 식으로 개발하는 xAI 도 타격 꽤 있을 듯), Meta나 Google은 예전부터 공개적으로 개발했었으니까 (Gemini 도 모델 공개고, LLaMa 는 애초에 저기 페이퍼 보니까 기반으로 쓴거고)
이거 보니까 Meta 가 CoCoNUT 발표한다고 한거에 이거 융합되면 진짜 장난 아닐 듯, 그리고 어짜피 deepseek-r1 이 "공개" 리서치로 나온이상 저거 팔로우업으로 이제 논문들 왕창 나올텐데, 개인적으로는 OpenAI 가 여태껏 사명이랑은 쌩판 다르게 숨겨놓고 개발하던걸 끄집어 낸거 같아서 deepseek 쪽에는 박수 쳐주고 싶긴 함. 예전 GPT-2 때 처럼 까놓고 개발해라;;;
이슈가 됐던건 OpenAI가 여태껏 리서치 방향이 "파라미터 뻥튀기" 로 성능 올리는 거 였었으니까, 이번꺼로 좀 치명타긴 할 듯
@ckshim4964 6 วันที่ผ่านมา ⁺¹
최고의 두뇌를 누가 만드느냐 이 걸 어디에쓰느냐 따질틈도없이
@케플러-o5p 6 วันที่ผ่านมา ⁺³⁷
이거 매번 양자역학때 나온것처럼 게임도 내가 보는 영역만 계산하고 내가 안보는 영역은 계산을 안하는 그런거 아닌가요? 굳이 쓸데없이 전체를 계산하는게 아니라 내가 원하는 걸 한정적으로 계산하는거죠.
@richardphillipsfeynman8851 6 วันที่ผ่านมา
양자역학?
@kh_kim777 6 วันที่ผ่านมา ⁺²
관측하지 않으면 존재하지 않는것이다
@슈퍼에서빠는팡-r7h 6 วันที่ผ่านมา ⁺¹⁰
음 그런 방식을 일부 신경망에서 사용하기는 하는데 님이 말한 방식대로 하려면 어떤 작업을 할때 어느 영역이 필수적으로 쓰이는지를 알아야함 근데 알다싶이 파라미터가 670B...사실상 힘들지 않을까 싶음
@꼴등항해사 6 วันที่ผ่านมา ⁺⁷
문과친구들 이해시킬려고 "본다"라고 설명하는데 그 눈으로 보는게 아닙니다. 그럼 장님들은 다른 세상을 살겠죠?
@kulkul-h8b 6 วันที่ผ่านมา ⁺³
맞습니다. 그런데 어느 분야든 초기 영역은 시간, 돈, 인력이 갈려나가죠. 이 세상 어떤 것이든 기본 데이터 베이스 없이는 발전할 수가 없죠. 딥식은 엄청난 비용과 시간이 투입된 남의 것을 그냥 허락없이 쓱 가져다 쓰고 그 비용을 전혀 넣지 않는 건데 일반인들은 그냥 선전문구에 홀려서 레밍떼처럼 이리저리 몰려 다니며 개소리나 씨부리면서 세상을 어지럽히죠. 모르면 가만히 있을 줄 아는 지혜라도 있어야 하는데.
@duk6046 5 วันที่ผ่านมา ⁺²
SW의 중요성이 또... 강대국과 중대국?의 차이는 결국 SW에서 벌어지는듯 HW는 그냥 사면 그만인데
@adamas7491 6 วันที่ผ่านมา ⁺⁴
건강을 제물로 영상을 연성하고 계셨군요 ㅋㅋㅋㅋㅋㅋ
영상이 빨리 쏟아지는 이유가 있었어
@haemil-zx5gv 6 วันที่ผ่านมา
등가교환
@브레인메이커 6 วันที่ผ่านมา ⁺²
안될공학 왜 도대체 왜 100만 안넘는지 이해 안가는 1인
@user-humanity2 6 วันที่ผ่านมา ⁺⁵
8:45 ㅋㅋㅋㅋ 대학원생이거든요. 자연스럽게 30달러 책정할 때 자기 인건비는 생각도 못했을걸욬ㅋㅋㅋㅋㅋ😂
@Wonderful.Writing 6 วันที่ผ่านมา ⁺⁷¹
물들어올때 노젓다가 태평양 건너가신 에러형님🎉
@noisecan 6 วันที่ผ่านมา ⁺¹
잘 듣고 있습니다. 감기 잘 나으세요. 감사합니다.
@알리오올리오-c9h 6 วันที่ผ่านมา ⁺²
보상을 확실하게 주면 줄수록 성능이 올라간다고 하셨는데 편향은 신경 안써도 되는 수준인가요?
충분한 성능에 도달했을때 일반화도 만족하니까 딥씨크가 완성된거긴 할텐데
@kkw2401 6 วันที่ผ่านมา
편향 때문에 r1제로를 베이스로 안 쓰고 합성데이터만 뽑아서 sft로 r1만든거 아닌가요? 어쩌면 r1제로가 하나가 아닐 수도 있겠다는 생각이 드네요. v3 아키텍쳐야 어차피 moe니까 특정 도메인"들"로 편향된 r1제로 여러 모델을 뽑아서 고품질 합성데이터 세트를 만들고 sft로 r1을 만들면 여러 분야에서 뛰어난 추론 모델이 나오는건데
@슈퍼리치-w4i 6 วันที่ผ่านมา ⁺¹⁷
그렇게 허접햇으면 미국이 저리 긴장할리가 ..오픈ai도 난리낫던데 무료로 오픈한다던데
@정명호-q1t 6 วันที่ผ่านมา ⁺³
인텔 스케일러블 골드서버에서 2.22bit 양자화 1.92토큰/초 로 돌리는데 성공을 해서
에픽서버 구매를 심히 고민중인 시점입니다... 저는 모델 가중치를 공개한게 미친거라고 생각합니다.
@답십리똥식이-h9e 6 วันที่ผ่านมา
님 뭐라는거에요???
@정명호-q1t 6 วันที่ผ่านมา ⁺⁷
@@답십리똥식이-h9e 딥식을그래픽카드없이 cpu로만 구동했고 컴퓨터 한대 맞출까 고민이고
이걸 오픈소스로 풀어버려서 개인컴퓨터에서 돌릴수 있게 만든게 개쩐다는겁니다.
@youngjoomoon847 6 วันที่ผ่านมา ⁺¹
미친게 아니고
인류를 위한 거인의 한 발
@답십리똥식이-h9e 4 วันที่ผ่านมา
@ 대단하시단말을 장난으로 한거임 ㄷㄷㄷ
@jasonsalomon5854 6 วันที่ผ่านมา ⁺¹
너무 고맙습니다. 열심히 노져으셔서, 구독-좋아요 했습니다.
@syncearth 6 วันที่ผ่านมา ⁺²
공학쪽은 잘 모르고 단어도 낯설지만, 열심히 영상 챙겨보고 있습니다. 감사합니다.
@kws6710 6 วันที่ผ่านมา ⁺¹⁷
딥씨크감탄...최근 커제의 결승불복 문제로 논란 .. 이를 중국 바이두가 딥씨크에 질문한 결과를 가사화했는데 내용이 어지간한 기자분석보다 훌륭하고 객관적임...진짜 기술력무섭다는 것 인정..김성룡바둑에 가면 관련내용 참조
@saveyou21 6 วันที่ผ่านมา ⁺⁴³
우리 뱃사공 에러 ㅋㅋㅋ 화이팅입니다 ㅋㅋ 최고의 정보 항상 감사해요 ㅋㅋ 에해라 디어 노를 저어라 ㅋㅋ
@unrealtech 6 วันที่ผ่านมา ⁺⁵
영차영차 ㅋㅋㅋ
@thekkyoung 5 วันที่ผ่านมา
시청자한테 "정신 차리고 보라"고 하는 안될공학ㅋㅋㅋㅋ
@dlfmatjd9940 5 วันที่ผ่านมา ⁺³
딥시크의 기술이 다 공개된 건 아니지만 공개된 기술에 기반하여
부분적인 재현이 가능했다는 게
영상 내용 같은데요.
사람들이 궁금한 건
딥시크가 어떤 기술적인 혁신을
했길래 저비용으로 챗 쥐피티보다
나은 성능이 나온 거냐는 거죠.
@rucaru3039 5 วันที่ผ่านมา ⁺³
그 내용을 처음부터 지금까지 영상 몇개씩 올라왔는데도 이해 못 할 내용이면 그냥 이해 안하시는게 맞지 않을까요?
@Factchks 3 วันที่ผ่านมา
챗지피티 데이터 증류
@seungchuljung6354 6 วันที่ผ่านมา ⁺²
감사합니다. 짧은 목소리가 인상적이네요.
@Mintcherry79 5 วันที่ผ่านมา ⁺¹
deepseek가 이번에 좋은 알고리즘을 고안하고 그걸 또 모두에게 다 공개한건 맞을텐데 세상이 너무 정치경제적으로 접근하는거 같은 느낌입니다.
물론 그 덕분에 deepseek가 유명해 진거 같지만...
ai를 발전 시키는 좋은 알고리즘은 이번에 deepseek에서만 특별하게 나온게 아니라 그동안 계속 나왔던 것일텐데 말이죠.
@김백차 6 วันที่ผ่านมา ⁺¹
딥시크가 에러님 이름값 제대로 하게 만들었네요 ㅋㅋㅋㅋㅋㅋㅋㅋ
@손정호-t4d 6 วันที่ผ่านมา ⁺³
설명을 들으니 완벽하게 이해했습니다. 이건 절대 알려고하면 안되는영역이란것을..
@terminslator 6 วันที่ผ่านมา ⁺¹
공감합니다 ㅎㅎㅎ
@캬캬켜켜켜캬캬 6 วันที่ผ่านมา ⁺¹³
h100쓴 애들이 강화학습하면 더 개쩔어지는 거아님 결국?
@박달나무-u4o 6 วันที่ผ่านมา ⁺⁸
용도에 따라서 그런 고성능 하드웨어가 필요 없는것도 있어요.
@rothsshvili5125 6 วันที่ผ่านมา ⁺⁶
소프트웨어적으로 최적화 안시키면 하드웨어만 무한 증설은 위험
@Lucas-gz8sy 6 วันที่ผ่านมา ⁺⁴
목표 서비스의 스펙이 있는데 그걸 초과하는 하드웨어를 넣으면 자원이 남아돌아요. 비용 최적화가 안됨
@천개오공 6 วันที่ผ่านมา
더 개쩔어질텐데 자본이 무한대가 아니니까…
@이현종-n9k 6 วันที่ผ่านมา
같은 게임 앱도 최적화 되기 전엔 렉이 있다가 최적화 되면 사라짐.
딥씨크는 기존에 연구용으로 개발되던 것들을 양산화를 위해 최적화 과정을 거친 산물로 보임.
@DavidKim-iu2sw 6 วันที่ผ่านมา
물들어올 때 보트에 모다 2개로 돌리고 질주하시다 병나셨지만 와병 와중에도 모다돌리시는 공학님.
@JJ-mr2iw 6 วันที่ผ่านมา ⁺¹
에드워드 스노든도
제품대비 가격이 비싸다고 얘기하네요
트위터에 올라옴
@akk.fuller 6 วันที่ผ่านมา
정신이 혼미해질때쯤 딱 정신똑바로 차리라고 하시네
@levanterlee5945 6 วันที่ผ่านมา
딥씨크도 궁금하지만 관련 영상을 몇 개나 그리고 올리는 주기가 더 궁금해졌습니다..
@jason_cha 6 วันที่ผ่านมา ⁺²
12:03 네? 뭐라고요?
@블루밍-l4g 6 วันที่ผ่านมา ⁺¹
이제 점점 발전될수록 비싼황회장 ㅋㅋㅋ 서버모델살필요가 미래가 없다는건 맞다고봄
@jaemanlee6434 4 วันที่ผ่านมา
안녕하세요! 안될공학님 영상 잘 보고 있습니다.
항상 양질의 정보를 요약하고 정리해서 영상 만들어 주셔서 감사합니다.😍
다만 영어 채널 언급을 하셔서 공부할 겸 보려고 들어가봤는데..
AI 사용하신거죠?? 영어가 조금 듣기 불편한 것 같습니다.. ㅠㅠ 외국인 분들도 같은 지적이 있으신 것 같구요
무엇보다 조금 빠른 느낌에 단어나 문장 사이사이에 가끔 충분히 쉬지 않는 부분이 특히 이질감이 드는 것 같습니다
이부분 개선되면 정말 좋을 것 같아요!
@heechanlee6589 6 วันที่ผ่านมา ⁺¹
노를 젓는게 아니라 고속정 모터 5개를 달고 미친듯이 바다를 나아가는거 같은데??
@세세-j5n 6 วันที่ผ่านมา ⁺⁶
오선의 증시에서 여길 추천해주시더라구요ㅋㅋㅋㅋ 더 몰려와랏
@lightinmind 6 วันที่ผ่านมา ⁺¹
흐암… 딥시크가 장난없이 저비용인건 가능한 듯
@브라록스 6 วันที่ผ่านมา ⁺⁴
진짜 열일하시네요 ㅎㄷㄷㄷㄷ
@Nano-pk9hm 6 วันที่ผ่านมา ⁺²
훈련 자체는 어렵지 않다는 거지 뭐.
서비스 비용이 엄청 큼
@아재아재봐라 5 วันที่ผ่านมา
감사합니다
@user-minggi 6 วันที่ผ่านมา
이정도면 '노'가 아니고 제트엔진 아닌가요 ㅋㅋㅋ
@베리써니 6 วันที่ผ่านมา
에러님, ai한테 어떻게 인센티브 주나요?
제가 너무 일반이니라 무식한 질문인지 모르지만, 요즘은 고교 영어 모의고사 지문에 ai 관련된것들이 많이 등장해요.
기술적인 디테일은 몰라도 큰틀을 알아두면 도움이 되더라구요.
연휴동안 잘 못 알아듣는 와중에 즐겼습니다. 감사해요.
@anamnesis9575 6 วันที่ผ่านมา
강화학습 관련내용 찾아보면 궁금한 부분 해결하실 수 있을겁니다.
인센티브를 주는게 베네핏을 주는게 아니라 확률 기반 강화학습에서 특정 결정에 대한 가중치를 보강하는 부분으로 생각하면 좋습니다 ~
@미노-h5o 4 วันที่ผ่านมา
⁠@@kkw2401 강화학습을 잘못 아신것 같습니다
@아아아어-e6t 3 วันที่ผ่านมา
그냥 숫자 장난입니다. 잘 했네, 90점 줄게, 점수가 계속 높아지게 하는 방향으로 내부 계산과정에 사용되는 수십수백 미지수(x)를 계속 조정하는거임. 이번에 90점이야? 그럼 다음에 더 잘해오면 100점 줄게. 이게 보상임니다. 컴퓨터한테는 그냥 전보다 커진 숫자일 뿐이에요, 인간 이해측면에서 보상이라는 의미지, 수치적인 최적화입니다.
@一妄一語 6 วันที่ผ่านมา ⁺⁷
볼 수록 인간두뇌와 ai 구조는 다르지 않구나 싶음.
@Ima184mm 5 วันที่ผ่านมา
우리도 AI 손놓고 있을수는 없는데.
Ai 개발하는데 제일 많이 사용하는 언어가 파이썬이라고 들었는데 사실인가요?
@조현우-y1z 6 วันที่ผ่านมา ⁺⁴
형님 요즘 노젓는 왕팔뚝 안보여줘서 섭섭합니다. 얼른 쾌차하시고 득근하십쇼.
@WestWood_M 3 วันที่ผ่านมา
헐.. 아하..!! ㅋㅋㅋㅋㅋㅋ
@user-ck1mq4id3h 6 วันที่ผ่านมา
아 이채널 안될과학이 아니었구나 맨날 tv 로 틀다보니 몰랐네
@makealpha1 6 วันที่ผ่านมา
웹서핑중에 색칠하는거 무슨앱쓰신건가요??
@고래등-m7t 6 วันที่ผ่านมา ⁺⁷
드디어 노가 부셔졌습니다
@abcxxzhhvb 6 วันที่ผ่านมา ⁺⁷
좋다는 소리구나. amd도 잘되겟네0
@독기-e9p 6 วันที่ผ่านมา
왜 그런건가요?
@koonsickgreen6272 5 วันที่ผ่านมา
우리나라 Upstage 같은 작은 회사도 기회를 잡을 수 있지 않을까 합니다. 관계자 아님ㅋㅋ
@정태영-b1x 6 วันที่ผ่านมา
인간의 호기심, 탐구욕을 병 따위가 이길 수 없지 ㅋㅋㅋㅋ
@cedriverallen 6 วันที่ผ่านมา ⁺¹
안될공학님 딥씨크 소개 10편 이상 하다 , AI 모델 개발 CEO 되는거 아닌가요? 개나소나 다 하는데 못할거 없다 생각합니다.
될까? 의심하지 말고 해 보면 "되더라" ....
@dotbutter 6 วันที่ผ่านมา ⁺¹
Ai너무조아요 공부하면서 영상만들어올리고있어요
@유승훈-y4n 6 วันที่ผ่านมา ⁺¹
딥식이계의 로윙머신
@Reviewbot012 5 วันที่ผ่านมา
이분 딥시크 되신건가요
@2023MooHyeon 5 วันที่ผ่านมา
물 들어올때 노저어서 파나마 운하를 지나는 유투버
@MonxMad 6 วันที่ผ่านมา ⁺¹
에러님 영상을 보면얼마나 AI 진화하는느껴지네요
@ncttpihiy 6 วันที่ผ่านมา ⁺¹
chatGPT한테 물어보고 한 거 아님?
@tsarbomba4582 6 วันที่ผ่านมา
딥시크라는 메기가 나오니까 코파일럿도 딥씽크가 나와 성능이 좋아져서 이제 좀 만족스럽게 대답 해 주다라구요
@박무재-t2q 6 วันที่ผ่านมา
Kia 설명 보쏘~ 쫀득쫀득하네요
@mink849 6 วันที่ผ่านมา ⁺²
발음이 신기하시네 한국분이 아니신가
@jh-vj1vn 6 วันที่ผ่านมา
이분 엔비디아 인버스 두배짜리 사셨나요?
@JeongJaeWoo 6 วันที่ผ่านมา ⁺³
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
# 1. 기본 언어 모델 로드
model = AutoModelForCausalLM.from_pretrained("gpt2") # 예시로 GPT-2 사용
tokenizer = AutoTokenizer.from_pretrained("gpt2")
# 2. 간단한 프롬프트 템플릿
def create_prompt(instruction):
return f"Instruction: {instruction}
Response:"
# 3. 보상 함수 (예: 숫자 연산의 정확성)
def reward_function(output, target):
# 실제 구현은 더 복잡할 수 있음
return 1 if output == target else 0
# 4. 학습 루프
def train_model(model, tokenizer, num_episodes=1000):
optimizer = torch.optim.Adam(model.parameters(), lr=1e-5)

for episode in range(num_episodes):
# 카운트다운 게임 예시
instruction = "Count down from 5 to 1."
prompt = create_prompt(instruction)

input_ids = tokenizer.encode(prompt, return_tensors="pt")
output = model.generate(input_ids, max_length=50)

generated_text = tokenizer.decode(output[0])
reward = reward_function(generated_text, "5 4 3 2 1")

# 강화 학습 업데이트
loss = -reward # 간단한 정책 경사 방법
loss.backward()
optimizer.step()
optimizer.zero_grad()

if episode % 100 == 0:
print(f"Episode {episode}, Reward: {reward}")
# 5. 모델 훈련
train_model(model, tokenizer)
# 학습된 모델 사용
def use_model(instruction):
prompt = create_prompt(instruction)
input_ids = tokenizer.encode(prompt, return_tensors="pt")
output = model.generate(input_ids, max_length=100)
return tokenizer.decode(output[0])
# 테스트
print(use_model("Count down from 10 to 1."))
@Keepheap 6 วันที่ผ่านมา ⁺⁸
형 연휴 만에 제 알고리즘의 1순위가 되어버리셨어요 ㅋㅋㅋㅋ
좋은데... 몸은 관리 하시면서 해주세요... 🫡
필요한 소식들 시간 아껴주셔서 항상 감사합니다.
@haim7512 6 วันที่ผ่านมา
미국은 기술 천천히 푸는것 같은데 중국이 그냥 질러 버렸네 ㅋㅋㅋ
@ston.k444 6 วันที่ผ่านมา
공학도가 몸으로 노를 저으려 했던게 잘못이다.
기계를 만들어서 노를 저어야한다.
@iminiz 6 วันที่ผ่านมา
음성이 좀 빠르고 끊기는 것 같아요
@sebeom9866 6 วันที่ผ่านมา ⁺¹
자비스 가능한건가요?

ต่อไป

เล่นอัตโนมัติ

딥씨크 개발, NVIDIA CUDA 해자가 무너진다…? 딥시크 AI 퀀트 엔지니어들이 선택한 CUDA 우회 개발의 의미 | PTX