NVIDIA H100의 20배 성능... Cerebras의 세계에서 가장 빠른 AI 추론기 등장 | On-Chip 메모리와 웨이퍼 기반 칩 설계 의미

แชร์
ฝัง
  • เผยแพร่เมื่อ 13 ก.ย. 2024
  • 웨이퍼를 통째로 칩으로 만드는 Cerebras에서 Wafer Scale Engine-3 (WSE-3) 기반의 AI 추론 시스템을 발표하고 클라우드 서비스까지 지원합니다. 제가 직접 테스트해보니 토큰 기준으로 초당 1800토큰이 넘는데요. 실상 세계에서 가장 빠른 AI 추론기가 맞습니다. HBM이 없이도 훨씬 더 높은 대역폭을 가지는 건 Wafer에 On-Chip Memory인 SRAM을 44GB나 실은 덕분인데요. Cerebras가 추구하는 방향과 설계 구조의 의미, 앞으로 AI 시장에서의 헤게모니 싸움에 대해 정리하였습니다.
    #웨이퍼 #AI칩 #Cerebras
    Written by Error
    Edited by 이진이
    unrealtech2021@gmail.com

ความคิดเห็น • 376

  • @칼융-t4v
    @칼융-t4v 15 วันที่ผ่านมา +25

    요약
    1.웨이퍼 한 장에 sram과 cpu가 통합되어 있는 구조라서 처리속도가 넘사벽
    2.통짜로 웨이퍼 한 장을 써야 되서 수율문제, 비용문제, 발열문제, 전력소비 과다 문제가 발생
    3.그럼에도 자본이 충분히 공급될 상황이 갖춰지면 언젠가는 대세가 될 가능성이 있다
    개인적인 생각이지만 이게 미래에 대세가 될 가능성이 있다면 현시점 자본력과 기술력이 넘사벽인 엔비디아에서도 연구 개발 하지 않을까?

  • @이루릴
    @이루릴 15 วันที่ผ่านมา +15

    뭐든 첨에는 폄하받더라도 가능성을 제시해준다는 것만으로도 의미가 있죠. HBM도 처음에는 비현실적이라고 무시받았지만 결국 성공했듯이...
    시장에서 약간 우습게(?) 보던 Cerebras, Groq, Graphcore 같은 독자적인 칩 개발사들을 다시 보게 되는 부분이 있네요.
    짐켈러의 tenstorrent도 놀라운 것을 보여줄 수 있을지 기대가 됩니다.
    그리고 엔비디아가 AI학습영역에서는 왕이었지만 중장기적으로 AI추론 영역도 지배하려고 진짜 열심히 노력하고 있는데...
    현실적으로 추론 시장에서만큼은 쉽지 않겠다는 부분을 다시 한번 느끼게 되네요.

  • @martinahn9092
    @martinahn9092 15 วันที่ผ่านมา +21

    감사합니다.
    오늘 낮에 시스코 이야기를 했는데 ... ㅎㅎㅎ
    NVIDIA는 시스코와 다르다고 했는데 불과 몇시간만에 생각이 바뀔수 있다니 ..... 세상이 참 빠르네요!

    • @user-dz5yb4wj8
      @user-dz5yb4wj8 12 วันที่ผ่านมา +1

      웨이퍼는 효율이 안좋음 안쓰는 이유가있는거임 부품하나 망가지면 통채로 갈아야함

    • @kimbrandon3083
      @kimbrandon3083 5 วันที่ผ่านมา

      @@user-dz5yb4wj8 효율이 20배나 차이가 날까요? 한마디로 지금 쓰던 시스템 부품 교체 20번 하는거보다 싸다고 하면? 수율은 올리면 되고 그리돼면 메모리 반도체칩은 사장될겁니다

    • @user-dz5yb4wj8
      @user-dz5yb4wj8 5 วันที่ผ่านมา +1

      @@kimbrandon3083 웨이퍼에 하는건 이미 10년 전부터 있던거임 안쓰는 이유는 현실에서 못쓰기때문임 사이버 탁상론자들이나 좋다고 하는거임 현장을 조또 모르고 하는소리임

    • @user-dz5yb4wj8
      @user-dz5yb4wj8 5 วันที่ผ่านมา

      @@kimbrandon3083 개 뼈다구같은 소리하지마셈 이거에 혹하는것 자체가 이쪽 관련자는 아니라는건데 저딴 50년후에나 가능할 제품을 믿는거부터가 멍청한거임 사이버세상에서 유튜브 어디 주서듣고 허무맹랑한 말같지도않은 소리에 선동당하는것 자체가 존나 멍청함

  • @starlightt20
    @starlightt20 16 วันที่ผ่านมา +152

    웨이퍼단위면 가성비랑 수율이 나오나...불량하나생기면 그비싼 웨이퍼 통채로 날라가네. 게다가s램이라니

    • @gregory000
      @gregory000 16 วันที่ผ่านมา +9

      S램이 미래다 비싸고 좋지 그리고 5nm 면 수율 됨

    • @dtdtst
      @dtdtst 16 วันที่ผ่านมา +13

      Hbm도 수율이 문제임

    • @user-gu8yp1ww1s
      @user-gu8yp1ww1s 15 วันที่ผ่านมา +7

      웨이퍼 하나의 면적에 SRAM 다 때려박는게 핵심이니까

    • @JinWonLee
      @JinWonLee 15 วันที่ผ่านมา +19

      @@gregory000 5나노면 수율 된다구요? ㅋ 웨이퍼 하나가 통째로 다 살아야 되는데...

    • @realdennis79
      @realdennis79 15 วันที่ผ่านมา +13

      수율이 불량이 있는 부분을 감안해서 redundant 로 설계함. 잊고 있었는 회사였는데 AI로 나오네요.

  • @junghoonlee890
    @junghoonlee890 15 วันที่ผ่านมา +10

    오늘 정보 너무 좋아요. 굿굿

  • @이경민-d9v
    @이경민-d9v 16 วันที่ผ่านมา +10

    Hbm은 주문제작생산이고 지금은 매진이라서 안쓰는게 아니라 못쓰는거죠.

  • @user-hc3sc5mv7q
    @user-hc3sc5mv7q 15 วันที่ผ่านมา +9

    ARM 코어나 GPU 둘다 원래는 다른 용도였는데, 지금은 x86을 대체, 압도하고 있는것처럼 SRAM도 지금의 캐시 수준에서 벗어나서 DRAM과 위상을 역전시킬수있을까요. 궁금하네요

    • @user-gu8yp1ww1s
      @user-gu8yp1ww1s 12 วันที่ผ่านมา +3

      GPU는 애초에 병렬 연산용이고 ARM은 임베디드용 프로세서의 한계를 극복하지 못했듯이 SRAM도 구조적 한계로 절대 대체 못할듯

  • @user-yw2vl2bj4g
    @user-yw2vl2bj4g 16 วันที่ผ่านมา +30

    진짜 진정한 SOC로다....ㄷㄷㄷ😮😮😮

  • @please-wake-up-now
    @please-wake-up-now 15 วันที่ผ่านมา +1

    와, 세상이 정말 빠르게 변하네요! 😲 웨이퍼 기반 기술은 진짜 새로운 패러다임이 올 것 같아요. 수율 문제만 잘 해결하면 대박일 듯! 이 기술이 AI의 미래를 어떻게 바꿀지도 궁금하네요. 🤔✨

  • @sjyoon0603
    @sjyoon0603 15 วันที่ผ่านมา +7

    좋은 정보 제공해주셔서 감사해요! 매일 안될공학 영상 보는데 보람이 있네용!!!

  • @guraliusjo2224
    @guraliusjo2224 16 วันที่ผ่านมา +21

    온칩이 800배이면 hbm보다 휠씬 비싸지 않나요?

    • @user-randomNO
      @user-randomNO 16 วันที่ผ่านมา +10

      가격어마어마할듯 수율도 hbm보다 떨어질것같고…

    • @K-electronic
      @K-electronic 14 วันที่ผ่านมา

      가격이 아니아 용량이 880배라는 뜻 아닌가

  • @seongsuyun3447
    @seongsuyun3447 14 วันที่ผ่านมา +7

    영상 중간쯤 보다가 그냥 웃고 갑니다 ㅎㅎ 팹관련 현직분들은 이게 얼마나 허무맹랑한 제품인지 잘 아실 거에요.
    그냥 단순하게 생각하면 아주 큰 ASIC이라고 보면 됩니다. 지금 장점만을 부각시켜서 그렇지 웨이퍼를 통째로 사용하는 칩이 가지는 단점은 장점과는 비교 불가 입니다.
    발열부터 시작해서, 불량, 패키징, 가격 무엇하나 제대로 대응할 수 있는 것이 없습니다.
    장점으로 내세운 성능도, 추후 확장성이나 설계 변경등을 고려하면 반쪽짜리 성능이고요.
    이게 상용이 가능한 제품이라면 엔비디아는 몰라도 빅테크들은 이미 설계를 시작했거나 시범운영중이었겠죠. 빅테크들이 설계한 칩 사이즈 보면 답이 나옵니다.

    • @user-dx9oy9mp9g
      @user-dx9oy9mp9g 13 ชั่วโมงที่ผ่านมา

      현직자인지 몰라도 말하는 뽄새가 역겹기 짝이 없네요. 그냥 웃고 갑니다? 진짜 역겹기 짝이 없는 인간 같으니라고

  • @giltoriver
    @giltoriver 16 วันที่ผ่านมา +4

    좋은 영상 소개 감사합니다.

  • @jhp680
    @jhp680 15 วันที่ผ่านมา +6

    굉장히 흥미로운 얘기군요. 설계 철학이 아주 재밌습니다.
    그런데 궁금한 점은 저 웨이퍼 칩의 수율이 어느 정도인 걸까요? 5나노가 성숙됐다면 80~90% 정도의 싱글 다이 수율일까요? 0.9라고 가정하면 0.9의 84승이 84다이짜리 전체 웨이퍼칩의 수율이 되는 거 맞나요? 계산해보면 0.00014 즉 0.014%가 나오네요; 싱글 다이 수율이 99%면 수율 43% 정도네요.
    이거 보고 느낀 게, 이런 문제를 인지하고 엔비디아에서 블랙웰에서 싱글 칩 2개를 옆에다 갖다붙인 형태를 취해본 거란 생각이 드네요. 온 칩으로 하면 빨라진다는 거도 알고 그렇다고 웨이퍼 통쨰로 하면 수율 문제가 생기니까 두 마리 토끼를 다 잡으려 한 거 같은.. 근데 이게 sram을 크게 만든건 아니고 같은 gpu코어를 붙인 거라 조금 다른 거 같기도 하고 뭔가 과도기적인 무언가 같네요.

  • @himekawafuka
    @himekawafuka 16 วันที่ผ่านมา +3

    The company has never officially disclosed the price of its chips, but they are believed to cost around $2-3 million. Hock said that a single CS-3 uses 23kW.2024. 3. 13.

  • @clearx7506
    @clearx7506 16 วันที่ผ่านมา +36

    scale is all you need란 말이 나올정도로
    llm의 규모를 키우는것이 지능과 연결된다라는 현추세로봤을때는 저걸 쓸일은 없을겁니다...
    본문에서도 봤다싶이 절대메모리 용량자체가 한계입니다.
    기껏해야 저 큰웨이퍼를 썻는데 절대용량은 44기가가 한계죠
    조단위 파라미터 llm은 못돌린단 얘기고 용량확보를 위해 몇장을 이어버리면
    h100을 이어버리것이랑 결국 계산기때려보면 손해일겁니다..
    그러니 다들 안쓰는거겟죠

    • @dtdtst
      @dtdtst 16 วันที่ผ่านมา +5

      그건 sota를 경쟁하는 리서치 사례에 적용되는 이야기지 프로덕션에 신경쓰는 최선두 기업들은 효율성 향상을 위한 모델 경량화에 환장함
      gpt 4o mini, gemini 1.5 flash 같이 쿼리 밀도와 비중이 높은 sllm들은 50b 이하 크기라 sram 44기가로 돌리고도 남음

    • @user-in5qn7je3v
      @user-in5qn7je3v 15 วันที่ผ่านมา +7

      ⁠@@dtdtst50b 이하가 어떻게 44gb에서 돌아가죠. 모델 올리러면 100gb 이상 필요할탠데... 양자화해서 돌아가는걸 돌리고도 남는다고 표현하신건가요

    • @dtdtst
      @dtdtst 15 วันที่ผ่านมา

      @@user-in5qn7je3v 대다수의 기업들은 당연히 8bit 이하 수준으로 양자화해서 서빙하고
      로드밸런싱 인프라에 기반해서 4bit 이하 모델도 사용하는데 50b 모델 돌리기에는 남아돌죠

    • @bookworm5971
      @bookworm5971 14 วันที่ผ่านมา

      @@user-in5qn7je3v
      영상 안보셨나요… 보고 답시다

    • @자유-w4d
      @자유-w4d 13 วันที่ผ่านมา

      @@user-in5qn7je3v 지금 Chat GPT도 계속 증류해서 다운스케일하고 양자화 해서 호스팅 하는 겁니다. 애초에 8q양자화 이상으로 벤치상 점수 차이가 없어요.

  • @MomsMilks
    @MomsMilks 15 วันที่ผ่านมา +17

    저거 때문에 우리나라 변압기가 역대 최고로 수출 잘되고 있다고 합니다.

    • @user-su6fg4iu7q
      @user-su6fg4iu7q 12 วันที่ผ่านมา

      제룡이가 슬퍼여

  • @user-ji4mi1gi3z
    @user-ji4mi1gi3z 15 วันที่ผ่านมา +4

    먼지떨어지면 그부분은 죽이는 설계를 했겠죠
    하나 잘못됬다고 통으로 버리지는 않을듯

  • @나를대하는것에관하여
    @나를대하는것에관하여 15 วันที่ผ่านมา +3

    이 채널은 구독자들이 지식이 상당하네ㄷㄷ 뭔말인지 하나도 모르겠네ㅋㅋ

  • @jaeminjung7598
    @jaeminjung7598 15 วันที่ผ่านมา +1

    회사가 연구 개발한 기술이 회사 가치에 얼마나 작용하는가에 대한 것은 고객의 수요 뿐이죠. 어떤게 더 효율적이다 뭐다 하는 이야기보다 결국 LLM을 사용하는 유저가 무엇을 선택하느냐가 중요할 것 같습니다. 개인적으로 ChatGPT, Copilot, Claude를 사용하면서 퀄리티가 무엇이 좋냐에 갈리지 토큰이 얼마나 더 빨리 나오냐는 특정 속도가 넘어가면서 크게 중요한 요소는 아닌 것 같습니다.
    따라서, Cerebras에서 LLama 3 8b를 엄청나게 빠르게 제공한다고 해도 유저가 과연 많이 사용할까? 는 의문이고 LLama 3 8b가 아니라 사람들이 사용하는 LLM 서비스 제공자인 OpenAI, anthropic에서 Cerebras와 협력하여 현재 모델을 더 빠르게 제공한다면 사용자에게 더 큰 가치를 제공할 것 같네요.

  • @gaiserne
    @gaiserne 15 วันที่ผ่านมา

    감사합니다. 재밌게 봤어요.
    이쯤되면 짐 캘러가 어디까지 할 수 있을지도 궁금해지네요

  • @cross4991
    @cross4991 13 วันที่ผ่านมา +1

    결국 설계 보다는 수율 좋은 생산력이 돈 버는거임

  • @user-er1oz9fe2d
    @user-er1oz9fe2d 15 วันที่ผ่านมา +1

    홈페이지 들어가서 질문을 해봤는데 내용이 진짜 엉터리입니다. ㅋㅋ 빠르긴 엄청 빠르네요

  • @123qazqsx
    @123qazqsx 13 วันที่ผ่านมา +1

    수율 최소 90프로대에 육박해야 할텐데, 그런 공장이 현실에 없을듯

  • @준스톤-x1d
    @준스톤-x1d 13 วันที่ผ่านมา +1

    우리는 엔비디아직장인들의 시대에 살고있다

  • @orangeblue9141
    @orangeblue9141 15 วันที่ผ่านมา +1

    제 생각인데, ai 연구에서 경량화쪽 연구가 활발해지면서 어느 정도 성능에서 합의점에 도달하지 않을까 생각합니다. 그보다 이제 같은 성능의 칩을 어떻게 하면 싸게 공급할 수 있을까? 이런 쪽으로 포커싱이 되지 않을까 하네요.

  • @MondayGone
    @MondayGone 15 วันที่ผ่านมา +1

    연산력을 펑펑 낭비해버릴 수 있게 되면 어떤 AI가 튀어나올지 기대되네요 ㅋㅋ
    비전 인식 + 생성 AI도 성능의 벽에 가능성이 막혔던 분야였으니..

    • @MondayGone
      @MondayGone 15 วันที่ผ่านมา

      사람들은 다들 "이만하면 됐다. 그만하자. 소형화에 집중하자" 같은 말을 하고 있는데
      전 AI 개발사들이 그러지 않을 거라고 생각합니다
      일반 서비스용이라면 몰라도, AI 개발용 AI는 극한의 극한까지 규모를 쌓아 올리겠죠. 그러지 않으면 회사간 경쟁에서 밀릴 테니..

  • @aquariss
    @aquariss 15 วันที่ผ่านมา +4

    2:35 블랙웰 두개 합쳐서 GH200 을 만든다는 설명은 틀린 것 같습니다.
    GH200은 1 Grace CPU(ARM) + 1 Hopper GPU(H100)이 합쳐진 거고 GH200을 보드에 두 개 넣고 NVlink 로 연결하면 GH200 NVL2라고 부릅니다.
    블랙웰은 H200 GPU 두개를 합친거고 이름은 B200. B200을 Grace CPU랑 합치면 GB200 입니다.
    (제가 틀렸을 수도 있으니 확인해보셔요)

  • @IlIlIIlIllIIlIlIIlIlI
    @IlIlIIlIllIIlIlIIlIlI 15 วันที่ผ่านมา

    좋은 정보 감사합니다! 댓글들도 다 유용하고 좋네요. 혹시나 확인 차 여쭤보는데 이 영상 세레브라스 측으로부터 지원 제작을 받았다거나 한 건 아니죠? 약간 긍정적인 뷰가 많이 강조되게 들어와서요. 댓글 보기전엔 와 엄청난 신기술?!?! 이런 느낌이었네요.

  • @fkalsh
    @fkalsh 15 วันที่ผ่านมา +2

    매우 비효율적으로 보이긴해도 그걸로 어떤 AI의 벽을 깨서 기존에 안되는걸 될수있게 만들면 대박나긴할듯 ㅋ
    과연 그게 가능할지 의문이네

  • @raincho7809
    @raincho7809 16 วันที่ผ่านมา +17

    아무리 좋아도 수율이 안나오면 춘장들 뻘짓과 차이가 없을듯.

    • @KK-ub6ub
      @KK-ub6ub 15 วันที่ผ่านมา +3

      뻘짓은 아니지

    • @김문경-f3c
      @김문경-f3c 14 วันที่ผ่านมา +1

      @@KK-ub6ub뻘짓맞음 수율이 전부임

  • @hoyakim4280
    @hoyakim4280 15 วันที่ผ่านมา +1

    왠지 사이버다인에서 개발한 "그 칩"하고 비슷하게 생겼네요. 저건 와플모양이고 후기 양산형은 쪼꼬렛 모양이려나.

  • @user-er7hy5sp9v
    @user-er7hy5sp9v 15 วันที่ผ่านมา +10

    얼굴 안까고 유튜버 하는 애들은 믿음이 안가

    • @사당꿈나무
      @사당꿈나무 11 วันที่ผ่านมา +1

      근데 왜 와? 안 오면 되잖아.

    • @user-er7hy5sp9v
      @user-er7hy5sp9v 10 วันที่ผ่านมา

      @@사당꿈나무 그러게.. 거슬리게 왜 자꾸 뜨지 영구차단 ㄱ

  • @superspeedmotor
    @superspeedmotor 14 วันที่ผ่านมา +2

    주식 빼야 하나요?

  • @user-gu8yp1ww1s
    @user-gu8yp1ww1s 15 วันที่ผ่านมา +1

    와ㅋㅋ 웨이퍼 하나를 통째로 칩으로 써서 SRAM으로 도배를 해버리네ㅋㅋㅋㅋ

  • @klade2307
    @klade2307 16 วันที่ผ่านมา +1

    근데 텍스트 기반 추론말고, 이미지 생성이나 영상 생성에서는 엔비디아 GPU가 더 좋지 않을까요?

  • @user-rm6dz2or9z
    @user-rm6dz2or9z 11 วันที่ผ่านมา +1

    빛보다 빠르면 타임머신도 가능한 애기

  • @jayyoo906
    @jayyoo906 14 วันที่ผ่านมา +1

    이 모든 경이로운 기술에 한국에서 기술적으로 기여 하는 부분은 있나? 기억소자 주문생산외에?

  • @hyeonminkim9182
    @hyeonminkim9182 16 วันที่ผ่านมา +7

    5나노로 저정도가 가능하다면...삼서에서도 도전해볼만 할지도?

    • @userk5024
      @userk5024 15 วันที่ผ่านมา

      빅다이 경험이 매애애애우 부족

    • @정명호-q1t
      @정명호-q1t 13 วันที่ผ่านมา

      삼성이 tsmc보다 불량율이 높아서 안될껄요

  • @Learn96
    @Learn96 15 วันที่ผ่านมา +5

    그렇게 좋다면 왜 아직도 시장을 장악하지 못 했는지가 납득이 안 가긴 하네요.

    • @realdennis79
      @realdennis79 15 วันที่ผ่านมา +2

      신생회사입니다. 2019년 부터 제품이 나오기 시작함. 2017년 부터 구글이나 퀄컴의 투자를 받기 시작함. 잘 될지 안될지 모르겠는데 잘 되었으면 하는 회사임. 몇년전에 coreteks 유튜브에서 본거 같은데 제품화를 시도를 하는 모양입니다.

  • @gura_1
    @gura_1 16 วันที่ผ่านมา +9

    이젠 속도는 아무 의미가 없음
    이젠 누가 제일 최신이고 누가 제일 정확한지가 중요한 시기임

  • @user-ws9hw5wd7k
    @user-ws9hw5wd7k 15 วันที่ผ่านมา +1

    헐 웨이퍼 한장 안에 불량이 얼마나 많은지 알구나 이야기 하나

  • @lottokang
    @lottokang 13 วันที่ผ่านมา

    온칩메모리 구조가 더 높은 성능에 더 적은 전력 , 더빠른 결과를 가져오게 되니 적당한 온칩 사이즈로 제작하는 게 답이될 수도 있어보이네요. 지금의 엔비디아 AI칩 자체가 너무 고가이기도 하고 고전력에 발열문제도 심각한데 GROOQ이나 CEREBRES같이 온칩메모리가 대안이 될 수도. 그럼 국내 메모리 제조사들에겐 큰 타격이 될 수도 있겠네요

  • @vema384
    @vema384 15 วันที่ผ่านมา +1

    그 지인이 어떤분인지 모르겠지만, 기술개발은 유독 세라브라스만 하는것은 아니겠지요. 단일칩 사이즈가 저리크면 응축열방출 문제가 엄청나겠고, TDP도 더 커지겠죠. 무엇보다 인류의 발전방향은 대형화보단 소형화이며 중량화가 아닌 경량화입니다. 속도에 양보할수 없는것은 편의성이며, 미래 기술의 표준은 그어딘가의 타협점을 찾겠져, 특히 B2C에서는 시장성이 없는 아이템같습니다. 항상 좋은 영상 감사합니다. ❤

    • @K-electronic
      @K-electronic 14 วันที่ผ่านมา

      저 칩을 b2c라고 생각하시는건가요?? 진심으로?????

    • @lottokang
      @lottokang 13 วันที่ผ่านมา

      오히려 대규모 엔비디아 칩보다 더 효율적일 수도 있어보이네요.

    • @정명호-q1t
      @정명호-q1t 13 วันที่ผ่านมา

      글쎄요 최근 20년의 반도체 발전 경향을 보면 대형화로 가고 있습니다..

  • @masterjo98
    @masterjo98 16 วันที่ผ่านมา +4

    수율도 별 문제 없는게 먼지 하나 떨어졌다고 다 버릴 필요 있나요? SRAM부분이면 그부분만 안쓰게 하면 되지.... SRAM 용량이 작아져서 성능이 좀 떨어지는 제품이 나올순 있어도 웨이퍼 다 버릴 필요는 없다고 생각이 드네요

    • @MUNSC
      @MUNSC 15 วันที่ผ่านมา +1

      같은제품에 성능이 제각각 다른 반도체가 있다? 그 기업 제품 살까요? 신뢰성 문제죠
      그래서 웨이퍼 공정들이 진공에서 이루어지는거고요. 괜히 써도 별 문제 없는걸 폐기할까요~
      TV를 샀는데 보는데 문제는 없는데 led 하나가 나갔어요? 이 제품 살건가요? 사람마다 다르겠지만 바로 반품하겠죠.

    • @klkim4998
      @klkim4998 15 วันที่ผ่านมา +1

      @@MUNSC미니멈 보장 수준만 제시하고 게런티하면 됨. 오버 스펙은 복불복으로 가져가는거고. 스펙 범위 제시해주면 구매함

    • @user-wp5yy8db3z
      @user-wp5yy8db3z 15 วันที่ผ่านมา +3

      이런 놈들 특 지가 사는 폰에 마감만 이상해도 바로 환불함

    • @falcon9ft710
      @falcon9ft710 15 วันที่ผ่านมา +4

      @@MUNSC
      이미 소비자용 CPU도 최대 클럭은 랜덤 뽑기이고, 불량 난 부분 죽여서 싸게 파는 모델도 많음
      불량이 많이 나면 하급제품으로 팔면 되고, 성능이 조금 떨어지는 부분은 애초에 마진을 두어여하는 부분이지

    • @정명호-q1t
      @정명호-q1t 13 วันที่ผ่านมา

      @@MUNSC이미 모든반도체 칩이 그러고 있고 품질 검사해서 칩컷해서 하위모델로 팔아버립니다 40기가 모델내고 가격 20퍼센트 깎으면 중소규모 기업이나 대학교에선 살껄요?

  • @gle_Goo
    @gle_Goo 15 วันที่ผ่านมา +1

    20년 뒤엔 손톱만한 칩이 지금 cerebras 한 다이보다 속도가 빠르겠지..?

  • @mn04147
    @mn04147 13 วันที่ผ่านมา

    와 짱빠르다는거면 확실히 새로운 가능성들이 생기지 않을까 싶네요
    저번에 4차산업, 5G 이야기 나올때도 이렇게 빨라서 뭐가 좋은거지 싶었는데 자율주행 자동차나 디지털 트윈등은 엄청난 통신속도가 있어야지 새로운 가능성이 생기는 부분들이 있더라고요
    이 칩도 마찬가지로 엄청난 처리속도로 인해서 새로운가능성이 충분히 있지 않을까 싶네요
    예를 들어서 현실에서1000년을 관찰할 일을 10분만에 시뮬레이션 돌려버린다거나
    실시간으로 사람에 반응하는데 반응정도가 아니라 사람의 신경보다 빠르게 움직여서 동작하는 보조도구, 로봇등이 있을 수 있지 않을까 싶네요

  • @dongyulee2095
    @dongyulee2095 16 วันที่ผ่านมา +23

    오래 전 떡밥, 웨이퍼 한장 중 하나의 fet 반도체만 삑살나서 나오면, 수율이 떨어짐, 인공위성, 카메라, 포토센서는 웨이퍼 한장으로 만드는데, 그건, 몇 픽셀 삐구나도 괜찬고, 소프트웨어가 보정해 주기 때문에 사용함...
    Nvidia, 황사장이 바보가 아님...
    될 것 같으면, 황사장이 투자 했겠지...

    • @kirin1229
      @kirin1229 16 วันที่ผ่านมา +4

      구획에 따라선 비활성화하는 방법도 있긴하죠

  • @유태조
    @유태조 14 วันที่ผ่านมา

    오!! 세레브라스!! 감사합니다~~~ 안될공학 화이팅!!

  • @HeeM-w6t
    @HeeM-w6t 14 วันที่ผ่านมา

    로보틱스랑 연동하는 과정에서 지금 기술로는 느린 반응성이 큰 허들이었을거 같은데 저런걸로 개선하면 좀 더 반응성 좋은 로봇들이 등장할 수 있겠네

  • @준호윤-b3u
    @준호윤-b3u 12 วันที่ผ่านมา +1

    그러뭐해 한번고장나면 전체갈아야하는데 A/S 어떻게 감당해 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

  • @PrimeCreations758
    @PrimeCreations758 6 วันที่ผ่านมา

    Cerebras System 투자할 수 있는 방법이 있나요? 주식 시장 상장은 아직 안 된 건가요?

  • @jasonsalomon5854
    @jasonsalomon5854 13 วันที่ผ่านมา +1

    그런데 웨이퍼 통째로 하면, 생산 수율 경제성이 맞나? 웨이퍼 하나 에러나면 그냥 다 버려야 하는데, 과연 수율이 경제성이 맞을 것인가가 문제인 것 아닌가요?

    • @user-hakjeong
      @user-hakjeong 6 วันที่ผ่านมา

      저게 3세대고 1세대모델이 이미gpt3훈련이 일부사용됨. 그래서 시장에서 생산되는 공정보다 더낮은 공정을사용하고 그렇게해도 대용량의 컴퓨팅성능하고 칩간대역폭제한이없어 전력효율성도 훨씬높음.1,2세대를 어느정도 생산도 이미 많이 했기때문에 수율문제는 생산하기에 큰문제 없을정도로 잡았다고봐야지. 근데 아직 쿠다생태계가 독보적이라 아직 대중화가안된것뿐 기술자체의 잠재력은 크다고봄

  • @iamnugu
    @iamnugu 16 วันที่ผ่านมา +1

    ㅋㅋㅋ 뭐에요 이게 ㅋㅋㅋ 대체 어디까지 거대해지는거에요 ㅋㅋ

  • @jupiterjo6914
    @jupiterjo6914 15 วันที่ผ่านมา +3

    로직 인 메모리 구조로 20년전 AI 반도체 IP 설계를 우리 팀에서 실험적으로 시뮬 진행했었음 딱 Cerebras와 유사한 아키텍쳐로 그당시 비용 문제로 TEST만 하고 끝냈었는데 저 아키텍쳐에는 문제가 있어 해결 방안으로 가변 적인 로직 구조가 되어야 하나 평면 구조에선 구현하기 힘듬 즉 현재보다 수십배 더 고도화된 3차원 구조로 전환이 필수적임 즉 수천층 수만층의 다층레이어의 다음세대 반도체 기술의 탄생이 필요한 시점임

  • @신의한수김태우
    @신의한수김태우 15 วันที่ผ่านมา +2

    Chat gpt보다 속도는 엄청 빠른데 내용의 신뢰성은 점점이네요...글로 묻고 답하고 구두로는 안되는 것 같고요...

  • @푸프리프리
    @푸프리프리 16 วันที่ผ่านมา +5

    와.... 저거를 5나노.....
    진짜 수율나오긴하나....

  • @wb8495
    @wb8495 19 ชั่วโมงที่ผ่านมา

    대량양산 성공 극히 어려움. 온칩개념 제품이나온지 반세기가 되어가는데 생산중 메모리Cell나가면 CPU도 같이버리게되어 오프칩이 대세인건데 양산되더라도 극도로비싼칩이될듯

  • @investor7277
    @investor7277 16 วันที่ผ่านมา +9

    전투기에 달리는 레이더도 웨이퍼 통째로 만든다는것 같던데ㅎㅎ
    이것도 국방용으로 첩보를 정보로 필터링 시키는 AI같은거에 쓰자

    • @ssangdog
      @ssangdog 16 วันที่ผ่านมา +4

      ㅋㅋㅋ 그거 그냥 안테나 입니다 생긴건 비슷하죠? MEMS 예요.

  • @lostpalanpi
    @lostpalanpi 9 วันที่ผ่านมา

    현시점 기준으론 썸네일용 화제 그 이상은 아닌듯하네요. 지금의 최신공정들이 레거시가 될 때 쯤이면 가능할지도 모르겠습니다

  • @user-fe4vm5wu5z
    @user-fe4vm5wu5z 15 วันที่ผ่านมา

    속도 빨라도 크기,가격,온도 적으로
    문제만 없으면 대박이겠어요

  • @pwknai
    @pwknai 16 วันที่ผ่านมา +1

    이건 특별한 기술이기라기보단(아 기술이 맞긴 하죠.) 웬지 콜롬부스의 계란에 근접해보이네요 ^ ^ ㅎㅎㅎ
    누가 그걸 못해? 라기보단 그걸 일부러 해내는 발상인 느낌이랄까...

  • @럭키비키다
    @럭키비키다 16 วันที่ผ่านมา +4

    나스닥에 상장주 인가요?
    있다면 종목이 뭔가요?

  • @deathfielder
    @deathfielder 15 วันที่ผ่านมา

    아직까진 웨이퍼 합치는거보다
    Ml 개발자가 일일히 네트워크 고민해서 데이터 위치시키니는게 쌈

  • @user-pc5rx9ip5o
    @user-pc5rx9ip5o วันที่ผ่านมา

    저렇게 웨이프가 크면 클수록 수율은 나쁘기 때문에 웨이프를 크게 하지 않는 것인데...수율이도 좋다는 것이 사실일까? 의문이 생기네요.

  • @자이언트티
    @자이언트티 15 วันที่ผ่านมา +1

    속도가 빠르다고 하는데 똑같은 내용이 계속 반복돼있고 이상한대답하고있는디

  • @고스트-x5i
    @고스트-x5i 16 วันที่ผ่านมา +5

    저 회사가 특허낸건가요?
    저게 좋다면 엔비디아도 저걸 못만들이유는 없을거같은데.

    • @선준-g8e
      @선준-g8e 15 วันที่ผ่านมา

      이건뭔 ㅋㅋㅋ 그렇게따지면 애플이 블랙웰 못만들이유가 어딨음

  • @user-kd6yd7ql2k
    @user-kd6yd7ql2k 3 วันที่ผ่านมา

    과거 hdd 쓰던 시절 램디스크 설치 한 느낌일듯

  • @HappySeong-se2vg
    @HappySeong-se2vg 14 วันที่ผ่านมา

    ㅋㅋ 예전 컨셉을 실현한 현재.
    하지만 크기 수율 제조 실용성 관점에서 가성비 안나와 사라진 형태임.

  • @user-kd6yd7ql2k
    @user-kd6yd7ql2k 3 วันที่ผ่านมา

    넘사벽 s램이라서 속도도 엄청나네 가격 도 넘사벽일걸
    가격을 줄이려면 결론 hbm 써야함 속도 개선 할려면 통신 채널를 늘리는 방법밖에

  • @jgpark2216
    @jgpark2216 16 วันที่ผ่านมา

    삼성 5나노에서 IBM 서버칩 만든다고 하는거 보니 삼성 5나노도 완전 숙성된 공정이고
    4나노도 엑시 2200만드는거 봐서는 거의 정착한듯..
    3나노 gaa 차세대패키지 팬아웃패널패키지 적용한 액시노스 W1000 봐서는 어느정도 해결책은 찾은듯..
    수율만 제대로 올라오면 될듯..
    삼성도 라벨리온 칩도 만드니 오퍼만 오면 제대로 만들 능력은 완성된듯하네요

  • @user-hakjeong
    @user-hakjeong 15 วันที่ผ่านมา

    저정도속도차이라면 전력(어차피 속도가빠르니까 같은처리량대비 전력은 큰차이안날듯)수율등차이는 나중에잡더라도 개발할가치가있지

  • @앵그리구리-x9f
    @앵그리구리-x9f 15 วันที่ผ่านมา

    기존 업체들이 저걸 안하는 이유가 있었을텐데 과연...

  • @answjdgod
    @answjdgod 6 วันที่ผ่านมา

    cerebras 가서 몇개질문해보니 대답퀄리티는 재미니 gpt보다 별로네요 답은 빨리나와요

  • @dohyunbarg
    @dohyunbarg 10 วันที่ผ่านมา

    저런 생각은 많은 사람들이 생각했지만 수율문제 해결도 문제고 sram가격도 문제고 하지만 수율은 레이저로 수율문제가 되는 코어를 죽이는 방식으로 해결할 듯 하여간 저 방식이 가장 이상적이라는 것은 모든 사람이 알았던 것이고 하지만 비용 때문에 비용효율적일 수 있을까? 라는 점인데 쓰다보면 답이 나오겠지

  • @bookworm5971
    @bookworm5971 14 วันที่ผ่านมา +2

    댓글보면 ai 공부하는 사람이랑 주식하다가 좀 주워들은 사람이 좋지 않은비율로 섞여있는거같은데

    • @dlsrksguadhX
      @dlsrksguadhX 13 วันที่ผ่านมา

      테크 채널 유튜버 입장에선 손님은 많아서 좋지만 언제든 댓글 배틀이 열릴 위험성이 상존

    • @user-hakjeong
      @user-hakjeong 6 วันที่ผ่านมา

      그냥 유튜브영상인데 잘아는사람들만 있어야할이유도 없음

  • @sypark3579
    @sypark3579 13 วันที่ผ่านมา

    On memory chip 가장 잘 할 수 있는 회사가 삼성전자인데
    참 뭐하고 있는지 모르겠네요

  • @djlipsum1526
    @djlipsum1526 12 วันที่ผ่านมา

    기업이 누군지가 아니라 기업이 어딘지라고 해야 되는게 아닐지.......가끔 이런 모습 보여주실 때마다 정말 착잡합니다.................

  • @tspark1071
    @tspark1071 8 วันที่ผ่านมา

    넓은 책상에서 공부하는 식이네요.

  • @user-ol6dc9ok8z
    @user-ol6dc9ok8z 12 วันที่ผ่านมา

    서버실 영상도 있는데 실제 칩 사진 한장이 없네요

  • @dr.aizeta
    @dr.aizeta 16 วันที่ผ่านมา +1

    가격이 문제 아니에요?

  • @Boem-eo.pikachu
    @Boem-eo.pikachu 13 วันที่ผ่านมา

    그래서 쿠다생태계는 어떻게 찢을거야

  • @sblee918
    @sblee918 14 วันที่ผ่านมา

    전력이 문제겠어요. 20배나 빠르다는 것은 기업 입장에서 시간이 돈인데...

  • @jasonsalomon5854
    @jasonsalomon5854 13 วันที่ผ่านมา +1

    도대체 어디에서 생산 수율을 맞춰서 구운 것임? TSMC?, 삼성? 도대체 무슨 회사에서 웨이퍼를 구워준 것임? 도저히 불가능...... 굽는 회사가 어디인지 밝히면 내가 믿겠소.

  • @gia235
    @gia235 15 วันที่ผ่านมา

    자 칩 하나에 봄바르디어 한대값입니다???

  • @user-zx9hy2fq7t
    @user-zx9hy2fq7t 15 วันที่ผ่านมา

    아니 에러님이 56k 모뎀도 아니고 14k 를 쓰셨었어?!

  • @jhl9444
    @jhl9444 16 วันที่ผ่านมา

    삼성이 이 아이디어로 설계 생산 까지 하면 중상급 스펙만 나와도 현H100을 확실하게 누른다는 말인데. 삼성도 해볼만한 시도 일듯

    • @user-kl7sh7nw4m
      @user-kl7sh7nw4m 15 วันที่ผ่านมา

      할 수는 있는데 단기간에 안됨

  • @meguru420
    @meguru420 15 วันที่ผ่านมา +1

    음 ~ 저걸로 비트코인 채굴하면 재벌되겠네 ,,, 알아보니 안된다고 합니다

  • @afad8662
    @afad8662 16 วันที่ผ่านมา +1

    가격을 공개해야...

  • @koomyuoung
    @koomyuoung 2 วันที่ผ่านมา

    인텔도 CPU자체에 On chip memory로 올리는과정이지만서도
    저건 수율안나와 쓸수 있을지 ㅋㅋ
    물리적 위치별 비활성화를 한다면 가능하겠지만서두

  • @nomad-traveler-sw
    @nomad-traveler-sw 8 วันที่ผ่านมา

    속도 문제는 이제 끝났고 라고 봐야겠네

  • @fafan777
    @fafan777 16 วันที่ผ่านมา +26

    오늘 엔비디아 실적발표후
    떡락하는 주가속도로 달려왔습니다😂

    • @user-ui6wy1es1f
      @user-ui6wy1es1f 16 วันที่ผ่านมา +15

      거의다 말아올렸어요 속도가 느려요 ㅋㅋㅋㅋㅋㅋ 양전각임 ㅋㅋㅋㅋ

    • @mong-mongg
      @mong-mongg 15 วันที่ผ่านมา

      ​@@user-ui6wy1es1fㅋㅋㅋ?

    • @KK-ub6ub
      @KK-ub6ub 15 วันที่ผ่านมา

      @@user-ui6wy1es1f 니가 바로 인간지표 -7%

    • @hansteem
      @hansteem 15 วันที่ผ่านมา

      @@user-ui6wy1es1f 양전이요? 6퍼 하락했던데요?

  • @darkrok6948
    @darkrok6948 15 วันที่ผ่านมา +2

    수율이 문제 인데 이게 가장 큰 문제겠네요
    지금까지의 시스템칩 보면 칩만들고나서 문제 있으면 문제 있는거 비활성화나 잘라서 사용했는데
    원칩 사용이면 수율이 100퍼가 나와야한다는건데 이게 거의 불가능한 이야기 이니까요

    • @user-hakjeong
      @user-hakjeong 6 วันที่ผ่านมา

      1~2세대 다문제없이 개발하고 생산해서 사용한곳도 여러군데있음. 이미 수율문제는 판매하는데 문제없거나 수요만 많아지면 커버가능해지는수준일거란거임. 벤치마크성능이 압도적이라 실사용시 성능저하문제가 발생하지않으면 수율이 좀낮아도 사용할가치가있음

  • @meinlet5103
    @meinlet5103 3 วันที่ผ่านมา

    써보니까 진짜 엄청 빠르긴하네

  • @user-tq7qr2jw6v
    @user-tq7qr2jw6v 5 วันที่ผ่านมา

    웨이퍼? 통짜를??? 에반데 그렇게 좋은거를 우리가 알 정도면 업계 사람들이 몰랐을까?
    그리고 웨이퍼 통짜로 써야 높은 처리속도가 나온다고 발표하면
    대다수 사람들은 블랙웰 수백개 연결하는게 더 낫지 라고 생각함
    그리고 소형으로는 못 만들기때문에 특정 조건 아니면 소외받을거는 기정사실
    그리고ai생태계가 엔비디아 쿠다 아니면 돌아가기 힘들게 만든 상황이라서
    소형화 될때까지 꽤 오래걸림

  • @평범하지_않은_인간
    @평범하지_않은_인간 14 วันที่ผ่านมา

    아예 칩을 원형으로 해서 웨이퍼 가장자리까지 쓸 수는 없는건가...

  • @user-gp4tl9nw6r
    @user-gp4tl9nw6r 15 วันที่ผ่านมา

    영상 잘 보고 있습니다. 이 분야 지식 없어서, 제가 사용하는 기기 중에서 보면 애플 M1 프로세서 원칩 등장 이후 그 안에 메모리도 있고 발열 적고 베터리 덜 먹어서 배터리 타임 늘어나고 고사양 게임도 잘 돌아가는 개념으로 보면 되는지 모르겠네요. 영상 제작 하느라 수고 많으셨어요 ^^

  • @ungs727
    @ungs727 16 วันที่ผ่านมา +3

    어마무시하네요

  • @LeeHeeseoTV
    @LeeHeeseoTV 15 วันที่ผ่านมา

    군사용. 해킹용. 전문가용. 전쟁용

  • @winwin9151
    @winwin9151 13 วันที่ผ่านมา

    가격은 7만배 아님? 병령과 직렬로 설명하면 불필요한일에도 같은 에너지를 사용하겠지 병렬은 활동적을때 다른쪽은 에너지를 줄 일수 있음 분할의 장점 빠르긴 빠르네 인간이 인지할수 없을정도로