Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 พ.ย. 2024

ความคิดเห็น • 3

  • @voncolborn9437
    @voncolborn9437 9 หลายเดือนก่อน +2

    Being an old-timer on computer ops (from back in the 80s), I find this whole new world of computer operations totally facinating. It really is hard for me to wrap my head around the size and performance of these systems. My hat is off to you guys. I'm watching and learning a little, too.

  • @prajyot2021
    @prajyot2021 5 หลายเดือนก่อน

    Need more such detailed content Jared. Appreciate your Work. Thanks Mate

  • @kazimejbaulislam9185
    @kazimejbaulislam9185 10 หลายเดือนก่อน

    amazing explanation! Thanks