4.5x Faster CUDA C with just Two Variable Changes || Episode 3: Memory Coalescing

แชร์
ฝัง
  • เผยแพร่เมื่อ 16 พ.ย. 2024

ความคิดเห็น • 14

  • @surajsamal4161
    @surajsamal4161 3 หลายเดือนก่อน +6

    anther day another banger

    • @0mean1sigma
      @0mean1sigma  3 หลายเดือนก่อน

      Thanks 😃

  • @siddharth-gandhi
    @siddharth-gandhi 19 วันที่ผ่านมา +1

    You sir are the 3b1b of GPU programming!

    • @0mean1sigma
      @0mean1sigma  19 วันที่ผ่านมา

      Thanks a lot, glad you found it useful 😃

    • @amitsnowman6886
      @amitsnowman6886 2 วันที่ผ่านมา

      @@0mean1sigma Keep it up! I remember watching 3b1b with similar popularity as your videos!

  • @ProjectPhysX
    @ProjectPhysX 3 หลายเดือนก่อน

    Yes yes yes more GPU programming videos!! Fantastic!
    Memory coalescence is is one of the magic tricks that make GPU software lightning fast. When I first experienced this ~4x speedup for a one-line change it blew me away. Unfortunately for many GPU kernels the optimization mostly ends here at the global memory bandwidth limit.
    Only special cases like matrix multiply or n-body can get another 10x from shared/local memory, and beyond there is still warp operations through inline assembly. Looking forward to next episode!

    • @0mean1sigma
      @0mean1sigma  3 หลายเดือนก่อน

      Thanks a lot 😀…. Next video is on tiling! I’m more excited to share that one. When I first learned tiling (~3 years ago), it was confusing and took me a long time to get the hang of it. I’ve always felt that HPC concepts go well with animations so I’m trying to do that using this channel.

  • @dandan1364
    @dandan1364 2 หลายเดือนก่อน

    Super
    High quality content. Thank you.

  • @xujiacao6776
    @xujiacao6776 หลายเดือนก่อน

    Great video!

    • @0mean1sigma
      @0mean1sigma  หลายเดือนก่อน

      Glad you found it useful 😃

  • @jakeaustria5445
    @jakeaustria5445 3 หลายเดือนก่อน

    Thank you

  • @abdulamaan4784
    @abdulamaan4784 3 หลายเดือนก่อน

    nice video

  • @dandan1364
    @dandan1364 2 หลายเดือนก่อน

    I’m super curious why, in this code, you never any of the function parameters and you use variables that aren’t declared in the function.

    • @0mean1sigma
      @0mean1sigma  2 หลายเดือนก่อน

      There's a small typo. I forgot to change the A inside the function to d_A. Thanks a lot for catching that, I completely missed that while writing the animation code. However, in the code repo, it's correct.