Miguel Raz - Building a compile-time SIMD optimized smoothing filter

แชร์
ฝัง
  • เผยแพร่เมื่อ 15 ต.ค. 2024

ความคิดเห็น • 3

  • @Debrugger
    @Debrugger 17 วันที่ผ่านมา +4

    5:10 Note the "ss" at the end, which stands for scalar single(-precision float). This code is processing one element at a time and just happens to use AVX/FMA instructions to do it. You want "ps" (packed single), which is the SIMD version of the instructions.

  • @dotmyself
    @dotmyself 2 หลายเดือนก่อน

    Really nice talk!

  • @foobar-km4ek
    @foobar-km4ek 17 วันที่ผ่านมา

    3:49 the rust code is measuring the creation of the list & transformation, while in Python & Julia he is only benchmarking the transformation... so silly