RDMA over Ethernet for Distributed AI Training at Meta Scale (SIGCOMM'24, Paper 246)

แชร์
ฝัง
  • เผยแพร่เมื่อ 18 ธ.ค. 2024

ความคิดเห็น • 1

  • @siyuyan413
    @siyuyan413 4 หลายเดือนก่อน

    Excellent speech. Some questions, thanks. 1) How to deal with slow-reciever and Incast? 2)Whether the number of QPs connections dessert exists? 3) if a tor‘s uplink failure occurs, is the qp flow unevenly distributed?