ขนาดวิดีโอ: 1280 X 720853 X 480640 X 360
แสดงแผงควบคุมโปรแกรมเล่น
เล่นอัตโนมัติ
เล่นใหม่
State-Space Model就是1960年發表的Kalman filter,當初就是被拿來預測阿波羅計畫的太空船軌道。後來在現代控制理論和訊號處理被大量使用,MAMBA的論文看起來還有些缺陷,從頻域的角度來看,MAMBA系列的論文把SSM中系統矩陣的特徵值虛數部份給丟棄,個人猜測應該是穩定度的問題導致,SSM是回授系統,穩定度的維持是重中之重。
Very interesting topic!
最進有三個哈佛小子做專用transformer專用的晶片,這樣會有影響?
That chip you mentioned is for inference but not for training (nVd)! Quite difference!
Mamba
Yes.
請問speak有主動的部分嗎?
State-Space Model就是1960年發表的Kalman filter,當初就是被拿來預測阿波羅計畫的太空船軌道。後來在現代控制理論和訊號處理被大量使用,MAMBA的論文看起來還有些缺陷,從頻域的角度來看,MAMBA系列的論文把SSM中系統矩陣的特徵值虛數部份給丟棄,個人猜測應該是穩定度的問題導致,SSM是回授系統,穩定度的維持是重中之重。
Very interesting topic!
最進有三個哈佛小子做專用transformer專用的晶片,這樣會有影響?
That chip you mentioned is for inference but not for training (nVd)! Quite difference!
Mamba
Yes.
請問speak有主動的部分嗎?