Блин почему ты только первые 3 шага + частично Cls (в основном только его название) объясняешь, почему нельзя всю архитектуру с енкодером, вниманием и декодером объяснить
Может быть потому, что я обленился) А может быть, потому что у меня в этом курсе до этого было три лекции про механизмы внимания) SDPA: th-cam.com/users/live7siDicen3a4?feature=share MHA: th-cam.com/users/liveL6IsrTV-FI8?feature=share Свойства MHA: th-cam.com/users/livePtKdN0Cn48Y?feature=share А может быть потому, что я рассказал про архитектуру в целом и декодер в этих лекциях: Архитектура: th-cam.com/users/lives8uzBNSmyMU?feature=share Декодер: th-cam.com/users/liveoJ0zAgqNx00?feature=share А может быть, я не рассказываю в лекции ViT про декодер просто потому, что в ViT декодера нет, есть только энкодер)
как всегда, на высшем уровне, спасибо большое
Спасибо, что смотрите) и за лестный отзыв)
Позвольте узнать, а сколько вообще лекций в курсе предполагается?
Я думаю, 27-29
Блин почему ты только первые 3 шага + частично Cls (в основном только его название) объясняешь, почему нельзя всю архитектуру с енкодером, вниманием и декодером объяснить
Может быть потому, что я обленился)
А может быть, потому что у меня в этом курсе до этого было три лекции про механизмы внимания)
SDPA: th-cam.com/users/live7siDicen3a4?feature=share
MHA: th-cam.com/users/liveL6IsrTV-FI8?feature=share
Свойства MHA: th-cam.com/users/livePtKdN0Cn48Y?feature=share
А может быть потому, что я рассказал про архитектуру в целом и декодер в этих лекциях:
Архитектура: th-cam.com/users/lives8uzBNSmyMU?feature=share
Декодер: th-cam.com/users/liveoJ0zAgqNx00?feature=share
А может быть, я не рассказываю в лекции ViT про декодер просто потому, что в ViT декодера нет, есть только энкодер)