Transformers
ฝัง
- เผยแพร่เมื่อ 18 ม.ค. 2024
- ارائه دهنده : محمد مهدی فرح بخش - دانشجوی کارشناسی ارشد مهندسی نرم افزار و پژوهشگر حوزه یادگیری عمیق و بینایی کامپیوتر
در این ویدیو، ما به بررسی یکی از معماریهای مدرن و پرکاربرد در حوزه پردازش زبان طبیعی میپردازیم: شبکه ترنسفورمر.
شبکه ترنسفورمر یک شبکه عصبی است که بر اساس مکانیزم توجه "Attention" کار میکند و مزیت های قابل توجهی نسبت به مکانیزم های بازگشتی یا کانولوشنی دارد.
این شبکه اولین بار در مقالهای با عنوان “Attention is all you need” توسط محققان گوگل در سال 2017 معرفی شد. این مقاله یک انقلاب در زمینه ترجمه ماشینی ایجاد کرد و سپس ترنسفورمرها در بسیاری از تسکهای دیگر مانند مدلسازی زبان، دستهبندی متن، پرسش و پاسخ و غیره کاربرد یافتند.
در این ویدیو، ما به توضیح ساختار و کارکرد شبکه ترنسفورمر میپردازیم و نشان میدهیم که چگونه اتنشن میتواند همه چیز مورد نیاز شما برای پردازش زبان طبیعی باشد. همچنین، ما چند نمونه از کاربردهای شبکه ترنسفورمر را معرفی میکنیم. اگر شما علاقهمند به یادگیری شبکه ترنسفورمر هستید، این ویدیو را از دست ندهید.
از مجموعه ارائه های هفته ب هفته
انجمن علمی داشجویی مهندسی کامپیوتر - دانشکده برق، کامپیوتر و فناوری های پیشرفته - دانشگاه ارومیه
#دانشگاه_ارومیه #شبکه_های_پیچیده #شبکه #مهندسی_کامپیوتر #مهندسی #نرم_افزار #یادگیری_ماشین #کانولوشن #transformers #machinelearning