BERT (预训练Transformer模型)

Vision Transformer for Image Classification

Swin Transformer论文精读【论文精读】

ไฮไลท์ฟุตบอล พรีเมียร์ลีก 2024/25 สัปดาห์ที่ 12 : แมนเชสเตอร์ ซิตี้ พบ สเปอร์ส

ประวัติพี่หนุ่ม กรรชัย โหนกระแส #หนุ่มกรรชัย #โหนกระแส #nwfinance

ยอด ดีเลิศ อะไรใหม่ ๆ สับ ๆมหัศจรรย์ ที่สุด❤️‍🔥🫵🏻 #4EVE #SkyTrainMusicFest

Vision Transformer (ViT) 用于图片分类

Shusen Wang

มุมมอง 27 302

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 26 พ.ย. 2024

ความคิดเห็น • 43

@minghaoliu1832 3 ปีที่แล้ว ⁺³
哇居然更新了！抢前排
@jianwang8020 3 ปีที่แล้ว ⁺²
讲的非常好，重点明确，深入浅出
@bobby2636 ปีที่แล้ว ⁺¹
课件做的太棒了，谢谢分享
@ShusenWang ปีที่แล้ว ⁺¹
你的头像牛逼，哈哈哈
@Sea-m-08 3 ปีที่แล้ว ⁺³
讲的太好了！学习了很多，谢谢🙏
@UntitledBoxer 5 หลายเดือนก่อน
講得很清晰，感謝分享！
@SJMao 3 ปีที่แล้ว ⁺¹
讲得非常清晰，非常感谢！
@rikola2914 3 ปีที่แล้ว ⁺²
非常清晰，赞
@Flyforward226 2 ปีที่แล้ว ⁺⁵
感谢老师。有个问题，如果我们并不需要C1~C9的话（只需要C0），那么我们为什么要去计算他们呢？或句话说C1～C9用来做什么呢
@ericdu5199 หลายเดือนก่อน
实际上是在C0-C9中做了softmax的最优选择；博主是假设了最终选出C0，所以其他的就没用了，不会走入下一层。
@macknightxu2199 ปีที่แล้ว
skip connection, batch normalization? 是否这样拼写呢？
@tianyili7148 ปีที่แล้ว
讲得真清楚！赞
@fxls_ 10 หลายเดือนก่อน
看完了感谢老师
@tedq4303 3 ปีที่แล้ว ⁺²
讲的太好了
@aroonsubway2079 3 ปีที่แล้ว ⁺³
感谢老师，想确认一下CLS的作用和用法。您之前BERT的视频也看过了。我对CNN比较熟悉，输入一个image，输出就是预测向量，很直观，而ViT中，最后得到的c0其实是已经包含了image的全部信息了吧，为什么在image之外还必须有一个CLS作为额外输入呢？是为了整齐吗？或者换个说法，比如CIFA10分类，CLS的值具体是0，1， 2，... 9 吗还是说不需要任何有意义的值? 假如没有CLS的话，直接z0...zn通过全相联产生c0应该也能达到目的吧？感觉自己的理解好初级，还请老师指点。
@ShusenWang 3 ปีที่แล้ว ⁺²
CLS是个符号，它的Embedding是自动学出的。目的是这样的。如果9个patch作为输入，Attention的输出就是9个向量，可最终只需要一个向量，这就是问题所在。用CLS位置上刚好一个向量，用作计算输出。
@aroonsubway2079 3 ปีที่แล้ว ⁺²
@@ShusenWang 谢谢老师回复。我主要纠结的地方是CLS和输入图像的GT是什么关系？您说 “CLS是个符号，它的Embedding是自动学出的”，那可不可以理解为视频7:55中CLS携带着image class的信息（比如输入图片是猫　CLS＝１，如果是狗，CLS＝２，重要的是CLS是不是random或是常数）被Embed转化为z0 , 然后Embed的参数在back propagation时被更新？
但如果只让ｚ１～ｚ９通过Encoder生成ｃ１～ｃ９的话，image信息一点都没有丢失，所以用某种方法吧ｃ１～ｃ９合并为一个ｃ０再与GT计算loss应该也行吧（当然那就又变回类似CNN的结构了）？但如果是为了“整齐且充分利用自注意力层的结构”而定义CLS->z0->c0，就能说得通了。不好意思又问这么多，我思维总绕不出CNN ：）
我在想CLS->z0->c0这条路的好处是，虽然它不引入任何image信息（？）但是自注意力的作用下c0就能包括x1~x9的信息，所以直接用c0就好，而不必像我说的想方设法融合 c1~c9 (比如再加一层FC layer)，这是最大的好处。那么为什么不可以直接用c1来做classification呢？难道是c1虽然也包含x1~x9的全部信息，但是不如c0中立？
@jizhang02 3 ปีที่แล้ว
@@aroonsubway2079 我觉得 c1 到c9是每个patch，特征不全面，所以没有用来分类。c0是定义为可以学习的CLS，而且因为c0到c9的可训练参数都是一样的，共享的，所以就用c0了。我是这么认为的。不知道您怎么看？
@胡雅伦-i2p 2 ปีที่แล้ว ⁺¹
@@aroonsubway2079感觉CLS应该不会和图像GT有关系，否则这就是在cheating吧。你网络推理的时候，也不会提前知道样本的GT是什么，感觉CLS是一个固定的输入，但是最后会因为输入样本收到影响，从而产生不同的c0向量
@denaxu8824 2 ปีที่แล้ว ⁺²
@@ShusenWang 感谢老师，我也有同样的困惑，那CLS具体是什么呀？ c1-c9是图像patch , c0具体是什么呢？
@LycheeDesign ปีที่แล้ว
讲的很细。不错
@山田林-f5b 2 หลายเดือนก่อน
感謝分享！
@jellyfish4096 3 ปีที่แล้ว ⁺¹
讲得好清楚🥰
@王小虎-s5x 3 ปีที่แล้ว ⁺²
好想和老师一起学习啊
@麦敬睿 6 หลายเดือนก่อน
老师有课件的ppt文件嘛，想做课程展示。
@zhangkin7896 3 ปีที่แล้ว ⁺¹
讲的好棒啊！！！
@wanghuaxin435 3 ปีที่แล้ว ⁺¹
有transform的训练代码吗?
@mohammadsalah2307 3 ปีที่แล้ว ⁺¹
很好！支持！
@work4ai 3 ปีที่แล้ว
尊敬的王老师您好，为什么说没有位置编码ViT的输出说相同的呢？如果我们把图片划分成patches，按照从左到右，从上到下的顺序输入不就行了？这样Z1, Z2, ..., Zn的相对位置本身就有位置信息呀？
@hypl4706 3 ปีที่แล้ว
建议复习一下self-attention方法，这一方法并不会学到序列的位置信息
@liubo19831214 2 ปีที่แล้ว
0:8:36 王老师，为什么保留c_0 抛弃其他的？比如保留c_k（k=0,1,2,3中的任意一个）抛弃其他的可以吗？
@ShusenWang 2 ปีที่แล้ว ⁺¹
因为c0是classification符号位置上的输出。不能用其他位置上的。
@sharren9374 11 หลายเดือนก่อน
有华文的突然好感动哈哈
@嘤嘤嘤-s3h 3 ปีที่แล้ว
哇，这个视频居然还有一个中文版的！
@drunknoodle3188 2 ปีที่แล้ว
positional encoding 编码的向量应该是embedding吧，请问可以是one hot吗？
@ShusenWang 2 ปีที่แล้ว
通常用cosine之类的编码，在attention is all you need那篇文章里有讲。
@shiauthiewu5367 2 ปีที่แล้ว
transformer 在图像上的应用是没有 Decoder 的么？
@ShusenWang 2 ปีที่แล้ว
如果做caption生成，就有decoder了
@waltercartwright5114 2 ปีที่แล้ว
good video!!!
@王明明-q8q 3 ปีที่แล้ว ⁺¹
老师在B站有账号嘛，讲得很好，但是每次看需要特殊手段有点不方便
@tr77229591 3 ปีที่แล้ว
very good

ต่อไป

เล่นอัตโนมัติ

BERT (预训练Transformer模型)

BERT (预训练Transformer模型)

Vision Transformer for Image Classification

Vision Transformer for Image Classification

Swin Transformer论文精读【论文精读】

Swin Transformer论文精读【论文精读】

ไฮไลท์ฟุตบอล พรีเมียร์ลีก 2024/25 สัปดาห์ที่ 12 : แมนเชสเตอร์ ซิตี้ พบ สเปอร์ส

ไฮไลท์ฟุตบอล พรีเมียร์ลีก 2024/25 สัปดาห์ที่ 12 : แมนเชสเตอร์ ซิตี้ พบ สเปอร์ส

ประวัติพี่หนุ่ม กรรชัย โหนกระแส #หนุ่มกรรชัย #โหนกระแส #nwfinance

ประวัติพี่หนุ่ม กรรชัย โหนกระแส #หนุ่มกรรชัย #โหนกระแส #nwfinance

ยอด ดีเลิศ อะไรใหม่ ๆ สับ ๆมหัศจรรย์ ที่สุด❤️‍🔥🫵🏻 #4EVE #SkyTrainMusicFest

ยอด ดีเลิศ อะไรใหม่ ๆ สับ ๆมหัศจรรย์ ที่สุด❤️‍🔥🫵🏻 #4EVE #SkyTrainMusicFest

จับซ้อการ์ดเป็นฝาแฝดกับอาจุมม่า 1 วัน ( เรียบร้อยไม่เป็นจริง? )

จับซ้อการ์ดเป็นฝาแฝดกับอาจุมม่า 1 วัน ( เรียบร้อยไม่เป็นจริง? )

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

Vision Transformer Basics

Vision Transformer Basics

【機器學習2021】Transformer (上)

【機器學習2021】Transformer (上)

【機器學習2021】自注意力機制 (Self-attention) (上)

【機器學習2021】自注意力機制 (Self-attention) (上)

Swin Transformer paper animated and explained

Swin Transformer paper animated and explained

【博士Vlog】2024最新模型Mamba详解，Transformer已死，你想知道的都在这里了！

【博士Vlog】2024最新模型Mamba详解，Transformer已死，你想知道的都在这里了！

Transformer论文逐段精读

Transformer论文逐段精读

【小岛浪吹】中国连续发生社会暴力事件，暴力事件越来越多了吗？压力山大的年轻人什么时候能够松口气

【小岛浪吹】中国连续发生社会暴力事件，暴力事件越来越多了吗？压力山大的年轻人什么时候能够松口气

ศึกมวยไทยพันธมิตร 25/11/2024

ศึกมวยไทยพันธมิตร 25/11/2024

ยิ่งกว่าถูกหวย ! เจอ Threadripper และ RTX 2080 Ti ในถังขยะ #ExtremeIT

ยิ่งกว่าถูกหวย ! เจอ Threadripper และ RTX 2080 Ti ในถังขยะ #ExtremeIT

"เบิ้ล ปทุมราช" งมหอย จับปลา ทำอาหาร เฮ็ดเองเบิ่ด | เฮ็ดอย่างเซียนหรั่ง FULL EP.19 | One Playground

"เบิ้ล ปทุมราช" งมหอย จับปลา ทำอาหาร เฮ็ดเองเบิ่ด | เฮ็ดอย่างเซียนหรั่ง FULL EP.19 | One Playground

กินแปลกประเทศจีน สตรีทฟู้ดฉงชิ่ง 24 ชั่วโมง BANKII 8K

กินแปลกประเทศจีน สตรีทฟู้ดฉงชิ่ง 24 ชั่วโมง BANKII 8K

How many people are in the changing room? #devil #lilith #funny #shorts

How many people are in the changing room? #devil #lilith #funny #shorts

เพื่อนผมมันทำได้ไง มันทำไม่ได้ไม่ใช่หรอ?? | Minecraft #minecraft #มายคราฟ #fypシ #minecraftmemes #ตลก

เพื่อนผมมันทำได้ไง มันทำไม่ได้ไม่ใช่หรอ?? | Minecraft #minecraft #มายคราฟ #fypシ #minecraftmemes #ตลก

ริกกับมอร์ตี้กับโฆษณาสุดเฟี้ยว #tooneytunes #rickandmorty #ริคแอนด์มอร์ตี้ #เรื่องนี้ต้องดู

ริกกับมอร์ตี้กับโฆษณาสุดเฟี้ยว #tooneytunes #rickandmorty #ริคแอนด์มอร์ตี้ #เรื่องนี้ต้องดู

[#2024MAMA] BIGBANG (빅뱅) - 뱅뱅뱅 (BANG BANG BANG) + FANTASTIC BABY | Mnet 241123 방송

[#2024MAMA] BIGBANG (빅뱅) - 뱅뱅뱅 (BANG BANG BANG) + FANTASTIC BABY | Mnet 241123 방송