【BERTによる自然言語処理入門#5】Transformer

【1-3: 強化学習の概要】みんなの強化学習講座

直感で理解するLSTM・GRU入門 - 機械学習の基礎をマスターしよう！

The IMPOSSIBLE Puzzle..

ย่าน - ปรีชา ปัดภัย : เซิ้ง|Music 【Official MV】

ครูบาช่วยต้ายัตด้วย - แกล้งเดย์ ให้หลับเเล้วโกนหนวด เอาขนหมออ้อยแปะทำหนวด

【BERTによる自然言語処理入門#4】Seq2SeqとAttention

データサイエンス研究所

มุมมอง 2 550

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 11 พ.ย. 2024

ความคิดเห็น • 13

@kineo68 ปีที่แล้ว ⁺¹
この動画を見て、Attentionの仕組みがようやくわかりました。
ありがとうございます
@ぴっぴ-d9i ปีที่แล้ว ⁺¹
4:49　当たりで質問です。
Iを出力するときにはLSTM(h5,emb("eos")) = h6 → (線形変換とソフトマックス) → "I" という流れなのはわかりました。
しかしloveを出力するときが微妙にもやもやしていて、LSTM(h6,emb("I")) ＝h7 → (線形変換とソフトマックス) → "love" とするとのことですが、
h6 = emb("I")というわけではないのですか？一度h6を"I"に直して再度埋め込みをしてLSTMの引数に入れたほうが関数が再帰的になって楽というのはわかりましたが、ぶっちゃけh6だけで推論できそうで、Iを再度埋め込みする必要ないのでは？と思いました。
それともh6とemb("I")は別物なのでしょうか？
@dken ปีที่แล้ว
h6とemb("I")は別物です！
h6は、日本語+eosの情報を持ったベクトルであり、emb("I")はIを持ったベクトルです！
@ぴっぴ-d9i ปีที่แล้ว ⁺¹
@@dkenなるほど！はっきり分かったので助かります！
行間少なくてとても分かりやすいのでいい動画ですね！
@わかさぎフォーティン 9 หลายเดือนก่อน ⁺¹
7:53
Attentionが各層独立に計算できることは分かりましたが、予測時はその入力となる~h0, ... ~h5を直前のLSTM層から出力するのに、前のtokenが出力されるのを待たないといけないと思うのですがどうでしょうか？
@dken 8 หลายเดือนก่อน
そうですね、LSTMの層は待たないといけなくなりますね。
ゆえに、transformerではLSTMの層を排除してattention層のみを利用したのだと思います！
@ねこじぞう-i6v 9 หลายเดือนก่อน ⁺¹
出力であるはずのI love you so much が入力とされているのはなぜですか？
出力されるものがDecoderに入れる前からわかっているというのはどういうことですか？
@dken 9 หลายเดือนก่อน
デコーダーでは、一文字前のtokenを入力にして次のtokenを出力しているので、入れる前からわかっているわけではありません！
@ねこじぞう-i6v 9 หลายเดือนก่อน ⁺²
@@dken 解説ありがとうございます！
一文字前の出力が決まってから次の文字の処理が始まるって言うことですか？
@dken 9 หลายเดือนก่อน
@user-or2mr6cx7d
予測時はそうだと思います！
学習時は答えがあり全部一気にできるので
@ねこじぞう-i6v 9 หลายเดือนก่อน
@@dken 丁寧に解説ありがとうございます！
@aoyudai-6236 ปีที่แล้ว ⁺¹
大学院では何の研究をしてらっしゃるんですか？
@dken ปีที่แล้ว
画像生成に関する研究を行っています！

ต่อไป

เล่นอัตโนมัติ

【BERTによる自然言語処理入門#5】Transformer

【BERTによる自然言語処理入門#5】Transformer

【1-3: 強化学習の概要】みんなの強化学習講座

【1-3: 強化学習の概要】みんなの強化学習講座

直感で理解するLSTM・GRU入門 - 機械学習の基礎をマスターしよう！

直感で理解するLSTM・GRU入門 - 機械学習の基礎をマスターしよう！

The IMPOSSIBLE Puzzle..

The IMPOSSIBLE Puzzle..

ย่าน - ปรีชา ปัดภัย : เซิ้ง|Music 【Official MV】

ย่าน - ปรีชา ปัดภัย : เซิ้ง|Music 【Official MV】

ครูบาช่วยต้ายัตด้วย - แกล้งเดย์ ให้หลับเเล้วโกนหนวด เอาขนหมออ้อยแปะทำหนวด

ครูบาช่วยต้ายัตด้วย - แกล้งเดย์ ให้หลับเเล้วโกนหนวด เอาขนหมออ้อยแปะทำหนวด

รถถัง จิตรเมืองนนท์ vs จาค็อบ สมิธ ONE 169 | 9 พ.ย.67

รถถัง จิตรเมืองนนท์ vs จาค็อบ สมิธ ONE 169 | 9 พ.ย.67

【BERTによる自然言語処理入門#6】BERT

【BERTによる自然言語処理入門#6】BERT

Transformerについて本質を分かりやすく解説！

Transformerについて本質を分かりやすく解説！

【深層学習】BERT - 実務家必修。実務で超応用されまくっている自然言語処理モデル【ディープラーニングの世界vol.32】#110 #VRアカデミア #DeepLearning

【深層学習】BERT - 実務家必修。実務で超応用されまくっている自然言語処理モデル【ディープラーニングの世界vol.32】#110 #VRアカデミア #DeepLearning

水差し問題をPythonとソルバーで確かめる

水差し問題をPythonとソルバーで確かめる

【4分で分かる】seq2seqについて解説！

【4分で分かる】seq2seqについて解説！

【Transformerの基礎】Multi-Head Attentionの仕組み

【Transformerの基礎】Multi-Head Attentionの仕組み

【自然言語処理入門】形態素解析をしてTf-idfとCos類似度で文書類似度を測る

【自然言語処理入門】形態素解析をしてTf-idfとCos類似度で文書類似度を測る

ディープラーニングで時系列データの未来予測をしてみよう〜RNN(LSTM)〜【Python時系列分析#4】

ディープラーニングで時系列データの未来予測をしてみよう〜RNN(LSTM)〜【Python時系列分析#4】

พลิกดาวสู่ดิน ! จาก “ทนายดัง” สู่ “ผู้ต้องขัง” อึ้ง เจอแฉ ล้วงความลับ พลิกคดีเหยื่อ #ถกไม่เถียง

พลิกดาวสู่ดิน ! จาก “ทนายดัง” สู่ “ผู้ต้องขัง” อึ้ง เจอแฉ ล้วงความลับ พลิกคดีเหยื่อ #ถกไม่เถียง

ขนมปังแผ่นละ35บาท! ขนมปังโปรตีน? #chengandrock #เช้งกับร็อค #luckytree

ขนมปังแผ่นละ35บาท! ขนมปังโปรตีน? #chengandrock #เช้งกับร็อค #luckytree

Teamwork makes the dream work 💪🏼

Teamwork makes the dream work 💪🏼

Hoodie gets wicked makeover! 😲

Hoodie gets wicked makeover! 😲

SARAN x DIEOUT - อยู่ก่อนได้มั้ย

SARAN x DIEOUT - อยู่ก่อนได้มั้ย

โชคชะตาความซวย • คุณโอ๊ต 9 บาท | 9 พ.ย. 67 | THE GHOST RADIO

โชคชะตาความซวย • คุณโอ๊ต 9 บาท | 9 พ.ย. 67 | THE GHOST RADIO

🔴Live โหนกระแส ลืมดูดวงให้ตัวเอง! "อาจารย์ตี่ลี่ ฮวงจุ้ย" โดนจับคาบ้าน หลังพาดีเจดังหลบไปชายแดน

🔴Live โหนกระแส ลืมดูดวงให้ตัวเอง! "อาจารย์ตี่ลี่ ฮวงจุ้ย" โดนจับคาบ้าน หลังพาดีเจดังหลบไปชายแดน

รถถัง จิตรเมืองนนท์ vs จาค็อบ สมิธ ONE 169 | 9 พ.ย.67

รถถัง จิตรเมืองนนท์ vs จาค็อบ สมิธ ONE 169 | 9 พ.ย.67