「単語ベクトル」とは何か?

แชร์
ฝัง
  • เผยแพร่เมื่อ 29 พ.ย. 2024

ความคิดเห็น • 156

  • @Mejiro_kyoso
    @Mejiro_kyoso 2 ปีที่แล้ว +293

    掃除機の「飼う:1」どう考えてもルンバで草

    • @stsz1403
      @stsz1403 2 ปีที่แล้ว +32

      ルンバの登場で掃除機の単語ベクトルがペット方向にも伸びつつある
      =ペットに使われるような文脈に掃除機という単語が用いられるようになってきた
      未知の環境に進出して進化の途上にある生物のようで面白い

    • @えび-v1p
      @えび-v1p 10 หลายเดือนก่อน +1

      4:43 これw

    • @2001space-odessey
      @2001space-odessey หลายเดือนก่อน +1

      「所有する」と「飼う」が近いのかもしれない

  • @ybk1940
    @ybk1940 2 ปีที่แล้ว +450

    東京-日本+イギリス=ロンドンなのなんとなく理解できるしすごいなこの概念

    • @ギョーザ爆弾
      @ギョーザ爆弾 2 ปีที่แล้ว +173

      移項すると東京-日本=ロンドン-イギリスで首都-国が成り立つからすごいよな。

    • @underambii8388
      @underambii8388 2 ปีที่แล้ว +19

      @@ギョーザ爆弾 やべぇめちゃくちゃすげぇwwww

    • @鳥獣GIGA
      @鳥獣GIGA 2 ปีที่แล้ว +20

      @@underambii8388 当然の帰結

    • @pihha5204
      @pihha5204 2 ปีที่แล้ว +36

      東京は日本の首都だった…?

    • @イッヌ-m6y
      @イッヌ-m6y 2 ปีที่แล้ว +46

      @@pihha5204 江戸時代の住民現る

  • @やまた-h3k
    @やまた-h3k 2 ปีที่แล้ว +44

    毎回、最後にスッキリさせてから考えさせられることを言ってるのが好き。
    「ほらほら、何見てばかりいるんだ?君も考えるんだよ?!」
    って言われてる気がしていつも、はっ!ってなる

  • @-haru885
    @-haru885 2 ปีที่แล้ว +116

    コサイン類似度で内積計算出てきて知ってる知識が使えてなんか良かった

    • @____ai6121
      @____ai6121 2 ปีที่แล้ว +16

      学んできたことがこんなところで、、、!と思うと、勉強しておいてよかったなあって思いますよね。

  • @Natttttto
    @Natttttto 2 ปีที่แล้ว +5

    この人の動画なに見ても外れないんだよなぁ

  • @hirominakami9991
    @hirominakami9991 2 ปีที่แล้ว +170

    さすが猫吸い
    吸引がちゃんと入ってるの凄い笑
    色々見させてもらってるけど、改めて言語面白いなと思いました

    • @ギョーザ爆弾
      @ギョーザ爆弾 2 ปีที่แล้ว +37

      掃除機に飼うが1あるのはルンバの影響だろうか

    • @しめい-l4m
      @しめい-l4m 2 ปีที่แล้ว +11

      @@ギョーザ爆弾 砂浜でルンバ散歩させてそう

  • @タケノコ-n4n
    @タケノコ-n4n 3 ปีที่แล้ว +264

    猫に吸引が12あるの良いw

    • @GO-ts1nu
      @GO-ts1nu 2 ปีที่แล้ว +58

      これか
      th-cam.com/video/eHVp3p8zZRw/w-d-xo.html

    • @ギョーザ爆弾
      @ギョーザ爆弾 2 ปีที่แล้ว +29

      てか普通に猫吸うもんな

    • @ももみかん-s3t
      @ももみかん-s3t 2 ปีที่แล้ว +17

      でも、猫を吸う人いる。間違いではない

    • @osentak
      @osentak 2 ปีที่แล้ว +25

      犬に吸引がないのはおかしい

    • @ももみかん-s3t
      @ももみかん-s3t 2 ปีที่แล้ว +4

      @@osentak 犬のどこを吸うかによる

  • @m.e.7382
    @m.e.7382 2 ปีที่แล้ว +116

    最近では文脈を考慮できるBERTが用いられることが多いですね。"I ate an apple."と"I have a apple product"のappleをフルーツと会社のappleとして区別できます。

  • @対艦巨砲大好きな人
    @対艦巨砲大好きな人 2 ปีที่แล้ว +40

    何に使うんやこんなもん、と思ったらそうか…
    なるほど、そうやってネットって検索者の要望に答えてたのか…
    すげーな…プログラマーの方々には頭が上がらないな…

  • @mdmy-srrc
    @mdmy-srrc 3 ปีที่แล้ว +70

    以前これを研究していた方をお見かけしたことがあります。物事の性質を数学的に考えるのは楽しいですね。

  • @fontono
    @fontono 2 ปีที่แล้ว +27

    Googleが生まれたての頃、開発者がテレビのインタビューに答えていたのを思い出す。
    インタビューア 「あなたは何をしているのですか?」
    Google開発者  「我々はコンピュータに『常識』を覚えさせているのです。ものすごくたくさん」

  • @登録者100万人目指す米
    @登録者100万人目指す米 2 ปีที่แล้ว +28

    猫吸いは猫好き、
    掃除機飼うはルンバの影響が出てて草。

  • @kk-xn9rm
    @kk-xn9rm 2 ปีที่แล้ว +17

    国語でも数学でもなくてガチガチの情報系の内容だった!!

  • @35satori
    @35satori 2 ปีที่แล้ว +136

    文系も理系も仲良く発狂できる動画見つけたw

    • @109ドル
      @109ドル 2 ปีที่แล้ว +9

      美術系も数字強い方が便利だなって何度も思いました
      多分言語とかも統計とか地学にぶち当たって泡吹いてるんだろうなぁ

    • @ss-jx5tf
      @ss-jx5tf 2 ปีที่แล้ว

      理系はわかるんじゃね?これ
      俺はわからんけど

    • @ふゆ-y1q
      @ふゆ-y1q 2 ปีที่แล้ว +2

      実際にプログラム組むのは別ですが、文系でも大学で金融、心理学、社会学、マーケティングとかで、統計の基礎としてやるかなぁと思います。

    • @inntaisagi
      @inntaisagi ปีที่แล้ว

      言い方が草

  • @iwa6981
    @iwa6981 2 ปีที่แล้ว +7

    NETFLIX でAIの偏見についての動画をちょっとだけ見てたので、それをよりプログラム的にわかりやすく解説してくれてありがとう

  • @cecilehonda2234
    @cecilehonda2234 2 ปีที่แล้ว +16

    これで社会科学についても研究できるから本当に素晴らしいですね

  • @seasidelabel
    @seasidelabel 2 ปีที่แล้ว +17

    つまり単語ベクトルとは要素に分解するということですね。
    東京(地名、首都、日本)-日本(国)+イギリス(国)=?(地名、首都、イギリス) こうすると分かりやすいかな?
    言い換えれば、要素の似ている単語は入れ替えても文章がおかしくない、ということになりますね(「犬を飼っている」→「猫を飼っている」、「バス通勤」→「電車通学」の様に)

  • @そふぃ-n4d
    @そふぃ-n4d 2 ปีที่แล้ว +17

    今日のQuizKnockさんの動画見て戻ってきました!
    QuizKnockさんの方ではこれを使った式でクイズしてたのですが、こちらではどうやってベクトルを判定しているのか何故そんなことができるのかを理論的に説明されていてどちらも面白いです☺

  • @tase9979
    @tase9979 2 ปีที่แล้ว +88

    言語のベクトルについては知らない分野で面白かったです。
    ところで、日本語のデータ収集では文法的に英語よりやりにくいところがあるのかなと感じました。
    例えば動画にあった「猫-吸う」は「目的語-動詞」で、「掃除機-吸う」は「主語-動詞」(「掃除機で」なら手段ですが)の関係です。「猫を吸う」ので猫は吸われる側であり、掃除機は「掃除機が(ゴミなどを)吸う」ように吸う立場が一般的かと。そうなると、名詞の後の「が」「を」「で」といった助詞を考慮しないといけないのかなと思います。
    また、英語は語順が重要(ここは詳しくないのですが間違ってたらすみません)で語の前後の関係でデータの傾向がでそうですが、日本語は語順を入れ換えることができることも多い(例「掃除機が猫を吸う」→「猫を掃除機が吸う」※猫を掃除機で吸ってはいけない)ので、そういったことも気を付けないといけないのかなと思いました。

  • @sudou07
    @sudou07 2 ปีที่แล้ว +19

    ただのとんでも研究かと思ったら、実用的な技術だった・・・。

  • @yuya9623
    @yuya9623 ปีที่แล้ว +1

    単語ベクトルの生成方法が体感的にとても良くわかりました!!ありがとうございます!!

  • @みかづきも-g8q
    @みかづきも-g8q 2 ปีที่แล้ว +26

    1人掃除機を飼ってるやつが居るな

  • @toofoo7382
    @toofoo7382 2 ปีที่แล้ว +7

    自然言語処理の分野では一般的な手法やね 導入が分かりにくい考え方だから、この動画は良い教材になるなぁ

  • @agemakimakimaki
    @agemakimakimaki 2 ปีที่แล้ว +7

    このこと知った時、ベクトル好きになったなあ

  • @skys6015
    @skys6015 2 ปีที่แล้ว +7

    4:40 「猫吸い」の文化を知る者にとってはニヤリとする調査結果。
    さて、今回の動画のテーマを元に、SNS由来のビッグデータによって新しい検索アルゴリズムの技術革新が起きれば、現在のseo過対策問題や検索キーワードの選択が苦手な人の問題への解決策が得られそうですね。とてもわくわくしたテーマでした。

  • @hirozoo3974
    @hirozoo3974 2 ปีที่แล้ว +2

    へぇ〜面白い言葉遊びだなぁ〜と思っていたら検索に利用されているですげぇー!!!ってなった

  • @Ryon_P329
    @Ryon_P329 2 ปีที่แล้ว +25

    このベクトルも時代に合わせてアップデートしていけばかなり有能

  • @ああ-o6y6b
    @ああ-o6y6b 2 ปีที่แล้ว +15

    来年、言語解析の授業取ろうかな

  • @三竹山-m2r
    @三竹山-m2r 3 ปีที่แล้ว +11

    おもしろいチャンネルを見つけてしまった
    応援します

  • @user-ly9el2kb5u
    @user-ly9el2kb5u 3 ปีที่แล้ว +68

    私は外大卒の日本語教師という超文系なんですが、理系目線の言語学面白いですね!

    • @うめ子-n7i
      @うめ子-n7i 3 ปีที่แล้ว +14

      自然言語処理は計算機科学ではメジャーな分野です!

  • @ninomiya-27
    @ninomiya-27 2 ปีที่แล้ว +3

    6:50
    最初は言ってることに納得してたけど、数学的に考えると「性別の関係ない職業A」から「性別の関係ない職業B」になるのは仕方ない気がしてきた。

  • @KLEWDO
    @KLEWDO 2 ปีที่แล้ว +1

    よろしければ、他の動画にも日本語の字幕付けてください。日本語学習者にとって、より簡単になりますよ。ありがとうございます!

  • @yotta11
    @yotta11 2 ปีที่แล้ว +11

    単語空間の空間としての構造に興味が出てくる
    例えば犬と猫が張る空間はどのようなものかとか線形独立な動物50個の線型結合で哲学用語を表したら係数はどうなるかとか

    • @fukyouwa-yin
      @fukyouwa-yin 2 ปีที่แล้ว +2

      後半想像したら草

    • @Mrdango-sq6lh
      @Mrdango-sq6lh 2 ปีที่แล้ว +2

      単語空間の基底が動物園になってるのは流石に草

  • @植松京子
    @植松京子 2 ปีที่แล้ว +16

    2:53アインシュタイン➖物理学➕哲学=ニーチェ

  • @ranten-oukoku
    @ranten-oukoku 5 หลายเดือนก่อน +4

    あれ?ゆるコンピュータ科学ラジオでの水野氏のモノマネより遥かに声高いぞ

  • @ZipRas497
    @ZipRas497 2 ปีที่แล้ว +3

    λさんのやつでも見たけどすごいねこれ

  • @reito-udon
    @reito-udon 2 ปีที่แล้ว +10

    言語の機械学習ってどうやってたのか知らんかった。ベクトルにしてと特徴量取り出してたんかな

  • @soryay
    @soryay 2 ปีที่แล้ว +3

    猫・掃除機の伏線が吸引で回収されるのすごいww

  • @Tomohiko_JPN_1868
    @Tomohiko_JPN_1868 2 ปีที่แล้ว +12

    単語ベクトルってSFやオカルトっぽい言葉で格好いいですね。
    単語という1元の1変数を2元の1変数に変換して
    操作出来る形にするっていうのは
    数学でいう実数空間からベクトル解析や複素平面へ拡げたような感じですね。
    追記:    (プログラマ) - (男性) = (専業主婦)
    これ、失礼な言い方だけど意味を考えれば割と良い線行ってます。
    多くの薄給プログラマは雑用エンジニアみたいな作業が大半ですし
    あれを女性に置き換えて例えるとすれば家事手伝いの作業って比喩としては冴えてます。

  • @大豆大好き剥き太郎
    @大豆大好き剥き太郎 2 ปีที่แล้ว +10

    Microsoftのツイートbotが問題発言をしたのは繕うという作業が抜けていたからだと思うね

  • @johnlennon2009nyc
    @johnlennon2009nyc 2 ปีที่แล้ว

    分かりやすくて助かりました

  • @sk-15
    @sk-15 2 ปีที่แล้ว +3

    ものすごくおもしろい。

  • @cocoh4873
    @cocoh4873 2 ปีที่แล้ว +1

    昨日のクイズノックで鶴崎さんがこれ使ってましたね

  • @momonso0821
    @momonso0821 2 ปีที่แล้ว +2

    これは最近見た動画の中で一番ほえーーってなった
    類似した検索結果とかSiriに聞いた時とかの答えとかが,多少表記ゆれあっても理解してくれるのなんでかなーっていつも疑問だったわ

  • @みゃーもと-l8e
    @みゃーもと-l8e 2 ปีที่แล้ว +2

    悪いデータを集めて暴走の流れ
    こち亀だなぁてひとり笑いました。

  • @grandmascurtain
    @grandmascurtain 2 ปีที่แล้ว +8

    猫吸ってる人いるし掃除機飼ってる人いるもんな〜

  • @HayakitaP
    @HayakitaP 2 ปีที่แล้ว +2

    この言葉の関係性が最も遠いと考える10単語を入力すると語彙力が測れるってサイトがありましてね…(英語限定ですが)

  • @全てをぶっ潰す
    @全てをぶっ潰す 2 ปีที่แล้ว +7

    喋り方好きすぎる

  • @クリーブランド-e5l
    @クリーブランド-e5l 2 ปีที่แล้ว +4

    transformerを音声に適用すると今ひとつって現象が起こるのはきちんと合成しないと違和感の塊の音声と違って
    文字ベクトルは出力がちょっと正しい値からズレてても決まった単語に寄せてくれるからうまくいくだけなんだな

  • @やんほぬ-r1m
    @やんほぬ-r1m ปีที่แล้ว +1

    機械は嘘をつかないってことですね

  • @toshihirom2038
    @toshihirom2038 2 ปีที่แล้ว +5

    ドラえもんー猫はコロスケでしょうよ

  • @mimizu8706
    @mimizu8706 2 ปีที่แล้ว +6

    画像も言語と同じベクトルに変換できると画像検索や画像生成(単語から画像)とか画像の分類や状況説明(画像から単語)もできるよね

  • @p0ny0s95
    @p0ny0s95 2 ปีที่แล้ว +5

    数字50個で定義されるベクトルって事は、50次元世界での矢印…ってコト!?

  • @山内太郎-m9w
    @山内太郎-m9w 2 ปีที่แล้ว +6

    単語ベクトルは「一つの単語に一つの意味」を前提とする研究で、複数の意味を持つ単語やその文法表現に対しては課題が多い ちょっと触れてほしかった

  • @ISSAN-02
    @ISSAN-02 2 ปีที่แล้ว +2

    分布仮説の説明の例文のところで一瞬でも空白に「メタルギア」と入れれば良いのかと思ってしまったワイは恐らく末期

  • @ajimov
    @ajimov 2 ปีที่แล้ว +2

    学習元の人間が「AIは差別的だ!」と叩くの皮肉でいいよね

  • @アクアジェットで吹っ飛ばしてけ
    @アクアジェットで吹っ飛ばしてけ 6 หลายเดือนก่อน

    いちいち登場してくれるの助かる

  • @しんぴのしずく
    @しんぴのしずく 2 ปีที่แล้ว +1

    これで「ゲスの極み乙女。」とか「ポムポムプリン」とかの対義語作ったらどうなるか知りたい

  • @そらぞめ
    @そらぞめ 4 หลายเดือนก่อน +2

    ???「古典的な単語ベクトルはお煎餅に似ている」

  • @TK-vr1ob
    @TK-vr1ob 2 ปีที่แล้ว +1

    単語全部が線型空間に存在してる場合、言語の論理に近似するんじゃないかていうのはあまりにも勝手すぎるし、上手くいかない理由はその仮定にあるのは明らかだから、実際にそれなりの精度を持ったアルゴリズム開発した人間はどういう精神力の持ち主なんだて思う

  • @TG-xx4rp
    @TG-xx4rp 2 ปีที่แล้ว +3

    単語の言語ベクトルに対してその動作、例えば(successに対してsucceed)みたいな本質的には意味が同じではあるが品詞が異なる関係についてはコサイン類似度がかなり高くなりそうなんだけど言語テンソルなるものを導入すれば解決できる??

  • @calvalefirea2926
    @calvalefirea2926 2 ปีที่แล้ว

    なんの前置きもなくさも常識かのようにPython、しかも対話版使っててびっくりした
    いやgensim使うならpythonなので問題ないんだけども
    Colabとか使うのかなぁと思ってたのでびっくり
    あと思ったよりしっかり説明してて勉強になる

  • @おむ-t5s
    @おむ-t5s 2 ปีที่แล้ว +2

    8月-夏休み気になる

  • @なつめぐ-n1w
    @なつめぐ-n1w 2 ปีที่แล้ว

    動画内の説明だと2次元グラフだけど、実際には一つの単語を説明するには15次元になるの面白いな

  • @葛葉恨之介-z1x
    @葛葉恨之介-z1x 2 ปีที่แล้ว +3

    おもしろい むかし論理学という本で理論の計算式というのを見たことがあるのですが それを数値化できるとは

  • @anubisu1024
    @anubisu1024 2 ปีที่แล้ว +2

    猫のテキストデータのうち1割弱が猫吸いしてて草

  • @遊輔堂薫風
    @遊輔堂薫風 2 ปีที่แล้ว +6

    意味は単語自体に内在はしていないので、周りの語との関係から意味を定量化する、という仕組みですね。←雑なまとめ

  • @aaaaa-kq1dh
    @aaaaa-kq1dh 2 ปีที่แล้ว +1

    AIも人間の偏見や悪い言葉を学習するのか…善悪はともかくそれだけ精巧ということだな

  • @3kan-7e5
    @3kan-7e5 2 ปีที่แล้ว +4

    何やこの文系の皮を被った理系は……

  • @showflatkk.3288
    @showflatkk.3288 2 ปีที่แล้ว +18

    その点、りんなは日本らしくオタク化していったよな

  • @ss-jx5tf
    @ss-jx5tf 2 ปีที่แล้ว +1

    偏見っつーか事実だわな
    割合として多いから仕方ないっちゃ仕方ない

  • @Nana-t9k4l
    @Nana-t9k4l 2 ปีที่แล้ว +2

    犬の時に吸引が出てきて笑ってしまった

  • @凜月-m7e
    @凜月-m7e 2 ปีที่แล้ว

    ベクトル化は分類問題でお世話になりました

  • @toyosohakmorik9838
    @toyosohakmorik9838 2 ปีที่แล้ว +9

    多次元ベクトルも可能ですか?

    • @ian-df6dc
      @ian-df6dc 2 ปีที่แล้ว +42

      猫について数字が50個って言ってたしそもそもこれが50次元ベクトルなのでは

  • @みかさ-d8d
    @みかさ-d8d 2 ปีที่แล้ว +2

    犬吸引しますよ!(愛犬家

  • @yasshi05
    @yasshi05 2 ปีที่แล้ว +1

    理系なのでタイトルが「単位ベクトル」に見えたwww

  • @時雨ユキ
    @時雨ユキ 2 ปีที่แล้ว +4

    単語が近い遠いってどうやって定義すんだろ

    • @sunsuga8524
      @sunsuga8524 2 ปีที่แล้ว +1

      近い遠いは色々あるぜ!
      数値で、距離尺度化しちまえば、クラスタ分析もできるしMDS分析もできるぜ!

  • @ReyZone00れいぞーん
    @ReyZone00れいぞーん 2 ปีที่แล้ว

    !?大学の自然言語のプロジェクトでやったことだ!

  • @ppp-ry5gg
    @ppp-ry5gg 2 ปีที่แล้ว +1

    パラメタが一個一個何を表してるのか気になるな

  • @龍女導師
    @龍女導師 2 ปีที่แล้ว +5

    むしろ大多数の人間が間違えていてAIが正しいんじゃね?

  • @gerektreqretnowar7783
    @gerektreqretnowar7783 2 ปีที่แล้ว +1

    内積使いそうと思ったら使ってた

  • @cocoadrink_014
    @cocoadrink_014 2 ปีที่แล้ว

    単位ベクトルなんて概念があるのか、為になるなぁ。

  • @hajimeshachou
    @hajimeshachou 2 ปีที่แล้ว

    線形代数の授業でやったなーなつい

  • @류해
    @류해 2 ปีที่แล้ว

    掃除機は何で一回飼ったことがあるの?

  • @osigorisanda
    @osigorisanda 2 ปีที่แล้ว

    支離滅裂な文を作るときに役立ちそう

  • @nihey7853
    @nihey7853 2 ปีที่แล้ว

    ある単語の周囲に出てくる単語の類似度で判定かーおもろいな

  • @一郎鈴木-d8e
    @一郎鈴木-d8e ปีที่แล้ว +1

    猫と吸うはもっと関連度高いと思います

  • @katsenberg3036
    @katsenberg3036 2 ปีที่แล้ว

    最後んところの恐ろしい前兆… あえて作ったAIならばあまり偏見や差別の思想を残さないで作って欲しいですが

  • @優希-x4n
    @優希-x4n 2 ปีที่แล้ว

    掃除機の1回出てきた「飼う」は絶対ドラえもんじゃん

  • @ジュピター-q4m
    @ジュピター-q4m 2 ปีที่แล้ว +1

    東京ー日本=首都、首都+イギリス=ロンドンみたいな感じするもんなぁ

  • @1f5d0dc68c
    @1f5d0dc68c 2 ปีที่แล้ว +2

    good video :)

  • @一汁三菜-t8d
    @一汁三菜-t8d 2 ปีที่แล้ว +2

    いよいよ文系だからって言い訳が出来ない時代が来たな、、

  • @Sean-y8m5h
    @Sean-y8m5h 2 ปีที่แล้ว +1

    その場合、同義語は一次従属ですね

  • @my-nj6gq
    @my-nj6gq 2 ปีที่แล้ว +1

    タイトルめっちゃ単位ベクトルに見えた笑

  • @ずるん-z4r
    @ずるん-z4r 2 ปีที่แล้ว +5

    飼う掃除機はルンバのことだろうね

  • @なむりん0624
    @なむりん0624 2 ปีที่แล้ว

    ちょー面白い

  • @ももみかん-s3t
    @ももみかん-s3t 2 ปีที่แล้ว +1

    Tay…手越?

  • @JohnDoe-tn7ni
    @JohnDoe-tn7ni 2 ปีที่แล้ว +2

    猫は吸うもの

  • @aaaaa-kq1dh
    @aaaaa-kq1dh 2 ปีที่แล้ว +2

    猫と吸引って…中川翔子のことであってる?笑

  • @半ダム-v1f
    @半ダム-v1f 2 ปีที่แล้ว +5

    猫吸い勢