ご視聴コメントありがとうございます!🎉 鋭い質問ですね😎 解釈については、回帰か SEM かなどのモデルの違いとはまた別の方向を、深く検討する必要があります。 x が増加すると y が増加すると書けば、通常は因果があると解釈されると思いますが、 因果の有無は、ドメイン知識や先行研究を用いてその因果が妥当かどうか検証したり、統計的因果推論の技法を使う必要があります。 x が大きいときに y も大きい傾向にあるという、相関的な解釈であれば、回帰でも SEM でも可能となります。 ここらへんは、以下の本の2.2節に詳しく書きましたので、ぜひ見ていただけるとよいかと思います!(^o^) amzn.to/3F0hZ4a
統計ほぼ独学で参考書に必死でかじりついている心理学徒でしたが、本当にこの動画は分かりやすかったです!参考書には出てこない大雑把なニュアンス「データの相関が一番うまく説明される形にする」など、感覚的に腑に落ちる部分が多く助かりました。他の動画も見てみます!ありがとうございます。
ご視聴コメントありがとうございます!!!
お役に立てて光栄です!!!🎉🎉🎉
まさに、心理の方々なんかは、重い統計と向き合う方々なので、
そんな方の力になりたいなと思って動画を生成してます!🔥
ぜひこの理解をご活用いただけると嬉しいです!🤩🎉
最近AIciaちゃんの動画にどはまりしてかたっぱしから見ています。勉強になります!ありがとうございます!
おおー!ありがとうございます、嬉しいです!😍🎉🎉
これからも価値ある動画を生成できるよう頑張りますので、応援よろしくお願いします🎉
わかりやすかったです。もっと聞きたい!って思いました。
ご視聴コメントありがとうございます😍🎉🎉
ぜひ、たくさんありますので、のんびりお楽しみください😋
どんな本読んでも意味わからんくて、こういう動画本当にありがたいです、、ありがとうございます😭😭😭
よかった!
そういう人のために動画を生成してるのです!😍😍😍
楽しんでいただけたようで何より!!!
とても分かりやすい説明でした!
SEMの本質が、素人ながら理解できたように思います!
ありがとうございました!
それはとても良かったです!😍🎉🎉🎉
とても楽しいので、ぜひ調査研究に使ってみてくださーぃ!(^o^)
論文の参考にします!
ご視聴コメントありがとうございます!!!🤩🤩🤩
ぜひぜひ!
なかなか使える子ですので、ぜひご活用くださいませ😍
Pythonを使って機械学習、データサイエンスの勉強を始めたばかりの初心者です。見えない因子が見えてくる、面白いです。これで可視化できると説明性が増しますね。見SEMをPythonでも使用できそうな記事を見かけたので試してみようと思います!ありがとうございます(心理学にいろんな統計が使われていること初めて知りました、興味のある分野なので、さらにわくわくしました!)
ご視聴コメントありがとうございます!🎉
楽しんでいただけたようで、とても嬉しいです🤩🎉
他にも因子分析など、よく使うものを動画にまとめているので、是非色々楽しんでみてください!(^o^)
すごく分かりやすいです。
ご視聴コメントありがとうございます!😍🎉
楽しんでいてだければ何よりです!💪
いろいろ勉強させていただいますが、どれも本当に面白く、そして助かっています。むかし大学で「文系物理」というオクシモロンのような名前の講座があって、それが教養課程で受けた最高の講義だったと思っているのですが、それに近い切れ味を感じます。SEMの数式に興味を持ちましたのでぜひ自習してみます。
おほめに預かり光栄です😊😊😊
ぜひ、SEM の世界をお楽しみください😊🎉
分析する側にならないと分からない事って多いですよねー
教科書だとモデルが計算から出てくるように感じちゃうけど、実際はPCはモデルを作ってくれてるのではなく確認してくれてるってイメージ、だから人間大事w
そうなんですよね!
そういう感覚は、特に、数理統計から攻めた私が理解するに時間がかかる領域でした😋
大学内で見ていたんですけど、変な勘違いされました。以上です。
フフフフフ😎
逆に布教してみてはいかがでしょう?😎
0:17の因子分析の正統進化が“困る分析の正統進化”に見えた
😱😱😱
、、、たしかに、、(笑)
字はきれいに書きますね😎
分かりやすかったです!
最近、成長曲線モデルや交差遅延モデルを扱う機会があったので解説してほしいです。。
ご視聴コメントありがとうございます!
そのモデルも面白いですよねー!!!😍
今は作りたい動画が大量なので、いつ作れるかわかりませんが、いつか作りたいと思います!
18:00 言語力、数理力、記憶推論などは他のデータから参照した数値をもとに相関関係を見てるのでしょうか?
すみません、質問の意味がよくわかりません😢
どういう意味でしょうか?
@@AIcia_Solid 質問力足りなくてすみません。
1.因子、潜在変数である(言語力、数理力、記憶推論)はあいしあさんが勝手に決めた変数ですか?
2.18:00 ごろにある相関関係の決定方法について、例えば言語力の場合国語に対して0.51、英語に対して0.50、論理に対して、0.68などの数値は14:37で話している「いい感じ」とか「しゃべりだすとやばい」の部分で決定しますか?
3. 2の部分がしゃべりだすとやばい部分だったとしても、「言語力」という曖昧なデータをどのように数値化してどのように使ったのかが分かりにくいです。
質問の意図が分かりくいようでしたら容赦なく言ってください!
AI との会話ではあるあるなので気にしないでください😋
1. そのとおりです!
SEM では、因子構造の仮説をたて、計算し、修正することを繰り返すのが一般的です。
このとき、仮説は人間がたてる必要があります。
また、因子の意味も、人が解釈する必要があります。
2. そのとおりです!
ここは、数学的詳細が気になる場合でなければ、ソフトウェアに任せるのがよいでしょう。
ちなみに、気になる場合は、この本がおすすめです。
amzn.to/3dAbuUG
3. すみません😢
そこは意図的に省きました。
また数学的な詳細を話すシリーズがあれば、そこで解説を試みることにします😎🔥
@@AIcia_Solid 夜遅くに返信ありがとうございます!
それぞれの理解が深まりました。
実は数学知識が中学レベルのまま人工知能や分析などに興味持ってしまったのです(笑)
少しづつ頑張ってあいしあさんに追いつけるように頑張ります!
ぜひ!
お待ちしています😎
データ分析でPath Analysisを使用するので、ゼロから学ばせていただいております。お時間がある時にもう1つ少し複雑なPath analysisの例を投稿していただければ有り難いです!隈なく見させていただきます!
ご視聴コメントありがとうございます!
たしかに!!!
path 解析やってない!!!
ありがとうございます(^o^)
そのうち動画化します!😍🎉🎉🎉
@@AIcia_Solid 楽しに待っております!!よろしくお願いいたします🙇♂️
説明大変分かりやすかったです.構造方程式のαとβを決定するやり方を気になって調べてみたところ,最小二乗法と最尤推定法の二つがあると知りました.両者の推定法のどちらがよく用いられるのか,そして一方が用いられている理由をご存じでしょうか?
いい質問ですね!
私はあまりここにリテラシーないので、よくわかりません🙇♀️🙇♀️🙇♀️
なんとなく、手法的には最尤法の方が良さそうな気もしますが、わかりません🤔
論文化するのであればその分野の人に聞いてみたり、
ただ調査するだけなら色々試して比較してみるのがよいのではないかと思います!
@@AIcia_Solid返信ありがとうございます! ただの調査なので比較して検討してみようと思います!
因子分析が「困る分析」に見えておもしろい
それは新しい視点ですね🤣🤣🤣
最後のワーク・エンゲイジメント、会社と仕事の相関って小さかったんでしょうか?
家庭環境と健康状態ってどうなんでしょう?(腰痛とやる気の話はちょっとだけ覚えてます)
素敵な質問ありがとうございます!
もちろん相関は強くありましたが、SEM のモデルを立てる上では、そこには相関のパラメーターをおかないほうが良いです。
というのも、これら因子の相関を、直接相関のパラメタで置くのか、より下位の因子からの影響で説明するのか、二通り出てきてしまって、最適化がうまくいかなくなるからです。
実際のデータ的には、想像のとおり、めちゃ相関しています!
@@AIcia_Solid
そうだったんですね!!
SEMモデルについてちょっと調べてみようと思います!いつもありがとうございます!
ぜひ調べてみてください!
なかなか素敵ですよ!🎉
こちらこそ、いつも素敵な質問ありがとうございます🎉🎉🎉
作品を作り上げる、芸術のような楽しさを感じさせますね。
この図を見て思ったのですが、昔(40年位前)ニューラルネットワークというのが、随分と流行った気がします。最近はあまり聞きません。図が似ている気がしますが、関係はあるのでしょうか?
ニューラルネットワークは今大流行していると思いますが、それとは別ですか、、?
関係がないといえば嘘かもしれませんが、あまり関係を見いだしても理解の役に立つかは分かりません。
構造方程式モデリングは構造方程式モデリング、ニューラルネットワークはニューラルネットワークです👀
いつもわかりやすい動画ありがとうございます!
初歩的な質問で恐縮ですが、
構造方程式モデリングとグラフィカルモデリングの位置付け的な違いはなんでしょうか?
ご視聴コメントありがとうございます!
業界や目的でも違うと思うので一概には言えないですが、私の感覚だと、
グラフィカルモデリングは、1つの概念について変数が1つのデータに利用します。割とふつーのデータのイメージです。
構造方程式モデリングは、1つの概念について、3つ以上の変数があるデータに使います。心理学的な調査票でよく用いられます。(質問が1つだと、正確に把握できないので、複数使います)
何となくこの違いが一番メインである気がします🤔
他の強い人の意見も聞きたいところです🤤
構造方程式モデリングでは、予め仮定したパス図でうまく表現できなかったら、また新しいパス図を仮定して分析して、、、
といったことを繰り返すのでしょうか?
ご視聴コメントありがとうございます😊
その通りです!
そうやって探索的にいいものを探していくことになります(^^)
@@AIcia_Solid LINGAMなどの手法は、パス図を仮定する必要がないと思うのですが、
細かい違いなどはどういったところでしょうか?
すみません、質問の意味がよく分かりません。
手法が異なるので、細かな違いはたくさんあります。
どのようなことが知りたいのでしょうか?
@@AIcia_Solid LINGAMについて知りたかっただけです!
できれば因果探索の動画なども出してくれると嬉しいです。
なるほど!
そういうことですね!
LINGAM はじめ、因果推論については、今年中かおそくても来年ごろには出す予定です。
しばしお待ちください😋
構造方程式って行列の積で書けそう…。係数を決定するところの「やばい計算」って、線形代数と他の何かを悪魔合体させたような感じですか?
鋭いですね😎✌️✌️
行列で書いて、良い感じに良い値を見つけます。
詳しい計算は、
amzn.to/2CMStSd
にありますよ!
ちゃんと読めばそんなにやばくないです😋
Amosを使ってχ2値やGFIなど適合度を出そうとしているのですが、データが大きいこともあり、2日がかりで計算してくれているのですが、結果的に値がでないということを繰り返しています。観測値を順序尺度でとっていますが、それらを平均値でとった値を観測値として、単純な構造で適合度を出しても良いものなのでしょうか。もし、お時間がありましたら教えていただけますと幸いです。
順序尺度を平均して間隔尺度としてSPSSに入れ込んでいますので、それらを使ってパス図を描いて適合度を出すという手法に切り替えようともって思い始めました。コンピュータのスペックの問題なのかもしれませんが、反復の計算に時間がかかり凹んでいます。
そこまで具体的な話は、私でもわかりかねます、、、。
データ量や変数量を確認してみてはいかがでしょうか?
あとは、変数間に線形の関係がない歌や、変な相関関係がないかをみてみるのも良いかもしれません!
@@AIcia_Solid ご丁寧にお返事いただき、感謝です。変な相関・・・。確かに相関の線形を入れすぎているために重くなっているとは思います。観測変数は変えてはいけないのだろうということは概ねわかりました。もう少し勉強を進めていきます。(ちなみに博士号を取得する回を拝見しました。有り難うございました)
あ、変数の間に線型な関係があったらたぶん計算止まらないので、そういうのは除去するのがよいと思います!
(エラーで教えてくれそうなものですが、、)
いろんな動画をみていただきありがとうございます😊
これからも価値ある動画を作れるようがんばります!🔥
計算はコンピュータがやってくれますが、モデリングを考えるのが大変だと思いました。構造のモデリングを自動的に導くような手法があるのでしょうか?
そこを考えるのが人間に残された仕事です😎
いい感じの手法もなくはないですが、それは結局何らかの誤差関数を最適化する結果が得られるだけで、モデルを通してデータと対話することで深い理解を得るという、本手法でもっとも大事なところは満たせません😢
@@AIcia_Solid ありがとう御座います。AIciaさんみたいな方がyoutuberにいてありがたいです。たくみさんもおっしゃってましが、大学の先生は、授業を教えるプロではないため、分かりづらい方も多いです。高度な授業をなるべくわかりやすく多くの方に理解するようにコンテンツを作成されている教育系youtuberは、国の宝だと思ってます。応援しております。
そんなそんな😊😊😊
本当にそうなるべく、これからも精進を続けます!🔥
興味深く拝見しました。
1つ気になったことがあるのですが、
SEMにおいて、モデルが安定するために必要なサンプル数って算出できるのでしょうか。
いい質問ですね!
基本的には、共分散構造が鍵になるので、共分散行列が十分な精度で求まる量あればよいかとおもいます。
おそらく、ある程度見積もることはできるとおもおますが、調べてみないとなんともわかりません、、、!🙇♀️
Udemyでpythonも含めた講義をして欲しいですw鬼パイセンの元絶賛データスパークリング中でもっと知りたいです最高です。
ここらへんは Python 実装薄いですからねー😇😇😇
Python についてはまた色んな TH-camr さんもいますので、そちらを参考にしていただけたらいいと思います(^o^)
応援しています!🎉
@@AIcia_Solid ありがとうございます!いつもありがとうございます😭
いつも勉強させてもらってます。
構造方程式の係数、α、βは回帰分析の係数と同様でしょうか?
つまり、y=ax+bz+eのときyはxとzのみで予測でき、xが増加するとyはa倍増加すると単純に線形回帰式として使えるのでしょうか?
ご視聴コメントありがとうございます!🎉
鋭い質問ですね😎
解釈については、回帰か SEM かなどのモデルの違いとはまた別の方向を、深く検討する必要があります。
x が増加すると y が増加すると書けば、通常は因果があると解釈されると思いますが、
因果の有無は、ドメイン知識や先行研究を用いてその因果が妥当かどうか検証したり、統計的因果推論の技法を使う必要があります。
x が大きいときに y も大きい傾向にあるという、相関的な解釈であれば、回帰でも SEM でも可能となります。
ここらへんは、以下の本の2.2節に詳しく書きましたので、ぜひ見ていただけるとよいかと思います!(^o^)
amzn.to/3F0hZ4a
脳汁出ました!最高です!
自分は公認会計士なのですが、周りに会計士×データサイエンティストみたいな方はいらっしゃいますか?もしいればどういったキャリアを歩んでいるのかお聞きしたいです。
ご視聴コメントありがとうございます!😍🎉🎉🎉
脳汁、、、いいですね、、、、、🤤
すみません、残念ながら私の周りにはおりません、、🙇♀️
他の方に聞いてみていただけると良いかと思います!🙇♀️🙇♀️🙇♀️
化学が別の因子って、何か納得w特に高校レベルだと。
このデータは人工的に作られたものなので、中身はそこまで信じないでください😋
良くある解説ブログとかよりも分かりやすくて、ためになりました!
質問なのですが、SEMにはベイジアンネットワークにあるような手法の限界やデメリットなどはないのでしょうか?
おほめに預かり光栄です😊
もちろん、似た手法ではあるので、限界やデメリットもあります。
たとえば、 SEM は一定数の説明変数の数がないと使えない(ざっくり、潜在変数の3倍くらい)など、手法特有の制限もあったりします。
詳しくは、実際に適用する課題やデータ次第だと思いますが、個性ある手法なので、適材適所が鍵になると思います!
いつも拝見させていただいております!現在因子分析について勉強中で一つだけお聞きしたいのですが、観測変数から潜在変数への因果は記述できるものなのでしょうか?
ご視聴コメントありがとうございます!
基本的には、SEM ではそもそも観測変数から潜在変数への因果は想定しないことが多いように思います。
どのようなケースを想定されているでしょうか、、、?
一応、心理学でのアンケート系のデータでは、回答行動によって心理状態が変化し、それによって次の回答が変わったりするので、観測変数から潜在変数への影響を考慮することはあります。
ですが、SEM の中ではやられず、別の箇所で対処されるのが一般的な気がしています🤔
@@AIcia_Solid ご返信ありがとうございます!素人が考えた仮説にはなりますが、「ブランド力」は顧客満足度や市場シェア、認知度などの観測可能と思われる変数で記述できるのではないかと思います。
ありがとうございます!
素敵な仮説だと思います。
ちなみに、「記述できる」とはどういう意味でしょうか?
@@AIcia_Solid モデルの中で仮説を定義できるという意味で使っています!
モデルで仮説を定義できるという意味であれば、正しいと思います!
ワークエンゲージメントの例は、5つ全て潜在変数で、観測変数は書くのを省略してるのでしょうか?
その通りです!
観測変数は省略させていただきました😋
1つ確認したいことがあるのですが、
今回の動画では、潜在変数を定義するにあたり観測変数がダブりなく使われていると思うのですが、
実際の分析では、観測変数を複数の因子に含めることも可能ですか?
すみません! お返事遅くなりました!
いろいろ調べたところ、多分大丈夫だと思います!
推定がまともに行くかどうかの条件(識別可能条件)が結構複雑にはなりそうだなという印象です!
詳しくはこの本を見ていただけると分かるかと思います!
amzn.to/3NzEiPW
今回の例で言うと、構造方程式で表されるx,y,z,wなどの観測変数の値にはその教科の全生徒の平均の値が入るんですか??
いいえ、平均点が入るわけではありません。
各生徒の得点が構造方程式にしたがっていると考えます!
因子分析もベイズで書けることですしグラフィカルモデルはSEMを含むと思って良いんですかね
(グラフ理論でいうところの)グラフに統計モデルを対応させるときその統計モデルをグラフィカルモデルと呼ぶ、というのがグラフィカルモデルの定義だそうです。ということはパス図をグラフとみれば、SEMもグラフィカルモデルといえるのかなと。
K Dr. そうなんですねありがとうございます。
パス図が両矢印を含むのであえてベイジアンネットワークとは言いませんでしたが、SEMがベイズモデルの枠組みで説明できるのかどうか、という点が気になったところでした。(そう解釈することでSEMの拡張がしやすくなると思ったので)
言葉の定義の問題もあるので一概に言えませんが、動画で紹介した範疇だと、
グラフィカルモデルでは潜在変数(観測できない変数)を扱わないのに対し、 SEM では潜在変数を扱うとか、
推定の方法が若干違う(※)などの違いもあります。
ほとんど似た用途に使われますが、潜在変数の関係をみたいか、観測変数の関係をみたいかで使い分けられるような印象です。
※グラフィカルモデルでは、検定 + 最尤法で、 SEM は適合度でモデルを選ぶというマニアックな違いもあります
Aicia Solid Project ご丁寧に説明頂きありがとうございます。
グラフィカルモデルは潜在変数を扱わないというのがどういう意味なのか分からないのですが、LDA(トピックモデルの方)や隠れマルコフモデル・線形動的システムなどは典型的な潜在変数を扱うグラフィカルモデリングがなされると思うのですが、そこらへんの扱いが気になりました。(そんなこと言ったら任意のベイズモデルはグラフィカルモデルで書けるじゃないかと言われそう)
いつも拝見させていただいています。
今回の場合観測変数の単位が全部100点満点だと思うんですけど、違った単位を使いたい場合はどうすればいいですか?
例えば体重と身長とかです。
その場合はとりあえずαとβを出して正規化の時に工夫をするという事になりますか?
後18:16の所の誤差因子がない理由ってなんかあるんですか?
先にデータを正規化してから用いることが多いです。
18:16 の図は、「①→」の部分が誤差項に対応します😋
詳しくは書籍などを見ていただけるとよいと思います!
オススメにでてきて見まくっちまったぜ。おもしろかった!
気になるんですけども、統計学者の人達はどういう順番でこういうのするんですか?
やっぱりまず因子分析してからグラフィカルモデリングとか構造分析に入るのか…?使い分け方とかあったら聞いてみたいです!
TH-cam さんナイス😎✌️
その時の分析の目的や仮説によります!
まずは平均分散共分散ヒストグラムなど、基本的なデータを確認したあと、仮説に合わせたモデルを用いて分析することになります。
なので、それぞれの分析モデルが、どういう事ができるものなのか広くわかっていることが肝要になると思います😊
やりたいことと分析モデルのできることを合わせるんですね。ありがとうございます!料理人の厨房覗き動画みたいに、いつか分析モデルの決定過程とか見てみたいです!
分析配信、やりたいんですけどねー!!!!!
kaggle や SIGNATE は配信に問題ありますし、、、。
何か良いテーマがあったら教えてください!!
うーんパッと思いついたのは、ウェブサイトやらラインの広告の効果測定くらいですね…
得られるデータは広告見た数、クリックして開いた数、それで実際買った数、その会員データ(年齢性別都道府県等)くらいでしょうか…
あとは打った広告の特徴なんかを分類して(文字多め、人の顔、商品の画像だけ)その効果を数値で出すとかですかね…全部想像なので恐縮ですけども😫
コロナでEC事業が盛り上がってるのでデータ分析したい方は多いようなきがします…!
そういう系のデータで、オープンに使ってよくて、収益化してもよかったりするやつがあると理想なんですよね😇
もしみつけたら教えてください!!!
はじめまして。いつも動画をありがとうございます。とても参考にさせていただいております。
私は数学を一切扱わないド文系の学部から転身し、只今「共分散構造分析」の課題に挑戦しています。
分析の仕組みは掴めたような気がしているのですが、いざ自分で取り組もうとすると、どのようなデータを分析対象とすればいいのかがわからなくて。。
「インターネット上で適当なデータが拾える」と先生がおっしゃっていたのですが、連絡がなかなかつかなくて締め切り日が迫ってきて焦っています💦
そこで、以下の2点質問させていただければ幸いです。
ー共分散構造分析に適用されるデータの特徴
ー共分散構造分析に使えるデータがありそうなソース
素人目線の質問、また、長文で大変申し訳ありません。ご助言など頂けましたら幸いです。失礼しました💦
共分散構造分析に使えるデータは、互いに相関が高い変数がたくさんはいっているもので、自分のドメイン知識による直感が反映できるものが望ましいです。
複数の観測変数から、1つの本質的な因子を見いだす分析なので!
そのため、心理学系の質問紙のデータなんかは良く用いられると思います。
今回紹介した手法とは異なりますが、相関行列から分析を実行できる手法もありますし、
相関行列なら数多の論文に生データとして載っているので、それをやってみるのもありかもしれません👀
@@AIcia_Solid お忙しいところ、ご丁寧なお返事をありがとうございます!!
早速、いただいた手がかりを元に再度検索をかけてみました。そして、やっと心理学系の質問紙のデータを見つけることができました。
データの形式としては、各質問に対して5段階評価で答えるもので、質問項目が30程、また、回答数が1000以上ありました。
30列×1000行のマスに1~5までの各評価が記入されているものです。
このデータは、共分散構造分析に用いるデータとしては適切でしょうか??(質問数、回答数が多すぎでしょうか?!)
また、共分散構造分析をする際には因子分析をしてから構造の推定をするのでしょうか?
毎度、質問になってしまい、すみません💦
良いデータだと思います!😍
先に因子分析をやる手順も素敵だと思います!🎉
最後の実例では、原因系{ソフト、ハード}から結果系WEに直接パスがないのがポイントですね。2つの中間変数で両者の関係が説明しきれている、と解釈できます。
でしょ😍
大量に作ってあれこれ考えた結果、これに落ち着きました🎉