視覚で理解する分散分析。原理をわかりやすく解説します!

แชร์
ฝัง
  • เผยแพร่เมื่อ 3 ม.ค. 2025

ความคิดเห็น • 42

  • @ウェンリー-f5o
    @ウェンリー-f5o 6 วันที่ผ่านมา

    とても分かりやすい説明ありがとうございます😊

  • @井上勝雄
    @井上勝雄 ปีที่แล้ว +7

    この図による説明は、本当に分かり易い。群間分散と 群内分散の違いの説明が素晴らしい。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      ありがとうございます(*^-^*)

  • @qchan7
    @qchan7 ปีที่แล้ว +2

    いつも分かり易い動画をありがとうございます。
    すーーーっと頭の中に入ってきます。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      コメントありがとうございます(^_^)
      いつもご視聴いただき、こちらこそありがとうございます!

  • @ph1493
    @ph1493 7 หลายเดือนก่อน +4

    工学部の計測で困ってましたが、この動画ガチ分かりやすい。ホンマに感謝です!

    • @DataScienceLab.
      @DataScienceLab.  7 หลายเดือนก่อน

      コメントありがとうございます(*^-^*)
      お役に立てて嬉しいです!

  • @uncletrian9319
    @uncletrian9319 2 ปีที่แล้ว +6

    めっちゃわかりやすくて助かります!!!!!本当にありがとう

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      コメントありがとうございます(^-^)
      こちらこそありがとうございます!

  • @faraday.michal
    @faraday.michal 3 ปีที่แล้ว +6

    いいね1000回押したいです。
    やっぱアニメーションがわかりやすいですね。

    • @DataScienceLab.
      @DataScienceLab.  3 ปีที่แล้ว +3

      いいね1000回のお気持ち、受け取りました!!
      ありがとうございます(^-^)

  • @にゃぱにゃぱ
    @にゃぱにゃぱ 2 ปีที่แล้ว +8

    明日テストだったので助かりました😭やはり、Σだらけの教科書より、それを言語化してくれる方が分かりやすいですね!!

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      コメントありがとうございます!
      ですよね~
      私も分散分析の勉強を始めた頃は、参考書がΣだらけで、分散分析の本質を理解するのに苦労しました(>_

  • @in5668
    @in5668 11 หลายเดือนก่อน +1

    こんにちは。分かりやすい動画ありがとうございます。
    1つ質問宜しいでしょうか。
    6:30辺りの母分散の推定で自由度を出すときの、全全平方和を計算する際に使った変数9つのうち、自由に決めることが出来るのは8つ」、「群間平方和は変数3つのうち、自由に決めることが出来るのは2つ」とありますが、自由に決めるとはどのような意味でしょうか?
    宜しくお願い致します。

    • @DataScienceLab.
      @DataScienceLab.  10 หลายเดือนก่อน

      例えば、x1,x2,x3を使って偏差平方和を計算する時、偏差は各x-(x1,x2,x3の平均)で計算します。
      x1が変わると当然、(x1,x2,x3の平均)も変わります。
      x2が変わると当然、(x1,x2,x3の平均)も変わります。
      x3が変わると当然、(x1,x2,x3の平均)も変わります。
      だから、偏差平方和の計算結果が変わらないようにするには、偏差平方和の計算に使う、x1,x2,x3と(x1,x2,x3の平均)の全てが変わらないようにする必要があります。
      例えば、x1,x2までを自由に決めたとしたら、x3によって偏差平方和の計算結果を操作できます。逆に言うと、x3は自由に決めることはできません。
      「自由に決めることができる」というのは、こんなイメージです。

  • @おすま-m5q
    @おすま-m5q 2 ปีที่แล้ว +1

    統計を最近勉強し始めたものです。質問が二つほどあります。
    一つ目は、全平方和S_Tを計算する意味はあるのでしょうか?F分布によって、群間平方和と郡内平方和の比較をすることで差の有無を調べるので、S_Tの必要性を理解することができませんでした(全平均は群間平方和を計算するうえで必要であることは理解しました)。
    解釈としては、分散の加法性によって、全平方和と群間平方和を計算することで、郡内平方和はそれら二つの差で求まるからということになりました。この解釈だとどちらにせよ計算しているので、直接、群間平方和と郡内平方和を計算すればよいのではないかと思いました。
    二つ目は、6:23の母分散の推定とは、何の母分散を推定しているのでしょうか?
    群間の分散なのか、郡内の分散なのか、はたまたそれ以外の分散なのか疑問に思いました。
    データサイエンスLabさんの分散分析の解説が一番わかりやすかったです!
    これからも、統計勉強の過程でお世話になると思います!その際に、初歩的な質問をしてしまうかもしれませんが、回答していただけたら励みになります。
    長文失礼いたしました。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      ①一元配置実験の場合は、直接SEを求めることが比較的容易ですが、二元配置以上の実験になると、直接SEを求めようとすると非常に煩雑な計算をすることになるので、通常、SEはSTから各要因の平方和を引いて計算します。
      ②群間分散(各群の母平均が従う分布の分散)の推定、郡内分散(母平均からのずれが従う分布の分散)の推定です。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      嬉しいコメントありがとうございます(^-^)

  • @atussy7465
    @atussy7465 3 ปีที่แล้ว +1

    こちらもとっても分かりやすくて助かっています。
    9月にQC検定を控えているので、過去問や問題集をやりつつ、復習がてら動画で勉強させていただいています。
    さて、こちらでも気付いてしまって気まずいのですが、「郡内」「群内」が割と自由奔放に・・・

    • @DataScienceLab.
      @DataScienceLab.  3 ปีที่แล้ว +2

      セルフチェック漏れが多くすみません(>-

    • @atussy7465
      @atussy7465 3 ปีที่แล้ว +1

      @@DataScienceLab.
      もうノートに取りながら死ぬほど拝んでます♪ありがたやありがたや♪

  • @masashimatsuura3071
    @masashimatsuura3071 ปีที่แล้ว +3

    わかりやすい解説ありがとうございます。
    群間に差があるかを判定する基準として、郡内分散を用いる理由を教えて頂けないでしょうか。
    分子に群間分散を用いるのは、各群に差がない→各群の平均は全体の平均とほぼ同じ→値は小さくなるので、各群の差分を表現できると理解しています。
    ただ分母に郡内分散を用いるのがなぜかが理解しきれずにおります。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      例えば、群Aの平均が100で、群Bの平均が101だったとして、群Aと群Bに差があると言えるかどうかはこの情報だけでは判断できません。
      もし、群Aはデータが99.9~100.1の範囲でばらついており、群Bはデータが100.9~101.1の範囲でばらついているなら、差があると言えそうですが、もし、群Aが90~110の範囲でばらついており、群Bが91~111の範囲でばらついているなら、差があるとは言えなそうですよね。
      各群がどの範囲でばらついているのかは郡内分散で知ることができるので、分母に郡内分散の推定値を用います。
      ↑これは直感的な理解のための説明で、数学的な理解のためには、以下の動画を参考にしてみてください!
      ▼そういう理由だったのか!分散分析でなぜF検定が使われるのか?
      th-cam.com/video/UH2W8usbniA/w-d-xo.html

  • @ph4746
    @ph4746 2 ปีที่แล้ว +1

    6:28 「全平方和を計算する際に使った変数9つのうち、自由に決めることができるのは8つです」についてなのですが、もう既に決まってる1つってどのことでしょうか?👀

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      計算式中に平均値が入っていますが、9つ全部を自由に決めてしまうと、平均値が変わってしまいます。
      だから、9つのうちの8つしか自由に決めることはできません。

    • @ph4746
      @ph4746 2 ปีที่แล้ว +1

      @@DataScienceLab. あ、9つ中8つの値を決めたら残りの1つは平均値と先に決めた8つの値からまとまってしまう(=自由ではない)ってことですね!ありがとうございます😭

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      そのとおりです(^-^)v

  • @たろう佐藤-z2v
    @たろう佐藤-z2v 2 ปีที่แล้ว +1

    イメージ化の労作、大変にありがとうございます。感謝いたします。
    私の質問の語義が適切ではありませんでした申し訳けございません。修正させてください。
    一部で誠に恐縮ですが、疑問が生じました。このイメージはあくまで印象でしょうか、それとも論理図でしょうか。私が勘違いしていたら恐縮ですが、長さでの説明が一部理解できません。3:36のあたり「全体の平均u」と「群の平均」の間にある標本データについては図の距離感と式が合わないような気がしました。例えば左辺「x₁₂ - u」の長さよりも、右辺「a₁ + e₁₂」の長さが長くなってしまうと思うのですが・・・「x₂₁ - u」「x₂₃-u」についても同様の疑問がありました。しかし長さをイメージしたあとに、図の矢印方向を式では符合(+-)を付けて代入して増減を表すということなのですね。別途:偏差平方和については別途理解しました。
    ありがとうございます。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      コメントありがとうございます(^-^)
      図中の矢印の長さは距離であり、平方和の大きさではありません。
      赤枠の9つの数値を用いて計算した平方和が『群間平方和』、青枠の9つの数値を用いて計算した平方和が『郡内平方和』で、両者を足した結果は『全平方和』と一致します。
      不思議ですよね!
      この方法で平方和を分解できる理由を解説した動画も作製していますので、よかったら参考にしてください!
      th-cam.com/video/HlkDo-AH_R0/w-d-xo.html

    • @たろう佐藤-z2v
      @たろう佐藤-z2v 2 ปีที่แล้ว +1

      @@DataScienceLab. 早速に、ご指摘ご指南くださり誠にありがとうございます。私の語義に誤りがありましたので元文を訂正させていただきました。←と+-で理解できました。失礼しました。

  • @tornade365
    @tornade365 2 ปีที่แล้ว +1

    緊急です。
    Duncan post hoc test(多重比較のDuncan法)について一週間以内に動画を出していただくことはできないでしょうか?

  • @myfairc-girls2305
    @myfairc-girls2305 2 ปีที่แล้ว +1

    お世話になります。
    F分布はX二乗統計量(を自由度で除したもの)の比の分布のことだった筈ですが、なぜ平均平方(標本分散)の比がF分布に従うのでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      Xが標準正規分布に従うとき、X二乗のnこ分の和が従う分布が自由度nのカイ二乗分布です(カイ二乗分布の定義)。
      よって、Y1がN(μ1,σ1^2)に従うとき、(Y1-μ1)/σ1のnこ分の二乗和は自由度nのカイ二乗分布に従い、(Y1-Y1バー)/σ1のnこ分の二乗和は自由度n-1のカイ二乗分布に従います。
      同じように、Y2がN(μ2,σ2^2)に従うとき、(Y2-Y2バー)/σ2のmこ分の二乗和は自由度m-1のカイ二乗分布に従います。
      F検定の帰無仮説は『2つの母分散が等しい(ここではσ1^2=σ2^2)』なので、σ1^2/σ2^2=1となるため、結果、平均平方の比がF分布に従うことになります。
      ※コメント欄で解説するのが難しく、伝わらなかったらごめんなさい(>-

    • @myfairc-girls2305
      @myfairc-girls2305 2 ปีที่แล้ว +1

      @@DataScienceLab.
      帰無仮説においては分散が等しいので約分して表示しないということですね。
      ありがとうございました。

  • @たろう佐藤-z2v
    @たろう佐藤-z2v 2 ปีที่แล้ว +1

    わかりやすく説明くださり誠にありがとうございます。初心者的質問かもしれませんがご容赦ください。実際の使用では、群1・群2・群3のサンプルサイズが違うことがあるかと思います。例えば極端ですがサンプルサイズが「群1は50個」「群2は25個」「群3は15個」といった場合です。このような場合、分散分析において群数が少ない群を除くか補正するなどの何らかの手法を施すと思いますが、よく使われる手法は何でしょうか。毎回すみません。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      コメントありがとうございます(^-^)
      一元配置分散分析に限っては、各群のサンプルサイズが異なっていても分析可能です。各群のサンプルサイズが同じである場合と同じように、各データを、群間成分(各群の平均)と群内成分(各データ-各群の平均)に分解して、群間成分の平方和と郡内成分の平方和を計算すると、その和は全体の平方和と等しくなりますよ!

    • @たろう佐藤-z2v
      @たろう佐藤-z2v 2 ปีที่แล้ว +1

      毎回、迅速に丁寧にご教授くださり大変にありがとうございます!
      すると「サンプルサイズ」の問題は「等分散性の検定のほうで確認できていれば良い」と考えてよろしいでしょうか。度々、申し訳けございません。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      仮説検定におけるサンプルサイズを検討する際には、『検出力』の考え方を適用するのが一般的だと思います。
      有意水準、誤差分散(仮定値)、検出したい平均の差、水準数、サンプルサイズ、を指定すれば検出力が計算できるので、逆算で、所望の検出力で検定することができるサンプルサイズを求めることができます。

    • @たろう佐藤-z2v
      @たろう佐藤-z2v 2 ปีที่แล้ว +1

      @@DataScienceLab. さん
      本当にありがとうございます。勉強の大きな指針になります。

  • @屋敷大和-g8n
    @屋敷大和-g8n ปีที่แล้ว +1

    わかりやすい~(/・ω・)/