「Studentのt検定」「Welchのt検定」の違いも含めて、対応のない2標本t検定を完全解説!

แชร์
ฝัง
  • เผยแพร่เมื่อ 30 ม.ค. 2025

ความคิดเห็น • 37

  • @バレル-m7d
    @バレル-m7d ปีที่แล้ว +1

    疑問が解けました。ありがとうございます!

  • @つばさ-y3c
    @つばさ-y3c 2 ปีที่แล้ว +1

    いつも勉強させて頂いてます!
    本当にわかりやすい説明で助かります!

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      コメントありがとうございます(^-^)
      いつもご視聴いただき、ありがとうございます!

    • @つばさ-y3c
      @つばさ-y3c 2 ปีที่แล้ว +1

      @@DataScienceLab.
      半年前から拝見させて頂いてますが、ここ3ヶ月で別の資格勉強してたこともあり、すこし統計学から離れていました。
      別の資格勉強がうまいこと受かりそうなので統計学を再開しましたが、当初拝見させて頂いた以上にわかりやすく感じております!

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      少し間が空いたことで、頭が整理されたのかもですね(^-^)
      半年間も視聴してくださっているのですね!
      ありがとうございます!

    • @つばさ-y3c
      @つばさ-y3c 2 ปีที่แล้ว +1

      @@DataScienceLab.
      ちなみに、今回動画とは関係なくてポアソン分布についてどうしても気になることがあるのですが。。。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      ポアソン分布の動画も、そのうちつくりたいと考えていますよ(^-^)

  • @おすま-m5q
    @おすま-m5q 2 ปีที่แล้ว +1

    対応のない2票本t検定についてわかりやすく説明していただきありがとうございます。
    P値は標準正規分布で発揮するため、標準化する(母平均を引いて、標準偏差で割る)必要性と不偏分散を用いる理由(期待値が母分散になる)を理解しました。
    自分の中の解釈なのですが、
    2標本の二つの分布が未知の場合でも(正規分布でない)、サンプルを多くとることで中心極限定理によって、標本平均の分布が正規分布に従う。正規分布の分散の加法性によって二つの分布(二つの標本平均の分布)の差の分布は、平均はそれぞれの差、分散はそれぞれの和の正規分布になるから、最初に述べたような標準化を行い(二つの母平均と二つの不偏分散及び自由度から)t検定を行うことができるということですかね。
    studentのt検定に関しては、二つの分布の母分散が等しいと仮定しているため、それらをプールした分散(二つ推定分散の和)が必要なのですね。
    welchのt検定では分散をプールする必要がない(二つの母分散が等しいとはわからない)が、自由度は等価自由度を用いなければならない。
    備忘録のようになってしまって申し訳ありません。

    • @おすま-m5q
      @おすま-m5q 2 ปีที่แล้ว +1

      疑問に思ったことがあるのでup主様に質問があります。統計初学者なので的外れな質問かもしれません。
      上のコメントの5~7行目の中心極限定理によって標本平均は正規分布に従うことはわかるのですが、そもそもt検定(t分布)は母集団が正規分布に従うことを仮定した場合に用いることができるものですよね?
      例題の果樹園の問題では、母集団のいちごの重さが正規分布に従う仮定をしているのでしょうか?そうでなければ、中心極限定理も利用できず(サンプル数的に)、t分布に従わないと思うのですが。。。わかりやすく解説をしていただけたら幸いです。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      正規母集団からとった標本で計算する標本平均が従う分布は正規分布です。
      正規母集団ではない母集団からとった標本で計算する標本平均が従う分布は、近似的に正規分布です(中心極限定理)。※けっこう少ないサンプルサイズでも正規分布ライクになります。
      サンプルサイズが小さい時の母平均の推定精度は低いため、2つの母集団の母平均がけっこう離れていないと確からしい検定はできません。その時、分布が厳密に正規分布なのかどうかは問題にはならない(正規分布ライクで問題ない)と考えます。
      なので、いちごの重さが正規分布に従っていてもいなくても、t検定で評価して問題ない、というのが私の考えです。

  • @menotsu3513
    @menotsu3513 ปีที่แล้ว +1

    7:35 プーリングも触れているので、参考動画として以下も加えた方が良いと思います。
    「プーリングがスッキリ理解できる!イメージは不偏分散の合体。」
    th-cam.com/video/TlZvLLpEt0A/w-d-xo.html

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว

      アドバイスありがとうございます。
      参考動画に追加させていただきました!

  • @LL-us1qg
    @LL-us1qg ปีที่แล้ว +1

    はじめまして。仕事で統計の基礎知識が必要となり、本動画で勉強しております。最後の例題で質問があります。果樹園Aと果樹園Bとの母分散を等しいと考えた理由を教えていただけないでしょうか。どうぞよろしくお願いします。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      ”母分散が等しいと考えられる”というのは問題文中にある仮定です。
      母分散が等しいと考えられるなら「Studentのt検定」を使い、母分散が等しいかどうかわからないなら「Welchのt検定」を使うわけですが、この例題では母分散が等しいと考えられるという仮定があるので、Studentのt検定を使って検定をしています。

    • @LL-us1qg
      @LL-us1qg ปีที่แล้ว +1

      ご丁寧な返信、ありがとうございます。大変良く理解出来ました。
      いつも大変勉強になる動画、ありがとうございます。何度も見て勉強してます。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      いつもご視聴いただきありがとうございます!
      今後ともよろしくお願いいたします(^-^)

  • @藤原元希-q8m
    @藤原元希-q8m ปีที่แล้ว +1

    ありがとうございました。
    質問なのですが、例題の自由度は Na+Nb-2=15 ではなくて、なぜ Na+Nb=17 を用いているのでしょうか?
    ご解説よろしくお願い致します。

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      na=9で、nb=10なので、na+nb-2=17です。

  • @halkumooo
    @halkumooo 2 ปีที่แล้ว +2

    過去の動画も参考にしながらいつも勉強させていただいております。
    1点質問です。
    Xaバーが従う分布とXbバーが従う分布を比較しているとき、分散の方を足し合わせているのはなぜでしょうか?(分散の加法性が成り立つのは理解しました)

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +3

      単純に、確率変数XAbarと確率変数XBbarの差である、確率変数(XAbar-XBbar)が従う分布の期待値と分散を考えているという風に理解してもらえれば良いかと思います。
      【参考】正規分布には再生性という性質があり、確率変数X1とX2(互いに独立)が共に正規分布に従っているなら、確率変数X1+X2も正規分布に従います。

    • @halkumooo
      @halkumooo ปีที่แล้ว +1

      @@DataScienceLab.
      なるほど、難しく考えすぎて根本が間違っていたことに気づきました…
      理解しました、ありがとうございます!
      3月にQC2級を受験します。
      統計学は学生の頃から苦手で嫌だなーと思っていたところ、データサイエンスLab.さんの動画に出会いまして。
      テキストの理解にこちらの動画を活用させていただいてます。
      とても分かりやすくて理解度が段違いで良いので、これからもお世話になりますm(_ _)m

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +1

      嬉しいコメントありがとうございます(^-^)
      試験がんばってください!

  • @うさみみんらでぃんちゃん
    @うさみみんらでぃんちゃん ปีที่แล้ว +2

    等分散の検定せずとも最初から全部 Welch でやるのはダメなんですかね?

    • @DataScienceLab.
      @DataScienceLab.  ปีที่แล้ว +2

      むしろ、等分散の検定なしでWelchのt検定をしたほうがいいと私は考えます。
      なぜなら、等分散であった場合のWelchのt検定の結果は、Studentのt検定の結果と同じになるからです。

    • @うさみみんらでぃんちゃん
      @うさみみんらでぃんちゃん ปีที่แล้ว +1

      @@DataScienceLab.
      なるほど。多重検定の問題になりますものね。いつも良質なコンテンツを有難うございます。

  • @おじゃ鯖の友人
    @おじゃ鯖の友人 2 ปีที่แล้ว +2

    studentのt検定で、プールされた分散まではわかったのですが、t分布が自由度na+nb-2のt分布に従うの証明はどこか参考にできるとこはありますでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +1

      コメントありがとうございます(^-^)
      証明の動画は準備していませんが、プーリングについては、下記の動画の12:40から解説しています。
      [解答テクニック]二元配置分散分析の肝である交互作用。これでもう間違えない!
      th-cam.com/video/EH_pMI1nXV0/w-d-xo.html

  • @代助
    @代助 2 ปีที่แล้ว +1

    studentのt検定のプールされた分散は加重平均を用いるのではないでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      (平方和の合計)÷(自由度の合計)は、不偏分散の加重平均を計算していることと同じことになります。
      なぜなら、不偏分散は、平方和÷自由度で計算されるからです。

  • @yellowtail5191
    @yellowtail5191 2 ปีที่แล้ว +1

    いつもわかりやすい解説ありがとうございます。QC検定の手法の勉強をしているとよくプールとかプーリングというワードを目にしますが、これは「ひとまとめにする(足し算する)」という理解で良いのですよね? 因みにですが、テキストにはプールした分散のことを「同時推定量」って記載してありました。。。(^^; 難しいですねぇ。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      プーリングとは、母分散が同じであると仮定できる場合に、ひとまとめにすることで、誤差の自由度を大きくすることです。
      これによって、精度の高い推定や検定ができるようになります。

    • @yellowtail5191
      @yellowtail5191 2 ปีที่แล้ว +1

      @@DataScienceLab. さん。ありがとうございます。プーリングは確か実験計画法の中で有意でない結果がえられた場合に誤差を小さくするためだけに使われる手法だと思っていたのですが、考え方は同じですかね。

    • @DataScienceLab.
      @DataScienceLab.  2 ปีที่แล้ว +2

      はい、同じ考え方です!