なぜn-1で割るのか?がわかる!標本分散と不偏分散の違いと使い分けを徹底解説!

Поділитися
Вставка
  • Опубліковано 27 гру 2024

КОМЕНТАРІ • 53

  • @gonzanankai2625
    @gonzanankai2625 2 роки тому +7

    どの動画も簡潔で非常に分かりやすいです。今まで、公式や用語を何となく暗記していましたが、これでスッキリしました。また、例題があるので理解しやすいです。ありがとうございました。

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому

      コメントありがとうございます(^-^)
      こちらこそ、嬉しいコメントをありがとうございます!

  • @soumenoishii1637
    @soumenoishii1637 Місяць тому +1

    わかりやすいです❤ありがとうございました😊

  • @えま-k7z
    @えま-k7z 10 місяців тому +1

    わかりやすすぎる。本当にありがとうございます。

  • @藤原元希-q8m
    @藤原元希-q8m Рік тому +2

    分かりやすかったです。ありがとうございます。

  • @内川小百合-v6w
    @内川小百合-v6w 3 роки тому +5

    動画の5:09前後の「まとめ」の冒頭箇所(母分散と標本分散の大小比較)ですが、実際に計算してみると、標本分散の方が大きくなるケースがありました。
    (以下の計算根拠は、動画内にある数式を基に計算したものです。)
    例えば、母集団の要素として10個の数字{2,8,5,9,6,4,6,8,7,7}があるとします。当該母集団の平均は6.2、偏差平方和は39.6、分散は3.96となります。
    一方母集団から5つのサンプル{2,8,9,6,7}を抽出した場合、サンプルの平均は6.4、偏差平方和は29.2、分散は5.84となります。
    以上のことから、母分散≧標本平均とはならい場合がある気がするのですが、当方が何か勘違いして理解しているのであれば、是非ご教授くださいませ。
    よろしくお願いします。

    • @DataScienceLab.
      @DataScienceLab.  3 роки тому +6

      コメントありがとうございます(^-^)
      そのとおりですね。
      低い確率で、標本が偏ってサンプリングされた場合は、標本分散のほうが大きくなる場合も確かにありますね。
      サンプリング→標本分散を計算する、を何度も繰り返した時に、それらの標本分散の平均は必ず母分散よりも小さくなります。
      よって、標本分散の『期待値』が必ず母分散よりも小さくなる、と説明するべきでした。
      ご指摘いただきありがとうございます!
      また、混乱させてしまい、申し訳ありませんでした(>-

    • @田中すんすん
      @田中すんすん Рік тому +1

      あなたのおかげでひらめきました。ありがとうございます。

  • @三輪大先生
    @三輪大先生 Рік тому +2

    高校数学や情報Ⅰを教えている塾講師です。今一つ納得できなかったところだったのですが、謎が解けました。
    素晴らしい動画です。ありがとうございます。

    • @DataScienceLab.
      @DataScienceLab.  Рік тому +2

      コメントありがとうございます(^-^)
      お役にたてて嬉しく思います!

  • @qchan7
    @qchan7 2 роки тому +1

    素晴らしい教材をありがとうございます!
    勉強になりました。

  • @こけし-h3g
    @こけし-h3g 3 місяці тому +1

    あああああ…なるほど…めちゃくちゃ助かりました

  • @なおぽん-g9o
    @なおぽん-g9o 2 роки тому +5

    なぜn-1で割るのか理解できていませんでしたが、ご説明のおかげでスッキリしました!ありがとうございます。引き継ぎ他の動画でも勉強させていただきます!

  • @かばさん-m3e
    @かばさん-m3e Рік тому +1

    わかりやすかった

  • @Fun-Fan6
    @Fun-Fan6 3 роки тому +2

    他のチャンネルでも色々見てたけれど、やっと今意味がわかった!!!
    ありがとうございます!!
    自分メモ
    2:31
    3:45

    • @DataScienceLab.
      @DataScienceLab.  3 роки тому +1

      お役に立ててよかったです(^-^)

  • @パプリカ2000
    @パプリカ2000 6 місяців тому +1

    わかりやす過ぎて飛ぶ

  • @user-om2ec4lc3q
    @user-om2ec4lc3q Рік тому +1

    わかりやすい動画ありがとうございます!最近勉強し始めたので初歩的な質問になってしまうのですが、標本平均の分散を足したら母分散に近づくのがなぜかよく分かりません。良かったら教えて貰えると幸いです。

    • @DataScienceLab.
      @DataScienceLab.  Рік тому +2

      母集団からサンプリングした標本によって、母分散を推定したいという場面で、本来であれば、各データと母平均の差の二乗の総和を計算したいところですが、母平均が不明なので標本平均で置き換えたとします。
      この時、母平均はただひとつの決まった値であるのに対して、標本平均はサンプリングの度に異なる値となります(ばらつきを持ちます)。
      つまり、標本分散は母分散よりも過小にばらつきを見積もっていることになります。
      よって、その標本平均のばらつき分を補正してあげると辻褄が合うわけです。

  • @がっきーさん-p3l
    @がっきーさん-p3l Рік тому +2

    わかりやすい動画ありがとうございます!
    初歩的な質問で申し訳ないのですが、Excelで標準偏差計算する時、大きく分けてSTDFV.PとSTDFV.Sがあり、前者は母標準偏差、後者は標本の標準偏差とありました。ですが、前者はnで割り、後者はn-1で計算されるようでした。動画の解説と逆な気がしたのですが、これはExcel特有なのでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Рік тому +1

      "stdev.p"は"var.p"で計算した標本分散の平方根で計算されます。
      "stdev.s"は"var.s"で計算した不偏分散の平方根で計算されます。
      "var.p"は『引数を母集団全体とみなして、母集団の分散(標本分散)を返します』と説明があるかと思います。これは、10このデータで計算するなら、その10このデータ自体の分散を計算するということです。
      "var.s"は『標本に基づいて、母集団の分散の推定値(不偏分散)を返します』と説明があるかと思います。これは、10このデータで計算するなら、その10このデータを使って、10このデータをとってきた元の母集団の母分散の推定値を計算するということです。
      Excelの説明書きが少々ややこしいのですが、前者がnで割る標本分散、後者がn-1で割る不偏分散のことであり、動画の解説と同じです。

    • @がっきーさん-p3l
      @がっきーさん-p3l Рік тому +1

      ありがとうございます!
      すいません、少し混乱しているので具体例で確認させていただきたいです…
      例えば、1ロット100個あるものから、10個を抜き取ってデータを取得した場合、
      1.10個そのものの標準偏差を算出する場合は、stdev.p
      2.10個のデータから母集団の標準偏差を推測した場合はstdev.s
      と捉えてよろしいでしょうか。

    • @DataScienceLab.
      @DataScienceLab.  Рік тому +2

      概ねその理解で合ってます!
      正確には、不偏分散は、無限母集団の母分散の良い推定量です。
      有限母集団からサンプリングした標本で有限母集団の母分散を推定する際には『有限修正』が必要です。
      ※母集団が、1ロット(100個)であるという指定がある場合は、その母集団は有限母集団になります。

  • @ph4746
    @ph4746 2 роки тому +2

    標本分散と標本平均の分散の違いがわからないです、、😭
    前者は母集団から1回だけn個のデータを取ってきて、後者は母集団からn個のデータを取ってくるのを?回やって、1回1回の平均の分散を求めている、という理解で合ってますでしょうか?👀

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +2

      標本分散は、単純にnこのデータで計算した分散(偏差の二乗の総和÷n)です。
      母集団からnこサンプリングして計算した標本平均Xbarは、サンプリングの度に異なりますが、そのXbarが従う分布の分散が、標本平均の分散です。

    • @ph4746
      @ph4746 2 роки тому +1

      ご説明くださりありがとうございます😊
      データサイエンスLab.さんのご返信の内容は理解できましたが、今度はその標本分散と標本平均の分散の和が母分散に近づく理由を教えていただけますでしょうか🙏
      なんとなくイメージはつくのですが加法性っぽいものが成り立つのかなぁと思いまして。。

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +2

      こちらの動画が参考になると思います!
      ▼不偏分散が本当に『不偏性』を持つのかシミュレーションで確かめてみた。
      ua-cam.com/video/St5SximKYpg/v-deo.html

    • @ph4746
      @ph4746 2 роки тому +1

      @@DataScienceLab. ありがとうございます、見てみます!

  • @makio3922
    @makio3922 3 роки тому +1

    めっちゃわかりやすすぎました!ありがとうございました!

    • @DataScienceLab.
      @DataScienceLab.  3 роки тому +1

      コメントありがとうございます!
      お役に立ててうれしいです(^-^)

  • @tky4336
    @tky4336 3 роки тому +4

    統計学全くの初学者です
    質問失礼します
    3:07
    左辺(母分散)と右辺(標本分散)
    割る数がどちらもnという文字で表されていますが 中身は違いますよね?
    左辺のnは(母数)で右辺のnは(標本の大きさ)
    ですよね?

    • @tky4336
      @tky4336 3 роки тому +1

      それとも同じでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  3 роки тому +2

      コメントありがとうございます!
      中身は違います。
      同じ『n』を使ってしまったのでわかりにくかったですね、すみません(>_

    • @YOUSUPERTERIO
      @YOUSUPERTERIO Рік тому

      ​@@DataScienceLab.
      主様、動画に感謝します。
      質問者の方と同じ疑問を持ったのですが、母と標準でサンプル数が異なるなら、4:59の通分はNGではないのでしょうか?

    • @YOUSUPERTERIO
      @YOUSUPERTERIO Рік тому

      ​@@DataScienceLab.
      すみません、勘違いでした。

  • @yuyakecoffee1970
    @yuyakecoffee1970 Рік тому +1

    なるほどー

  • @tky4336
    @tky4336 2 роки тому +2

    質問失礼します。
    (標本分散) 1/n Σ(x -xbar)^2

    (標本平均の分散) σ^2/n
    がなぜ (母分散)σ^2 になるのでしょうか?
    母分散の不偏推定量になるってだけで
    σ^2になる訳ではないのではないでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      解説に『期待値』が抜けています。
      標本分散の『期待値』+標本平均の分散=母分散、です。
      言葉足らずで申し訳ありませんでした(>_

  • @ワッシュー
    @ワッシュー 2 роки тому +2

    非常にわかりやすい解説有難うございます。
    不変分散と標本分散の違いを明確に説明している書籍を持っていなかったので大変助かりました。
    概要欄の中心極限定理の動画が閲覧できなくなっているので、恐縮ですが、再度、動画をアップしてくださいますようお願い致します。

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      コメントありがとうございます(^-^)
      申し訳ございません(>-

    • @ワッシュー
      @ワッシュー 2 роки тому +1

      @@DataScienceLab. 様。
      有り難うございます。
      すみません。不変分散ではなく、不偏分散でした。

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      たいした間違いではないと思います(^-^)
      これは私の考えになりますが、学問として統計学を学ぶのであれば用語を正しく使うことが求められると思いますが、統計学を実務で使ってデータを価値に変換するために重要なのは『用語を正しく使うこと』≪『本質の理解』だと考えています!

  • @kenjitakashima3035
    @kenjitakashima3035 2 роки тому +1

    標本分散と不偏分散のアルファベット合っていますでしょうか?

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +3

      統計学で用いられる各種記号は、文献によってまちまちで統一されていないので、お手持ちの参考書で使用されている記号に読み替えて理解していただければと思います!

  • @トピ丘
    @トピ丘 2 роки тому +3

    分かりやすい解説動画をありがとうございます!
    もしよろしければ、式展開の際に、σ^2(1-1/n)がσ^2(n-1/n)に変換した理由をお教えいただければ幸いです!
    他の説明は理解できましたが、そこだけ気になりました!

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      コメントありがとうございます(^-^)
      右辺と左辺の1/nを相殺するためです!
      『1-1/n』だと1/nが消せませんが、『(n-1)/n』にすれば1/nを消せるからです。

    • @トピ丘
      @トピ丘 2 роки тому +1

      @@DataScienceLab. こちらこそ、丁寧なご解説ありがとうございます!
      質問の仕方が曖昧ですみません...
      『1-1/n』をどうすれば、『(n-1)/n』に変換できるのか知りたいです!
      両辺n倍したら、『n-n/n』になると思いまして...

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      1-1/n = n/n - 1/n = (n-1)/n
      例えば『1-1/5』を計算する時に、1-1/5 = 5/5 - 1/5 = (5-1)/5 = 4/5 と計算しているのと同じ考え方です!

    • @トピ丘
      @トピ丘 2 роки тому +1

      ​@@DataScienceLab. なるほど!おかげ様で理解できました!!
      他の動画もご覧させていただいて、分かりやすくて助かってます!
      ありがとうございます!!

    • @DataScienceLab.
      @DataScienceLab.  2 роки тому +1

      それは良かったです(^-^)
      お役に立てて大変嬉しく思います!

  • @流離のラガーマン
    @流離のラガーマン Рік тому +1

    標本分散 2.5じゃないの?

    • @DataScienceLab.
      @DataScienceLab.  Рік тому +1

      標本分散は(偏差の二乗の総和÷データ数)で計算するので、10÷5で2です。
      ↓よかったらこちらの動画をチェックしてみてください。
      ▼なぜn-1で割るのか?がわかる!標本分散と不偏分散の違いと使い分けを徹底解説!
       ua-cam.com/video/LE-sKjbMAA0/v-deo.html