標本平均の期待値と推定値、推定量(統計学について自分用まとめ)
Xiは実データではあるもののその実態は確率変数にすぎないということです。(これがイメージしにくい原因)
そしてその取得する確率変数Xiは母集団の確率変数Xと同じ分布に従うと仮定されているのです。
ここの文章が僕にとって大事だった。
よく考えてみてほしいんですけど、確率的に変化する事象の平均を取るという行為もまた不確実な事象なのです。
例えば先ほど石を30回投げたら平均は0.67になりましたが、もう一回30回投げて平均をとっても大抵は0.67にはなりません。
つまりこの
130∑30i=1Xiという計算自体も確率的に変化する確率変数なわけなのです。
そこでこの30回の実験を一固まりにして神様だけが知っているこの実験の組の期待値を考えてやると、なんと最初に調べようとしていた期待値と一致するというわけです。式で表すと次のようになります。
E[1n∑ni=1Xi]=E[Xi]
同様のことだが、大事だった。
サンプルサイズとサンプル数や標本分布と標本におけるデータ度数分布。標本分散と不偏分散、不偏分散平方根uと不偏標準偏差Dなど曖昧になりがちな言葉の定義について。
変動係数について。
URL内の
について、なぜ不偏標準偏差Dで代用しないのかと疑問に思って質問したところ、
鋭いご質問ありがとうございます
— 遠田祐人★トダユト先生(。-`ω-)b (@atarimae55) 2021年1月19日
不偏標準偏差は計算式が難しすぎて実用性の低い値と言われています(分布の性質次第では求まらないことも)
一方、不偏分散平方根は必ず求められます
なので、実用性の観点からUを用いるのが一般的と言われています(ただ、私は学生時代ここで少しモヤモヤしました😅
とのことでした。不偏分散平方根は必ず求められ、不偏標準偏差は求まらないこともあるようですね。ご回答いただきありがとうございます。
そこで今回は、推測統計学でよく出てくる用語の対応関係について軽く書いていきます。1人でも多くの方に推測統計学の予習・復習に利用していただければ幸いです。
これがとても良かった。本文内画像がとにかく良い。
×よくある間違い:標本平均170cm,標準誤差0.5cmだから、母平均が169cm~171cmに含まれる確率は95%だ
◎正しい:標本平均が170cm,標準誤差0.5cmと求まった。無作為標本抽出を繰り返し行えば100回に95回の割合で「標本平均 ± 2×標準誤差」の中に母平均を含んでいるのだから、とりあえずは母平均が169cm~171cmの中に含まれると考えて問題ないだろう
〇:(次に行う無作為抽出の結果から計算される)95%信頼区間が母平均 μ を含む確率は95%
◎:無作為抽出を繰り返し行えば100回に95回の割合で95%信頼区間が母平均 μ を含む
×:今計算された95%信頼区間が母平均 μ を含む確率は95%
母平均は定数であり、確率的に変動することはありません。
確率的に変動するのは95%信頼区間の方です。
信頼区間における正しい認識が書かれている。間違って覚えていた...
僕より
今は頭のいい人がたくさんの有益な情報を見やすくを残してくれていて助かります。
(もう少しgoogleの検索が優秀になってくれて、そのような記事を上位に表示してもらえると助かるのですが、検索の仕方を工夫します。)
各ライターの方へ
無断で紹介しているのを自覚しているので、不都合があればご連絡いただけると助かります。(連絡先→twitter:@machi_living)