基礎教育統計学　講義メモ

参考資料

ハンバーガー統計学にようこそ！
http://kogolab.jp/elearn/hamburger/

納得！エクセル統計分析
http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/excel1.html

２００６年２月１１・１８日　実施

■■■　２月１１日

記述統計 descriptive statistics

■１．一変量の統計量

・平均mean 分散variance　の２つが基本
・算術平均　+代表地　-情報の現象
・偏差deviation・・・データの散らばり具合をあらわす

【練習】｛６５、７０、７５｝の平均、偏差、分散、標準偏差を求める
１）平均：７０
２）偏差＝平均からの差：−５　０　５
　　偏差の総和：０（かならず０になる）
　　偏差の二乗の和：25+25=50
３）分散＝偏差の二乗の和の平均＝２５
４）標準偏差＝分散の平方根＝５

【考え方の基本】
平均：単なる足し算
偏差：二乗してるために散らばり具合がわかる

【EXCELの基本】
・オートフィルを固定させるには＄　例：C10セルを固定→$C$10
・平方根（ルート）・・・（数値）^0.5 または =SQRT（数値）を利用する
・分散・・・VARP = VARiance Population
・標準偏差・・・STDEVP + STandard Deviation Population
・乱数発生・・・RAND() 0 < X < 1のXを発生させる

チェビシェフの不等式：平均回り２σの範囲内に全体の７５パーセントが入る。σ＝標準偏差

【標準化変量】 standardized variable
z 標準化変量←平均をゼロ、標準偏差を１にするための平均
z = (ある数値x-平均値mean)/標準偏差SD

偏差値＝標準化変量×１０（標準偏差を１０倍にする）＋５０
知能指数＝標準化変量×１５＋１００

■２．二変量の統計量

・共分散 covariance
　xとyの分散の積
　正の相関のときはプラス、負の相関のときはマイナス
・相関係数 correlation coefficient
　共分散をxyの標準偏差の積で割ったもの。−１＜Ｒ＜１
　１は正の完全相関、−１は負の完全相関

■３．確率分布

・確率変数 Probability
　【例】サイコロの目＝ｘ
　　　　サイコロの目が１と出る確率とは？
　　　　P(x=1)=1/6　確率変数は１／６
　　　　サイコロの目が３．５になる確率はないので、
　　　　P(x=3.5)=0　確率変数はゼロ

・確率分布

・確率変数の平均と分散
　【例】サイコロの目ｘの平均値

= 1*1/6 + 2*1/6 + ... 6*1/6
= 1*P(x=1) + 2*P(x=2) ... 6*P(x=2)

・算術平均（ウェイトが等しい）と加重平均（ウェイトが異なる）
・総和＝データ×ウェイト
・確率平均の平均はその確率をウェイトに使用した加重平均
→数学的期待値expectation

■４．推論統計

母集団と標本：母集団から無作為に抽出された標本の要素の値は確率変数である。
統計的推論は観測された標本の値から、それらを生み出す母集団の性質を探ることである。

統計量：標本の要素の何らかの関数
【例】標本平均sample meanと標本分散sample variance

■■■　２月１８日

■　前回のまとめ

・平均と分散

　平均 mean：代表値＝原数値の総和を割る
　分散 variance：散らばり＝偏差の二乗の総和を割る

・平均は加重平均が一般的　→　数値×ウェイト　の総和

■　推論統計　inference statistics

・母集団と標本：母集団から無作為に抽出された標本から、母集団の性質を探る。

　母平均μ＝x1*P(xi)+P(x2) ... P(x∞) = E(x)
　母分散σ2＝(x1-μ)2*P(x1-μ) + ... = E[(x-μ)2]

　　E:期待値
　　P:確率変数　平均に近いほど、確率変数は上がる。離れるほど下がる。

・統計量と標本分布　標本:sample

　統計量statistic：標本の要素の何らかの関数

　標本平均：x-bar
　標本分散：S2

・複数の標本：標本は何回とってもいいので、標本平均の平均が存在できる

　標本平均の平均：μx-bar
　標本平均の分散：σ2*1/n

・既知の世界である標本から、未知の世界である母集団を知ることが、推論統計の目的

・標本平均の平均と分散：無作為標本において標本の要素を確率変数と考えるとき、
　統計量もまた確率変数である。したがって、統計量も平均と分散を持つことになる。

【結論】標本平均x-barを母平均μの不偏推定量として利用できる。

・標準化統計量zi=(xi-平均) / 標準偏差
→平均０　分散１　になる

■　仮説検定

１）帰無仮説mull hyphothesis：仮説は証明するようり否定するほうが容易である。
２）仮説のもとで検定統計量を計算：検定統計量は確率を持つ確率変数でもある。
３）検定統計量の確率を調べる：検定統計量の確率が十分小さいとき、仮説は棄却rejectされる。
　　検定統計量が大きいとき、仮説は棄却されないか、または採択acceptされる。
４）十分小さな確率とは、通常５％または１％を用いる。この値を統計的に意味のある水準ということから、
　　有意水準level of significanceと呼ぶ。