基礎教育統計学 講義メモ
参考資料
ハンバーガー統計学にようこそ!
http://kogolab.jp/elearn/hamburger/
納得!エクセル統計分析
http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/excel1.html
2006年2月11・18日 実施
■■■ 2月11日
記述統計 descriptive statistics
■1.一変量の統計量
・平均mean 分散variance の2つが基本
・算術平均 +代表地 -情報の現象
・偏差deviation・・・データの散らばり具合をあらわす
【練習】{65、70、75}の平均、偏差、分散、標準偏差を求める
1)平均:70
2)偏差=平均からの差:−5 0 5
偏差の総和:0(かならず0になる)
偏差の二乗の和:25+25=50
3)分散=偏差の二乗の和の平均=25
4)標準偏差=分散の平方根=5
【考え方の基本】
平均:単なる足し算
偏差:二乗してるために散らばり具合がわかる
【EXCELの基本】
・オートフィルを固定させるには$ 例:C10セルを固定→$C$10
・平方根(ルート)・・・(数値)^0.5 または =SQRT(数値)を利用する
・分散・・・VARP = VARiance Population
・標準偏差・・・STDEVP + STandard Deviation Population
・乱数発生・・・RAND() 0 < X < 1のXを発生させる
チェビシェフの不等式:平均回り2σの範囲内に全体の75パーセントが入る。σ=標準偏差
【標準化変量】 standardized variable
z 標準化変量←平均をゼロ、標準偏差を1にするための平均
z = (ある数値x-平均値mean)/標準偏差SD
偏差値=標準化変量×10(標準偏差を10倍にする)+50
知能指数=標準化変量×15+100
■2.二変量の統計量
・共分散 covariance
xとyの分散の積
正の相関のときはプラス、負の相関のときはマイナス
・相関係数 correlation coefficient
共分散をxyの標準偏差の積で割ったもの。−1<R<1
1は正の完全相関、−1は負の完全相関
■3.確率分布
・確率変数 Probability
【例】サイコロの目=x
サイコロの目が1と出る確率とは?
P(x=1)=1/6 確率変数は1/6
サイコロの目が3.5になる確率はないので、
P(x=3.5)=0 確率変数はゼロ
・確率分布
・確率変数の平均と分散
【例】サイコロの目xの平均値
= 1*1/6 + 2*1/6 + ... 6*1/6
= 1*P(x=1) + 2*P(x=2) ... 6*P(x=2)
・算術平均(ウェイトが等しい)と加重平均(ウェイトが異なる)
・総和=データ×ウェイト
・確率平均の平均はその確率をウェイトに使用した加重平均
→数学的期待値expectation
■4.推論統計
母集団と標本:母集団から無作為に抽出された標本の要素の値は確率変数である。
統計的推論は観測された標本の値から、それらを生み出す母集団の性質を探ることである。
統計量:標本の要素の何らかの関数
【例】標本平均sample meanと標本分散sample variance
■■■ 2月18日
■ 前回のまとめ
・平均と分散
平均 mean:代表値=原数値の総和を割る
分散 variance:散らばり=偏差の二乗の総和を割る
・平均は加重平均が一般的 → 数値×ウェイト の総和
■ 推論統計 inference statistics
・母集団と標本:母集団から無作為に抽出された標本から、母集団の性質を探る。
母平均μ=x1*P(xi)+P(x2) ... P(x∞) = E(x)
母分散σ2=(x1-μ)2*P(x1-μ) + ... = E[(x-μ)2]
E:期待値
P:確率変数 平均に近いほど、確率変数は上がる。離れるほど下がる。
・統計量と標本分布 標本:sample
統計量statistic:標本の要素の何らかの関数
標本平均:x-bar
標本分散:S2
・複数の標本:標本は何回とってもいいので、標本平均の平均が存在できる
標本平均の平均:μx-bar
標本平均の分散:σ2*1/n
・既知の世界である標本から、未知の世界である母集団を知ることが、推論統計の目的
・標本平均の平均と分散:無作為標本において標本の要素を確率変数と考えるとき、
統計量もまた確率変数である。したがって、統計量も平均と分散を持つことになる。
【結論】標本平均x-barを母平均μの不偏推定量として利用できる。
・標準化統計量zi=(xi-平均) / 標準偏差
→平均0 分散1 になる
■ 仮説検定
1)帰無仮説mull hyphothesis:仮説は証明するようり否定するほうが容易である。
2)仮説のもとで検定統計量を計算:検定統計量は確率を持つ確率変数でもある。
3)検定統計量の確率を調べる:検定統計量の確率が十分小さいとき、仮説は棄却rejectされる。
検定統計量が大きいとき、仮説は棄却されないか、または採択acceptされる。
4)十分小さな確率とは、通常5%または1%を用いる。この値を統計的に意味のある水準ということから、
有意水準level of significanceと呼ぶ。