基礎教育統計学 講義メモ

参考資料

ハンバーガ統計学にようこそ!
http://kogolab.jp/elearn/hamburger/

納得!エクセル統計分析
http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/excel1.html


2006年2月11・18日 実施

■■■ 2月11日

記述統計 descriptive statistics

■1.一変量の統計量

・平均mean 分散variance の2つが基本
・算術平均 +代表地 -情報の現象
・偏差deviation・・・データの散らばり具合をあらわす

【練習】{65、70、75}の平均、偏差、分散、標準偏差を求める
1)平均:70
2)偏差=平均からの差:−5 0 5
  偏差の総和:0(かならず0になる)
  偏差の二乗の和:25+25=50
3)分散=偏差の二乗の和の平均=25
4)標準偏差=分散の平方根=5

【考え方の基本】
平均:単なる足し算
偏差:二乗してるために散らばり具合がわかる

EXCELの基本】
・オートフィルを固定させるには$ 例:C10セルを固定→$C$10
平方根(ルート)・・・(数値)^0.5 または =SQRT(数値)を利用する
・分散・・・VARP = VARiance Population
標準偏差・・・STDEVP + STandard Deviation Population
・乱数発生・・・RAND() 0 < X < 1のXを発生させる

チェビシェフの不等式:平均回り2σの範囲内に全体の75パーセントが入る。σ=標準偏差

【標準化変量】 standardized variable
z 標準化変量←平均をゼロ、標準偏差を1にするための平均
z = (ある数値x-平均値mean)/標準偏差SD

偏差値=標準化変量×10(標準偏差を10倍にする)+50
知能指数=標準化変量×15+100

■2.二変量の統計量

・共分散 covariance
 xとyの分散の積
 正の相関のときはプラス、負の相関のときはマイナス
相関係数 correlation coefficient
 共分散をxyの標準偏差の積で割ったもの。−1<R<1
 1は正の完全相関、−1は負の完全相関

■3.確率分布

・確率変数 Probability
 【例】サイコロの目=x
    サイコロの目が1と出る確率とは?
    P(x=1)=1/6 確率変数は1/6
    サイコロの目が3.5になる確率はないので、
    P(x=3.5)=0 確率変数はゼロ

・確率分布

・確率変数の平均と分散
 【例】サイコロの目xの平均値

= 1*1/6 + 2*1/6 + ... 6*1/6
= 1*P(x=1) + 2*P(x=2) ... 6*P(x=2)

・算術平均(ウェイトが等しい)と加重平均(ウェイトが異なる)
・総和=データ×ウェイト
・確率平均の平均はその確率をウェイトに使用した加重平均
→数学的期待値expectation

■4.推論統計

母集団と標本:母集団から無作為に抽出された標本の要素の値は確率変数である。
統計的推論は観測された標本の値から、それらを生み出す母集団の性質を探ることである。

統計量:標本の要素の何らかの関数
【例】標本平均sample meanと標本分散sample variance


■■■ 2月18日

■ 前回のまとめ

・平均と分散

 平均 mean:代表値=原数値の総和を割る
 分散 variance:散らばり=偏差の二乗の総和を割る

・平均は加重平均が一般的 → 数値×ウェイト の総和

■ 推論統計 inference statistics

・母集団と標本:母集団から無作為に抽出された標本から、母集団の性質を探る。

 母平均μ=x1*P(xi)+P(x2) ... P(x∞) = E(x)
 母分散σ2=(x1-μ)2*P(x1-μ) + ... = E[(x-μ)2]

  E:期待値
  P:確率変数 平均に近いほど、確率変数は上がる。離れるほど下がる。

・統計量と標本分布 標本:sample

 統計量statistic:標本の要素の何らかの関数

 標本平均:x-bar
 標本分散:S2

・複数の標本:標本は何回とってもいいので、標本平均の平均が存在できる

 標本平均の平均:μx-bar
 標本平均の分散:σ2*1/n

・既知の世界である標本から、未知の世界である母集団を知ることが、推論統計の目的

・標本平均の平均と分散:無作為標本において標本の要素を確率変数と考えるとき、
 統計量もまた確率変数である。したがって、統計量も平均と分散を持つことになる。

【結論】標本平均x-barを母平均μの不偏推定量として利用できる。

・標準化統計量zi=(xi-平均) / 標準偏差
→平均0 分散1 になる


■ 仮説検定

1)帰無仮説mull hyphothesis:仮説は証明するようり否定するほうが容易である。
2)仮説のもとで検定統計量を計算:検定統計量は確率を持つ確率変数でもある。
3)検定統計量の確率を調べる:検定統計量の確率が十分小さいとき、仮説は棄却rejectされる。
  検定統計量が大きいとき、仮説は棄却されないか、または採択acceptされる。
4)十分小さな確率とは、通常5%または1%を用いる。この値を統計的に意味のある水準ということから、
  有意水準level of significanceと呼ぶ。