読書メモ
統計学はまず,国の問題を数字で表す方法として発達した.政治世界における算術という感じで.
数理統計学はばらつきを科学的に分析する学問
英国では公衆衛生に統計学が使用され,統計学の重要性が再認識された.
ナイチンゲールも統計家であった,事実を明確にするために統計学を使用した.
統計分布は二種類に分けられる
1. 確率分布
2. 度数分布
確立分布の種類
1. 二項分布
2. ポアソン分布
3. 正規分布
4. カイ二乗分布
5. t分布
6. F分布
変数
* 離散変数 例)眼の色,性別
* 連続連数 例)温度
ベイズの定理は,確率分布で表現される過去の判断が新情報によってどのように変化するのかを数式的に表したものである.
二項分布はある事象の発生を調べたい時に使われる.
正規分布の形を決めるのは,算術平均と標準偏差
3つの平均
1. 算術平均
2. 中央値:データが上半分とした半分のちょうど半分になるように分ける点:アウトライヤーに強い
3. 最頻値(モード):一番度数が大きい値を使う.
異常値があるデータだと算術平均が変になる.(統計のトリック)
母集団:集合
標本:ヨウ素
標本抽出方法
1. ランダム抽出 理想的だが,母集団全体のリストが必要
2. 系統抽出 全体のリストから一定間隔に抽出
3. 便宜的抽出 調査しやすい対象を選んで利用する.信頼性が低い
4. 有意抽出 代表的だと思う対象を選ぶ
5. 層化抽出 調査でポイントになると考える特性によって,標本を層状に分割する.
モーメント法
* 一次モーメントは算術平均
* 二次モーメントは偏差の二乗の平均
* 三次モーメントは偏差の三乗の平均 (歪度)
* 二次モーメントは偏差の四乗の平均
ピアソン分布系
* ピアソンIII系 ガンマ曲線 カイ二乗分布の発見に使われた
* ピアソンIV系 非対称国選のセット
* ピアソンV系 正規曲線
* ピアソンVI系 スチューデントのt分布
共分散は2種類の確率変数がどの程度同じ挙動を示すのかを表す.2種類の確率変数が同じ向きに動く傾向が強ければ共分散は正になり,逆向きに動く傾向が強ければ共分散はマイナスになる.全く関係がない場合は共分散は0になる.
分散は,確率変数に適用され,確率変数の値が期待値からどのくらいずれるのかを表す.
相関のすべてが真というわけではない.まったく無意味でありながらも,数学的には完璧な相関も考えられる. (擬似相関)
相関係数を百分率のように考えてはいけない
0.80は0,40よりも2倍相関があることを意味しない.
回帰とは,最小二乗法を使って,二つの連続変数に関する統計的予測を行うこと.