2018年09月05日

多変量解析がわかる

本日は涌井良幸 氏、涌井貞美氏の
多変量解析がわかる
です。
多変量解析がわかる (ファーストブック)

分散、共分散、相関係数など
基本的な事項から始まり、単回帰分析、重回帰分析、
そして、主成分分析や因子分析、SEM、判別分析まで
カバーされている一冊です。

特に、主成分分析や因子分析記述が数式に頼らず、
分かりやすい例で説明されています。

統計学は変数が多く、数学的な扱いが複雑なので、
初心者向けの表面的なものか、
専門家向けの難解な数学書になりがちです。

本書はその中間にある良書だと思いました。


大学教養課程の数学程度の学力がある方で
多変量解析を学びたい人にお勧めの一冊です。
入門書より一歩進んだ多変量解析を
短期間に学ぶことができるでしょう。




情報の宝庫とされるインターネットを探しても、
個票データ(すなわち一次データ)
はなかなか見つけられません。
それだけ価値があるからです。


回帰方程式が得られると、目的変量と説明変量の関係、
そして説明変量間の力関係が明らかになります。
これが回帰方程式を求める大きな狙いです。


主成分分析は合成変量の合理的な基準を
次のように設定します。
一つ一つの個体が最もバラバラになるような変量の和を作る


「一つ一つの個体が最もバラバラになるような変量の和」
ということは、数学的には分散が最大になるような
変量の和ということです。


新変量を合成するのに、
「和でなく積でも良いのでは?」
という考えもあります。
しかし、通常はこの考えは採用されません。
そのアイデアを採用すると数学的扱いが
大変困難になるからです。


主成分分析はデータの見方を変えただけ


因子分析は、多変量のデータを対象にして、
本質的な原因(すなわち共通因子)を
あぶり出す統計学的な手法なのです。


古典的な因子分析では、変量を標準化します。


古典的な因子分析では、共通因子の意味を仮定せずに、
共通因子の個数だけを仮定して分析を進め、
最後にその意味を考えます。
このような分析法を探索的因子分析といいます。


多変量解析では、分散を最大の情報源として捉えます。


このように、あらかじめ因子やデータ構造に
意味を与えてデータ分析を行うのが
SEM(Structural Equation models)です。
分析者の主観で共通因子に意味を与え、
自由なデータ構造を思い描いて統計分析が行えます。


相関がある場合も調べなければ、
どちらが良いモデル化は比較できません。
そこで、次のパス図のように、共通因子どうしの
相関があるモデルを考えることにします。
それが非直交モデルの因子分析です。


因子分析、そしてそれを発展させたSEMでは、
資料から得られる分散と共分散の値に、
モデルから得られる分散と共分散を一致させるように、
パラメータを決定します。


これまでは一致のさせ方として最小2乗法を多用してきました。
しかし、SEMの世界において、この最小2乗法は主流ではありません。
それに変わって最尤推定法が活躍します。


多変量正規分布を用いて最尤推定法で
モデルを決定するメリットは、
最初に述べたように、検定が行えることです。


資料の中の格個体がいくつかのグループに分けられているとき、
その分類の基準をあぶり出すのが判別分析です。


確率を考慮して平均値からの遠近を
議論したいことがあります。
その要請に応えるのがマハラノビスの距離です。


マハラノビスの距離の大小で、
ある個体がP,Qのどちらの群に属するかを
判別できることがわかります。






engineer_takafumi at 01:08│Comments(0) ★理系本の書評 |  ⇒ 数学

コメントする

名前
 
  絵文字