統計の全体像を把握していないと難しいのかなという印象の問題です。

私は①、③、④に関してはすぐに消去できましたが、②、⑤で迷いました。恥ずかしながらクラスター分析についてよく知らなかったため、完全に消去しきれなかったからです。

ただ、内容的には②であっていると感じてましたので②に〇をしました。

正答は②です。

問題

問7 量的な説明変数によってつの質的な基準変数を予測するための解
析方法として、最も適切なものをつ選べ。

① 因子分析
② 判別分析
③ 分散分析
④ 重回帰分析
⑤ クラスター分析

引用:心理研修センター

解説

以前線形モデルについては説明しました。変数が一次関数のようにあらわされるモデルのことでしたね。

y=ax+b

上記のようにあらわされるとき、yとxは影響しあっていると言えますので、yとxの関係を調べることにもつながってきます。さて、統計の多変量解析(沢山のデータを扱う統計的解説)においては、このようにある変数同士の関係を調べたりするものと、様々な変数からいえることを抽出・要約するような手法に分かれます。

今回、説明変数と目的変数という言葉が使われていますが、これは前者である「変数同士の関係を調べたりする手法」に用いられるものです。

問題文の意味は「量的なデータと質的なデータの関係を調べたりする手法はどの手法ですか」という意味です。私は暗記は嫌いなのでこのような問題も暗記しろとは言わずに一つ一つ丁寧に理解していくことが必要です。

因子分析は、変数同士の関係を調べたりする手法ではなく、様々な変数を要約する手法です。なので、この問題の答えとしては適しません。

判別分析は、問題文の通り、様々な量的変数から質的変数を求める統計手法です。例えば、腹囲・身長・体重からメタボリックシンドロームかどうか判別する分析を考えてみましょう。最終的に欲しい変数は「メタボリックシンドロームであるか、ないか」です。なので、〇か×かという答えが欲しいわけです。これは当然のことながら名義尺度になります。一方で、腹囲等は数量的データになりますので量的データから質的データを求める統計手法と言えるわけです。

分散分析は、複数の母集団の平均が意味のある差かどうか検定する手法です。「分散」分散という位なので当然分散を使います。分散や平均はそもそも量的データでしか扱わないものなので質的データの入る余地がありません。そういった意味で問題の意味とはずれる統計手法でしょう。

重回帰分析は、線形モデルであり、様々な変数同士の関係を調べたりする統計手法です。ですが、説明変数・目的変数が両方量的データでないと使用することができません。

クラスター分析は、様々な変数を要約する手法なので、この問題には適しません。

 

以上から答えは②の判別分析であるといえます。