高校生でも、ちゃんと理解していれば解ける問題です。基礎的な知識を問うにはなかなか良問だなと感じました。

答えは⑤です。自信あります。

問題

問6 順序尺度によるデータの散布度として、正しいものをつ選べ。

① 中央値
② 平均値
③ 標準偏差
④ 不偏分散
⑤ 四分位偏差

引用:心理研修センター

解説

質的変数と量的変数

統計を学び始めるときの序盤に出てくる概念です。「いやー言ってることはわかるんだけど、だからなに?」と思われている方も多いのではないでしょうか。このあと、名義尺度、順序尺度、間隔尺度、比例尺度などが出てきますが、序盤で大事なのは量的変数か質的変数かということです。

名義尺度と順序尺度は質的変数

間隔尺度と比例尺度は量的変数

とりあえず、これが大事なところです。質的研究や量的研究という言葉もあり、心理学の中では「質的」「量的」というのはかなり重要ワードです。どこかの機会で詳しく説明したいと思いますが、今回は「質的=数値で扱えないもの」「量的=数値で扱えるもの」とざっくり説明しておきましょう。

代表値と尺度

例えば、日本の都道府県名の書いてあるカードの入った袋を考えてみてください。これを便宜的に「北海道=1」「青森=2」……のように数値化して、中身を全部エクセルに入力してみました。この時、平均を求めて大体20くらいなったとして、この袋の平均は「20!つまり東京!」としてなんの意味があるでしょうか。なんの意味もありませんね。

また小さい順に並べて、「ちょうど真ん中は岩手!」とかやっても意味がありません。(中央値)

これは名義尺度の例です。名義尺度で平均や中央値を計算しても何の意味もありません。代表値として意味があるの最頻値(何が一番多かったか)くらいでしょう。

さて、もう少し心理学っぽくしてみましょう。

モロヘイヤに関する好き嫌いを5件法のアンケートで取ってみました。

あなたはモロヘイヤが好きですか?

大好き 5 4 3 2 1 大嫌い

これを、100人にとって同じようにエクセルに入力してみました。これの平均が2.5だった時にこの数字に意味はあるのでしょうか。結論から言うと、この数字に意味はありません。モロヘイヤが大好きすぎて世界のモロヘイヤを食べ比べているような人は5を付けるでしょう。一方で「食べれなくはないけど、ヌルヌル感が嫌い」という人は1を付けるかもしれません。もしデータがこの二人だけならば、この二人の平均は3です。このように、5や1といっても感覚的なものでしかないので、そこで平均のような感覚の強度を求めるような代表値をとってもあまり意味がないのです。

一方で、中央値に関しては意味があります。先ほどの二人の場合、中央値も3になりますが、この場合「この母集団の半数はモロヘイヤを好ましく思っている」というデータになります。2人だとイメージつきづらいですが、1000人にアンケートを取って中央値が2だったりするならば、半数の人はモロヘイヤを好ましく思っていないということが言えます。

長々と説明してきましたが

名義尺度は、平均値も中央値も意味がない。順序尺度は中央値に意味はあるが、平均値に意味はない

これが言いたかったのです。

散布度とその指標

散布度はその母集団にどのくらいのばらつきがあるかを示したものです。ばらつきとはデータがどのくらい散らばっているかということですね。

散布度の指標としては「標準偏差」「普遍分散」「四分位偏差」等があります。さて、やっと問題に近づいてきましたが、順序尺度の散布度にはどれが適切かという話になります。

難しい数式を出しても皆さん嫌になると思うので、簡単に説明します。

標準偏差と普遍分散に関してはその算出に平均値を用います。一方、四分位偏差は中央値を使います。

以上からも分かるように、順序尺度において標準偏差と普遍分散はあまり意味をなさないということになりますので、四分位偏差を用いるのが適切ということになります。

統計に関しては別の機会に詳しく説明していきたいと思います。