X
    Categories: 雑記

相関表の意味とエクセルCOUNTIFS関数・配列数式を使った相関表の作り方

相関表はどのような表で,どのように作るのでしょうか。また,作成上の留意点は何でしょうか。
  • 変量XとYをそれぞれ階級に分けて作った度数分布表相関表といいます。
  • 相関表は,量的変数どうしの関係を調べるときに作成します。特に,2つの量的変数の相関関係を調べるとき,それぞれの取り得る値(xとyの組)がデータ数に比べて少なく,重なる点が多くなる場合は,相関表を作成します。
  • 相関表は,Microsoft Excel で COUNTIFS 関数と配列数式を使うと手際よく作成できます。
  • 作成の際は,量的変数か質的変数化を明確にしておくことが大切です。量的変数とは,大きさや多さなど量的に変化する特性をもったものを測定対象とし,対象がその量的な特性をどの程度有するかを測定したものです。

1 相関表とは

(1)2つの変数の関係を表す表

2つの変数の関係を調べるとき,相関表とクロス表を利用することができます。

  • 2つの変数が,量的変数どうしの場合は,相関表
  • 2つの変数が,質的変数どうしの場合は,クロス表

を作成して相関関係を分析します。

(2)量的変数と質的変数

量的変数

大きさや多さなど量的に変化する特性をもったものを測定対象とし,対象がその量的な特性をどの程度有するかを測定したもの

質的変数

質的な差異を測定対象とし,対象のもつ質的差異が,配列順序が一義的には決められないカテゴリーのどれに該当するかを測定したもの

例えば,量的変数は,身長,体重,質的変数は血液型,性別,出身地などです。

量的変数の身長は,身長計で長さを数値で表します。体重は体重計で重さを数値で表します。最近の体重計は高機能で,体脂肪率,内臓脂肪レベル,筋肉量,筋質点数,基礎代謝量,体内年齢,体水分率,推定骨量,アクティブ度など(cf:タニタ体組成計・体脂肪計)が測定できるものもあります。
これらも量的変数となるものです。

体脂肪率判定
…略…タニタの体組成計の測定結果は,DXA法の測定値を基準にしており,非常に高い相関関係にあります。
TANITA corporation「体組成計の測定項目の見かたについて」[ONLINE]http://www.tanita.co.jp/health/measure/taisoseikei/(2018.11.13参照)

タニタ博士によれば,「『おすすめ測定時間』での体組成計の体脂肪率測定値」と「DXA法の体脂肪率測定値」とに高い相関関係があり(体組成計での体脂肪率の測定は,あくまで推定値),相関係数は0.94とのことです。

相当に強い正の相関です。これら2つの測定値も量的変数です。

一方,血液型などは質的変数です。血液型は,凝集性などの血液の特性をもとに分類しています。

私たちの血液は,ABO,Rh,P,MNなどといった分類により多くの血液型に分けられます。なかでもABO,Rhの血液型は,輸血をするうえでの必須項目となります。また,血小板の輸血などをさらに効果的に行うため,白血球型(HLA)の検査も重要となります。

日本赤十字社「血液の基礎知識」[ONLINE]http://www.jrc.or.jp/donation/first/knowledge/(2018.11.13参照)

(3)相関表とは

相関表は,量的変数どうしの関係を調べるときに作成します。

特に,2つの量的変数の相関関係を調べるとき,それぞれの取り得る値(xとyの組)がデータ数に比べて少なく,重なる点が多くなる場合は,相関表を作成します。

「変量XとYをそれぞれ階級に分けて作った度数分布表を相関表という」※大阪書籍「新数学事典」P637L






2 相関表の機能

(1)相関図は「点」が重複する場合がある

例えば,次の例のように,国語科と数学科の100点満点の検査結果を,それぞれ20点刻みの5つの階級に分けて評価を行ったとします。
評価の値は,正の整数値で最小値が1,最大値が5です。
評価の結果,データから次の表の値が得られました。(N=20)


この値の組を相関図に表すと,同じ点に複数の組が重なります。
例えば(4,4)の組は7つあります。
下の相関図では,値の組が重なっていることを読み取れません。
相関図の表現方法を改善しなければ,データは8つだけ(N=8)と誤認します。

このように,同じ点に複数のデータが重なる場合,相関図では相関関係の特徴を正しく視覚的・直感的に把握することが難しくなります。

なお,相関図の表現方法を改善する方法としては,「」の記号を重なった度数に応じて際立った記号に変えたり,相関図と箱ひげ図を組み合わせた図を用いたりする方法が考えられます。

(2)重複する「点」を度数として表せる

同じ点に複数のデータが重なる場合は,次のような相関表を作成します。
相関表では,複数のデータが同一セルに該当する場合は度数で表すことができ,重複するデータ数を明確に示すことができます。

次のように相関表に整理すると,上図の相関図と比べて,各セルの重みを考慮した相関関係の傾向を読み取ることができます。






3 エクセルを使った相関表の作り方

相関表は,Excelを使うと手際よく作成できます。
以下に,Microsoft Excel 2013 で相関表を作成する手順を説明します。

例として,国語科と数学科の検査結果の相関を調べます。100点満点の検査結果は,20点刻みの5つの階級に分けます。値は正の整数値で最小値が1,最大値が5とします。

(1)元データ一覧表と相関表の枠組の作成

次のような元データの一覧表と相関表の枠組を作成します。
例では,国語科の検査結果をB列,数学科の検査結果をC列に縦方向に入力します。

また,相関表の枠組は,縦方向が国語科,横方向が数学科とし,それぞれ1から5の枠を作ります。加えて,合計欄を作成します。

(2)度数と合計を数式で計算する

本項では,条件に合うセルの度数をカウントする「COUNTIFS 関数」を使用します。

COUNTIFS 関数は,複数の範囲のセルに条件を適用して,すべての条件が満たされた回数をカウントします。
書式
COUNTIFS (条件範囲 1, 検索条件 1, [条件範囲 2, 検索条件 2],…)COUNTIFS 関数の書式には,次の引数があります。
  • 条件範囲 1 必ず指定します。対応する条件による評価の対象となる最初の範囲を指定します。
  • 条件 1 必ず指定します。計算の対象となるセルを定義する条件を数値,式,セル参照,または文字列で指定します。たとえば,条件は 32,”>32″,B4,”Windows”,または “32” のようになります。
  • 条件範囲 2, 条件 2,… 省略可能です。追加の範囲と対応する条件です。最大 127 組の範囲/条件のペアを指定できます。

Excel Online ヘルプ「COUNTIFS 関数」(2018.11.13参照)

① 度数を表示するセルを選択する

まず,度数を表示させたいセル範囲,セルC26からセルG30をドラッグして選択します。

② COUNTIFS関数を入力する

今,セルC26が白色に反転し,入力状態になっています。
そのまま,「=COUNTIFS(」をキーボードから入力します。「(」まで入力します。なお,数式は半角文字で入力します。

③ 国語科のデータ範囲を選択する

「検索条件範囲 1」として,セルB2からセルB21までを,ドラッグして選択します。

すると,数式は,「=COUNTIFS(B2:B21」と表示されます。そのまま「F4」キーを押します。数式は,「=COUNTIFS($B$2:$B$21」と変わります。「F4」キーを押すと,相対セル参照「B2:B21」が,絶対セル参照「$B$2:$B$21」に変わります。

続いて,「,」を入力します。これも半角です。

④ 「検索条件 1」を選択する

「検索条件 1」として,セルB26からセルB30までを,ドラッグして選択します。

すると,数式は,「=COUNTIFS($B$2:$B$21,B26:B30」となります。

続いて,「,」を入力します。

⑤ 数学科のデータ範囲を選択する

「検索条件範囲 2」として,セルC2からセルC21までを,ドラッグして選択します。
そのまま「F4」キーを押して絶対セル参照にします。

数式は,「=COUNTIFS($B$2:$B$21,B26:B30,$C$2:$C$21」となります。

続いて,「,」を入力します。

⑥ 「検索条件 2」を選択する

「検索条件 2」として,セルC25からセルG25までを,ドラッグして選択します。

数式は,「=COUNTIFS($B$2:$B$21,B26:B30,$C$2:$C$21,C25:G25」となります。
続いて,「)」を入力します。

⑦ 配列数式にする

最後は, Ctrl + Shift + Enter を押します。
すると { }  の間に数式が挿入された配列数式が作成できます。

数式は,「{=COUNTIFS($B$2:$B$21,B26:B30,$C$2:$C$21,C25:G25)}」となります。

なお,Excel Online では,配列数式を入力できません。PCにインストールされた Excel での編集が必要です。

数式:{=COUNTIFS($B$2:$B$21,B26:B30,$C$2:$C$21,C25:G25)}
が正しく入力できれば,次のように相関表の各セルに度数が表示されます。

 

⑧ 相関表の計欄の値を計算する

相関表のセルC26からH31までを,ドラッグして選択します。度数が表示されているセルも含めて選択します。

セルを選択した状態で,「編集」→「ΣオートSUM」→「Σ合計」をポイントしクリックします。

すると,自動で度数の合計が計欄に表示されます。

まとめ
  1. 変量XとYをそれぞれ階級に分けて作った度数分布表相関表といいます。
  2. 相関表は,量的変数どうしの関係を調べるときに作成します。特に,2つの量的変数の相関関係を調べるとき,それぞれの取り得る値(xとyの組)がデータ数に比べて少なく,重なる点が多くなる場合は,相関表を作成します。
  3. 相関表は,Microsoft Excel で COUNTIFS 関数と配列数式を使うと手際よく作成できます。
  4. 作成の際は,量的変数か質的変数化を明確にしておくことが大切です。量的変数とは,大きさや多さなど量的に変化する特性をもったものを測定対象とし,対象がその量的な特性をどの程度有するかを測定したものです。






maru320i:
Related Post