【目次|SPSSの使い方】

クロス集計 (CROSSTABS)

【用途】(順序尺度を含む)質的変数の関連の分析 !!社会調査の分析の主役!!

【データ】出力例1〜4、7は、國學院大学 経済学部「アンケート調査」 2014年度「コンビニ、漫画、ディズニー・リゾート、俳優と旅行についての調査」【を開く】の性別(設問40)のおにぎりが最も好きなコンビニチェーン(設問4)のクロス集計であり、設問4の質問文は「あなたが最も好きなおにぎりはどのチェーンのものですか。ひとつだけ選んでください」である。出力例2も同調査の、性別(設問40)のスイーツが最も好きなコンビニチェーン(設問5)のクロス集計であり、設問5の質問文は「あなたが最も好きなおにぎりはどのチェーンのものですか。ひとつだけ選んでください」である。設問4と設問5ともに、もとの回答選択肢は 「1_ココストア」、「2_サークルKサンクス」、「3_スリーエフ」、「4_セイコーマート」、「5_セブン-イレブン」、「6_デイリーヤマザキ」、「7_ファミリーマート」、「8_ポプラ」、「9_ミニストップ」、「10_ローソン」、「11_こだわりはない」、「12_コンビニで(設問4ならば)おにぎり(設問5ならば)スイーツは買わない」の12カテゴリーの単一回答であり、これらをともに回答が少なかった回答選択肢を「その他のチェーン」に統合し、回答が多かった「セブン-イレブン」、「ファミリーマート」、「ローソン」、「こだわりはない」、「コンビニで(設問4ならば)おにぎり(設問5ならば)スイーツは買わない」の5カテゴリーに再編し、「コンビニで(設問4ならば)おにぎり(設問5ならば)スイーツは買わない」は欠損値とした。

【手順】

  1. メニューバーの[分析]を選択し、ドロップダウン・リストから[記述統計]を、その右のドロップダウン・リストから[クロス集計表]を選択する。

    23版15版
    図1 クロス集計表の選択

  2. [クロス集計表]ダイアログ・ボックスで、左側の変数リストから行(表側)変数を選択(クリックまたはドラッグ)し、右向きの、16版以降ならば矢印、15版以前ならば三角形のボタンをクリックすると、右側上段の行変数ボックスに表示される。なお、複数の変数を一度に選択したい時には、集計する最初の変数を左クリックし、スクロールバーを使用するなどの方法で移動し、集計する最後の変数をシフトキーを押しながら左クリックして選択する。
  3. 左側の変数リストから列(表頭)変数を選択(クリックまたはドラッグ)し、(この図では変数を選択した後なので左向きになっているが)右向きの、16版以降ならば矢印、15版以前ならば三角形のボタンをクリックすると、右側中段の列変数ボックスに表示される。
    「アンケート調査」の履修者には、レイアウト上の問題で独立変数もしくはクロスの軸を列(表頭)変数として選択することを推奨する。
  4. ここで[OK]ボタンをクリックしてしまうと、%が出力されない!! ので、16版以降ならば上から2番目の、15版以前ならば下段中の、[セル]ボタンをクリックして、[クロス集計表:セルの表示の設定]チェックボックスを開く。

    23版
    図2 クロス集計表のダイアログ・ボックス

  5. 行(表側)変数が独立変数またはクロスの軸である場合には、左下のパーセンテージの[行]ををチェックし、
  6. 列(表頭)変数が独立変数またはクロスの軸である場合には、[列]をチェックし、
  7. 行変数と列変数とのどちらが独立変数でどちらが従属変数なのか区別がない(相互関係などの)場合には、[行]と[列]の両方をチェックし、
    ※この例では列変数だけチェックすれば十分であるが出力例での説明の都合上、[行][列][合計](15版では[全体])のすべてをチェックした。
  8. [続行]ボタンをクリックする。

    23版15版
    図3 クロス集計表:セルの表示の設定のチェックボックス

  9. せっかくSPSSを使うのだからχ二乗値検定【を開く】やその他の統計量が必要な時には、図 16版以降ならば1番上の、15版以前ならば下段左の[統計ボタン]をクリックし、
  10. 開かれた[クロス集計表:統計量の指定]チェックボックスの必要な統計量(この例では、χ二乗値検定だけ)の項目をクリックし、[続行]ボタンをクリックする。

    23版15版
    図4 クロス集計表:統計量の指定のチェックボックス

  11. [クロス集計表]ダイアログ・ボックスの[OK]ボタンをクリックする。

【デフォルトの出力】セル内の度数、周辺分布

【出力例1:性別(設問40)のおにぎりが最も好きなコンビニチェーン(設問4)(2014年度)のクロス集計表】

  1. この出力例は、(前述したように、)図2で表側( 行) 変数におにぎりが最も好きなコンビニチェーン(設問4)、表頭(列)変数に性別(設問40)を選択したクロス集計結果である。
  2. (前述したように、)図3の[クロス集計表:セルの表示の設定]でパーセンテージの[行][列][全体]のすべてをチェックした。 表側の好きなおにぎりのチェーン(設問4)は「セブン-イレブン」、表頭の性別(設問40)は「1_男性」のセルに注目して、SPSSの出力の文字色は黒だけであるが、3つの%を説明する都合、[行]は赤[列]は青[総和]は緑で表示した。各セル内には上から順に、
    1. (デフォルトの統計量である)度数がセル内の最上行に出力される:好きなおにぎりのチェーン(設問4)は「セブン-イレブン」、かつ、性別(設問40)は「1_男性」が127人いる。
    2. 行%:行(表側)変数の各行の周辺値を分母とする行%(69.4%)がセル内の上から2行目に出力される:好きなおにぎりのチェーン(設問4)は「セブン-イレブン」の合計183人のうち、「1_男性」が127人:69.4%=127人/183人*100、である。
    3. 列%:列(表頭)変数の各列の周辺値を分母とする列%(64.5%)がセル内の上から3行目に出力される:性別(設問40)が「1_男性」の計197人のうち、「セブン-イレブン」が127人:64.5%=127人/197人*100、である。
    4. 総和%:総和286人を分母とする総和%(44.4%)がセル内の最下行に出力される:「総和」計286人のうち、「セブン-イレブン」かつ「1_男性」が127人: 44.4%=127人/286人*100、である。
  3. 性別の好きなおにぎりのチェーンは、合計(=全体)で回答が多い順に、「セブン-イレブン」は男性が64.5%、女性が62.9%、「ファミリーマート」は男性が9.1%、女性が14.6%、男性が7.6%、女性が7.9%とほぼ同じぐらいであった。

表1 クロス集計の出力例1 (23版)

クロス表クロス表, テーブル, 2 レベルの列ヘッダーと 3 レベルの行ヘッダー, 6 列と 27 行のテーブル
  性別(設問40) 合計
1_男性 2_女性
好きなおにぎりのチェーン(設問4) セブン-イレブン 度数 127 56 183
好きなおにぎりのチェーン(設問4) の % 69.4% 30.6% 100.0%
性別(設問40) の % 64.5% 62.9% 64.0%
総和の % 44.4% 19.6% 64.0%
ファミリーマート 度数 18 13 31
好きなおにぎりのチェーン(設問4) の % 58.1% 41.9% 100.0%
性別(設問40) の % 9.1% 14.6% 10.8%
総和の % 6.3% 4.5% 10.8%
ローソン 度数 15 7 22
好きなおにぎりのチェーン(設問4) の % 68.2% 31.8% 100.0%
性別(設問40) の % 7.6% 7.9% 7.7%
総和の % 5.2% 2.4% 7.7%
その他のチェーン 度数 6 0 6
好きなおにぎりのチェーン(設問4) の % 100.0% 0.0% 100.0%
性別(設問40) の % 3.0% 0.0% 2.1%
総和の % 2.1% 0.0% 2.1%
こだわりはない 度数 31 13 44
好きなおにぎりのチェーン(設問4) の % 70.5% 29.5% 100.0%
性別(設問40) の % 15.7% 14.6% 15.4%
総和の % 10.8% 4.5% 15.4%
合計 度数 197 89 286
好きなおにぎりのチェーン(設問4) の % 68.9% 31.1% 100.0%
性別(設問40) の % 100.0% 100.0% 100.0%
総和の % 68.9% 31.1% 100.0%

【出力例2:性別(設問40)のおにぎりが最も好きなコンビニチェーン(設問4)(2014年度)のクロス集計表の追加統計】

  1. 出力例2の表2は、図4で指定した出力例1の追加統計のカイ(χ)2乗値検定である。カイ2乗値検定は、クロス集計の結果、2変数間に関連があるのか、それとも関連がないのか確認するために行う。
  2. カイ2乗値検定の安易な見方は、「Pearson のカイ 2 乗」行の「漸近有意確率 (両側)」列を見て、これが5%以下であれば関連がある、5%より大きければ関連がないと判断する。
  3. 表2の「Pearson のカイ 2 乗」行の「漸近有意確率 (両側)」列の「.345」は、34.5%のことであり、これは「2変数間に関連がない」というカイ2乗値検定の帰無仮説が支持される可能性が34.5%であり、性別とおにぎりが最も好きなコンビニチェーンとは関連がないことを意味する。

表2 カイ 2 乗検定の出力例1 (23版)

カイ 2 乗検定カイ 2 乗検定, テーブル, 1 レベルの列ヘッダーと 1 レベルの行ヘッダー, 4 列と 7 行のテーブル
  自由度 漸近有意確率 (両側)
Pearson のカイ 2 乗 4.481 4 .345
尤度比 6.159 4 .188
線型と線型による連関 .165 1 .684
有効なケースの数 286    

【出力例3:性別(設問40)のスイーツの好きなコンビニチェーン(設問5)(2014年度)のクロス集計表】

  1. この出力例は、(前述したように、)図2で表側( 行) 変数にスイーツが最も好きなコンビニチェーン(設問5)、表頭(列)変数に性別(設問40)を選択したクロス集計結果である。
  2. 図3ではパーセンテージの[行][列][全体]のすべてをチェックしているが、出力例3は図3のパーセンテージの[列]だけをチェックした場合の出力を示した。
  3. 性別のスイーツの好きなコンビニチェーンは、「ローソン」は女性が38.8%と多く男性が23.0%と少ないのと比べて、「セブン-イレブン」は男性が29.8%と多く女性が15.3%と少なかった。

表3 クロス集計の出力例2 (23版)

クロス表クロス表, テーブル, 2 レベルの列ヘッダーと 3 レベルの行ヘッダー, 6 列と 15 行のテーブル
  性別(設問40) 合計
1_男性 2_女性
好きなスイーツのチェーン(設問5) セブン-イレブン 度数 57 13 70
性別(設問40) の % 29.8% 15.3% 25.4%
ファミリーマート 度数 36 13 49
性別(設問40) の % 18.8% 15.3% 17.8%
ローソン 度数 44 33 77
性別(設問40) の % 23.0% 38.8% 27.9%
その他のチェーン 度数 30 15 45
性別(設問40) の % 15.7% 17.6% 16.3%
こだわりはない 度数 24 11 35
性別(設問40) の % 12.6% 12.9% 12.7%
合計 度数 191 85 276
性別(設問40) の % 100.0% 100.0% 100.0%

【出力例4:性別(設問40)のスイーツが最も好きなコンビニチェーン(設問5)(2014年度)のクロス集計の追加統計】

  1. 出力例4の表4は、図4で指定したクロス集計の出力例2の追加統計のカイ(χ)2乗値検定である。
  2. 表4の「Pearson のカイ 2 乗」行の「漸近有意確率 (両側)」列の「.030」は、3.0%のことであり、これは「2変数間に関連がない」というカイ2乗値検定の帰無仮説が支持される可能性が3.0%であり、性別とスイーツが最も好きなコンビニチェーンとは5%水準で有意差が認められたことを意味する。

表4 カイ2乗検定の出力例2 (23版)

カイ 2 乗検定カイ 2 乗検定, テーブル, 1 レベルの列ヘッダーと 1 レベルの行ヘッダー, 4 列と 7 行のテーブル
  自由度 漸近有意確率 (両側)
Pearson のカイ 2 乗 10.725 4 .030
尤度比 10.925 4 .027
線型と線型による連関 4.089 1 .043
有効なケースの数 276    

【データ】出力例5〜6は、國學院大学 経済学部「アンケート調査」 2014年度「コンビニ、漫画、ディズニー・リゾート、俳優と旅行についての調査」【を開く】の設問8 現在読んでいる漫画雑誌、質問文が「現在読んでいる漫画雑誌をつぎのなかからすべて選択してください」という多重回答で、選択していれば1、選択していなければ0とコーディングした。

【出力例5:3_週刊少年ジャンプ別の2_週刊少年マガジン のクロス集計表(2014年度)】

  1. 3_週刊少年ジャンプを図2の[行]、2_週刊少年マガジンを図2の[列]に選択し、
  2. 図3の「パーセンテージ」のうち[行]と[列]をチェックし、
  3. 図4の[カイ2乗]をチェックした。

表5 クロス集計の出力例3 (23版)

3_週刊少年ジャンプ と 2_週刊少年マガジン のクロス表3_週刊少年ジャンプ と 2_週刊少年マガジン のクロス表, テーブル, 2 レベルの列ヘッダーと 3 レベルの行ヘッダー, 6 列と 12 行のテーブル
  2_週刊少年マガジン 合計
.00 1.00
3_週刊少年ジャンプ .00 度数 177 11 188
3_週刊少年ジャンプ の % 94.1% 5.9% 100.0%
2_週刊少年マガジン の % 72.8% 22.4% 64.4%
1.00 度数 66 38 104
3_週刊少年ジャンプ の % 63.5% 36.5% 100.0%
2_週刊少年マガジン の % 27.2% 77.6% 35.6%
合計 度数 243 49 292
3_週刊少年ジャンプ の % 83.2% 16.8% 100.0%
2_週刊少年マガジン の % 100.0% 100.0% 100.0%

【出力例6:3_週刊少年ジャンプ別の2_週刊少年マガジン のクロス集計の追加統計(2014年度)】

  1. (表2と表4のように2×2表以外の場合では、カイ2乗値検定の漸近有意確率 (両側)しか出力されないが)、表6のように表側・表頭変数ともに2カテゴリーの2×2表の場合では、カイ2乗値検定の正確な有意確率 (両側)と正確有意確率 (片側)が出力される。
  2. 2×2表の場合、探索的分析ならば正確な有意確率 (両側)を、仮説検証型分析ならば正確有意確率 (片側)を見て判断する。
  3. 表6のPearson のカイ 2 乗行の漸近有意確率 (両側)は0.000であるが、これは参考までにして、正確有意確率 (両側)の.000(=0.0%)を見て、週刊少年ジャンプを読んでいる人であれば週刊少年マガジンを読んでいる人が多く、1%水準で有意差が認められたと判断する。

表6 カイ2乗検定の出力例3 (23版)

カイ 2 乗検定カイ 2 乗検定, テーブル, 1 レベルの列ヘッダーと 1 レベルの行ヘッダー, 6 列と 10 行のテーブル
  自由度 漸近有意確率 (両側) 正確な有意確率 (両側) 正確有意確率 (片側)
Pearson のカイ 2 乗 45.154 1 .000    
連続修正 42.983 1 .000    
尤度比 43.864 1 .000    
Fisher の直接法       .000 .000
線型と線型による連関 44.999 1 .000    
有効なケースの数 292        

【作表】
クロス集計表で必要となる統計量は、有効ケース数(もしくは無回答をクロス集計に包括して%の分母を計算した場合の集計値)、度数がセル内の%の分母となる独立変数(またはクロスの軸)の度数であり、%が独立変数(またはクロスの軸)の周辺値の%、セル内の%が独立変数(またはクロスの軸)の周辺値を分母とする%が必要である。セル内の%については、独立変数(またはクロスの軸)を表側にレイアウトした場合では行%、表側にレイアウトした場合では列%が必要である。ただし、独立変数と従属変数との区別が不明確な場合には、行%と列%との両方を掲載した方が良い。

【クロス集計表をエクセルで加工する方法】
(tables optionをインストールしていない場合)クロス集計表を公表する際に慣行となっているレイアウトに加工するためには、エクセルを用いると便利である。

  1. 出力結果の例の表1に示した、性別(設問40)の好きなおにぎりのチェーン(設問4)のクロス集計を、表1との相違点として、
    1. 好きなおにぎりのチェーン(設問4)のカテゴリーは再編せずに、もとの12カテゴリーとし、「12_コンビニでおにぎりは買わない」を欠損値としない。
    2. 全体(#292)と性別(男性(#203)女性(#89))の変数値ラベルに%の分母となるケース数(:全体 '全体(#292)'、性別 '男性(#203)' '女性(#89))'を指定した。
    3. 図3 クロス集計表:セルの表示の設定のチェックボックス で[列]パーセンテージだけを選択した。
  2. エクセル書式でエクスポートする。
  3. 当該のエクセル・シートを開く。
  4. 【統計量見出し列の削除】「度数」、「性別(設問31) の %」という統計量の見出し列は不要なため削除する。
  5. 【各セル内の列%の移動】表示する(=削除しない)各セルの列%を、各セルの上の行(=度数が表示されている行)に移動(=切り取り&ペースト)する。結果として表示しない(=削除する)各セルの度数が上書き(=消去)される。
  6. 【各セル内の列%行の削除】表示する(=削除しない)各セルの列%を移動(=切り取り&ペースト)し終わった列%行を削除する。
  7. これで一応完成であるが、レイアウトの関係で、%の分母となる度数の行と、全体の%の列を、各セルの前に移動しても構わない。ただし、当該の行・列を移動する前に、セルの結合を解除する必要がある。

表7 性別(設問40)の好きなおにぎりのチェーン(設問4)のクロス表

  全体性別(設問40)
全体(#292)男性(#203)女性(#89)
好きなおにぎりのチェーン(設問4) 1_ココストア0.0%0.0%0.0%
2_サークルKサンクス 0.7%1.0%0.0%
3_スリーエフ 0.7%1.0%0.0%
4_セイコーマート 0.0%0.0%0.0%
5_セブン-イレブン 62.7%62.6%62.9%
6_デイリーヤマザキ 0.0%0.0%0.0%
7_ファミリーマート 10.6%8.9%14.6%
8_ポプラ 0.0%0.0%0.0%
9_ミニストップ 0.7%1.0%0.0%
10_ローソン 7.5%7.4%7.9%
11_こだわりはない 15.1%15.3%14.6%
12_コンビニでおにぎりは買わない 2.1%3.0%0.0%

Copyright: text 2000-2015 by Michio Ogiso, graphics by 1999-2009 SPSS Japan, 2010-2015 IBM Corp., Revised on 26. Oct. 2015

【先頭行へ】 【目次|SPSSの使い方】へ