【SPSSの使い方の目次へ】

統計用語と調査用語

社会調査用語

  1. 社会調査データの構造

     社会調査データは、(回答者や回答社といった)ケースを、変数をとする二次元行列の形をとる。個々の変数の列での位置はすべてのケースに共通していることを固定書式、個々の変数の順番は一定でカンマ(,) またはブランクで区切られているが列の位置は一定ではないことを自由書式と呼ぶ。従来、社会調査データは固定書式を用いたテキスト・ファイルの形で入力・保存することが多かった。

  2. 変数

     変数(variable)とは調査票における個々の質問や質問項目のことであると考えれば理解し易いだろう。また、変数値(value)とは、当該の設問や質問項目の回答選択肢のことである。厳密に定義すれば、変数とは、個々のケースによって変わり得るところの変数値を配列要素とする一次元行列のことである。したがって、ひとつの変数は特定のケースであれば必ず変数値をひとつに特定することができる。
     質的変数とは、職業や支持政党のように、コーディングや集計の都合上、ある回答選択肢の内容を数値で示しているが、その数値と回答選択肢との結合は論理的な必然性がなく、平均を算出しても意味が無い、名義尺度のカテゴリーを変数値としている。一方、量的変数とは、変数値が連続量として見なし得る変数のことであり、平均を算出して意味がある変数である。統計分析のうえでは、絶対尺度、比率尺度、距離尺度だけでなく、順序尺度、2値の質的変数を含んで量的変数と扱って差し支えない。
     また、想定される因果関係における原因を独立変数(説明変数)、結果を従属変数(被説明変数)と呼ぶ。

  3. 多重回答

     ある質問に対して複数の回答選択肢を選択する形式を多重回答と呼ぶ。多重回答には、「2つだけ○印をつけてください」などと2つだけ○印をつけてもらうなどの選択する数を指定する複数選択方式(変数のコード化様式がカテゴリ)と、「該当するものの番号をすべて○印で囲んでください」などと選択する選択肢の数を限定せずに該当する選択肢のすべてに○印をつけてもらう複数択一(二値)方式(変数のコード化様式が2分)との二通りの形式がある。
     複数選択形式の場合では選択してもらう数の変数となり、複数二値形式の場合では選択肢(項目)の数だけの変数となる。複数二値方式の場合、入力の方法には、○印がついていれば1、ついていなければ0またはブランクと入力する2値データ方式と、○印がついている項目の番号を追い込んで入力する方法との二通りがある。2値データ方式の場合、項目数だけのカラムが必要となる。追い込み方式の場合では、項目数×項目番号の最大値の桁数が必要となるが、あとで2値データ方式に変換する必要がある。

  4. 固定書式のデータ・フォーマットの設計

     コンピュータのデータの1つの列(カラム)には、1つの数字または文字(1バイトの半角文字)しか入力することができない。したがって、回答選択肢が10未満である変数は1カラムで済むが、回答選択肢が2ケタの変数は2カラム必要となる。また、実数を入力する場合には、その最大値を入力できるだけのカラム数が必要となる。多重回答方式の場合では、まず、複数選択方式ならば複数選択する数×カテゴリーの最大値の桁数が必要となる。複数二値方式の場合、入力の方法には、○印がついていれば1、ついていなければ0またはブランクと入力する2値データ方式と、○印がついている項目の番号を追い込んで入力する方法との二通りがある。2値データ方式の場合、項目数だけのカラムが必要となる。

統計用語

  1. 統計的検定

     統計的分析を用いて仮説の支持/棄却を判断したり、知見を探索する際には、これらの意思決定の補助的な判断材料として統計的検定を併用することが多い。統計的検定の帰無仮説は、多くの場合「変数間には関連がない」という規範的な仮説であり、また、統計的検定の帰無仮説が棄却される危険率が5%以下ならば「変数間には関連がある」という仮説が支持されたという判断する。仮説検証のためには片側検定を、探索的分析のためには両側検定を用いるが、片側検定の方が有意差の区域が2倍広くなる。

  2. χ二乗値検定

     クロス集計を行って2変数間に関連があるかどうかを確認するために、χ(カイ)二乗値検定を行う。χ二乗値検定の帰無仮説とは「2変数間に関連が無い=セル内の分布は周辺分布を反映した期待度数と等しい」であり、χ二乗値は期待度数と観測度数との誤差の総計に相当する。「2変数間に関連が無い」という帰無仮説が棄却される危険率の有意水準が5%以下である場合には2変数間に関連がある、1%以下である場合には強い関連がある、と判断して差し支えないであろう。なお、χ二乗値検定の場合、セル内の度数が5以下のセルが1つ以上ある場合には統計的検定の結果の信頼性が低くなることに注意が必要である。

  3. 分散分析

     分散分析は、独立変数が質的で従属変数が量的な場合に用いる。独立変数が1つだけの場合は一元配置分散分析、独立変数が複数の場合は多元配置分散分析と呼ぶ。分散分析とは、級内(サブ・グループ内部の)分散と級間(サブ・グループ間の)分散とのどちらが大きいのかを検討する手法であり、「すべてのサブ・グループ間での母平均は等しい」という帰無仮説を立ててF検定を行い、帰無仮説が棄却される危険率の有意水準が5%以下である場合には平均値に有意な差があり、1%以下である場合には強い有意差がある、と判断して差し支えないであろう。独立変数と従属変数との相関係数に相当するものが相関比(η)である。
     多元配置分散分析では、個々の独立変数が従属変数に対して与える影響を主効果、独立変数どうしが絡み合って従属変数に対して与える影響を交互作用効果と呼び、それぞれの効果を独立に分析できる。
     従属変数が量的で、複数の独立変数のなかに質的変数と量的変数とが混在している場合には、共分散分析を行う。この場合、質的な独立変数を要因、量的な独立変数を共変量と呼ぶ。さらに、従属変数が複数ある場合には、多変量共分散分析が可能である。

  4. 相関分析・相関係数

     量的な2変数間の関係は相関分析によって行う。相関係数は通常はPearson のγ(積率相関係数)を用いる。γは量的な2変数間の相関の強さを示す係数であり、ある変数xとyとの関係をグラフに示した場合、両者の関係が比例関係のように一直線上に並ぶ程度を示すものである。ただし、比例関係ではxの値が定まれば必ずyの値も定まるが、相関という考え方はxとyとが一義対応関係にあるのではなく曖昧さがあることを前提としている。xの値が高くなればyの値も高くなることを正の相関関係、xの値が高くなればyの値は低くなることを負の相関関係、xとyとが無関係、もしくはランダムな関係にあれば無相関と呼ぶ。γの値は完全な正の相関関係の場合には+1.0、完全な負の相関関係の場合には-1.0をとる。γの読み方の目安としては、±0.0〜0.2ならば無相関、±0.2〜0.4ならばやや弱い相関、±0.4〜0.6ならばやや強い相関、±0.6〜0.8ならばかなり強い相関、±0.8〜1.0ならば非常に強い相関である、と判断できよう。
     なお、積率相関係数以外に順位尺度専用の順位相関係数もある。さらに、擬相関関係をチェックするために、ある変数を統制した(ある変数の影響を除去した)場合の2変数間の相関の強さを示す偏相関係数を算出できる。

  5. 因子分析

     内的一貫性の検討のためには、信頼性係数の算出に併用して因子分析が用いられる。因子分析は、分析に投入した変数でおたがいに相関が強い変数の合成変量を因子として、その因子と個々の変数との関係を調べることを通じて、変数の分類を可能とする手法である。因子分析のおもな統計量としては、何個分の変数の分散を代表しているかを示す固有値、因子と個々の変数との間での相関係数に該当する因子負荷量などがある。因子分析の結果、個々のケースごとの因子得点を算出し、因子得点によって尺度構成を行う方法もある。なお、因子を析出する方法には、主成分分析解主因子解イメージ解アルファ解などがある。ひとつの変数がひとつの因子だけに対して強い負荷を示すように整理するための因子負荷行列の回転方法には、バリマックス回転斜行回転などがある。主成分解を用いて因子負荷行列を回転しなかった(または、固有値が 1.0以上の変数が1個しか析出されなかった)場合には、主成分分析と等しくなる。

  6. 尺度構成と信頼性係数(α)

     抽象的な概念を調査票の設計の段階では個々の具体的な指標に分けて質問し、分析の段階でデータの要約を試みることがある。データの要約化は、加算尺度を用いることが多い。加算尺度を算出する場合、加算される指標間で正の相関関係が認められれば、その加算尺度は内的一貫性が確保されており信頼性が高い、と判断できる。しかし、加算される指標間の関係が無相関であった場合、加算された尺度の得点は何を意味するものか不明確となり、内的一貫性または信頼性が低いと呼ばれる。したがって、尺度構成を行う場合、内的一貫性の検討が必要となる。加算尺度の内的一貫性を示す統計量が信頼性係数、Cronbackのα(アルファ)である。

  7. 回帰分析

     回帰分析は、独立変数、従属変数ともに量的な場合に用いる。回帰分析は独立変数が1変数の場合は単回帰分析、独立変数が2変数以上の場合は重回帰分析と呼ばれる。単回帰分析の場合、片方の変数を独立変数、もう一方の変数を従属変数として仮定する以外は相関分析とほぼ等しい。重回帰分析の場合、複数の独立変数の合成変量と従属変数との間での相関を分析する考え方となり、この複数の独立変数の合成変量と従属変数との間での相関係数を重相関係数(R)、重相関係数の二乗を決定係数と呼ぶ。決定係数は、独立変数の合成変量が従属変数の分散を説明できる%に相当しており、決定係数のF検定によって、重回帰分析全体の有意水準を検討する。重回帰分析に用いた個々の独立変数と他の独立変数の影響を除去した従属変数との間の関係の強さを示すのが標準化偏回帰係数、β(ベータ)であり、βに関してはt検定を行う。なお、単回帰分析の場合、2変数間の相関係数γが重相関係数ならびにβと等しくなる。

Copyright, 2000-1 by Michio Ogiso

【先頭行へ】【SPSSの使い方の目次へ】