SPSS用語
SPSS書式のデータ・ファイル(SPSSファイル)とは、汎用機版SPSS-XやSPSS/PC+でのシステム・ファイルのことであり、素データと変数名、欠損値、ラベルなどが結合されたスプレッドシート型のデータ・ファイルに準じるものであり、デフォルトの拡張子は.savである。SPSS書式のデータ・ファイルはデータ・エディタ・ウィンドウに表示され、エクセルのシートに似た見た目であり、各行にケース、各列に変数が配置される二次元行列の形をとり、各列のガイドに変数名が表示される。
欠損値(missing value)とは、無回答や非該当など集計から除去する値のことである。
SPSSでの欠損値には、システム欠損値と、ユーザー定義の欠損値との2種類がある。
システム欠損値とは、素データでブランク(もちろん半角のブランク、全角=2バイト文字のブランクはブランクではなく、画面と印刷には字を出力しない「漢字」である)を入力してあった場合、つまり、無回答や非該当をブランクとコーディングした場合に、SPSSが自動的に欠損値として定義するものである。システム欠損値は集計に含めることができないため、無回答の場合には(=非該当以外では)使用しない方がよい。
ユーザー定義の欠損値とは、例えば、無回答を0や9とコーディングした場合に、ユーザーが自分で定義する欠損値のことである。無回答は単純集計や「基本」クロス集計では集計に含めることがあるため、(システム欠損値ではなく)ユーザー定義の欠損値を選択することが望ましい。ユーザー定義の欠損値は3つまでの個別の欠損値、または、範囲と1つの個別の欠損値のどちらかまで指定することができる。
相関分析の際、相関係数を計算する2変数のうちのどちらか1変数が欠損値であればそのケースを分析から除いて相関係数を計算するペア単位の欠損値除去と、相関行列を計算する変数のうちの1変数が欠損値であるケースを分析から除いて相関係数を計算するリスト単位の欠損値除去との2通りの欠損値除去の方法がある。相関行列をもとに計算する多変量解析の場合でも、欠損値除去の方法は、ペア単位とリスト単位とを選択できる。