社会調査工房オンライン-社会調査の方法
←→
1-4 データの分析
1-4-2 他の変数への値の再割り当て


どのような時に使うか
  1. 年齢、時間、金額など連続する量的な変数として測定した質問項目を、任意の数のカテゴリに割り当てる。
  2. 「1.そう思う」「2.ややそう思う」「3.あまりそう思わない」「4.そう思わない」といった尺度の質問項目を、「数値が高ければ高いほどそう思う」という方向に変換する。
  3. 「1.そう思う」「2.ややそう思う」「3.あまりそう思わない」「4.そう思わない」といった尺度の質問項目を、1と2を合併した「そう思う」群、3と4を合併した「そう思わない」群の2つのカテゴリに変換する。これは、クロス集計をおこなったときに、度数が5未満になってしまうセルが目立つ場合などに用いる。
  4. 所得などの選択肢「1.50万円未満」「2.50〜100万円」・・・について、1なら250,000、2なら750,000といったように選択肢の中央値を割り当てる、あるいは、「1.最も高い」に100、「2.やや高い」に 75、「3.ふつう」に50、「4.やや低い」に25、「5.最も低い」に0の数値を割り振って数量化する。

操作手順
  1. 割り当てを行う元の変数の欠損値がない状態(欠損値の欄が「なし」になっている状態)にする。
  2. 元の値と新しい値の対応関係について計画をたてる。
  3. [変換]→[他の変数への値の再割り当て]へ進んで下のウィンドウが表示されたら、①左側のボックスから割り当てを行いたい変数を選んで中央のボックスに矢印ボタンを使って移動させる。②「変換先変数」の名前欄とラベル欄に自分で適当な名前を付けて入力する。③[変更]ボタンを押す。
    下の画像は、名前:Q01A、ラベル:意識aという変数を選択して中央のボックスに移動させて、新しい変数の名前として「Q01A_score」、新しいラベルとして「意識aスコア」と入力し、[変換]ボタンを押したところまでを表している。

    画面:手順3 他の変数への値の再割り当て

     この例では、1つの変数しか中央のボックスに移動させていないが、もし意識b、意識cも意識aと同じような値の再割り当てを行いたければ、同時に中央のボックスへ移動させておくことができる。
  4. [今までの値と新しい値]ボタンを押す。新しく開いたウィンドウのなかで、①今までの変数における値が、②新しい変数におけるどのような値になるのかを指定して、③[追加]ボタンを押す。これを必要な数だけ繰り返す。

    画面:手順4 他の変数への値の再割り当て1

     この例では、1を4に、2を3に、3を2に、4を1に、5を0に置き換えている。また元の変数の欠損値(不詳)9は新しい変数でも同じく欠損値(不詳)なので9のままであると指定している。
     年齢、時間、金額など連続する量的な変数として測定した質問項目を、任意の数のカテゴリに割り当てる場合は、「今までの値」欄の「範囲」を用いる。下の例では、20〜29を1に、30〜39を2に、40〜49を3に、50〜59を4に、60〜69を5に置き換えている。また元の変数の欠損値(不詳)99は、新しい変数では一桁ですむので9に置き換えている。

    画面:手順4 他の変数への値の再割り当て2

  5. 元の変数の各数値が新しい変数でどのような変数に置き換えられるかをすべて指定し終わったら、[続行]を押して1ページ目のウィンドウに戻り、[OK]を押して値の再割り当てを実行する。
  6. 新しい変数の「値」を入力し、欠損値を指定する。「小数桁数」が2になっているので、これを0にする。元の変数の欠損値指定も戻しておく。

注意事項
  1. [変換]から[他の変数への値の再割り当て]を選ぶとき、すぐ上にある「同一の変数への値の再割り当て」を選ばないこと。[同一の・・・]を選ぶと、新しい変数を作らずに元の変数を直接変換するので後で取り返しがつかなくなりますヨ。
  2. 元の変数の欠損値指定を必ず解除しておくこと。
  3. 元の変数のどの値が新しい変数のどの値になるのか、作業する前に両者間の対応関係について計画をたてておくこと。特に年齢などを変換するときには、元の数値の範囲がどこからどこまでか、欠損値には何桁のどんな数値が使われているかについて、作業する前に「度数分布表」で確認しておくこと。
  4. 変換が終わったら元の変数、新しい変数ともに欠損値指定をしておくこと。

実践的なメモ
  1. 年齢や所得など、区切る基準がある程度決まっている場合(例えば、年齢であれば5歳区分あるいは10歳区分で分けることが一般的)は、上のような手順で問題ないが、そのような基準がない場合はどこからどこまでで1つのカテゴリとするかに迷うことがある。
  2. そのような時は「四分位数」を用いると良い。四分位数とは、「この数値で区切るとだいたい同じような人数のまとまりが4つできますよ」という値。例えば、200人の標本について100点満点のテストの点数の四分位数が「10・40・80」と出たならば、「10点以下」「11〜40点」「41〜80点」「81点以上」の4つのカテゴリそれぞれにだいたい50人ずつ入っているということがいえる。なおこのとき10点を25パーセンタイル、40点を50パーセンタイル、80点を75パーセンタイルと呼ぶ(あまり覚えなくても良いが)。
  3. 四分位数は、[分析]→[記述統計]→[度数分布表]へ進み、四分位数を知りたい変数を[変数]ボックスに入れた上で、[統計量]を押して「パーセンタイル値」欄にある「4分位」にチェックを入れ、[続行]を押して元のウィンドウに戻って[OK]を押して実行する。出力を見ると度数分布表の統計量に25、50、75の各パーセンタイルに当たる値が表示されているはず。これをメモして値の再割り当てを行うと、だいたい同じようなサイズの4カテゴリに再割り当てできる。論文等では「四分位数を用いてカテゴリ化した」という注釈を入れておくこと。

←→
copyright(c)2004 Konan University All Rights Reserved.