離散化

離散化とは

数値変数の離散化は,順序変数に変換することを意味する.このプロセスは、よくセグメンテーションと呼ばれるマーケティングで使用される.

XLSTAT 離散化ツール

XLSTATは、自動または非自動で実行できる複数の離散化手法を提供する.

  • 一定幅: 同じ範囲幅を持つクラスを作成するには,この手法を選ぶ.そして、範囲の値を入力する.最初の区間の下限に対応する“最小” をオプションで指定することができる.
  • 区間: 同じ範囲幅を持つ任意の区間数を作成するには,この手法を使用する.
  • 等度数: すべてのクラスができるだけ同じ数のオブザベーションになるようにするには,この手法を選ぶ.
  • 自動 (Fisher): Fisherのアルゴリズムを用いてクラスを作成するには,この手法を使用する.
  • 自動 (k-means): k-means アルゴリズムを用いてクラス(または区間)を作成するには、この手法を用いる.
  • 区間 (ユーザー定義): 最初の区間の下限とすべての区間の上限を昇順で格納する列を選択するには,このオプションを選ぶ.
  • 80-20: 最初のクラスが系列の最初の 80% を含み、2番目が残りの20%を含む2つのクラスを作成するには、この手法を使用する.
  • 20-80: U最初のクラスが系列の最初の 20% を含み、2番目が残りの80%を含む2つのクラスを作成するには、この手法を使用する.
  • 80-15-5 (ABC): データが昇順に並べられ、最初のクラスが系列の最初の 80% を含み、2番目が15%を,そして3番目が残りの5%を含む3つのクラスを作成するには、この手法を使用する.この手法は、しばしば“ABC分類”と呼ばれる.
  • 5-15-80: データが昇順に並べられ、最初のクラスが系列の最初の5% を含み、2番目が15%を、そして3番目が残りの80%を含む3つのクラスを作成するには、この手法を使用する.

生成するクラス(または区間、またはセグメント)の数は,ユーザーによって(たとえば一定幅の方法で),または手法それ自身によって(たとえば,2つのクラスが作成される場合の80-20 オプションで)固定される.

Fisherのクラス分類アルゴリズムは,類似したクラスを自動で融合できるので,ユーザーが要求するクラス数以下のクラス数を生成する.


含まれる機能: