データ・マネジメント

なぜデータの管理が必要なのか?

情報が複数のソースから得られている場合,分析を開始する前に,データを構成することが必要かもしれない.

XLSTATは,データを管理するための複数のオプションを提供する.

重複削除

表の重複削除がときどき必要になる.異なるソースからデータが集められた場合,あるいは入力エラーによって,いくつかのオブザベーションが 間違って重複して(または繰り返して)いるかもしれない.

グルーピング

グルーピングは,データを集計したい場合に便利である.たとえば,すべての販売記録(顧客idの1列と販売量の1列)を含む表があって,顧客ごとに1レコードになるように変換したいと考えて欲しい.XLSTATは,データを集計して,要約表を一瞬で得ることを可能にする.合計は,利用可能な可能性の1つにすぎない.

結合

結合は,データベース管理では一般的なタスクである. これは”キー”という共通の情報を基盤にして“水平的”に表を融合することができる.たとえば, 150 箇所でくつかの化学的指標を測定したと考えて欲しい.すると,データが収集された場所の地理的情報を追加したいと思うだろう. 地理的な表は,目的の150箇所を含む1000箇所の情報を格納する.2つの表を手作業で融合する退屈な作業を避けるために,結合(join)は,収集されたデータと地理的情報の両方を含む融合された表を一瞬で得ることを可能にする.

  • 内側結合(Inner joins): 融合された表は,両方の入力表に共通なキーのみを含む.
  • 外側結合(Outer joins): 融合された表は,1番目の入力表,2番目の入力表,または両方の入力表で利用可能なすべてのキーを含む.