Kodierung bei An / Abwesenheit

In vielen Bereichen liegen die Daten in Form eine Menge von Attributlisten vor (jeweils eine Liste pro statistischem Individuum). Dies könnte eine Liste pharmazeutischer Eigenschaften für eine Liste von Pflanzen sein, oder eine Liste von Vorkommenshäufigkeiten von Spezies in einem Biotop. Diese Listen können von vielen statistischen Tools nicht verarbeitet werden. Aus diesem Grund sollten sie zunächst in An-Abwesenheitstabellen überführt werden, wo jede Zelle eine Null enthält, wenn das entsprechende Attribut abwesend ist und Eins, wenn das Attribut anwesend ist.