Règles d'association

Les règles d'association permettent de trouver des relations orientées entre un ou plusieurs objets vers un autre groupe dans une grande base de données. Elles s'appliquent notamment au cas des supermarchés pour mettre en évidence des liens forts entre différents produits associés dans les paniers des consommateurs.

En 1994, Rakesh Agrawal et Ramakrishnan Sikrant ont proposés l'algorithme Apriori pour mettre en évidence des associations entre des items sous forme de règles. Cet algorithme est utilisé dans les problématiques où les volumes de données à analyser sont importants. Le nombre d'items pouvant être de plusieurs dizaines de milliers, la combinatoire est telle que toutes les règles ne peuvent être étudiées. Il convient donc de se limiter aux règles les plus importantes. Les mesures de qualités sont des valeurs probabilistes qui permettent de limiter l'explosion combinatoire pendant les 2 phases de l'algorithme et de trier les résultats.

XLSTAT permet d'appliquer cet algorithme sur des jeux de données soit d'Excel soit sous forme de fichiers plats afin d'analyser les paniers clients.