Deskriptive Statistiken (beinhaltet Boxplots und Scatterdigramme)

Benutzen Sie dieses Modul, um die deskriptiven Statistiken für eine eine oder mehrere kategorische oder quantitative Variablen zu berechnen und um grafische oder halbgrafische Anzeigen zur explorativen Datenanalyse zu erzeugen.

Liste der berechneten Statistiken der quantitativen Daten (Deskriptoren, die Gewichte beachten sind in Fettdruck dargestellt):

Anz. der Beobachtungen: Anzahl der Beobachtungen die tatsächlich in den Berechnungen berücksichtigt wurden, daß heißt nicht fehlende und nicht mit einem Nullgewicht versehene Beobachtungen, Anz. der fehlenden Beobachtungen: Anzahl der Werte die während der Berechnungen ignoriert wurden, d. h. fehlende oder mit Nullgewicht versehene Werte, Anz. der Minimumwerte: Anzahl der Werte, die dem Minimum gleich sind, % der Minimumwerte: Prozentsat der Werte, die dem Minimum gleich sind, Minimum: Minimalwert, 1. Quartil: Wert, unterhalb dessen sich 25 % der Daten befinden, Median: Wert, unterhalb dessen sich 50 % der Daten befinden, 3. Quartil: Wert, unterhalb dessen sich 75 % der Daten befinden, Maximum: Maximalwert, Bandbreite: Differenz zwischen Maximum und Minimum, Summe der Gewichte: für gewichtete Daten wird die Summe der Gewichte der Werte dargestellt, Summe: Summe der Werte (ggf. gewichtet) Mean: Summe der Werte (ggf. gewichtet), dividiert durch die Anzahl der benutzten Werte oder durch die Summe der Gewichte, wenn die Daten gewichtet sind, Geometrisches Mittel: Mittel, das nur sehr wenig durch große Werte beeinflußt wird. Das geometrische Mittel ist nicht definiert für Datensätze, die Null oder negative Werte enthalten, Harmonisches Mittel: Mittel, das nur sehr wenig durch einzelne große Werte beeinflußt wird, das aber sehr sensibel für kleine Werte ist, Kurtosis (Pearson): Koeffiizient, der die Kurvenform der Verteilung im Vergleich zur Gaußverteilung in Bezug auf Zugespitzheit und Flachheit beurteilt, Skewness (Pearson): Koeffizient, der die Schiefe eine Verteilund im Vergleich zu ihrem Mittelwert beurteilt, Kurtosis: Kurtosis-Koeffizient gemäß Excel, Skewness: Skewness-Koeffizient gemäß Excel, CV (Standardabweichung/Mittelwert): Variationskoeffizient, der die relative Dispersion beurteilt, ermittelt durch Division der Standardabweichung durch den Mittelwert. Dieser Koeffizient erlaubt den Vergleich der Dispersion von Variablen, die unterschiedliche Einheiten aufweisen, oder sehr unterschiedliche Mittelwerte aufweisen, Stichprobenvarianz: Varianz der Daten, (im Falle ungewichteter Daten ist der Nenner gleich n, d. h. der Umfang der Stichprobe), Geschätzte Varianz: Schätzung der Varianz für eine Population, woraus die vorliegende Stichprobe gezogen wurde (nichtschiefer Schätzer: im Falle ungewichteter Daten ist der Nenner n-1, mit n der Unfang der Stichprobe), Standardabweichung der Stichprobe: Quadratwurzel der Varianz der Daten, Geschätzte Standardabweichung: Quadratwurzel des Varianzschätzers für die Ausgangspopulation, Mittlere absolute Abweichung: Dispersionsmaß, das den Mittelwert der Werte der Abweichungen jeweils im Vergleich zum Mittelwert, Standardabweichung des Mittelwertes: Quadratwurzel des Verhältnisses zwischen der geschätzten Varianz und der Anzahl der benutzten Werte in der Berechnung.

Grafiken der quantitativen Variablen

Box-Plots, Univariate Scatterdiagramme, Kollektion bivariater Scatterdiagramme, Q-Q-Plots, P-P-Plots, Stamm- und Blatt-Plots.

Liste der Statistiken der kategorischen Daten

Zusammenfassung für alle Variablen: Anz. der Kategorien: Anzahl der Kategorien der für die Variable, Modus: Kategorie, die am häufigsten vorkommt oder das größte Gewicht aufweist (wenn die Daten gewichtet sind), Modushäufigkeit: für ungewichtete Daten die Häufigkeit des Modus, Modusgewicht: für gewichtete Daten, das Gewicht des Modus, Modus %: Prozentsatz des Modus, Rel. Modushäufigkeit: Relative Modushäufigkeit.

Statistiktabellen für jede Variable: Häufigkeiten: für ungewichtete Daten, Häufigkeiten der Kategorien, Gewicht: für gewichtete Daten, Gewicht der Kategorien, %: Prozentsatz der Kategorie, Rel. Häufigkeit: Relative Häufigkeiten der Kategorie.

Grafiken für kategorische Variablen

Histogramme, Kuchengrafiken.