Deskriptive Statistik – alles, was du wissen musst

02.02.23 Allgemeine Begriffe Lesedauer: 8min

Wie gefällt dir dieser Beitrag?

0 Bewertungen


Deskriptive-Statistik-Definition

Die deskriptive Statistik dient als eine Methode zur Datenauswertung. Fehler in der deskriptiven Statistik können erhebliche negative Einflüsse auf alle folgenden Entscheidungen haben. Aus diesem Grund ist ein besonders gründliches Arbeiten in diesem Bereich besonders wichtig. Wir zeigen dir, worauf es bei der deskriptiven Statistik ankommt und welche Werkzeuge in diesem Bereich besonders regelmäßig genutzt werden.

Deskriptive Statistik «einfach erklärt»

Die deskriptive Statistik gehört zu den wichtigsten Werkzeugen im Bereich der statistischen Datenerfassung und -aufbereitung. Sie bildet die Grundlage für viele weitere Operationen und Bewertungen.

Definition: Deskriptive Statistik

Im Begriff der deskriptiven Statistik steckt das Wort deskriptiv, was beschreibend bedeutet. Es handelt sich also um eine beschreibende Statistik und bildet die Grundlage für alle weiteren statistischen Arbeiten. Im Rahmen der deskriptiven Statistik möchte man anhand von Tabellen, Grafiken und durch die Bestimmung der relevanten Kennzahlen für einen Überblick über die Datenlage sorgen. Relevante Kennzahlen, auch Parameter genannt, sind beispielsweise der Mittelwert, die Varianz oder auch die Streuungsmaße. Die deskriptive Statistik bedient sich verschiedener Werkzeuge für unterschiedliche Zwecke.1

Prüfe deine Arbeit vor dem Druck
Mit der formellen Endkontrolle von BachelorPrint bekommst du bereits vor der Bestellung eine digitale Vorschau deiner gedruckten Arbeit. So kannst du die letzten Fehler deiner Arbeit beheben, damit der Perfektion deiner gedruckten Arbeit nichts mehr im Weg steht.

Deskriptive Statistik: Kennzahlen

Welche Kennzahlen die deskriptive Statistik nutzt, hängt maßgeblich davon ab, welche Fragestellung, aber auch welches Skalenniveau die verwendeten Daten bieten. Grundsätzlich gibt es drei verschiedene Arten von Kennzahlen, welche wieder eigene Parameter umfassen. Die wichtigen Kennzahlen im Bereich der deskriptiven Statistik sind:

  • Lageparameter
  • Zusammenhangsmaße
  • Streuungsmaße2

Beispiel:

Deskriptive Statistik-Beispiel

Lageparameter in der deskriptiven Statistik

Als wichtiges Mittel muss die deskriptive Statistik auf grundsätzliche Tendenzen eines Datensatzes reagieren können. Die Lageparameter geben genau diese Tendenzen an. Es wird im Rahmen der Lageparameter untersucht, ob die gemessenen Werte bestimmten Parameter zugeordnet werden können. Befragt man, wie im Beispiel die Personen nach ihrem Alter, können anhand der Antworten Lageparameter ermittelt werden. Im Zuge dessen sind das arithmetische Mittel, der Modus und der Median die wichtigsten Parameter.

Arithmetisches Mittel in der deskriptiven Statistik

Das arithmetische Mittel wird in der deskriptiven Statistik aufgrund seiner geringen Aussagekraft nur in seltenen Fällen eingesetzt. Es kann dir vermitteln, wie hoch oder auch niedrig deine Messwerte im Durchschnitt sind. Schauen wir uns dazu das Beispiel mit den Altersfragen nochmals genauer an. Beim arithmetischen Mittel werden alle Messwerte addiert und das Ergebnis dieser Addition durch die Anzahl der Messwerte dividiert.

Anhand des Beispiels wäre das also:

21+24+20+24+19+23+26+24= 181
181 : 8= 22,625

Das arithmetische Mittel wäre also 22,625 für das Alter der befragten Personen.

Berechnung des Modus in der deskriptiven Statistik

Der Modus kann für alle unterschiedlichen Skalenniveaus eingesetzt werden. Der daraus abgeleitete Modalwert beschreibt den Wert, welcher im vorhandenen Datensatz am häufigsten vorkommt.

Bleiben wir am Beispiel der Altersverteilung, wäre der Modalwert der Daten aufgrund der Angaben 24.

Der Median in der deskriptiven Statistik

Der Median wird immer anhand von Daten erhoben, welche den Anforderungen einer sogenannten Ordinalskala entsprechen.

Dies ist in unserem Beispiel mit den Altersangaben problemlos möglich. Sortiert man die Altersangaben entsprechend ihrer Höhe, kommt man auf folgende Reihenfolge:
19 20 21 23 24 26

Der Median zwischen diesen zwei Blöcken liegt somit bei 22 Jahren, da dies das arithmetische Mittel der beiden mittleren Werte 21 und 23 ist.

Streuungsmaße in der deskriptiven Statistik

Häufig genügen die Lagemaße nicht, um die Daten verständlich aufzubereiten. Die deskriptive Statistik setzt aus diesem Grund auch andere Hilfsmittel wie die Streuungsmaße ein. Dabei wird die Streuung der Daten erfasst, um unter anderem herauszufinden, ob es statistische Ausreißer gibt oder ob die Werte eher homogen sind. Die deskriptive Statistik bietet hier insgesamt drei standardisierte Streuungsmaße:

  • Varianz
  • Standardabweichung
  • Spannweite

Die Varianz in der deskriptiven Statistik

Die Standardabweichung ist eines der wichtigsten Werkzeuge der deskriptiven Statistik. Für die Berechnung genau dieser Abweichung ist es wichtig die Wurzel der Varianz zu ziehen. Da die Varianz allerdings nicht bei allen Daten vorgegeben ist, muss diese berechnet werden.
Die Formel für die Varianz lautet:

∑ [xi – ∅]2 / n

Dabei setzen wir xi für die Messwerte von i = 1 bis n und n = Anzahl der Messwerte.

In unserem Beispiel wäre der arithmetische Mittelwert aufgerundet 23. In die Formel eingesetzt hieße das:

∑2= ((21-23)2 + (24-23)2 + (20-23)2 + (24-23)2 + (19-23)2 + (23-23)2 + (26-23)2 + (24-23)2) : 8

= (4 + 1 + 9 + 1 + 16 + 0 +9 + 1) : 8 = 5,125

Die Standardabweichung als Maß der deskriptiven Statistik

Die deskriptive Statistik benötigt häufig genaue Werte. Dementsprechend wichtig ist es Abweichungen von den erwarteten Standards genauer definieren zu können. Die Standardabweichung ist die Wurzel aus der Varianz.

Dies wäre in unserem Fall die Wurzel aus 5,125 und ergibt 2,264. Diese Zahl zeigt uns jetzt die Standardabweichungen vom durchschnittlichen Alter der befragten Teilnehmer.

Die Spannweite als Teil der deskriptiven Statistik

Die deskriptive Statistik greift unter anderem auf die sogenannte Spannweite zurück. Unter diesem Begriff subsummiert sich der Abstand zwischen dem Minimum und dem Maximum der erhobenen Datensätze. Dies lässt sich leicht ermitteln, indem der niedrigste Wert vom Höchsten abgezogen wird.

Anhand unseres Beispiels wäre das also 26-19 = 7. Die Spannweite in unserem Beispiel liegt also bei sieben Jahren.

Statistische Zusammenhangsmaße in der deskriptiven Statistik

Die deskriptive Statistik ist nicht nur auf nackte Zahlen, sondern auch auf den Zusammenhang zwischen den verschiedenen Variablen angewiesen. Hier kommen die statistischen Zusammenhangsmaße ins Spiel. Denn diese müssen miteinander in Zusammenhang gebracht werden. Hierzu bedient sich die deskriptive Statistik verschiedener Korrelationskoeffizienten. Diese wären:

  • Die Korrelationskoeffizienz nach Pearson
  • Die Rangkorrelationskoeffizienz
  • Die Kontingenzkoeffizienz

Schauen wir uns diese drei Korrelationskoeffizienten einmal genauer an und betrachten wir deren Einsatzbereiche und Nutzen.4

Deine Arbeit gedruckt von BachelorPrint
Mit BachelorPrint erhältst du deine hochwertig gedruckte Arbeit mit einer persönlich konfigurierten Bindung bereits ab CHF 7,90. Und unser kostenloser Express-Versand sorgt dafür, dass jeder Schweizer-Student die Arbeit bereits am nächsten Tag in seinen Händen hält.

Der Korrelationskoeffizient nach Pearson

Die deskriptive Statistik kann und soll den Zusammenhang zwischen verschiedenen Variablen nachweisen können. Dazu ist es unter anderem wichtig lineare Zusammenhänge zu erkennen. Hierfür ist die Korrelationskoeffizienz nach Pearson ein gültiges Mittel. Die Formel zur Berechnung des Korrelationskoeffizienten ist relativ kompliziert, ergibt aber immer nur drei mögliche Ergebnisse.

Ist das Ergebnis ungefähr bei Null, so gibt es keine Korrelation zwischen den Variablen.
Liegt der Wert über Null, so gibt es eine positive Korrelation. Größere Werte von Faktor X bedeuten auch Größere Werte von Faktor Y. Ist der Wert kleiner als Null, gibt es einen negativen Zusammenhang. Steigen die Werte von X, sinken diese von Y gleichermaßen.

Betrachten wir dies an einem Beispiel. Die Personen aus dem Beispiel mit dem Alter, haben zudem das aktuelle Einkommen angegeben. Dies steigt mit dem Alter gleichermaßen an, sodass es hier zu einer positiven Korrelation kommt. Die deskriptive Statistik würde somit einen Zusammenhang vermuten lassen.

Der Rangkorrelationskoeffizient der deskriptiven Statistik

Der Rangkorrelationskoeffizient nach Spearman, welcher auch unter dem Namen Spearman Rho bekannt ist, stellt eine Methode da, Zusammenhänge zwischen einzelnen Variablen zu erkennen und nachzuweisen. Die Korrelation der Werte wird anhand vorher vergebener Ränge berechnet. Der Abstand zwischen den einzelnen Datenpunkten und Datensätzen ist dabei von untergeordneter Rolle.

Bleiben wir beim zuvor genannten Beispiel. Dem höchsten Einkommen wird nach diesem Werkzeug der Statistik der höchste Wert zugeordnet. Den anderen Einkommen jeweils nach ihrer Höhe ein niedrigerer Rang. So könnte man nun ganz einfach den Rangkorrelationskoeffizienten ausrechnen, würde allerdings hier zu keinen sauberen Ergebnissen kommen. Denn sowohl beim Wert x als auch beim Wert y dürfen keine Wert-Dopplungen vorkommen. Und mehrere Teilnehmer dieses Datensatzes haben das gleiche Alter, sodass die Berechnung nicht zuverlässig wäre.

Der Kontingenzkoeffizient in der deskriptiven Statistik

Im Grunde ist der Korrelationskoeffizient nach Person bereits ein Beispiel für den Kontingenzkoeffizienten. Der Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen verschiedenen nominalen oder ordinalen Variablen und Kennzahlen aus. Verglichen wird dabei die Häufigkeit von Merkmalen mit der Häufigkeit, welche ohne diese Merkmale aufgetreten ist. Das Maß für den Zusammenhang der beobachteten Merkmale ist die quadratische Kontingenz. Diese wird also zum Quadrat genommen.

Merke: Für die deskriptive Statistik ist dies ein eher schwacher Wert und nur bedingt belastbar.5

Was ist der Unterschied zwischen der deskriptiven und der induktiven Statistik

Besonders häufig kommt es zu Verwirrungen bei der Unterscheidung von deskriptiver und induktiver Statistik, obwohl sich beide Bereiche eigentlich einfach unterscheiden lassen. Die deskriptive Statistik bildet die Grundlage für alle weiteren Untersuchungen und Arbeiten mit den Daten.

Die induktive Statistik geht weit darüber hinaus. Sie versucht mit wahrscheinlichkeitstheoretischen Methoden zu ermitteln, ob sich auf Grundlage der Datenlage eine allgemeine Gültigkeit der Erkenntnisse ableiten lässt. Die deskriptive Statistik nutzt diese Methoden nicht.

Häufig gestellte Fragen

Die deskriptive Statistik ist ein Werkzeug, um Daten und ihren Nutzen zu bewerten und objektiv und sicher zu beschreiben. Die deskriptive Statistik ist ein wichtiges Werkzeug zur Datenerfassung und Einordnung.

In allen Bereichen, in denen statistische Datensätze erhoben und ausgewertet werden, bildet die deskriptive Statistik die Grundlage der Arbeit. Daher ist die deskriptive Statistik ein Universalwerkzeug in den verschiedensten Fachbereichen.

Auch wenn es wichtig ist die Formeln und ihre Einsatzbereiche zu kennen, gibt es mittlerweile viele hilfreiche Werkzeuge und Tools, welche die deskriptive Statistik deutlich einfacher machen.

Je nach gewähltem Fachbereich kann die deskriptive Statistik durchaus zur alltäglichen Arbeit gehören. Die Methoden und Mittel zu kennen ist in jedem Fall sinnvoll und zielführend.

Bei der deskriptiven Statistik werden Stichproben beschreiben. Die Inferenzstatistik folgt nun, um eine Aussage über die Grundgesamtheit zu treffen.

Quellen

1Novustat: Deskriptive Statistik, in: Novustat.com, o.D., [online] https://novustat.com/statistik-glossar/deskriptive-statistik.html#:~:text=Eine%20deskriptive%20Statistik%20beschreibt%20einen,von%20empirischen%20Daten%20zu%20beschreiben. (abgerufen am 23.01.2023)

2Lois D.: Deskriptive Statistik, in Unibw.de, April 2015, [online] https://www.unibw.de/hum-bildungswissenschaft/professuren/swm/methodenskripte/deskriptive-statistik.pdf (abgerufen am 23.01.2023)

3Welt der BWL: Varianz, in: Welt-der-bwl.de, o.D., [online] https://welt-der-bwl.de/Varianz#:~:text=Beispiel%3A%20Varianz%20berechnen&text=Die%20Varianz-Formel%20ist%3A%20?,%3D%2080%2F5%20%3D%2016. (abgerufen am 23.01.2023)

4Universität München: Deskriptive Statistik, in: Statistik.uni-muenchen.de, o.D., [online] https://www.statistik.uni-muenchen.de/formulare/skripte_u_aehnliches/deskriptivestatistik_groll.pdf (abgerufen am 23.01.2023)

5Bol G.: Kontingenzkoeffizient. In: Deskriptive Statistik: Lehr- und Arbeitsbuch, 2004, o.D., [online] https://doi.org/10.1524/9783486599510.125 (abgerufen am 23.01.2023)