Bei der Statistik handelt es sich um die „Lehre von Methoden zum Umgang mit Daten bzw. quantitativen Methoden“. Sie fasst bestimmte Vorgehensweisen zusammen, um empirische Daten zu analysieren. Empirie wiederum steht für das methodische und systematische Sammeln von Daten sowie für die Erkenntnisse aus diesen Daten. Die Statistik ist eine Hilfswissenschaft, die in sämtlichen empirischen Naturwissenschaften und Disziplinen verwendet wird, darunter die Medizin, Wirtschaftswissenschaften, Biologie, Chemie, Physik, Psychologie, Soziologie und Politologie. Sie bildet die theoretische Basis für alle empirischen Forschungen.
In dieser Lektion erfährst du, was genau Statistik ist und welche Rolle sie spielt, in welche Bereiche sich die Statistik gliedert und wie sie sich in die Praxis umsetzen lässt. Weiterhin nennen und erklären wir dir erste Fachbegriffe aus diesem Bereich. Am Schluss der Lektion findest du einige Übungsfragen, mit deren Hilfe du deinen Lernstand überprüfen kannst.
- Synonym: Sammelforschung (veralteter Begriff)
- Englisch: statistic | statistics | stats
Warum ist das Thema “Statistik” wichtig?
Aufgrund der immer mehr zunehmenden Digitalisierung auf globaler Ebene steigt die Menge gesammelter Daten in allen Disziplinen stark an. Auch die Statistik sowie die daraus abgeleiteten Analysen und Auswertungen der Informationen gewinnen immer mehr an Bedeutung.
Als Teilgebiet der Mathematik ist die Statistik ebenfalls sehr wichtig. Die reine mathematische Statistik zielt darauf ab, allgemeingültige Aussagen mittels Methoden der reinen Mathematik zu beweisen bzw. zu widerlegen. Dabei nutzt sie Erkenntnisse aus den mathematischen Grundlagen der linearen Algebra und der Analysis.
Einteilung der Statistik
Der Gesamtbereich der Statistik lässt sich in drei Teilbereiche untergliedern:
- Deskriptive Statistik
- Induktive Statistik
- Explorative Statistik

Deskriptive Statistik
Sie wird auch als beschreibende bzw. empirische Statistik bezeichnet und umfasst die Beschreibung, Aufbereitung und Zusammenfassung der vorliegenden Daten. Aus den quantitativen Daten entstehen Tabellen, Kennzahlen und grafische Darstellungen.
Induktive Statistik
Sie ist auch bekannt als mathematische, beurteilende, schließende oder Inferenzstatistik bekannt. Sie arbeitet mit Stichproben aus den vorliegenden Daten, aus denen die Eigenschaften einer gesamten Datengruppe abgeleitet wird. Die Grundlagen für diese Test- und Schätzverfahren liefert die Wahrscheinlichkeitstheorie.
Explorative Statistik
Sie wird auch als Data-Mining, analytische und hypothesen-generierende Statistik bezeichnet. Ursprünglich eine Mischform der beiden zuvor genannten Bereiche erhält sie in ihrer Anwendung einen wachsenden eigenständigen Wert.
Sie nutzt systematisch die deskriptiven und induktiven Methoden, um in den Datenbeständen möglicherweise vorhandene Zusammenhänge oder Differenzen aufzufinden und diese gleichzeitig hinsichtlich ihrer Resultate bzw. Sicherheit der Resultate sowie ihrer Stärke zu bewerten. Die Ergebnisse können als Hypothesen verstanden werden, die wiederum mittels induktiver Testverfahren zu bestätigen und statistisch zu sichern sind.
Praktische Umsetzung der Statistik in fünf Schritten
Bei statistischen Untersuchungen arbeiten theoretisches Fachwissen und statistisch-mathematische Methoden eng zusammen.
Die Durchführung einer solchen Untersuchung lässt sich im Allgemeinen in folgende fünf Schritte unterteilen:
- Planung
- Erhebung
- Aufbereitung
- Analyse
- Interpretation
Die fünf Schritte folgen nur selten unmittelbar aufeinander, sondern wechseln sich häufig ab. Abhängig ist dies von den Informationen, den Ergebnissen und den theoretischen Überlegungen während der statistischen Untersuchung.
Planung
Die Planungsphase wird auch als Definitionsphase bezeichnet; hier werden die Fragen zur Datenforschung klar formuliert und festgelegt. Definiert werden die Problem- und Zielstellung der statistischen Untersuchung sowie die theoretische Begründung dafür.
Dabei stehen folgende Entscheidungen an:
- Definition der Grundgesamtheit (Menge aller statistischen Einheiten bzw. Merkmalsträger, die untersucht werden soll)
- Festlegung der statistischen Einheiten, anhand derer gemessen wird
- Festlegung der zu erhebenden Variablen
- Festlegung der Operationalisierung (Messinstrument bzw. Indikator sowie dessen Messniveau, Erhebungsmethode, Erhebungsinstrument, Gewinnung der empirischen Informationen)
- Festlegung der Art und des Umfangs der Erhebung
Erhebung
Je nach gewählter Art der Erhebung ergeben sich weitere Schritte, wie die benötigten und zu untersuchenden Daten gewonnen werden:
- Im Zuge der primär-statistischen Erhebung werden die Informationen vom Forscher selbst erhoben, zum Beispiel anhand von Umfragen. Die Vorgehensweise der Datenerhebung ist festzulegen und die Erhebung vorschriftsmäßig durchzuführen.
- Bei der sekundar-statistischen Erhebung greift der Forscher auf Daten zu, die an anderer Stelle erhoben wurden, beispielsweise vom Statistischen Bundesamt. Der Vorteil liegt darin, dass Zeit und Arbeit eingespart werden; andererseits eignen sich nicht alle erhobenen Daten optimal für die Fragestellung oder der angestrebten Operationalisierung.
- Wählt der Forscher die tertiär-statistische Erhebung, nutzt er bereits von anderen erhobene und veröffentlichte Daten.
Aufbereitung
Die Datenaufbereitung umfasst die Codierung, Bereinigung und gegebenenfalls auch Umwandlung der erhobenen Variablen. Fehlende Werte werden mittels Imputationsmethoden durch begründete Modelle eingefügt, wobei hier größte Vorsicht geboten ist. Inzwischen gibt es eigene Forschungen zu Imputationsmethoden.
Die Ergebnisse der Datenbereinigung werden mithilfe von Zeichen und Konventionen präzisiert.
Analyse
In dieser Phase werden die Methoden der explorativen, deskriptiven und induktiven Statistik mittels Grafiken, Kennziffern und Tests angewendet. Viele Datenmengen werden heutzutage automatisch erhoben; außerdem werden die Auswertungsverfahren immer komplexer. Die Nutzung einer ausgereiften und hochwertigen Statistik-Software ist für die Analyse daher von großer Bedeutung.
Interpretation
Wie die Ergebnisse der statistischen Analysen interpretiert werden, hängt natürlich vor allem vom jeweiligen Fachgebiet ab. Die reine Zahlendarstellung ist in eine treffsichere Sprache umzusetzen, die außerdem wissenschaftlichen Kriterien genügen muss. Werden die aufgestellten Fragestellungen und Hypothesen nicht berücksichtigt, ist die statistische Auswertung praktisch bedeutungslos.
Zu einer überzeugenden statistischen Auswertung gehört der Einbau der gewonnenen Ergebnisse in einen flüssigen Text, der inhaltlich versehen wird mit:
- der entsprechenden Relevanz,
- der Entwicklung von der Fragestellung bis zur statistischen Methodik,
- der strukturierten Darstellung der Ergebnisse und
- dem Verweis auf den wissenschaftlichen Kontext, also dem „großen Ganzen“.
Dabei ist möglichen Schwachstellen der Datenanalyse Rechnung zu tragen. Um einen Erkenntnisfortschritt zu erzielen, sind Verweise und Querbezüge auf bereits vorhandene valide Studienergebnisse unbedingt erforderlich.

Grundlegende Begriffe in der Statistik
In der Statistik wird eine Art eigene Sprache gesprochen, mit vielen Begriffen, die für Außenstehende möglicherweise zunächst unverständlich sind.
Hier einige Beispiele:
- Daten: Zahlen bilden das Grundgerüst der Statistik. Liegen große Zahlenmengen vor, wird der Begriff „Daten“ genutzt.
- Variablen: Damit sind unterschiedliche Arten von Zahlen gemeint, beispielsweise Umsatz pro Tag und Anzahl der Mitarbeiter. Variablen sind messbare oder beobachtbare Merkmale.
- Merkmalsträger: statistische Einheiten bzw. Objekte, deren interessierende Größen erfasst werden
- Daten bzw. Merkmalsausprägungen: gemessene Werte eines Merkmalsträgers in Bezug auf das Merkmal
Übungsfragen
#1. Ist die Statistik ein Teilgebiet der Mathematik?
#2. Welchen Teilbereich der Statistik gibt es NICHT?
#3. Die Umsetzungsschritte der Statistik in die Praxis folgen ausnahmslos unmittelbar aufeinander. Richtig oder falsch?
#4. Ein Forscher hat grundsätzlich mehrere Möglichkeiten, die zu untersuchenden Daten zu gewinnen. Wie viele sind es genau?
#5. Wie nennt sich die Art der Datenerhebung, in deren Zuge der Forscher auf bereits erhobene und veröffentlichte Daten zugreift?
#6. Was genau sind Variablen NICHT?
Ergebnisse
Sie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr Informationen