Bei der logistischen Regression handelt es sich um ein statistisches Analyseverfahren, mit dem Zusammenhänge zwischen einer abhängigen und einer unabhängigen Variablen untersucht werden können, auch wenn diese nicht metrisch skaliert sind.
Wir zeigen dir in diesem Kapitel, welche Bedeutung die logistische Regression hat und was man darunter genau versteht. Unsere Übungsaufgaben kannst du anschließend nutzen, um dein Wissen in diesem Bereich zu überprüfen.
Welche Bedeutung hat die logistische Regression?
Die lineare Regression kann nur angewendet werden, wenn mindestens die abhängige Variable metrisch skaliert ist, ihre Werte sich also mit Zahlen darstellen lassen. Ist die abhängige Variable dagegen diskreter Natur, beispielsweise durch die Werte “Ja”, “Nein” und “Vielleicht” gekennzeichnet, so kann die logistische Regression genutzt werden, um den Zusammenhang der einzelnen Variablen zu untersuchen.
Somit können auch Aussagen über die Wahrscheinlichkeit der Ausprägung der abhängigen Variablen bei einer bestimmten Ausprägung der unabhängigen Variablen getroffen werden.
Mithilfe der logistischen Regression können beispielsweise folgende Fragestellungen beantwortet werden:
- Besteht ein Zusammenhang zwischen der persönlichen sportlichen Aktivität von Personen und den Ernährungsgewohnheiten?
- Gibt es einen Zusammenhang zwischen der Wahrscheinlichkeit für Schneefall im Dezember und dem Absatzvolumen von Weihnachtsdekorationsartikeln?
Was versteht man unter der logistischen Regression?
Wenn ein Zusammenhang zwischen einer abhängigen Variablen, die nicht metrisch ausgeprägt ist, und einer oder mehreren unabhängigen Variablen untersucht werden soll, kommt die logistische Regression zum Einsatz. Die Vorgehensweise zeigt sich in folgendem Beispiel.
Die Probanden wurden in zwei Gruppen aufgeteilt, wobei eine Gruppe das Getränk bekam (2), die andere nur normales Wasser (1) Folgende Ergebnisse wurden dabei erzielt:
Proband 1 | Proband 2 | Proband 3 | Proband 4 | Proband 5 | Proband 6 | |
---|---|---|---|---|---|---|
Konsum des Getränks | ja | ja | ja | nein | nein | nein |
Konzentrationsfähigkeit | 8 | 7 | 9 | 5 | 3 | 2 |
Die Ergebnisse aus der Tabelle werden anschließend geplottet:

Die Verbindung der geplotteten Datenpunkte zeigt an, wie eine logistische Funktion in diesem Fall aussehen könnte:

Um die Signifikanz der logistischen Regression zu überprüfen, wird anstelle des F-Tests in diesem Fall ein x2-Test durchgeführt. In diesem Fall ergibt dieser Test, dass die logistische Regression hoch signifikant ist. Anhand der Untersuchung an den Probanden konnte also festgestellt werden, dass der neue Energydrink das Konzentrationsvermögen erhöht.
Übungsfragen
#1. Was versteht man unter der logistischen Regression?
#2. Wozu dient das Verfahren der logistischen Regression?
#3. “Die Signifikanz der logistischen Regression kann mit einem F-Test überprüft werden.” – Diese Aussage ist:
#4. “Die logistische Regression kann nicht nur bei metrisch skalierten Variablen angewendet werden.” – Diese Aussage ist:
#5. “Die logistische Regression dient ausschließlich der Analyse der Umsatzzahlen von Unternehmen.” – diese Aussage ist:
Ergebnisse
Sie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr Informationen