Wie genau eine Faktorenanalyse funktioniert. Und wann eine, die explorative Faktorenanalyse oder eine konfirmatorische Faktorenanalyse verwendet werden, zeigt dir die folgende Erklärung.
Faktorenanalyse – Psychologie – einfach erklärt
In der Psychologie werden Faktorenanalysen vor allem in der Forschung eingesetzt – insbesondere für die Konstruktion von Tests und Fragebögen. Die Faktorenanalyse hat erfüllt verschiedene Aufgaben, die für die Forschung wichtig sind. Einfach erklärt sind das:
- Verringern einer großen Menge von Variablen
- Finden von Zusammenhängen, die Variablen miteinander verbinden
- Entwickeln von besser messbaren Konstrukten aus den Zusammenhängen
Faktorenanalyse – Definition
Eine Definition für die Faktorenanalyse ist:
Die Faktorenanalyse ist ein statistisches Analyseverfahren, das es ermöglicht, die Zusammenhänge zwischen den Variablen in einem Datensatz zu analysieren. Gemäß ihrer Gemeinsamkeiten können die Variablen mithilfe der Faktorenanalyse zu einer geringeren Anzahl von Gruppen (Faktoren) klassifiziert werden. Damit wird die Menge an Daten deutlich reduziert. Deshalb wird häufig davon gesprochen, dass die Faktorenanalyse ein datenreduzierendes Verfahren darstellt.
Mit Faktorenanalysen können die Fragen in einem Fragebogen (die Variablen) auf die wichtigsten reduziert werden (datenreduzierend). Das ist in der Forschung wichtig, da die Befragung (alle Arten von Fragebögen) die häufigste Forschungsmethode in der Psychologie und allen anderen Sozialwissenschaften ist. Kürzere Fragebögen sind erstens leichter aus auszufüllen, was sie bei Testpersonen beliebter macht und zweitens schneller auszuwerten, was die Forschung vereinfacht.
Die Reduktion ist möglich, da mit der Faktorenanalyse herausgefunden werden kann, welche Gruppen von Fragen zusammenpassen. Zusammenpassende Fragen messen etwas, dass ihnen gemeinsam ist. Die Gemeinsamkeit wird latente Variable oder Faktor genannt.
Mittels der Faktorenanalyse kann man gleichzeitig sehen, wie gut diese latente Variable durch die einzelnen Fragebogenitems erklärt wird, also wie gut sie messbar ist.
Es gibt zwei Arten von Faktorenanalysen. Sie werden
- explorative Faktorenanalyse und
- konfirmatorische Faktorenanalyse
genannt.
Explorative Faktorenanalyse
Die explorative Faktorenanalyse (EFA) kommt immer dann zum Einsatz, wenn Forschende noch keine konkreten Annahmen oder Hypothesen über die Struktur in ihren Daten haben, diese aber besser verstehen wollen. Mit der explorativen Faktorenanalyse kann untersucht werden, welche Gemeinsamkeiten die Variablen in einem Datensatz aufweisen und wie viele Faktoren den Daten zugrunde liegen.
Aus den Beobachtungen vieler Variablen (also etwa den Antworten auf Testitems), kann auf wenige diesen Antworten zugrundeliegende Faktoren (z. B. Intelligenz) geschlossen werden. Diesen kann man dann mit einer weiteren explorativen Faktorenanalyse noch weiter untersuchen, um noch genauere Faktoren zu finden. Das folgende Beispiel zeigt, wie dies bei einem Intelligenztest ablaufen könnte.
Die einzelnen Fragen und Aussagen in einem Fragebogen werden Items bzw. Testitems/Fragebogenitems genannt.
Du untersuchst einen Intelligenztest mit 100 Fragen mittels einer explorativen Faktorenanalyse. Es stellt sich heraus, dass die 100 Fragen sich gut in zwei Faktoren darstellen lassen. Der erste Faktor umfasst 38 Fragen und der zweite Faktor 62. Als du dir die einzelnen Fragen genauer ansiehst, fällt dir auf, dass die 38 Fragen der ersten Gruppen alle Fragen sind, bei denen Zahlenreihen vervollständigt werden müssen. In der zweiten Gruppe sind 62 Fragen, in denen es darum geht Sätze zu vervollständigen oder bestimmte Begriffe zu finden.
Das Beispiel zeigt, wie die einzelnen Fragebogenitems auf zwei zugrundeliegende Faktoren (oder Dimensionen) zurückgeführt werden können. Mit dieser Information könntest Du, wenn Du einen Fragebogen erstellst, zwei Unterkategorien bilden; in diesem Fall z. B. verbale und mathematische Intelligenz.
Durch die Reduktion auf die Dimensionen kannst Du die Anzahl der Fragen auch anpassen. Du könntest Dir überlegen, die Menge der Fragen zu dem ersten und dem zweiten Faktor anzugleichen. Damit konzentrierst Du die Fragen in deinem Fragebogen durch die Faktorenanalyse auf weniger, dafür aber informativere Fragen.
Konfirmatorische Faktorenanalyse
Konfirmatorische Faktorenanalysen (CFAs) werden verwendet, um zu überprüfen, ob die Struktur des Modells sinnvoll ist. Das bedeutet, es wird überprüft, ob ein Test oder Fragebogen auch wirklich das misst, was gemessen werden soll. Das nennt man die Konstruktvalidität.
Validität ist ein sogenanntes Gütekriterium für die empirische Forschung. Unter "Gütekriterien Psychologie" kannst Du mehr über Validität und andere Kriterien lernen.
Eine konfirmatorische Faktorenanalyse funktioniert wie eine umgedrehte explorative Faktorenanalyse. Die einzelnen Faktoren werden hier nicht berechnet, sondern überprüft. Das bedeutet, mit einer konfirmatorischen Faktorenanalyse wird getestet, ob die einzelnen Faktoren auch zu den Items passen.
Wie eine konfirmatorische Faktorenanalyse bei der Fragebogenkonstruktion verwendet werden kann, zeigt Dir das Beispiel des Intelligenztests:
Bei der Entwicklung des Tests wurde folgendes Item vorgeschlagen: "Ich halte meine Sachen immer ordentlich und sauber. 1 (Starke Ablehnung) - 2 - 3 - 4 - 5 (Starke Zustimmung)." Dieses Item weist wenig Gemeinsamkeit mit den übrigen Items auf. Es enthält wenig bis keine Information über das Konstrukt Intelligenz und lässt sich nicht gut durch die beiden Faktoren numerische oder verbale Intelligenz abbilden. Wäre dieses Item weiterhin Teil des Fragebogens, würde es die Konstruktvalidität des Messinstruments verringern.
Faktorladung, Eigenwerte, Kommunalität – Wichtige Begriffe der Faktorenanalyse
Um eine Faktorenanalyse verständlich beschreiben zu können, solltest Du ein paar Begriffe kennen. Mit diesen kannst Du Faktorenanalysen verstehen und nachvollziehen. Die Elemente sind:
- Faktorladung
- Eigenwert und
- Kommunalität
Sie werden für beide Arten von Faktorenanalysen (explorative und konfirmatorische) verwendet.
Faktorladung – Faktorenanalyse
Wie stark eine Variable mit den jeweiligen Faktoren zusammenhängt, lässt sich mathematisch durch die Faktorladung ausdrücken. Wenn eine Variable also besonders stark mit einem bestimmten Fator zusammenhängt, ist die Faktorladung für diesen Faktor sehr hoch, und für die anderen niedrig.
Als Faktorladung wird die Korrelation zwischen einer Variable und einem Faktor bezeichnet. Sie kann Werte zwischen -1 und 1 annehmen. Je stärker sich die Faktorladung von null unterscheidet, desto höher lädt die Variable auf dem jeweiligen Faktor.
Das folgende Beispiel macht den Zusammenhang noch einmal deutlich:
Die Antwort einer Versuchsperson auf das Item "Bitte ergänze die folgende Zahlenreihe: 0 1 3 6 10 _" hängt stärker mit dem Faktor numerische Intelligenz zusammen als mit dem Faktor verbale Intelligenz. Die Faktorladung für numerische Intelligenz sollte daher höher sein, als die für verbale Intelligenz.
Eigenwert – Faktorenanalyse
Eigenwerte sind Kennzeichen für die einzelnen Faktoren eines Modells. Der Eigenwert eines Faktors gibt an, wie sehr alle Variablen mit diesem Faktor zusammenhängen. Das Beispiel zeigt, was damit gemeint ist:
In dem Fragebogen zur Intelligenz werden auch die Items, die eher mathematische Intelligenz abfragen, zu einem geringen Teil mit dem Faktor "verbale Intelligenz" korrelieren, da die Versuchspersonen verbale Intelligenz nutzen müssen, um die Frage zu verstehen. Dies drückt sich dadurch aus, dass der Eigenwert für den Faktor "verbale Intelligenz" größer ist, als der für den Faktor "mathematische Intelligenz". Umgekehrt braucht man keine mathematische Intelligenz, um die verbalen Fragen zu beantworten.
Die folgende Definition hilft Dir, Dir alles Wichtige über die Eigenwerte in einer Faktorenanalyse zu merken:
Der Eigenwert eines Faktors ist ein Maß dafür, wie stark alle Variablen durch ihn erklärt werden. Der Eigenwert kann Werte zwischen 0 und unendlich annehmen. In der psychologischen Forschung wird in der Regel ein Wert über 1 als guter Wert angenommen.
Erhält man bei einer explorativen Faktorenanalyse viele Faktoren, kann man anhand der Eigenwerte diejenigen Faktoren (und die dazugehörigen Variablen) herausnehmen, die nur einen geringen Anteil der Variablen erklären. So können schnell viele Variablen auf einmal entfernt werden.
Kommunalität – Faktorenanalyse
Mit der Kommunalität wird mathematisch ausgedrückt, was die Variablen mit den Faktoren gemein haben. Damit kann festgestellt werden, ob eine Variable durch die ausgewählten Faktoren dargestellt wird oder nicht. Hat eine Variable eine niedrige Kommunalität, wird sie durch die Faktoren nicht gut abgebildet.
Die Kommunalität einer Variable ist der Wert, der angibt, wie sehr die Streuung (Varianz) dieser Variable durch alle Faktoren erklärt wird. Die Kommunalität kann Werte zwischen 0 und 1 annehmen. Je näher der Wert an 1 ist, desto höher ist der Varianzanteil der Variable, der von den Faktoren erklärt wird.
Streuung (oder Varianz) ist eine wichtige statistische Maßeinheit. Sie gibt an, wie stark die einzelnen Werte einer Variable sich um den Mittelwert verteilen (streuen). Wenn Du mehr über die Streuung oder andere statistische Maße lernen willst, klick Dich in die Erklärung "deskriptive Statistik" rein.
Faktorenanalyse – Beispiel
Faktorenanalysen werden überwiegend in der psychologischen Forschung eingesetzt – besonders in der Erstellung von Tests und Fragebögen. Zusätzlich kann die Faktorenanalyse bei der Auswertung helfen, die gewählten Faktoren weiter zu untersuchen und zu reduzieren.
Das Beispiel einer Fragebogenerstellung zeigt Dir, wie die Faktorenanalyse in der Praxis angewendet wird.
Faktorenanalyse – Fragebogen
Du hast dir vorgenommen, einen Intelligenztest zu entwickeln. Dazu sammelst Du als erstes Fragebogenitems, wie die folgenden:
- "Bitte ergänze die folgende Zahlenreihe: 0 1 3 6 10 _"
- "Das Gegenteil von Gewinn ist ... [ ] Preis [ ] Absage [ ] Verlust"
Um Fragebogenitems zu finden, kannst Du Dich gut an Fragebögen oder Tests zu einem ähnlichen Forschungsthema orientieren.
Du sammelst so lange Items, bis Du einen großen Pool an 100 Fragen hast. Diese Variablen enthalten alle eine bestimmte Information. Das Ziel einer guten Testkonstruktion wäre in diesem Beispiel, dass die Variablen Informationen über die Intelligenz der Versuchspersonen beinhalten. Um das herauszufinden, lässt Du Deinen Fragebogen von einer Gruppe Versuchspersonen bearbeiten.
Das Verfahren, einen Fragebogen vor der eigentlichen Forschung testen zu lassen, um Items, die keine, oder wenige Informationen beinhalten, herausfiltern zu können, wird Pretest genannt.
Der Intelligenztest wird von 50 Versuchspersonen bearbeitet. Wenn die Forschenden diese Daten anschließend auswerten, liegen zunächst 100 Variablen vor: die Antworten aller Teilnehmenden auf die 100 Testfragen. Diese Testantworten sind für Dich mittels einer Faktorenanalyse untersuchbar.
Mit einer explorativen Faktorenanalyse findest Du heraus, dass sich deine Variablen in zwei Faktoren zusammenfassen lassen. Nachdem Du Dir die betreffenden Fragen angesehen hast, fällt dir auf, dass die eine Gruppe von Fragen aus der Vollendung von Zahlenreihen und die zweite Gruppe aus Aufgaben zum Wortverständnis besteht. Den einen Faktor nennst Du "mathematische Intelligenz" und den zweiten "verbale Intelligenz".
Mithilfe der Faktorenanalyse kannst Du nur herausfinden, welche Faktoren statistisch mit welchen Variablen zusammenhängen. Die Faktoren kannst Du benennen, wie Du möchtest.
Zusätzlich hast Du sieben Fragen, die sich keinem der beiden Faktoren zuordnen lassen. Diese kannst Du direkt aus Deinem Fragebogen entfernen, da sie bei der Messung nicht helfen. Um Deinen Fragebogen weiter zu verkürzen, siehst Du Dir als Nächstes die Ladungen der Items an. Du entscheidest Dich, von jedem Faktor, die 25 Fragen mit der höchsten Faktorladung auszuwählen. So kannst Du in kurzer Zeit deinen Fragebogen von 100 Fragen, auf einen Fragebogen mit 50 Fragen kürzen und die Intelligenz, die Du misst, in die Faktoren "verbale Intelligenz" und "mathematische Intelligenz" unterteilen.
Faktorenanalyse – Big Five
Ein Teilgebiet der psychologischen Forschung ist die Persönlichkeitsforschung. Forscher*innen dieses Teilgebiets suchten nach bestimmten Eigenschaften, die einen Menschen besonders genau beschreiben. Eine Forschergruppe verließ sich dabei auf eine spezielle Theorie. Sie wird der lexikalische Ansatz genannt.
Der lexikalische Ansatz, auch Sedimentationshypothese genannt, bezeichnet die Annahme, dass alle wichtigen Persönlichkeitseigenschaften durch Adjektive abgebildet werden. Daraus folgt, dass sie sich auch in Wörterbüchern finden lassen müssten.
Zu Beginn wurden mehrere Tausend Adjektive, die die Persönlichkeit beschreiben, gesammelt. Sie wurden in mehreren Schritten mit explorativen Faktorenanalysen auf immer weniger Variablen reduziert, bis schließlich nur fünf Faktoren übrig blieben. Diese sind:
- Offenheit für Erfahrungen
- Gewissenhaftigkeit
- Extraversion
- Verträglichkeit
- Neurotizismus
Diese Persönlichkeitseigenschaften werden die Big Five genannt. Die Untersuchung nach dem lexikalischen Ansatz wurde zeitgleich von unterschiedlichen Forschungsgruppen mit ähnlichen Ergebnissen durchgeführt.
Faktorenanalyse - Das Wichtigste
- Die Faktorenanalyse ist ein statistisches Verfahren. In der Psychologie wird es vor allem in der Test- und Fragebogenkonstruktion eingesetzt.
- Es gibt zwei Arten von Faktorenanalysen:
- explorative Faktorenanalyse: Wird verwendet, um viele Variablen auf wenige Faktoren zu reduzieren.
- konfirmatorische Faktorenanalyse: Wird verwendet, um Hypothesen zu überprüfen.
- Die Faktorladung beschreibt, wie stark eine Variable mit einem Faktor zusammenhängt.
- Eigenwerte sind ein Maß dafür, wie stark ein Faktor alle Variablen erklärt.
- Kommunalität gibt an, wie sehr eine Variable durch alle Faktoren erklärt wird.
Nachweise
- Rasch et al. (2014). Quantitative Methoden 1: Einführung in die Statistik für Psychologen und Sozialwissenschaftler. Springer.
- Asendorpf; Neyer. (2012). Psychologie der Persönlichkeit. Springer.
Wie stellen wir sicher, dass unser Content korrekt und vertrauenswürdig ist?
Bei StudySmarter haben wir eine Lernplattform geschaffen, die Millionen von Studierende unterstützt. Lerne die Menschen kennen, die hart daran arbeiten, Fakten basierten Content zu liefern und sicherzustellen, dass er überprüft wird.
Content-Erstellungsprozess:
Lily Hulatt ist Digital Content Specialist mit über drei Jahren Erfahrung in Content-Strategie und Curriculum-Design. Sie hat 2022 ihren Doktortitel in Englischer Literatur an der Durham University erhalten, dort auch im Fachbereich Englische Studien unterrichtet und an verschiedenen Veröffentlichungen mitgewirkt. Lily ist Expertin für Englische Literatur, Englische Sprache, Geschichte und Philosophie.
Lerne Lily
kennen
Content Quality Monitored by:
Gabriel Freitas ist AI Engineer mit solider Erfahrung in Softwareentwicklung, maschinellen Lernalgorithmen und generativer KI, einschließlich Anwendungen großer Sprachmodelle (LLMs). Er hat Elektrotechnik an der Universität von São Paulo studiert und macht aktuell seinen MSc in Computertechnik an der Universität von Campinas mit Schwerpunkt auf maschinellem Lernen. Gabriel hat einen starken Hintergrund in Software-Engineering und hat an Projekten zu Computer Vision, Embedded AI und LLM-Anwendungen gearbeitet.
Lerne Gabriel
kennen