Unter dem Begriff „Clusteranalyse“ versteht man ein Segmentierungsverfahren, mit dem die zu untersuchenden Daten in Gruppen aufgeteilt werden sollen. Diese Gruppeneinteilung wird von Backhaus et al. (2003) folgendermaßen beschrieben:
„Die Mitglieder einer Gruppe sollen dabei eine weitgehend verwandte Eigenschaftsstruktur aufweisen; d.h. sich möglichst ähnlich sein. Zwischen den Gruppen sollen demgegenüber (so gut wie) keine Ähnlichkeiten bestehen. Ein wesentliches Charakteristikum der Clusteranalyse ist die gleichzeitige Heranziehung aller vorliegenden Eigenschaften zur Gruppenbildung. […] Bei allen Problemstellungen, die mit Hilfe der Clusteranalyse gelöst werden können, geht es immer um die Analyse einer heterogenen Gesamtheit von Objekten (z.B. Personen, Unternehmen), mit dem Ziel, homogene Teilmengen von Objekten aus der Objektgesamtheit zu identifizieren.“ Die im Folgenden dargestellte Clusteranalyse hat einen Datensatz der Katholischen Universität Eichstätt zur Grundlage, der sich auf eine 2004 durchgeführte Schülerbefragung bezieht. Leiter der Studie war Prof. Dr. Siegfried Lamnek; das Thema war „Gewalt in der Schule“. Die hier betrachteten Variablen sind acht Täter- und Opfer-Indizes, mittels denen die Schüler in Gruppen eingeteilt werden sollen.
Inhaltsverzeichnis
- Einleitung
- Zu den Daten
- Methodische Vorüberlegungen
- Diskussion verschiedener Lösungsmöglichkeiten
- Zusammensetzung der Cluster und Vergleich der Mittelwerte
- F- und t-Werte
- Endgültiges Modell
- Statistische Argumente
- Inhaltliche Argumente
- Zusammenhang mit soziodemografischen Merkmalen
- Zusammenfassung
Zielsetzung und Themenschwerpunkte
Die vorliegende Arbeit präsentiert eine Clusteranalyse, die einen Datensatz der Katholischen Universität Eichstätt zur Grundlage hat und sich auf eine Schülerbefragung zum Thema „Gewalt in der Schule“ bezieht. Ziel ist die Segmentierung der Schüler in Gruppen anhand von acht Täter- und Opfer-Indizes. Die Analyse untersucht verschiedene Clusterlösungen und bewertet diese anhand statistischer und inhaltlicher Kriterien.
- Anwendung der Clusteranalyse auf Schülerdaten zum Thema Gewalt.
- Vergleich verschiedener Clusteralgorithmen (Ward-Verfahren, Complete Linkage).
- Interpretation und Bewertung verschiedener Klassenlösungen.
- Analyse der Zusammensetzung der Cluster anhand von Mittelwerten.
- Beziehung der Cluster zu soziodemografischen Merkmalen.
Zusammenfassung der Kapitel
Einleitung: Die Einleitung führt in das Thema Clusteranalyse ein und beschreibt das Ziel, einen Schülerdatensatz der Katholischen Universität Eichstätt zur Gewalt in der Schule mithilfe dieses Verfahrens zu segmentieren. Der Datensatz beinhaltet acht Indizes, die sowohl Täter- als auch Opferverhalten erfassen. Die Einleitung stellt die Grundzüge der Clusteranalyse dar und skizziert den weiteren Ablauf der Analyse.
Zu den Daten: Dieses Kapitel beschreibt die Datenbasis der Studie: acht Variablen, die aus Items einer Schülerbefragung zum Thema Gewalt gebildet wurden. Diese Variablen erfassen sowohl die Erfahrungen der Schüler als Opfer als auch als Täter in vier Dimensionen (physische Gewalt gegen Personen, physische Gewalt gegen Sachen, psychische Gewalt und verbale Gewalt). Jeder Index hat einen Wertebereich von 0 bis 10. Zusätzlich existieren soziodemografische Merkmale im Datensatz für spätere Korrespondenzanalysen.
Methodische Vorüberlegungen: Aufgrund der Größe des Datensatzes (über 4000 Fälle) wird eine 10%ige Zufallsstichprobe gezogen, um die Daten zunächst zu explorieren und das weitere Vorgehen zu planen. Es werden das Ward-Verfahren und das Complete Linkage Verfahren für die Clusteranalyse verglichen. Die Analyse entscheidet sich für das Ward-Verfahren aufgrund der besseren Klassensituation im Vergleich zum Complete Linkage Verfahren, welches zu vielen kleinen und einer sehr großen Klasse führt. Die Analyse beschließt, die 2- bis 7-Klassen-Lösungen näher zu untersuchen.
Diskussion verschiedener Lösungsmöglichkeiten: Dieses Kapitel analysiert die Ergebnisse der Clusteranalysen mit 2 bis 7 Clustern. Es werden die Zusammensetzung der Cluster anhand von Mittelwerten der acht Indizes verglichen und die Homogenität der Gruppen anhand von F- und t-Werten beurteilt. Die Analyse verfolgt dabei systematisch die Aufspaltung der Cluster, beginnend bei der Zweier-Cluster-Lösung, um die Entstehung und die Eigenschaften der einzelnen Gruppen zu verstehen.
Schlüsselwörter
Clusteranalyse, Gewalt in der Schule, Schülerbefragung, Täter-Opfer-Indizes, Ward-Verfahren, Datenanalyse, Multivariate Analysemethoden, Homogenität, Klassendiagnose, Soziodemografische Merkmale.
Häufig gestellte Fragen (FAQ) zur Clusteranalyse von Schülerdaten zum Thema Gewalt
Was ist das Thema und der Zweck dieser Arbeit?
Diese Arbeit präsentiert eine Clusteranalyse, die einen Datensatz der Katholischen Universität Eichstätt zur Grundlage hat und sich auf eine Schülerbefragung zum Thema „Gewalt in der Schule“ bezieht. Ziel ist die Segmentierung der Schüler in Gruppen anhand von acht Täter- und Opfer-Indizes. Die Analyse untersucht verschiedene Clusterlösungen und bewertet diese anhand statistischer und inhaltlicher Kriterien.
Welche Daten wurden verwendet?
Die Datenbasis besteht aus acht Variablen, die aus Items einer Schülerbefragung zum Thema Gewalt gebildet wurden. Diese Variablen erfassen sowohl die Erfahrungen der Schüler als Opfer als auch als Täter in vier Dimensionen (physische Gewalt gegen Personen, physische Gewalt gegen Sachen, psychische Gewalt und verbale Gewalt). Jeder Index hat einen Wertebereich von 0 bis 10. Zusätzlich existieren soziodemografische Merkmale im Datensatz für spätere Korrespondenzanalysen. Da der Datensatz über 4000 Fälle umfasste, wurde eine 10%ige Zufallsstichprobe für die Analyse verwendet.
Welche Methoden wurden angewendet?
Es wurde eine Clusteranalyse durchgeführt, wobei das Ward-Verfahren und das Complete Linkage Verfahren verglichen wurden. Das Ward-Verfahren wurde aufgrund der besseren Klassensituation gewählt. Die Analyse untersuchte die 2- bis 7-Klassen-Lösungen. Die Zusammensetzung der Cluster wurde anhand von Mittelwerten der acht Indizes verglichen, und die Homogenität der Gruppen anhand von F- und t-Werten beurteilt.
Welche Ergebnisse wurden erzielt?
Das Kapitel "Diskussion verschiedener Lösungsmöglichkeiten" analysiert die Ergebnisse der Clusteranalysen mit 2 bis 7 Clustern. Die Analyse verfolgt systematisch die Aufspaltung der Cluster, beginnend bei der Zweier-Cluster-Lösung, um die Entstehung und die Eigenschaften der einzelnen Gruppen zu verstehen. Die detaillierten Ergebnisse sind im Dokument selbst aufgeführt und beinhalten die Analyse der Mittelwerte der acht Indizes für jede Clusterlösung sowie die Bewertung der Homogenität mittels F- und t-Werten.
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter sind: Clusteranalyse, Gewalt in der Schule, Schülerbefragung, Täter-Opfer-Indizes, Ward-Verfahren, Datenanalyse, Multivariate Analysemethoden, Homogenität, Klassendiagnose, Soziodemografische Merkmale.
Wie ist die Arbeit strukturiert?
Die Arbeit gliedert sich in folgende Kapitel: Einleitung, Zu den Daten, Methodische Vorüberlegungen, Diskussion verschiedener Lösungsmöglichkeiten (inkl. Zusammensetzung der Cluster und Vergleich der Mittelwerte sowie F- und t-Werte), Endgültiges Modell (inkl. Statistische Argumente, Inhaltliche Argumente und Zusammenhang mit soziodemografischen Merkmalen) und Zusammenfassung.
- Quote paper
- Florian Wohlkinger (Author), 2007, Clusteranalyse - Ein Anwendungsbeispiel, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/117121