|
Vorwort |
5 |
|
|
Inhaltsverzeichnis |
6 |
|
|
Teil I Einführung |
10 |
|
|
1 Einführung: Sozialwissenschaftliche Datenanalyse |
11 |
|
|
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik |
11 |
|
|
2 Ziele und Zielgruppe des Handbuchs |
12 |
|
|
3 Themenauswahl |
13 |
|
|
4 Gliederung und Inhal |
14 |
|
|
5 Ausblick |
14 |
|
|
Literaturverzeichnis |
15 |
|
|
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik |
16 |
|
|
1 Einführung |
16 |
|
|
2 Was heißt Kausalität? |
17 |
|
|
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität |
18 |
|
|
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen |
18 |
|
|
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität |
18 |
|
|
2.4 Kausalität als „Mechanismus“ |
19 |
|
|
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn? |
19 |
|
|
2.6 Exkurs: Die Logik der Erklärung |
20 |
|
|
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität |
21 |
|
|
2.8 Zum Vergleich der Kausalitäts-Definitionen |
23 |
|
|
3 Kausalität in sozialwissenschaftlichen Experimenten |
24 |
|
|
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression |
27 |
|
|
4.1 Enthalten Kausalmodelle Kausalaussagen? |
27 |
|
|
4.2 Regressionsanalyse und kausale Schlüsse |
28 |
|
|
4.3 Kausalität in anderen multivariaten Verfahren |
33 |
|
|
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität? |
34 |
|
|
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen |
36 |
|
|
6 Kausalität in Messmodellen |
38 |
|
|
7 Resümee |
41 |
|
|
8 Literaturempfehlungen |
41 |
|
|
Literaturverzeichnis |
42 |
|
|
Teil II Grundlagen der Datenanalyse |
46 |
|
|
3 Datengewinnung und Datenaufbereitung |
47 |
|
|
1 Daten |
47 |
|
|
2 Formen der Datenerhebung |
49 |
|
|
2.1 Befragung |
49 |
|
|
Persönlich-Mündliches Interview |
53 |
|
|
Schriftliche Befragung |
54 |
|
|
Telefonbefragung |
56 |
|
|
Onlinebefragungen |
57 |
|
|
Entscheidung für eine Befragungsform |
60 |
|
|
2.2 Beobachtung |
61 |
|
|
3 Stichprobenziehung |
63 |
|
|
4 Datenaufbereitung |
66 |
|
|
4.1 Transkription |
66 |
|
|
4.2 Kodierung |
66 |
|
|
4.3 Plausibilisierung |
67 |
|
|
4.4 Gewichtung |
68 |
|
|
4.5 Archivierung |
68 |
|
|
5 Literaturempfehlungen |
69 |
|
|
Literaturverzeichnis |
69 |
|
|
4 Uni- und bivariate deskriptive Statistik |
71 |
|
|
1 Univariate Statistik |
71 |
|
|
1.1 Lagemaße |
71 |
|
|
Arithmetische Mittel |
71 |
|
|
Median (Zentralwert) |
72 |
|
|
Modalwert |
74 |
|
|
1.2 Streuungsmaße |
74 |
|
|
Varianz, Standardabweichung und Variationskoeffizient |
75 |
|
|
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung |
77 |
|
|
Index qualitativer Variation |
78 |
|
|
1.3 Schiefe |
78 |
|
|
2 Bivariate Statistik |
79 |
|
|
2.1 Tabellenanalyse |
81 |
|
|
Spalten-, Zeilen- und Gesamtprozente |
81 |
|
|
Prozentuierung und statistische Unabhängigkeit |
82 |
|
|
Prozentsatzdifferenz |
83 |
|
|
Odds und Odds-Ratio |
84 |
|
|
Nominalskalierte Maße: Cramérs V |
85 |
|
|
Ordinalskalierte Merkmale |
87 |
|
|
2.2 Metrische Merkmale: Kovarianz und Korrelation |
91 |
|
|
3 Ausblick |
94 |
|
|
4 Literaturempfehlungen |
94 |
|
|
Literaturverzeichnis |
94 |
|
|
5 Graphische Datenexploration |
96 |
|
|
1 Einführung |
96 |
|
|
2 Graphische Methoden für die Datenexploration |
98 |
|
|
2.1 Einteilungskriterien für graphische Darstellungen |
98 |
|
|
2.2 Univariate Analysen |
99 |
|
|
Untersuchung der empirischen Häufigkeitsverteilung |
99 |
|
|
Vergleich von Verteilungen |
108 |
|
|
Die Darstellung von Zeitreihen |
112 |
|
|
2.3 Bivariate Analysen |
113 |
|
|
Das Anscombe-Quartett |
114 |
|
|
Streudiagramm |
115 |
|
|
2.4 Multivariate Analysen |
117 |
|
|
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen |
119 |
|
|
4 Literaturempfehlungen |
120 |
|
|
Anhang |
120 |
|
|
Literaturverzeichnis |
121 |
|
|
6 Der Umgang mit fehlenden Werten |
122 |
|
|
1 Einführung in Techniken zur Kompensation fehlender Werte |
122 |
|
|
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit |
122 |
|
|
1.2 Gewichtung |
125 |
|
|
Schätzung der Responsewahrscheinlichkeiten |
126 |
|
|
Gewichten oder nicht? |
127 |
|
|
Ergänzungen |
128 |
|
|
1.3 Multiple Imputation |
129 |
|
|
Voraussetzungen |
129 |
|
|
Erzeugung multipler Imputationen |
130 |
|
|
Auswertung multipel imputierter Datensätze |
132 |
|
|
Ergänzungen |
133 |
|
|
2 Mathematisch-statistische Grundlagen |
134 |
|
|
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit |
134 |
|
|
2.2 Gewichtung |
135 |
|
|
2.3 Multiple Imputation |
137 |
|
|
3 Beispiel: Einkommensgleichung mit fehlenden Werten |
140 |
|
|
4 Häufige Fehler |
144 |
|
|
5 Literaturempfehlungen |
146 |
|
|
Literaturverzeichnis |
147 |
|
|
7 Gewichtung |
148 |
|
|
1 Einführung in das Verfahren |
148 |
|
|
2 Mathematisch-statistische Grundlagen |
150 |
|
|
2.1 Designgewichtung in komplexen Stichprobenerhebungen |
152 |
|
|
Schichtung |
153 |
|
|
Proportionale Aufteilung |
154 |
|
|
Disproportionale Schichtung |
154 |
|
|
Klumpenauswahl |
155 |
|
|
Auswahl mit ungleichen Wahrscheinlichkeiten |
156 |
|
|
2.2 Kombination von Anpassungs- und Designgewichtung |
158 |
|
|
3 Gewichtung am Beispiel des ESS |
163 |
|
|
4 Häufige Fehler |
168 |
|
|
5 Literaturempfehlungen |
168 |
|
|
Literaturverzeichnis |
168 |
|
|
8 Grundlagen des statistischen Schließens |
170 |
|
|
1 Einführung in die Fragestellung |
170 |
|
|
2 Statistisches Schätzen |
171 |
|
|
2.1 Eigenschaften von Schätzern |
172 |
|
|
2.2 Intervallschätzung |
175 |
|
|
3 Statistisches Testen |
179 |
|
|
3.1 Hypothesentests über Konfidenzintervalle |
179 |
|
|
3.2 Signifikanztests |
180 |
|
|
3.3 Berücksichtigung der Trennschärfe von Tests |
183 |
|
|
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests |
185 |
|
|
4 Anwendungsfehler und Anwendungsprobleme |
187 |
|
|
4.1 Fallzahlabhängigkeit |
188 |
|
|
4.2 Spezifikation der statistischen Fragestellung |
189 |
|
|
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse |
190 |
|
|
Interpretation von Konfidenzintervallen |
190 |
|
|
Interpretation von Signifikanzen |
190 |
|
|
Formulierung der Forschungshypothese als Alternativhypothese |
191 |
|
|
Multiples Testen |
191 |
|
|
Modell-Fitting |
192 |
|
|
Stichprobenpläne als Quelle von Interpretationsfehlern |
193 |
|
|
5 Literaturhinweise |
193 |
|
|
Literaturverzeichnis |
194 |
|
|
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap |
195 |
|
|
1 Einführung in das Verfahren |
195 |
|
|
2 Mathematisch-statistische Grundlagen |
199 |
|
|
2.1 Standardfehler und Konfidenzintervall von ˆ? |
199 |
|
|
Normale Approximationsmethode |
200 |
|
|
Perzentil-Methode |
200 |
|
|
Bias-corrected and accelerated Methode (BCa) |
200 |
|
|
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten |
202 |
|
|
3 Ein Beispiel |
203 |
|
|
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation |
205 |
|
|
4 Häufige Fehler |
206 |
|
|
5 Literaturempfehlungen |
208 |
|
|
Literaturverzeichnis |
208 |
|
|
10 Maximum-Likelihood Schätztheorie |
209 |
|
|
1 Einführung in das Verfahren |
210 |
|
|
2 Die Mechanik des Maximum-Likelihood Verfahrens |
212 |
|
|
2.1 Das ML-Verfahren zur Bestimmung eines Parameters |
213 |
|
|
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter |
218 |
|
|
3 Statistische Eigenschaften der ML-Schätzer |
223 |
|
|
4 Inferenzstatistik und Modellanpassung |
226 |
|
|
4.1 Test auf Signifikanz individueller Parameter |
227 |
|
|
4.2 Test auf Signifikanz mehrerer Parameter |
228 |
|
|
Likelihood Ratio Test |
228 |
|
|
Wald-Test |
229 |
|
|
Lagrange Multiplikatortest |
230 |
|
|
4.3 Modellgüte |
231 |
|
|
McFadden R2 |
232 |
|
|
Wald- und LM-basierte R2 |
233 |
|
|
AIC und BIC |
234 |
|
|
5 Numerische Optimierungsverfahren |
235 |
|
|
6 Literaturempfehlungen |
237 |
|
|
Literaturverzeichnis |
238 |
|
|
Teil III Messen und Skalieren |
240 |
|
|
11 Reliabilität, Validität, Objektivität |
241 |
|
|
1 Einführung |
241 |
|
|
2 Objektivität |
242 |
|
|
2.1 Durchführungsobjektivität |
242 |
|
|
2.2 Auswertungsobjektivität |
243 |
|
|
2.3 Interpretationsobjektivität |
244 |
|
|
3 Reliabilität |
244 |
|
|
3.1 Retest-Reliabilität |
246 |
|
|
Beispiel zur Bestimmung der Retest-Reliabilität |
247 |
|
|
3.2 Die Paralleltest-Reliabilität |
247 |
|
|
3.3 Die Split-Half-Reliabilität |
248 |
|
|
Beispiel zur Bestimmung der Split-Half-Reliabilität |
249 |
|
|
3.4 Konsistenzanalysen |
250 |
|
|
Beispiel zur Bestimmung der internen Konsistenz |
250 |
|
|
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten |
251 |
|
|
4 Validität |
252 |
|
|
4.1 Die Inhaltsvalidität |
252 |
|
|
4.2 Kriteriumsvalidität |
253 |
|
|
4.3 Konstruktvalidität |
255 |
|
|
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität) |
255 |
|
|
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten |
256 |
|
|
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil |
257 |
|
|
5 Vorgehen zur Güteüberprüfung von Skalen |
258 |
|
|
6 Häufige Fehler |
259 |
|
|
7 Literaturempfehlungen |
259 |
|
|
Literaturverzeichnis |
260 |
|
|
12 Thurstone- und Likertskalierung |
261 |
|
|
1 Einleitung |
261 |
|
|
2 Thurstone Skalierung |
262 |
|
|
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ) |
262 |
|
|
Grundlagen des Verfahrens |
262 |
|
|
Vorgehensweise bei der Skalierung |
264 |
|
|
Anwendungsbeispiel |
266 |
|
|
2.2 Die Methode der gleich erscheinenden Intervalle |
270 |
|
|
2.3 Die Methode der sukzessiven Intervalle (MSI) |
272 |
|
|
Grundlagen des Verfahrens |
272 |
|
|
Anwendungsbeispiel |
273 |
|
|
2.4 Häufige Fehler bei der Thurstone Skalierung |
277 |
|
|
3 Likertskalierung |
277 |
|
|
3.1 Grundlagen des Verfahrens |
277 |
|
|
3.2 Anwendungsbeispiel |
279 |
|
|
3.3 Häufige Fehler bei der Likert Skalierung |
282 |
|
|
4 Literaturempfehlungen |
282 |
|
|
Literaturverzeichnis |
282 |
|
|
13 Guttman- und Mokkenskalierung |
284 |
|
|
1 Einleitung |
284 |
|
|
2 Guttmanskalierung |
286 |
|
|
2.1 Grundlagen des Verfahrens |
286 |
|
|
Modellannahmen |
288 |
|
|
Schätzung von Item- und Personenparametern |
289 |
|
|
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern |
290 |
|
|
Modellprüfung |
291 |
|
|
2.2 Anwendungsbeispiel |
297 |
|
|
2.3 Häufige Fehler bei der Guttmanskalierung |
299 |
|
|
3 Mokkenskalierung |
300 |
|
|
3.1 Grundlagen des Verfahrens |
300 |
|
|
Modellprüfung |
302 |
|
|
3.2 Anwendungsbeispiel |
306 |
|
|
3.3 Häufige Fehler bei der Mokkenskalierung |
308 |
|
|
4 Literaturempfehlungen |
308 |
|
|
Literaturverzeichnis |
309 |
|
|
14 Item-Response-Theorie |
311 |
|
|
1 Einführung |
312 |
|
|
2 Modelle für dichotome Items |
313 |
|
|
2.1 Das Rasch-Modell |
313 |
|
|
2.2 Das Birnbaum-Modell |
316 |
|
|
2.3 Das Modell mit Rateparameter |
317 |
|
|
3 Modelle für mehrstufig geordnete Items |
318 |
|
|
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell) |
318 |
|
|
3.2 Weitere IRT-Modelle für ordinale Items |
320 |
|
|
4 Weitere IRT-Modelle |
321 |
|
|
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell |
321 |
|
|
5 Modelltestung und Modellvergleiche |
322 |
|
|
6 Beispielanwendung |
324 |
|
|
6.1 Anwendung 1: Kompetenzmessung |
324 |
|
|
6.2 Anwendung 2: Surveyforschung |
326 |
|
|
7 Häufige Fehler |
330 |
|
|
8 Literaturempfehlungen |
331 |
|
|
Literaturverzeichnis |
331 |
|
|
15 Hauptkomponentenanalyse und explorative Faktorenanalyse |
333 |
|
|
1 Einführung in das Verfahren |
333 |
|
|
1.1 Einsatzmöglichkeiten |
333 |
|
|
1.2 Die Hauptkomponentenanalyse |
336 |
|
|
Eine geometrische Perspektive |
336 |
|
|
Die konkreten Schritte der PCA |
340 |
|
|
Bestimmung der Komponentenzahl |
341 |
|
|
Die unrotierte Lösung |
343 |
|
|
Rotation |
344 |
|
|
Berechnung von Komponentenwerten |
347 |
|
|
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne |
348 |
|
|
2 Mathematisch-statistische Grundlagen |
350 |
|
|
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen |
354 |
|
|
4 Probleme und Erweiterungen |
360 |
|
|
5 Literaturempfehlungen |
363 |
|
|
Anhang |
364 |
|
|
Literaturverzeichnis |
364 |
|
|
16 Korrespondenzanalyse |
366 |
|
|
1 Einleitung |
366 |
|
|
2 Mathematisch-statistische Grundlagen |
368 |
|
|
3 Ein Beispiel |
370 |
|
|
3.1 Graphische Darstellung |
370 |
|
|
3.2 Numerische Darstellung |
373 |
|
|
4 Erweiterungen der Korrespondenzanalyse |
376 |
|
|
4.1 Zusammengesetzte Tabellen |
376 |
|
|
4.2 Multiple Korrespondenzanalyse |
378 |
|
|
4.3 Aktive und passive Merkmale |
382 |
|
|
4.4 Andere Datenformate |
384 |
|
|
5 Häufige Fehler |
385 |
|
|
6 Diskussion |
386 |
|
|
7 Literaturempfehlungen |
386 |
|
|
Literaturverzeichnis |
387 |
|
|
17 Multidimensionale Skalierung |
389 |
|
|
1 Einführung in die MDS |
389 |
|
|
1.1 Die MDS als psychologisches Modell |
390 |
|
|
1.2 Die MDS zur Exploration von Datenstrukturen |
392 |
|
|
2 Mathematische Grundlagen der MDS |
393 |
|
|
2.1 Güte einer MDS-Lösung |
393 |
|
|
2.2 Bewertung des Stress |
395 |
|
|
2.3 MDS-Modelle |
397 |
|
|
2.4 MDS-Algorithmen |
400 |
|
|
2.5 Konfirmatorische MDS |
400 |
|
|
3 Häufige Fehler |
403 |
|
|
3.1 Degenerierte Lösungen in der ordinalen MDS |
403 |
|
|
3.2 Falsche Polung der Proximitäten |
405 |
|
|
3.3 Fehlbewertung von Stress |
406 |
|
|
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen |
407 |
|
|
3.5 Mechanische Interpretation „der“ Dimensionen |
409 |
|
|
3.6 Behandlung störender Punkte |
412 |
|
|
3.7 Überinterpretation von Dimensionsgewichten |
413 |
|
|
4 Literaturempfehlungen |
413 |
|
|
Anhang |
414 |
|
|
Literaturverzeichnis |
415 |
|
|
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen |
417 |
|
|
18 Analyse kategorialer Daten |
418 |
|
|
1 Einführung in das Verfahren |
418 |
|
|
2 Mathematisch-statistische Grundlagen |
430 |
|
|
3 Ein Beispiel |
440 |
|
|
4 Häufige Fehler |
448 |
|
|
5 Literaturempfehlungen |
450 |
|
|
Literaturverzeichnis |
450 |
|
|
19 Varianz- und Kovarianzanalyse |
452 |
|
|
1 Einführung in das Verfahren |
452 |
|
|
1.1 Vergleich von zwei Gruppen |
454 |
|
|
Modellgleichung |
455 |
|
|
Hypothesen |
455 |
|
|
Quadratsummen |
456 |
|
|
Freiheitsgrade |
457 |
|
|
Allgemeine Teststatistik |
457 |
|
|
Annahmen |
459 |
|
|
Exkurs: Mittlere Quadratsummen |
460 |
|
|
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse |
461 |
|
|
1.3 Mehrfaktorielle Varianzanalyse |
462 |
|
|
Modellgleichung |
462 |
|
|
Hypothesen |
463 |
|
|
Quadratsummen |
463 |
|
|
Freiheitsgrade |
464 |
|
|
Teststatistik |
465 |
|
|
Annahmen |
465 |
|
|
1.4 Kovarianzanalyse |
466 |
|
|
Modellgleichung |
467 |
|
|
ANOVA versus ANCOVA |
467 |
|
|
1.5 Effektstärke |
468 |
|
|
1.6 Teststärke |
471 |
|
|
2 Mathematisch-statistische Grundlagen |
472 |
|
|
2.1 ANOVA und ANCOVA als Spezialfälle des ALM |
473 |
|
|
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM |
477 |
|
|
3 Ein Beispiel |
480 |
|
|
3.1 Vergleich von zwei Gruppen |
480 |
|
|
3.2 Vergleich von mehr als zwei Gruppen |
481 |
|
|
3.3 Mehrfaktorielle ANOVA |
482 |
|
|
3.4 Kovarianzanalyse |
484 |
|
|
3.5 Annahmen der Varianz- und Kovarianzanalyse |
484 |
|
|
3.6 Teststärke |
488 |
|
|
4 Häufige Fehler – eine Checkliste |
488 |
|
|
5 Literaturempfehlungen |
489 |
|
|
Literaturverzeichnis |
489 |
|
|
20 Diskriminanzanalyse |
491 |
|
|
1 Einführung in das Verfahren |
491 |
|
|
1.1 Zielsetzung und Anwendungsmöglichkeiten |
491 |
|
|
1.2 Problemstellung und Prämissen |
493 |
|
|
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren |
495 |
|
|
1.4 Vorgehensweise |
497 |
|
|
Festlegung des Untersuchungsdesigns |
497 |
|
|
Extraktion der Diskriminanzfunktion(en) |
498 |
|
|
Evaluation der Diskriminanzfunktion(en) |
500 |
|
|
Merkmalsselektion und Klassifikation neuer Objekte |
502 |
|
|
2 Mathematisch-statistische Grundlagen |
503 |
|
|
2.1 Ermittlung der Diskriminanzfunktion (en) |
503 |
|
|
2.2 Prüfkriterien der Diskriminanz |
507 |
|
|
2.3 Klassifikationskonzepte |
508 |
|
|
Distanzkonzept |
509 |
|
|
Wahrscheinlichkeitskonzept |
510 |
|
|
Konzept der Klassifikationsfunktionen nach Fisher |
510 |
|
|
3 Anwendungsbeispiel |
511 |
|
|
4 Häufige Fehler |
515 |
|
|
5 Literaturempfehlungen |
517 |
|
|
Literaturverzeichnis |
518 |
|
|
21 Clusteranalyse |
520 |
|
|
1 Einführung in das Verfahren |
520 |
|
|
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster? |
521 |
|
|
1.2 Clusterstruktur |
522 |
|
|
1.3 Algorithmen |
522 |
|
|
1.4 Variablenräume |
523 |
|
|
1.5 Agglomerative Verfahren |
524 |
|
|
Ähnlichkeitsmaß, Distanz und Index |
524 |
|
|
Fusionswerte und Dendrogramme |
525 |
|
|
1.6 Wahl der Metriken und Agglomerationsverfahren |
526 |
|
|
1.7 K-Means (Clusterzentrenanalyse) |
527 |
|
|
1.8 TwoStep-Clusteranalyse |
529 |
|
|
2 Mathematisch-statistische Grundlagen |
530 |
|
|
2.1 Hierarchisch-agglomerative Verfahren |
530 |
|
|
Ähnlichkeitsmaße und Distanzen |
530 |
|
|
Gewichtung und Standardisierung von Variablen |
532 |
|
|
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten |
532 |
|
|
Dendrogramm und Ultrametrik |
533 |
|
|
2.2 K-Means |
534 |
|
|
2.3 TwoStep-Verfahren |
534 |
|
|
Die beiden Stufen der Clusterung |
534 |
|
|
Anzahl der Cluster |
535 |
|
|
Tabellen und Graphiken zur Beschreibung der Cluster |
536 |
|
|
3 Beispiel |
536 |
|
|
3.1 Daten- und Variablenauswahl |
536 |
|
|
3.2 Analyse |
537 |
|
|
3.3 Verbesserung der Clusterlösung |
540 |
|
|
Variablenauswahl |
540 |
|
|
Eliminieren von „Ausreißern“ |
540 |
|
|
Optimierung der Lösung durch eine K-Means-Analyse |
541 |
|
|
3.4 Überprüfen der Clusterlösung |
542 |
|
|
3.5 TwoStep-Clusteranalyse |
543 |
|
|
4 Häufige Fehler |
545 |
|
|
5 Literaturempfehlungen |
546 |
|
|
Literaturverzeichnis |
547 |
|
|
22 Analyse latenter Klassen |
548 |
|
|
1 Einführung in das Verfahren |
548 |
|
|
2 Mathematisch-statistische Grundlagen |
550 |
|
|
2.1 Modellansatz |
550 |
|
|
2.2 Parameterschätzung |
551 |
|
|
2.3 Computerprogramme |
553 |
|
|
3 Ein Beispiel |
555 |
|
|
3.1 Daten |
555 |
|
|
3.2 Zahl der latenten Klassen |
555 |
|
|
3.3 Lokale Unabhängigkeit |
559 |
|
|
3.4 Inhaltliche Interpretierbarkeit |
560 |
|
|
3.5 Stabilität |
562 |
|
|
3.6 Formale Validitätsprüfung durch Validitätsindizes |
564 |
|
|
3.7 Kriterienbezogene Validitätsprüfung |
564 |
|
|
4 Häufige Fehler |
566 |
|
|
5 Alternativen |
567 |
|
|
6 Literaturempfehlungen |
568 |
|
|
Literaturverzeichnis |
569 |
|
|
23 Netzwerkanalyse |
570 |
|
|
1 Einführung |
570 |
|
|
2 Darstellung der Verfahren |
575 |
|
|
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden |
576 |
|
|
Dyaden |
577 |
|
|
Triaden |
578 |
|
|
Triadische Umgebungen einzelner Knoten |
579 |
|
|
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung |
582 |
|
|
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten |
586 |
|
|
Cliquen und Clans |
587 |
|
|
k-Plexe und k-Cores |
588 |
|
|
Zusammenhangs-Komponenten |
588 |
|
|
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen |
589 |
|
|
3 Ein Beispiel |
589 |
|
|
3.1 Daten |
589 |
|
|
3.2 Zielsetzungen |
591 |
|
|
3.3 Erstellung des Datensatzes |
592 |
|
|
4 Literaturempfehlungen |
596 |
|
|
Literaturverzeichnis |
597 |
|
|
Teil V Regressionsverfahren für Querschnittsdaten |
599 |
|
|
24 Lineare Regressionsanalyse |
600 |
|
|
1 Einführung |
600 |
|
|
2 Mathematisch-statistische Grundlagen |
605 |
|
|
2.1 Das allgemeine Modell |
605 |
|
|
2.2 Die Identifikation der Regressionskoeffizienten |
606 |
|
|
2.3 Annahmen der Kleinst-Quadrat-Methode |
608 |
|
|
2.4 Die Bestimmung der Modellgüte |
610 |
|
|
2.5 Die statistische Absicherung der Regressionsergebnisse |
612 |
|
|
2.6 Die Interpretation der Regressionskoeffizienten |
616 |
|
|
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme |
618 |
|
|
3 Ein Beispiel |
621 |
|
|
3.1 Zur Operationalisierung |
621 |
|
|
3.2 Ergebnisse |
622 |
|
|
4 Häufige Fehler |
628 |
|
|
5 Literaturhinweise |
630 |
|
|
Literaturverzeichnis |
630 |
|
|
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik |
632 |
|
|
1 Einführung |
632 |
|
|
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen |
633 |
|
|
1.2 Regressionsdiagnostik: ein erster Einblick |
635 |
|
|
2 Mathematisch-statistische Grundlagen |
638 |
|
|
2.1 Annahmen der linearen Regressionsanalyse |
638 |
|
|
2.2 Grundlagen und Instrumente der Regressionsdiagnostik |
645 |
|
|
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik |
645 |
|
|
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells |
646 |
|
|
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten |
652 |
|
|
3 Regressionsdiagnostik am Beispiel |
655 |
|
|
3.1 Datengrundlage und Regressionsmodell |
655 |
|
|
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel |
656 |
|
|
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel |
661 |
|
|
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen |
665 |
|
|
5 Literaturempfehlungen |
666 |
|
|
Anhang |
667 |
|
|
Literaturverzeichnis |
667 |
|
|
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines |
669 |
|
|
1 Einführung |
669 |
|
|
2 Interaktionseffekte, Polynome und Splines |
670 |
|
|
2.1 Nicht-Additivität: Interaktionseffekte |
670 |
|
|
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation |
673 |
|
|
2.3 Nicht-Linearität: Polynome und Splines |
674 |
|
|
2.4 Polynome |
675 |
|
|
2.5 Splines |
677 |
|
|
3 Tests auf Gruppenunterschiede und Nicht-Linearität |
681 |
|
|
4 Anwendungsbeispiel I: Interaktionseffekte |
683 |
|
|
5 Anwendungsbeispiel II: Polynome und Slopes |
689 |
|
|
6 Häufige Fehler |
696 |
|
|
7 Literaturempfehlungen |
697 |
|
|
Literaturverzeichnis |
697 |
|
|
27 Robuste Regression |
699 |
|
|
1 Einführung in das Verfahren |
699 |
|
|
2 Mathematisch-statistische Grundlagen |
709 |
|
|
2.1 Der Kleinste-Quadrate-Schätzer |
709 |
|
|
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer |
710 |
|
|
Erwartungstreue, Konsistenz und Effizienz |
710 |
|
|
Relative Effizienz |
711 |
|
|
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung |
712 |
|
|
Zusammenfassung |
713 |
|
|
2.3 M-Schätzer |
713 |
|
|
Berechnung von M-Schätzern |
717 |
|
|
Bruchpunkt von M-Schätzern |
719 |
|
|
Bounded-Influence-Schätzer |
719 |
|
|
2.4 High-Breakdown-Schätzer |
720 |
|
|
LMS- und LTS-Schätzer |
720 |
|
|
S-Schätzer |
721 |
|
|
MM-Schätzer |
722 |
|
|
3 Ein Beispiel |
723 |
|
|
4 Literaturempfehlungen |
729 |
|
|
Literaturverzeichnis |
730 |
|
|
28 Mehrebenenanalyse mit Querschnittsdaten |
733 |
|
|
1 Einführung in das Verfahren |
733 |
|
|
2 Mathematisch-statistische Grundlagen |
741 |
|
|
2.1 Die Modellklassen der Mehrebenenanalyse |
743 |
|
|
Das Random-Intercept-Only-Modell (R-I-O-M) |
743 |
|
|
Das Random-Intercept-Modell (R-I-M) |
744 |
|
|
Random-Intercept-Random-Slope-Modell (R-I-R-S-M) |
744 |
|
|
Das Intercept-as-Outcome-Modell (I-as-O-M) |
745 |
|
|
Das Random-Coefficient-Modell (R-C-M) |
746 |
|
|
2.2 Beurteilung der Anpassung des Mehrebenenmodells |
747 |
|
|
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation |
749 |
|
|
Grand-Mean-Zentrierung |
749 |
|
|
Group-Mean-Zentrierung |
750 |
|
|
2.4 Standardisierung der kontextspezifischen und Populationsschätzer |
752 |
|
|
2.5 Besonderheiten des Erhebungsdesigns |
754 |
|
|
3 Ein Beispiel – Die deutsche PISA 2006 Studie |
755 |
|
|
4 Häufige Fehler |
763 |
|
|
5 Literaturempfehlungen |
764 |
|
|
Literaturverzeichnis |
765 |
|
|
29 Strukturgleichungsmodelle |
767 |
|
|
1 Einführung in das Verfahren |
767 |
|
|
1.1 Ausgangspunkt: Regressions- und Pfadmodell |
768 |
|
|
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen |
769 |
|
|
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle |
771 |
|
|
1.4 Das allgemeine Strukturgleichungsmodell |
773 |
|
|
Modellevaluation |
775 |
|
|
Modellvergleich |
776 |
|
|
Modellsparsamkeit |
777 |
|
|
1.5 Spezielle Modellvarianten |
778 |
|
|
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche) |
778 |
|
|
Längsschnittmodelle |
778 |
|
|
Modelle mit Interaktionstermen |
778 |
|
|
Die Behandlung fehlender Werte |
779 |
|
|
2 Mathematisch-statistische Grundlagen |
779 |
|
|
2.1 Ableitung der Elemente der Kovarianzmatrix ? |
779 |
|
|
2.2 Schätzung der Parameter |
780 |
|
|
3 Ein Beispiel |
783 |
|
|
3.1 Messung der latenten Konstrukte |
785 |
|
|
3.2 Messmodell der latenten endogenen Variablen |
785 |
|
|
3.3 Messmodell der latenten exogenen Variablen |
785 |
|
|
3.4 Überprüfung der Messmodelle |
786 |
|
|
3.5 Intervenierende Variablen |
788 |
|
|
3.6 Strukturgleichungsmodell |
788 |
|
|
4 Häufige Fehler |
790 |
|
|
5 Literaturempfehlungen |
792 |
|
|
Anhang |
793 |
|
|
Literaturverzeichnis |
794 |
|
|
30 Regression mit unbekannten Subpopulationen |
797 |
|
|
1 Einführung in das Verfahren |
797 |
|
|
2 Mathematisch-statistische Grundlagen |
799 |
|
|
2.1 Spezifikation |
800 |
|
|
2.2 Schätzung |
805 |
|
|
2.3 Test auf die Anzahl der Komponenten |
807 |
|
|
2.4 Anpassungsindizes |
808 |
|
|
3 Ein Beispiel |
808 |
|
|
4 Häufige Fehler |
816 |
|
|
5 Literaturempfehlungen |
816 |
|
|
Literaturverzeichnis |
817 |
|
|
31 Logistische Regression |
818 |
|
|
1 Einführung in das Verfahren |
818 |
|
|
1.1 Das lineare Wahrscheinlichkeitsmodell |
819 |
|
|
1.2 Die logistische Regression |
820 |
|
|
1.3 Interpretation der Koeffizienten |
822 |
|
|
2 Mathematisch-statistische Grundlagen |
825 |
|
|
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable |
825 |
|
|
Logit-Regression |
825 |
|
|
Probit-Regression |
827 |
|
|
2.2 Schätzung |
827 |
|
|
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität |
828 |
|
|
Standardisierte Koeffizienten |
829 |
|
|
Durchschnittliche marginale Effekte |
830 |
|
|
2.4 Interaktionseffekte |
831 |
|
|
2.5 Statistische Inferenz |
833 |
|
|
2.6 Goodness of fit und Modellvergleich |
834 |
|
|
3 Ein Beispiel |
835 |
|
|
4 Häufige Fehler |
843 |
|
|
5 Literaturempfehlungen |
844 |
|
|
Literaturverzeichnis |
845 |
|
|
32 Multinomiale und ordinale Regression |
846 |
|
|
1 Einführung in das Verfahren |
846 |
|
|
1.1 Von der binären zur multinomialen logistischen Regression |
847 |
|
|
1.2 Wahrscheinlichkeiten, Odds und Logits |
848 |
|
|
1.3 Modellschätzung und statistische Tests |
852 |
|
|
Besteht ein Zusammenhang? |
853 |
|
|
Wie stark ist ein Zusammenhang? |
853 |
|
|
Wie stark sind die relativen Effekte der erklärenden Variablen? |
854 |
|
|
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen |
855 |
|
|
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression |
857 |
|
|
2 Mathematisch-Statistische Grundlagen |
859 |
|
|
2.1 Schätzung |
859 |
|
|
2.2 Statistische Inferenz |
860 |
|
|
2.3 Modellanpassung |
861 |
|
|
2.4 Weiterführendes zu Regressionskoeffizienten |
862 |
|
|
Standardisierte Koeffizienten im ordinalen Regressionsmodell |
862 |
|
|
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell |
862 |
|
|
3 Anwendungsbeispiel |
863 |
|
|
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression |
863 |
|
|
3.2 Bildungsabschluss im ordinalen Logitmodell |
870 |
|
|
4 Häufige Fehler |
873 |
|
|
5 Literaturempfehlungen |
877 |
|
|
Literaturverzeichnis |
877 |
|
|
33 Regression für Zählvariablen |
878 |
|
|
1 Einführung in das Verfahren |
878 |
|
|
1.1 Poisson und negative Binomialverteilung |
879 |
|
|
1.2 Regressionsmodellierung |
880 |
|
|
Strukturkomponente |
880 |
|
|
Strukturkomponente: lineare und nichtlineare Prädiktoren |
881 |
|
|
Verteilungskomponente |
883 |
|
|
Inferenz |
883 |
|
|
2 Mathematisch-statistische Grundlagen |
884 |
|
|
2.1 Poissonmodell |
884 |
|
|
Maximum-Likelihood-Schätzung |
884 |
|
|
Parameter-Tests |
885 |
|
|
Devianz und Anpassungstests |
887 |
|
|
2.2 Quasi-Poissonmodell |
888 |
|
|
2.3 Modell der negativen Binomialverteilung |
889 |
|
|
3 Ein Beispiel |
889 |
|
|
4 Häufige Fehler |
893 |
|
|
5 Literaturempfehlungen |
894 |
|
|
Literaturverzeichnis |
894 |
|
|
34 Graphische Darstellung regressionsanalytischer Ergebnisse |
896 |
|
|
1 Einführung in das Verfahren |
896 |
|
|
2 Grundlagen der graphischen Darstellung |
897 |
|
|
3 Beispiele |
900 |
|
|
3.1 Streudiagramm- bzw. Scatterplot-Matrix |
900 |
|
|
3.2 Median- und Mean-Regression |
902 |
|
|
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten |
903 |
|
|
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots) |
905 |
|
|
3.5 Logistische Regression: Conditional-Effect-Plots |
908 |
|
|
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots |
911 |
|
|
4 Häufige Fehler |
915 |
|
|
5 Rückblick |
916 |
|
|
6 Literaturempfehlungen |
917 |
|
|
Literaturverzeichnis |
918 |
|
|
Teil VI Analyse von zeitbezogenen Daten |
919 |
|
|
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren |
920 |
|
|
1 Einführung in das Verfahren |
920 |
|
|
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren |
921 |
|
|
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse |
924 |
|
|
1.3 Durchführung der empirischen Analyse |
925 |
|
|
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen |
930 |
|
|
2 Mathematisch-statistische Grundlagen |
931 |
|
|
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes |
937 |
|
|
3.1 Zuweisungsmodell |
938 |
|
|
3.2 Matching und Balancierungstests |
940 |
|
|
3.3 Parameterschätzung |
944 |
|
|
4 Häufige Fehler |
947 |
|
|
5 Literaturempfehlungen |
949 |
|
|
Literaturverzeichnis |
949 |
|
|
36 Kausalanalyse mit Paneldaten |
951 |
|
|
1 Einführung in die Paneldatenanalyse |
951 |
|
|
1.1 Kontrafaktische Kausalanalyse und Paneldaten |
952 |
|
|
1.2 Eine intuitive Einführung in Panelregressionsmodelle |
954 |
|
|
1.3 Ein didaktisches Beispiel |
956 |
|
|
2 Eine präzisere Einführung in die Panelregression |
959 |
|
|
2.1 Das Fehlerkomponenten-Modell |
960 |
|
|
2.2 Die Schätzverfahren |
960 |
|
|
2.3 RE- oder FE-Modell? |
963 |
|
|
2.4 Ein Hybrid-Modell |
964 |
|
|
2.5 Panel-robuste Standardfehler |
965 |
|
|
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit |
966 |
|
|
3.1 Datenaufbereitung |
966 |
|
|
3.2 Schätzergebnisse |
968 |
|
|
3.3 Ein Modell mit Periodeneffekten |
970 |
|
|
3.4 Ein Hybrid-Modell |
971 |
|
|
3.5 Ein Wachstumskurven-Modell |
972 |
|
|
4 Nicht-lineare FE-Modelle |
973 |
|
|
4.1 Nicht-lineare Panelregressionsmodelle |
974 |
|
|
4.2 Das FE-Logit Modell |
974 |
|
|
4.3 FE-Modelle für Ereignisdaten |
976 |
|
|
5 Häufige Fehler |
978 |
|
|
5.1 Suboptimale Panelregressionsmodelle |
978 |
|
|
5.2 Grenzen von FE-Modellen |
979 |
|
|
6 Literaturempfehlungen |
981 |
|
|
Literaturverzeichnis |
981 |
|
|
37 Survival- und Ereignisanalyse |
983 |
|
|
1 Einführung in das Verfahren |
983 |
|
|
1.1 Spezifische Problemstellungen |
984 |
|
|
1.2 Erhebung von Ereignisdaten |
986 |
|
|
1.3 Zensierung von Beobachtungen |
987 |
|
|
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation |
988 |
|
|
2.1 Verschiedene Ratenmodelle und ihre Schätzung |
991 |
|
|
Sterbetafelmethode und Kaplan-Meier-Schätzung |
991 |
|
|
Das Exponentialmodell |
992 |
|
|
Das Cox-Modell |
992 |
|
|
Das Piecewise-Constant-Modell |
993 |
|
|
Parametrische Modelle der Zeitabhängigkeit |
994 |
|
|
2.2 Ein Beispiel |
994 |
|
|
3 Modellierung von parallelen und interdependenten Prozessen |
996 |
|
|
3.1 Ursachen und zeitabhängige Kovariablen |
997 |
|
|
3.2 Zeit und kausale Wirkungen |
998 |
|
|
3.3 Zeitachse und Ereignisse |
998 |
|
|
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit |
998 |
|
|
3.5 Zeitliche Form der Entfaltung von Wirkungen |
999 |
|
|
3.6 Das Prinzip der konditionalen Unabhängigkeit |
999 |
|
|
3.7 Ein Anwendungsbeispiel |
1000 |
|
|
4 Häufige Fehler |
1001 |
|
|
5 Literaturempfehlungen |
1002 |
|
|
Literaturverzeichnis |
1003 |
|
|
38 Latente Wachstumskurvenmodelle |
1005 |
|
|
1 Einführung in das Verfahren |
1005 |
|
|
2 Mathematisch-statistische Grundlagen |
1009 |
|
|
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust |
1012 |
|
|
4 Häufige Fehler |
1014 |
|
|
5 Literaturempfehlungen |
1016 |
|
|
Literaturverzeichnis |
1016 |
|
|
39 Sequenzdatenanalyse |
1018 |
|
|
1 Einführung in die Sequenzdatenanalyse |
1018 |
|
|
1.1 Was ist Sequenzdatenanalyse? |
1019 |
|
|
1.2 Grundlegende Konzepte |
1020 |
|
|
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung |
1024 |
|
|
2.1 Der Optimal Matching Algorithmus |
1024 |
|
|
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen |
1026 |
|
|
2.3 Die Diskussion um OM und neuere Entwicklungen |
1026 |
|
|
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen |
1028 |
|
|
3.1 Datenaufbereitung |
1028 |
|
|
3.2 Datenauswertung |
1030 |
|
|
4 Häufige Fehler |
1035 |
|
|
5 Literaturempfehlungen |
1037 |
|
|
Literaturverzeichnis |
1037 |
|
|
40 Zeitreihenanalyse |
1039 |
|
|
1 Einführung |
1039 |
|
|
2 Deskription und statistisches Modell |
1041 |
|
|
3 Stochastische Prozesse |
1042 |
|
|
4 Nichtstationäre (stochastische) Prozesse |
1047 |
|
|
5 Tests auf „Random Walk“ |
1049 |
|
|
6 Zerlegung von Zeitreihen |
1053 |
|
|
7 Interventionsanalyse |
1059 |
|
|
8 Ausreißer-Analyse |
1061 |
|
|
9 Transferfunktions-Modelle |
1064 |
|
|
10 Vektorielle stochastische Prozesse |
1068 |
|
|
11 Schluss |
1073 |
|
|
12 Literaturempfehlungen |
1074 |
|
|
Literaturverzeichnis |
1074 |
|
|
Anhang |
1077 |
|
|
Autorenverzeichnis |
1078 |
|