Gewichtung und Analyse komplexer Stichproben
Gewichtung
Wir helfen Ihnen bei der Berechnung von Auswahlwahrscheinlichkeiten im Rahmen von komplexen Stichprobendesigns zur Ermittlung von Design-Gewichten. Ferner unterstützen wir Sie bei der Berechnung von sog. Kalibrierungs- oder Anpassungsgewichten zur Reduktion der durch Nonresponse verursachten Verzerrungen der Schätzung.
Gewichtung bezeichnet eine Maßnahme, um bei der statistischen Datenanalyse die Stichprobe an die zu untersuchende Grundgesamtheit anzugleichen. Dies ist notwendig, wenn
- die potenzielle Verzerrung aufgrund unterschiedlicher Auswahlwahrscheinlichkeiten vermieden oder reduziert werden kann (Designgewichtung),
- die Reduktion potenzieller Verzerrung aufgrund von Antwortausfällen angestrebt wird (Anpassungsgewichtung oder Kalibrierung) oder
- durch die Anpassung an Parameter der Grundgesamtheit eine nachträgliche Schichtung und Reduktion der Varianz erwirkt werden kann.
Ein „Gewicht“ ist somit ein multiplikativer Faktor, der für jegliche Analysen eines Umfragedatensatzes verwendet werden kann, mit dem Ziel einen unverzerrten oder weniger verzerrten Schätzer für die Grundgesamtheit zu erhalten.
Imputation fehlender Werte
Durch Imputation können fehlende Werte durch existierende oder geschätzte Werte ersetzt werden, um einen Datensatz zu vollständigen. Dadurch wird möglich, zum Beispiel für Modellanalysen oder zur Anpassungsgewichtung mit einem vollständigen Datensatz zu arbeiten. Zudem hilft die Imputation fehlender Werte dabei, den Nonresponsde-Bias zu reduzieren sowie die Kovarianz-Struktur der Variablen und der jeweiligen Randverteilung zu reproduzieren.
Die Bestimmung von Imputationswerten sollte immer unter der Berücksichtigung des zugrundeliegenden Ausfallmechanismus erfolgen und unter der Verwendung von mit dem fehlenden Merkmal möglichst hoch-korrelierter Hilfsvariablen. Dazu stehen unterschiedliche Ansätze und Spender fernab von dem verwendeten Imputationsmodell zur Verfügung. Grob unterscheidet man hierbei einfache sowie die multiple Imputation sowie Hot- und Cold-Deck Verfahren zur Bestimmung von geeigneten Spendern. Je nach verwendeter Methode, Varianz-Kovarianz-Struktur und Modell hat die Imputation darüber hinaus auch einen Einfluss auf die Varianz des Schätzers, der aus den Daten ermittelt werden soll. Dies gilt in der späteren Verwendung der Daten ebenso zu berücksichtigen.
Die Imputation fehlender Werte für Ihren Datensatz kann bei GESIS sowohl für Ihren kompletten Datensatz als auch für ausgewählte Variablen in Auftrag gegeben werden. In Absprache mit Ihnen imputieren wir fehlende Werte unter der Verwendung einfacher oder multipler Impuation. Der Datensatz, für den dies erfolgen soll muss dafür GESIS zugänglich gemacht werden.
Nonresponse-Bias-Analyse
Nonresponse Bias kann immer dann entstehen, wenn sich Teilnehmende einer Befragung systematisch von den Nicht-Teilnehmenden unterscheiden. Das kann beispielsweise der Fall sein, wenn bestimmte gesellschaftliche Gruppen häufiger die Einladung zur Teilnahme nicht erhalten/nicht kontaktiert werden können, sich häufiger gegen eine Teilnahme entscheiden oder nicht in der Lage sind teilzunehmen (bspw. weil ihnen die zur Teilnahme nötige technische Ausstattung fehlt). Wenn die Gründe der Nicht-Teilnahme mit den Zielvariablen der Befragung assoziiert sind, kann aus den Antworten nicht zuverlässig auf die Grundgesamtheit geschlossen werden. Die Nonresponse-Bias-Analyse bietet Methoden, die Verzerrung durch Nonresponse zu bewerten.
Wir beraten zu den Möglichkeiten der Nonresponse-Bias-Analyse und geben Empfehlungen für die Art der Analyse für eine konkrete Fragestellung. Dabei unterscheiden wir zwischen Maßen für Nonresponse Bias auf Ebene einzelner erhobenen Fragen der Befragung (bspw. Benchmarkvergleiche und Subgruppenanalyse) und Maßen auf Befragungsebene (bspw. R-Indikatoren). Wir geben Empfehlungen für den Umgang mit Nonresponse Bias und zeigen mögliche Limitationen der Analyse von Befragungen unter Nonresponse Bias. Außerdem diskutieren wir die Möglichkeit der Korrektur von Nonresponse Bias.