Kleinräumige Kontextdaten sind für viele sozialwissenschaftliche Fragestellungen relevante Einflussfaktoren. Voraussetzung für die Nutzung räumlicher Kontextdaten ist bei den meisten Fragestellungen, dass räumliche Kontextdaten an Daten auf Individualebene zugespielt werden können. Um Kontextdaten an Individualdaten anspielen zu können, müssen in den Individualdaten räumliche Identifikatoren vorliegen. Darüber hinaus benötigt man messfehlerarme Kontextdaten auf möglichst kleinräumiger Ebene. In Deutschland ist der Mikrozensus als Quelle für Kontextdaten besonders geeignet, da eine breite Menge von Indikatoren abgeleitet werden kann, die prinzipiell auf Gemeindeebene und mit der Einführung der Geokoordinaten der Haushalte potenziell auf kleinerer Ebene verfügbar sind.
Vor diesem Hintergrund sollte in diesem Vorhaben gezeigt werden, wie aus dem Mikrozensus räumliche kontinuierliche regionale Kontextdaten geschätzt werden können, die anderen Datenquellen auf beliebig kleiner Ebene zugespielt werden können. Mit dem Mikrozensus Regionalfile 2000 konnten ausgehend von einem speziellen räumliche Kerndichteschätzerverfahren (Groß et al. 2017) großräumige kontinuierliche Verteilungen mit zufriedenstellendem Stichprobenfehler auf Koordinatenebene geschätzt werden. Da der Regionalfile nur Informationen auf Ebene der Mikrozensuskreisregionen enthält und er nur eine Substichprobe ist, wurde im zweiten Schritt eine Umsetzung des Verfahrens mit dem gesamten Mikrozensus 2015 im Onsite-Zugang versucht. Die Umsetzung wurde wegen Zuordnungsschwierigkeiten der Gemeinde-Shapefiles zu den Gemeinden und fehlender Abdeckung des Mikrozensus auf Gemeindeebene eingestellt. Zuletzt wurde mit den Daten des Zensus 2011 und dem Mikrozensus SUF 2011 untersucht, auf welcher räumlichen Ebene die räumliche Variation verschiedener soziodemographischer Variablen zum Tragen kommt. Daraus wurde erkennbar, dass für die meisten betrachteten Variablen die räumliche Variation unterhalb der Gemeindeebene stattfindet, d.h. eine Aggregation auf Gemeindeebene diese Information verliert.
Damit ist der Mikrozensus momentan nicht für die Schätzung räumlicher Kontextdaten geeignet. Dies kann sich grundsätzlich verbessern, wenn die seit 2018 erfassten Geokoordinaten veröffentlicht werden. Da es sich beim Mikrozensus jedoch um eine Klumpenstichprobe von Haushalten aus zufällig gezogenen Auswahlbezirken handelt, ist die zusätzliche Information der genauen Verortung der einzelnen Haushalt möglicherweise kein wesentlicher Zugewinn, da auf Ebene der Haushalte in einem Auswahlbezirk keine räumliche Variation vorliegt.
Groß, M.; Rendtel, U.; Schmid, T.; Schmon, S.; Tzavidis, N. (2017): Estimating the density of ethnic minorities and aged people in Berlin: Multivariate kernel density estimation applied to sensitive georeferenced administrative data protected via measurement error. Journal of the Royal Statistical Society: Series A (Statistics in Society), 180(1), 161–183. https://doi.org/10.1111/rssa.12179
Pforr, K. (2021): Regionale Kontextdaten mit dem Mikrozensus. GESIS Papers 2021/02. Köln: GESIS - Leibniz-Institut für Sozialwissenschaften. doi: http://dx.doi.org/10.21241/ssoar.71319.