Direkt zum Inhalt

Verknüpfung der Daten der IAB-SOEP-Migrationsstichprobe mit den "Integrierten Erwerbsbiografien (IEB)" des IAB

Bericht vom 11. Juli 2014

Hintergrund

Es ist bei Befragungen weltweit ein zunehmender Trend zu verzeichnen, Individualdaten mit administrativen Daten zu verknüpfen. Mit der Verwendung von verknüpften Daten wollen Forscher_innen ihre Itemsets validieren, vergrößern und spezifizieren sowie die Last für die Befragten verringern.
Das SOEP hat sich diesem vielversprechenden Trend der Verknüpfung von Daten angeschlossen und arbeitet daran, die erhobenen Daten der neuen SOEP-Migrationsstichprobe mit den präzisen und verlässlichen Informationen amtlicher Sozialversicherungsdaten verknüpfen. Diese Verknüpfung wird einen einzigartigen Datensatz erzeugen, der qualitativ hochwertige Studien zum Zusammenhang zwischen migrationsspezifischen Themen und individuellen Erwerbsbiografien ermöglicht.

Nach Beantwortung des SOEP-Fragebogens wurde eine Zufallsstichprobe von ca. zwei Dritteln der 5.000 Befragten in 2.700 Haushalten um ihr Einverständnis mit der Datenverknüpfung gebeten. Zuvor waren sie im Sinne der deutschen Datenschutzbestimmungen über die Implikationen einer potentiellen Datenverknüpfung informiert worden. In der jetzt laufenden zweiten Welle der Migrations-Stichprobe in diesem Jahr wird einen die zweite Zufallsstichprobe um die Einwilligung zur Datenverknüpfung gebeten.

Zustimmungsraten und Selektivität

Ungefähr 50 Prozent der Befragten stimmten der Datenverknüpfung schriftlich zu. Aufgrund des relativ hohen Anteils an Befragten, die der Datenverknüpfung nicht zustimmten, können Selektivitätsprobleme auftreten. Das bedeutet, dass sich Befragte, die der Datenverknüpfung zustimmten, möglicherweise in einigen Merkmalen systematisch von den 'Verweigerern' unterscheiden. Um diese Vermutung zu testen, wurden verschiedene multivariate Modelle geschätzt und der Einfluss von Variablen wie Herkunft und Rechtsstatus, Stellung auf dem Arbeitsmarkt und Einkommen, Sprache und Integration, demografischen Merkmalen sowie Haushalts- und Interviewer-Charakteristika auf die Wahrscheinlichkeit zur Teilnahme an der Datenverknüpfung untersucht. Insgesamt haben wir relativ wenig signifikante Effekte in unserem Modell feststellen können, was auf die hohe Qualität der Daten hinweist. Wenn andere Variablen konstant gehalten werden, scheinen einige Gruppen von Befragten mit einer etwas geringeren Wahrscheinlichkeit der Datenverknüpfung zuzustimmen: dazu gehören Befragte ohne Bildungsabschlüsse, Befragte türkischer Herkunft oder aus einem arabischen Kulturkreis kommend sowie Angestellte und Beamte in gering qualifizierten Positionen. Den in unseren Modellen mit Abstand negativsten Effekt hatte aber die generelle Zurückhaltung bei der Beantwortung von sensiblen Fragen, wie z.B. der nach dem Einkommen. Wir sind gerade dabei zu überprüfen, inwieweit es nötig ist unseren Datennutzer_innen Gewichte zur Verfügung stellen, um die angesprochenen Selektivitätsprobleme zu beheben.

keyboard_arrow_up