Bericht , Nachricht vom 05.03.2019

Qualitätsprüfung der Daten der IAB-BAMF-SOEP-Befragung von Geflüchteten

Als Folge der in der ersten Welle der IAB-BAMF-SOEP-Befragung von Geflüchteten im Jahr 2016 unsachgemäß durchgeführten Interviews (Nachricht und Dokumentation) wurden die Verfahren der Qualitätskontrolle und der Qualitätssicherung durch die Projektpartner und das Feldinstitut erheblich erweitert und intensiviert. Neben der Verbesserung der Überwachung der Feldorganisation und Standardverfahren der Überprüfung von statistischen Auffälligkeiten wurde ein neues Verfahren zur Identifikation von statistischen Auffälligkeiten der Interviewer entwickelt (Kosyakova et al., 2019, erscheint in Kürze). Im Rahmen dieses neuen statistischen Verfahrens konnten drei weitere Verdachtsfälle mit statistischen Auffälligkeiten identifiziert werden. Die von diesen Verdachtsfällen betroffenen Interviews wurden vor der Bereitstellung der Daten aus den Datensatz (Version v.34) gelöscht.

Zusätzlich zu der/dem bereits identifizierten Interviewer/in aus der ersten Welle der Befragung, sind durch das erweiterte Prüfverfahren für zwei weitere Interviewer/innen die auch in der ersten Welle tätig waren, statistische Auffälligkeiten identifiziert worden (vgl. Kosyakova et al. 2019). Obwohl nicht zweifelsfrei geklärt werden konnte, ob alle Interviews der betreffenden Interviewer/innen tatsächlich unsachgemäß durchgeführt wurden, haben sich die Projektpartner nach Rücksprache mit dem Befragungsinstitut Kantar Public dafür entschieden, sicherheitshalber sämtliche Interviews, die von Interviewer/innen-Verdachtsfällen betroffen sind, zu löschen. Dies hatte zur Folge, dass aus der ersten Welle weitere 47 Haushalts- und 62 Personeninterviews gelöscht wurden. Somit steht für die Analysen der ersten Welle des IAB-BAMF-SOEP Befragung Geflüchteter mit der Datenweitergabeversion V34 eine Stichprobe von 4.465 Befragungspersonen- und 3.273 Haushaltsinterviews zur Verfügung.

Auswirkungen auf die Nettostichprobe

Im Mittel sind die Auswirkungen der Löschungen auf die Ergebnisse gering. Die 62 gelöschten Personeninterviews entsprechen rund einem Prozent der Grundgesamtheit aus (N = 4.527). Entsprechend können mögliche Abweichungen in univariaten Statistiken diesen Wert nicht übersteigen. Darüber hinaus streuen die Angaben in den Interviews eher unsystematisch, sodass kaum Veränderungen in der Randverteilung zu erwarten sind. Dies lässt sich anhand verschiedener Merkmalsausprägungen, wie etwa die Verteilung nach Alter, Geschlecht, Erwerbsstatus, Deutschkenntnissen sowie nach Schul- und beruflichen Bildungsabschlüssen (e.g. nach der ISCED-Klassifizierung) exemplarisch verdeutlichen. Wie Tabelle 1 zeigt, sind Veränderungen nur im Dezimalbereich zu verzeichnen. Alle Werte sind gewichtet.

Tabelle 1: Ausgewählte Merkmalsausprägungen der Befragten nach Datenversion, Anteile in Prozent (gewichtet)

 

v.33.1

v.34

Geschlecht

 

 

Männlich

73.6

73.3

Weiblich

26.4

26.7

Gesamt

100

100

Beobachtungen

4527

4465

Alter (gruppiert)

 

 

18-29

54.5

54.6

30-59

43.2

43.2

60-83

2.3

2.2

Gesamt

100

100

Beobachtungen

4525

4463

Erwerbstätigkeit

 

 

Teilzeit

2.9

2.8

Ausbildung, Lehre

1.2

1.2

Geringfügig beschäftigt

2.3

2.3

Nicht erwerbstätig

88.1

88.0

Praktikum

2.5

2.6

Gesamt

100

100

Beobachtungen

4527

4465

Index Deutschkenntnisse (Lesen, Sprechen, Schreiben)

 

 

Sehr gut

24.4

25.3

Mittel

19.4

19.8

Schlecht

56.2

54.9

Gesamt

100

100

Beobachtungen

4523

4461

Schulbildung nach ISCED11 Klassifikation

 

 

In Schule

0.8

0.8

Primary

36.8

36.2

Lower Secondary

20.6

19.9

Upper Secondary

20.7

21.1

Post-Secondary

3.4

3.4

Bachelor

16.7

17.3

Promotion

1.1

1.1

Gesamt

100

100

Beobachtungen

4167

4131

Regionale Auswirkungen

Auch hinsichtlich regionaler Verzerrungen kann derzeit ausgeschlossen werden, dass der Charakter einer Zufallsstichprobe verloren ging. Einerseits wurde das Design- und Nonresponse-Gewicht entsprechend angepasst, andererseits zeigt sich, dass die Interviewer keine Primary Sampling Unit (PSU – regionale Cluster) exklusiv bearbeiteten. Somit stehen aus den betroffenen Regionen nach wie vor genügend Haushalte sowohl für Analysen der Erstbefragung als auch für weiteren Befragungen zur Verfügung. Insgesamt sind sieben PSUs betroffen, wovon in sechs tatsächlich Haushaltsinterviews realisiert wurden. Diese PSUs befinden sich alle in Bayern. Die zu löschenden Haushalte entsprechen rund 1% aller realisierten Haushaltsinterviews in diesem Bundesland (541).

Daten der zweiten Welle 2017

Die Daten der zweiten Welle waren von Anfang an den erweiterten Prüfverfahren unterworfen. Mögliche unsachgemäß durchgeführte Interviews wurden dadurch frühzeitig erkannt und gelöscht (Vgl. Kosyakova et al. 2019). Haushalte, deren Daten nur in der zweiten Welle aufgrund möglicherweise unsachgemäß durchgeführter Interviews gelöscht wurden, werden als temporärer Ausfall gewertet und in der dritten Welle re-kontaktiert. Die Gewichtungsfaktoren für die erste sowie für die zweite Welle wurden entsprechend angepasst. Somit ist die hohe Qualität und uneingeschränkte Nutzbarkeit der Daten gewährleistet.