Direkt zum Inhalt

SOEP-Core v32 - Änderungen am Datensatz

Änderungen am Datensatz

Datensatzinformation

SOEP-Core soep.v32

Die neue Datendistribution (1984–2015) "SOEP v32" bietet für den aktuellsten Erhebungszeitraum des Jahres 2015 die üblichen wellenspezifischen Variablen BFPBRUTTO, BFP, BFPEQUIV, BFP_MIG, BFPKAL, BFPGEN, BFPAGE17, BFHBRUTTO, BFH, BFHGEN, BFKIND und BEPLUECKE den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren).

1. Neue Migrationsstichprobe (M2)

2013 haben wir die erste IAB-SOEP-Migrationsstichprobe in Zusammenarbeit mit dem Institut für Arbeitsmarkt- und Berufsforschung (IAB) in Nürnberg durchgeführt (einen Überblick über M1 finden Sie im SOEP Survey Paper 216). Die Haushalte der zweiten IAB-SOEP-Migrationsstichprobe (M2) wurden 2015 erstmalig befragt und sind jetzt in die SOEP-Core-Daten integriert. Die Zielpopulation dieser IAB-SOEP-Migrationsstichprobe sind Personen, die zwischen 2010 und 2013 nach Deutschland eingewandert sind. Die größte Gruppe stellen dabei die Migrantinnen und Migranten aus den neuen EU-Mitgliedsstaaten in Osteuropa. Dieser Umstand ermöglicht es, die sich gegenwärtig vollziehende dynamische Änderung des Einwanderungsgeschehens nach Deutschland besser zu beschreiben. Die Stichprobe M2 besteht aus 1.096 Haushalten und ist, wie die Stichprobe M1, aus den Registerdaten der Bundesagentur für Arbeit gezogen worden.

Registerverknüpfung

Es ist für die beiden Migrationsstichproben möglich, die Daten der SOEP-Erhebung mit administrativen Arbeitsmarkt- und Einkommensdaten zu verknüpfen, falls für die jeweiligen Befragten eine explizite Zustimmung zur Registerverknüpfung vorliegt. Weil aber diese verknüpften Datensätze Sozialdaten enthalten und nur schwach anonymisiert sind, ist ein Zugang nur direkt im Forschungsdatenzentrum der Bundesagentur für Arbeit im IAB (FDZ IAB) möglich. Forscherinnen und Forscher erhalten Zugriff auf die FDZ IAB-Daten entweder während eines Gastaufenthaltes am IAB oder über einen kontrollierten Fernrechenzugang, der ebenfalls vom IAB eingerichtet wird. Anfragen für den Datenzugang müssen direkt an das FDZ IAB gestellt werden, zumal auch ein Datennutzungsvertrag mit dem IAB erforderlich ist.

Weitere Informationen auf den Webseiten des FDZ IAB.

2. Gewichtung

  • Die neue Stichprobe M2 wurde für die Version v32 in den Gewichtungsrahmen integriert. Wie im SOEP bei der Integration neuer Samples üblich werden für die Welle der Ersterhebung unterschiedliche Hochrechnungsfaktoren angeboten. Mit den Standardvariablen (bfhhrf/bfphrf) können alle Samples des SOEP auf die Gesamtbevölkerung Deutschlands hochgerechnet werden, mit den Variablen bfhhrfam1/bfphrfam1 nur die alten Samples A bis M1. Das neue Sample M2 lässt sich mit den Variablen bfhhrfm2/bphhrfm2 auf die Grundgesamtheit der Stichprobe hochrechnen.
  • Die Randanpassung auf Personenebene wurde umgestellt, so dass nun die Anzahl von Frauen und Männern in den jeweiligen Altersgruppen (5-Jahres-Schritte) als Rand vorgegeben wird. Bisher wurden zwei separate Ränder für Geschlecht und Altersgruppen verwendet.
  • Auf Anfrage werden für die Erhebungsjahre 2010 bis 2013 (Wellen BA bis BD) nun Hochrechnungsfaktoren unter Ausschluss der Samples L1 bis L3 zur Verfügung gestellt. Durch abweichende Erhebungsinstrumente der Samples L1 bis L3 im Rahmen der Befragung „Familien in Deutschland“ in den entsprechenden Wellen kann der Bedarf einer solchen Gewichtung entstehen, wenn Variablen analysiert werden sollen, die in den anderen Samples nicht erhoben wurden.

3. Geänderte Datensätze oder Variablen

  • MIGSPELL: Mit der Integration der Daten von 2013 (BD) bis 2015 (BF) wurden größere Änderungen in der Zahl und der Kodierung der Variablen in MIGSPELL notwendig, da insbesondere der Status bei der Einreise nach Deutschland in den einzelnen Wellen unterschiedlich genau abgefragt wurde. Zudem kam eine verbesserte Prozedur zur Imputation fehlender Datumsangaben zum Einsatz. Eine detaillierte Beschreibung der neuen Version von MIGSPELL finden Sie in Dokumentation der Biography and Life History Data für SOEP v32 (im Erscheinen).
  • Variablen im Zusammenhang mit Berufstätigkeit:
    • Die Variablennamen wurden geändert und sollten jetzt informativer sein: Der Name des Verkodungsschemas ist jetzt Teil des Variablennamens, z.B. isco88.
    • Die Verkodung der Berufstätigkeit (KldB92, ISCO-88) erfüllen jetzt besser die offiziellen Standards (z.B. Variablen mit den Endungen _kldb92 oder _isco88 in den $P-Datensätzen)
    • In $PGEN gibt es jetzt zusätzlich Variablen, die die Verkodungsschemata von KldB2010 und ISCO-08 nutzen.
    • Der Code für die Generierung der Prestigeskalen wurde überarbeitet, z.B. egp88_12 für die EPG-Klassen basiert jetzt auf dem ISCO-88 im Jahr 2012.
  • BIOIMMIG:  Die Variable biwfam ("Hat bereits Familienangehörige im Land") war auf Grund eines Kodierungsfehlers für die Migrantenstichproben in 2013 und 2014 falsch eingefügt. Dies wurde in der aktuellen Datenweitergabe behoben.
  • Erhebungsjahr: Mit der Version 32 heißen alle Variablen, die das Erhebungsjahr bezeichnen, konsistent syear. Zum Teil gab es noch vereinzelt Variablen mit den Namen wie erhebj und svyyear verwendet.
  • BFVP: Im Verstorbenendatensatz der Welle 32 (BFVP) wurde die Codierung der Personennummer der Auskunftspersonen und Verstorbenen im Vergleich zu den vorigen Wellen geändert. Während in den Datensätzen bis einschließlich BEVP der Code -2 in der Variable angibt, dass die jeweilige verstorbene oder Auskunftsperson kein Mitglied des SOEP war, wurde für diese Personen, die nicht zur Panelpopulation zählen, nun eine Personen-Id eingeführt. Diese sind anhand der Endung der ID-Variablen (persnr bzw. vpersnr) identifizierbar - endet die (v)persnr auf 97, 98 oder 99, so ist die Person kein Mitglied des SOEP gewesen. Für die Jahre bis 2014 besteht für diese Personen-Ids dafür noch der Wert -2.

4. Neue Datensätze oder Variablen

  • BIOIMMIG: Zusätzliche Variable für den Hauptgrund, nach Deutschland einzureisen (erst seit 2014 erfragt).
  • PFLEGE: Zusätzliche Variable, appraisal, mit dem Label: ’offiziell als pflegebedürftig eingestuft'.
  • $PEQUIV: sechs neue Variablen:
        -  ichsu$$ Child support, caregiver alimony
        -  fchsu$$ Imputation flag child support, caregiver alimony
        -  ispou$$ Divorce alimony
        -  fspou$$ Imputation flag Divorce alimony
        -  irie1$$ Riester pension plan
        -  irie2$$ Riester widow pension plan
  • PPFAD: Personenbezogener Metadatensatz
    • In einige Variablen zum Einwanderungshintergrund (germborn, corigin und immiyear) wurden bisher alle Befragten in Sample G, die nicht nach ihrem Geburtsland und Jahr der Einwanderung gefragt wurden, mit -3 kodiert. Weil Befragte anderer Stichproben (z.B. A) zwar ebenfalls nicht nach diesen Informationen gefragt worden waren, bisher aber mit -2 kodiert wurden, war die Kodierung für fehlende Werte über die Stichproben nicht konsistent. Dies wurde nun in der aktuellen Datenweitergabe v32 korrigiert.
    • Befragte, die 1949, dem Gründungsjahr der Bundesrepublik Deutschland, eingewandert sind, wurden bisher aufgrund eines Kodierungsfehlers als nicht in Deutschland geboren angesehen. Dies wurde in der aktuellen Version korrigiert. In Übereinstimmung mit dem Mikrozensus werden jetzt alle Personen, die vor 1950 (und nach 1949) eingewandert sind, als in Deutschland geboren angesehen. Dies führt auch zu einer Änderung des value labels von immiyear.
    • Weitere Informationen werden in der aktuellen Version von miginfo bereitgehalten, so auch die Änderungen der Werte.

5. Gelöschte Variablen

  • $PGEN: Ab Version v32 wird erwtyp nicht mehr generiert. Die Informationen, die mit erwtyp weitergegeben wurden, finden sich in den Variablen jobch$$, emplst$$ und lfs$$.
keyboard_arrow_up