SOEP-Core v32 - Datensatzinformation

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 sowie 2013 und 2015 wurden Migrations-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Seit Version 31 (10.5684/soep.v31) sind die Stichproben der Studie "Familien in Deutschland" (FiD) vollständig integriert, inklusive der seit 2010 bereits erhobenen Daten im Rahmen von FiD. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (10.5684/soep.v32i).

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2015

DOI: 10.5684/soep.v32
Erhebungszeitraum: 1984-2015
Veröffentlichungsdatum: 14.12.2016
Primärforscher: Jürgen Schupp, Jan Goebel, Martin Kroh, Carsten Schröder, Charlotte Bartels, Klaudia Erhardt, Alexandra Fedorets, Marco Giesselmann, Markus Grabka, Peter Krause, Simon Kühne, David Richter, Rainer Siegers, Paul Schmelzer, Christian Schmitt, Daniel Schnitzlein, Knut Wenzig

Datenerhebung: TNS Infratest Sozialforschung GmbH.

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland.

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht. 

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre alt oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

Datensatzinformationen:

 Anzahl der Einheiten 113.840
 Anzahl der Variablen 61.902 in 413 Datensätzen
 Datenformat STATA, SPSS, SAS, CSV

MD5 fingerprints

Weitergabeformat zip-Datei Einzeldatensätze
Stata zweisprachig 76ac7dacaf663934cc1511b08e3510d3  
Stata deutsch 088df0e5419d73f66d25b37ff6a41488  
Stata englisch d7f41baeeaffcbd8083f431a60860de5  
SPSS deutsch 829d6893bc7ae8bb636158f13cc5dd6b  
SPSS englisch 48f1d9ef7314c38084f1ebe436b6ff39  
SAS deutsch cac3ec7ccaa11e4484dbc4ed3eec8fcc  
SAS englisch 52c77d38b5fd8d57ab2575591ac698ae  
CSV dc3497a6af769753cd7c31a8ff93f3b0  
GGKBOU 0dd7977b178723ce512499d4bf7bb578  
GGKBOU englisch d6aa5c401047e51f7877818ffc202453  
Lehrversionen
Stata deutsch (Lehre) 020aa097295e452dd884992cd980a6ab  
Stata englisch (Lehre) 4f08c9219fa5beb1df09bdcb2278b339  
SPSS deutsch (Lehre) 08c54677b3640b725ddca5fe5fcab5e9  
SPSS englisch (Lehre) dd0c9903f53587be4b444dd228af0a6a  
SAS deutsch (Lehre) 8fd89a198861ff7ae6f9d73413fd2d75  
SAS englisch (Lehre) 190d3260961cae7d9fcbcecf1ff4b8c9  

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

SOEP-Core soep.v32

Die neue Datendistribution (1984–2015) "SOEP v32" bietet für den aktuellsten Erhebungszeitraum des Jahres 2015 die üblichen wellenspezifischen Variablen BFPBRUTTO, BFP, BFPEQUIV, BFP_MIG, BFPKAL, BFPGEN, BFPAGE17, BFHBRUTTO, BFH, BFHGEN, BFKIND und BEPLUECKE den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren).

1. Neue Migrationsstichprobe (M2)

2013 haben wir die erste IAB-SOEP-Migrationsstichprobe in Zusammenarbeit mit dem Institut für Arbeitsmarkt- und Berufsforschung (IAB) in Nürnberg durchgeführt (einen Überblick über M1 finden Sie im SOEP Survey Paper 216). Die Haushalte der zweiten IAB-SOEP-Migrationsstichprobe (M2) wurden 2015 erstmalig befragt und sind jetzt in die SOEP-Core-Daten integriert. Die Zielpopulation dieser IAB-SOEP-Migrationsstichprobe sind Personen, die zwischen 2010 und 2013 nach Deutschland eingewandert sind. Die größte Gruppe stellen dabei die Migrantinnen und Migranten aus den neuen EU-Mitgliedsstaaten in Osteuropa. Dieser Umstand ermöglicht es, die sich gegenwärtig vollziehende dynamische Änderung des Einwanderungsgeschehens nach Deutschland besser zu beschreiben. Die Stichprobe M2 besteht aus 1.096 Haushalten und ist, wie die Stichprobe M1, aus den Registerdaten der Bundesanstalt für Arbeit gezogen worden.

Registerverknüpfung

Es ist für die beiden Migrationsstichproben möglich, die Daten der SOEP-Erhebung mit administrativen Arbeitsmarkt- und Einkommensdaten zu verknüpfen, falls für die jeweiligen Befragten eine explizite Zustimmung zur Registerverknüpfung vorliegt. Weil aber diese verknüpften Datensätze Sozialdaten enthalten und nur schwach anonymisiert sind, ist ein Zugang nur direkt im Forschungsdatenzentrum der Bundesanstalt für Arbeit im IAB (FDZ IAB) möglich. Forscherinnen und Forscher erhalten Zugriff auf die FDZ IAB-Daten entweder während eines Gastaufenthaltes am IAB oder über einen kontrollierten Fernrechenzugang, der ebenfalls vom IAB eingerichtet wird. Anfragen für den Datenzugang müssen direkt an das FDZ IAB gestellt werden, zumal auch ein Datennutzungsvertrag mit dem IAB erforderlich ist.

Weitere Informationen auf den Webseiten des FDZ IAB.

2. Gewichtung

  • Die neue Stichprobe M2 wurde für die Version v32 in den Gewichtungsrahmen integriert. Wie im SOEP bei der Integration neuer Samples üblich werden für die Welle der Ersterhebung unterschiedliche Hochrechnungsfaktoren angeboten. Mit den Standardvariablen (bfhhrf/bfphrf) können alle Samples des SOEP auf die Gesamtbevölkerung Deutschlands hochgerechnet werden, mit den Variablen bfhhrfam1/bfphrfam1 nur die alten Samples A bis M1. Das neue Sample M2 lässt sich mit den Variablen bfhhrfm2/bphhrfm2 auf die Grundgesamtheit der Stichprobe hochrechnen.
  • Die Randanpassung auf Personenebene wurde umgestellt, so dass nun die Anzahl von Frauen und Männern in den jeweiligen Altersgruppen (5-Jahres-Schritte) als Rand vorgegeben wird. Bisher wurden zwei separate Ränder für Geschlecht und Altersgruppen verwendet.
  • Auf Anfrage werden für die Erhebungsjahre 2010 bis 2013 (Wellen BA bis BD) nun Hochrechnungsfaktoren unter Ausschluss der Samples L1 bis L3 zur Verfügung gestellt. Durch abweichende Erhebungsinstrumente der Samples L1 bis L3 im Rahmen der Befragung „Familien in Deutschland“ in den entsprechenden Wellen kann der Bedarf einer solchen Gewichtung entstehen, wenn Variablen analysiert werden sollen, die in den anderen Samples nicht erhoben wurden.

3. Geänderte Datensätze oder Variablen

  • MIGSPELL: Mit der Integration der Daten von 2013 (BD) bis 2015 (BF) wurden größere Änderungen in der Zahl und der Kodierung der Variablen in MIGSPELL notwendig, da insbesondere der Status bei der Einreise nach Deutschland in den einzelnen Wellen unterschiedlich genau abgefragt wurde. Zudem kam eine verbesserte Prozedur zur Imputation fehlender Datumsangaben zum Einsatz. Eine detaillierte Beschreibung der neuen Version von MIGSPELL finden Sie in Dokumentation der Biography and Life History Data für SOEP v32 (im Erscheinen).
  • Variablen im Zusammenhang mit Berufstätigkeit:
    • Die Variablennamen wurden geändert und sollten jetzt informativer sein: Der Name des Verkodungsschemas ist jetzt Teil des Variablennamens, z.B. isco88.
    • Die Verkodung der Berufstätigkeit (KldB92, ISCO-88) erfüllen jetzt besser die offiziellen Standards (z.B. Variablen mit den Endungen _kldb92 oder _isco88 in den $P-Datensätzen)
    • In $PGEN gibt es jetzt zusätzlich Variablen, die die Verkodungsschemata von KldB2010 und ISCO-08 nutzen.
    • Der Code für die Generierung der Prestigeskalen wurde überarbeitet, z.B. egp88_12 für die EPG-Klassen basiert jetzt auf dem ISCO-88 im Jahr 2012.
  • BIOIMMIG:  Die Variable biwfam ("Hat bereits Familienangehörige im Land") war auf Grund eines Kodierungsfehlers für die Migrantenstichproben in 2013 und 2014 falsch eingefügt. Dies wurde in der aktuellen Datenweitergabe behoben.
  • Erhebungsjahr: Mit der Version 32 heißen alle Variablen, die das Erhebungsjahr bezeichnen, konsistent syear. Zum Teil gab es noch vereinzelt Variablen mit den Namen wie erhebj und svyyear verwendet.
  • BFVP: Im Verstorbenendatensatz der Welle 32 (BFVP) wurde die Codierung der Personennummer der Auskunftspersonen und Verstorbenen im Vergleich zu den vorigen Wellen geändert. Während in den Datensätzen bis einschließlich BEVP der Code -2 in der Variable angibt, dass die jeweilige verstorbene oder Auskunftsperson kein Mitglied des SOEP war, wurde für diese Personen, die nicht zur Panelpopulation zählen, nun eine Personen-Id eingeführt. Diese sind anhand der Endung der ID-Variablen (persnr bzw. vpersnr) identifizierbar - endet die (v)persnr auf 97, 98 oder 99, so ist die Person kein Mitglied des SOEP gewesen. Für die Jahre bis 2014 besteht für diese Personen-Ids dafür noch der Wert -2.

4. Neue Datensätze oder Variablen

  • BIOIMMIG: Zusätzliche Variable für den Hauptgrund, nach Deutschland einzureisen (erst seit 2014 erfragt).
  • PFLEGE: Zusätzliche Variable, appraisal, mit dem Label: ’offiziell als pflegebedürftig eingestuft'.
  • $PEQUIV: sechs neue Variablen:
        -  ichsu$$ Child support, caregiver alimony
        -  fchsu$$ Imputation flag child support, caregiver alimony
        -  ispou$$ Divorce alimony
        -  fspou$$ Imputation flag Divorce alimony
        -  irie1$$ Riester pension plan
        -  irie2$$ Riester widow pension plan
  • PPFAD: Personenbezogener Metadatensatz
    • In einige Variablen zum Einwanderungshintergrund (germborn, corigin und immiyear) wurden bisher alle Befragten in Sample G, die nicht nach ihrem Geburtsland und Jahr der Einwanderung gefragt wurden, mit -3 kodiert. Weil Befragte anderer Stichproben (z.B. A) zwar ebenfalls nicht nach diesen Informationen gefragt worden waren, bisher aber mit -2 kodiert wurden, war die Kodierung für fehlende Werte über die Stichproben nicht konsistent. Dies wurde nun in der aktuellen Datenweitergabe v32 korrigiert.
    • Befragte, die 1949, dem Gründungsjahr der Bundesrepublik Deutschland, eingewandert sind, wurden bisher aufgrund eines Kodierungsfehlers als nicht in Deutschland geboren angesehen. Dies wurde in der aktuellen Version korrigiert. In Übereinstimmung mit dem Mikrozensus werden jetzt alle Personen, die vor 1950 (und nach 1949) eingewandert sind, als in Deutschland geboren angesehen. Dies führt auch zu einer Änderung des value labels von immiyear.
    • Weitere Informationen werden in der aktuellen Version von miginfo bereitgehalten, so auch die Änderungen der Werte.

5. Gelöschte Variablen

  • $PGEN: Ab Version v32 wird erwtyp nicht mehr generiert. Die Informationen, die mit erwtyp weitergegeben wurden, finden sich in den Variablen jobch$$, emplst$$ und lfs$$.


Individual (PAPI) 2015: Field-de Var-de Var-en
Household 2015: Field-de Var-de Var-en
Biography (PAPI) 2015: Field-de Var-de Var-en
Youth (16-17 year-olds) 2015: Field-de Var-de Var-en
Pre-Teen (11-12 year-olds) 2015: Field-de
Mother and Child (Newborns) 2015: Field-de
Mother and Child (2-3-year-olds) 2015: Field-de
Mother and Child (5-6-year-olds) 2015: Field-de
Parents and Child (7-8-year-olds) 2015: Field-de
Mother and Child (9-10-year-olds) 2015: Field-de
Deceased Individual 2015: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2

3) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

4) The Request for Record Linkage in the IAB-SOEP Migration Sample

5) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

6) SOEP 2007 – Editing und multiple Imputation der Vermögensinformation 2002 und 2007 im SOEP

7) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

8) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

9) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

10) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

11) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

12) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

13) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

14) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

15) SOEP Scales Manual (updated for SOEP-Core v32.1)

16) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

17) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

18) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

19) Multi-Itemskalen im SOEP Jugendfragebogen

20) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

21) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

22) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE

23) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables

24) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

25) SOEP-Core v34: Codebook for the EU-SILC-Like Panel for Germany Based on the SOEP

26) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite