SOEP-Core Version 35

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr Personen aus Haushalten in ganz Deutschland von unserem Erhebungsinstitut befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Zur adäquaten Erfassung des gesellschaftlichen Wandels werden immer wieder Stichproben implementiert, sowie eine Anpassung des Erhebungsprogramms vorgenommen.

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2018

DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . : 10.5684/soep-core.v35
Erhebungszeitraum: 1984-2018
Veröffentlichungsdatum: 01.11.2019
PrimärforscherInnen: Stefan Liebig, Jan Goebel, Martin Kroh, Carsten Schröder, Markus Grabka, Jürgen Schupp, Charlotte Bartels, Alexandra Fedorets, Andreas Franken, Jannes Jacobsen, Selin Kara, Peter Krause, Hannes Kröger, Maria Metzing, Jana Nebelin, David Richter, Diana Schacht, Paul Schmelzer, Christian Schmitt, Daniel Schnitzlein, Rainer Siegers, Knut Wenzig, Stefan Zimmermann

Datenerhebung: Kantar Deutschland GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland.

Anzahl der Haushalte: 18.682

Anzahl der Personen: 31.997 + 3971 Kinder

Besondere Stichproben: BürgerIn der DDR (1990), Zuwanderung/Migration (1994/95, 2013, 2015), Geflüchtete (seit 2016). Eine ausführliche Beschreibung aller Stichproben können Sie im SOEPcompanion unter SOEP-Samples in Detail nachlesen.

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehungen, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk oder per Registerstichprobe ausgesucht. 

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht die interviewende Person face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die im Befragungsjahr 12 Jahre alt werden oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten. Dort werden Fragen zu Wohnsituation und -kosten, verschiedenen Einkommensquellen sowie Fragen zu im Haushalt lebenden Kindern unter 12 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.) gestellt.

Zitation: Sozio-oekonomisches Panel (SOEP), Version 35, Daten der Jahre 1984-2018 (SOEP-Core v35). 2019. DOI: 10.5684/soep-core.v35

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)
  • Giesselmann, Marco, Mila Staneva, Jürgen Schupp, and David Richter. 2018. Das Sozio-Oekonomische Panel als Datenbasis für die Arbeits- und Organisationspsychologie. Zeitschrift für Arbeits- und Organisationspsychologie A&O 62 (3), 111-125. (https://doi.org/10.1026/0932-4089/a000273)

Für die SOEP-Core-Daten 1984-2018 (v35) - Wellen A bis BI - stehen folgende Datensätze zur Verfügung:

soep-core.v35

soep-core.v35i (International Scientific Use Version, 95%)

soep-core.v35t (Lehr-Version)

In der aktuellen Datenweitergabe komplett enthalten, auf spezielle Anfrage auch als Einzeldatensatz erhältlich:

soep.ddr18 (Leben in der ehemaligen DDR)

soep.iab-soep-mig.2018 (Migrationsstichproben)

soep.iab-bamf-soep-mig.2018 (Geflüchtetenstichproben)

SOEP-Core soep-core.v35

1. Neue Stichprobe in SOEP-Core

Als neue Auffrischungsstichprobe umfasst Sample O ca. 1.000 neue Haushalte. Diese wurden in Kooperation mit dem BBSR mit Hilfe eines neuen, auf Regionaldaten basierenden Stichprobendesign in Gebieten des Städtebauförderprogramms „Sozialen Stadt“ gezogen. Auf Basis der digital vorliegenden Daten zu den Grenzen der Soziale Stadt-Gebiete konnte rückwirkend ab dem Jahr 2000 eine neue Variable erstellt wurde, die kennzeichnet, ob die Wohnadresse des Haushaltes innerhalb eines solchen Fördergebiets liegt oder nicht (siehe auch die Variablenbeschreibung unten unter 4.4.)

2. Anpassungen in unserem neuen Hauptformat SOEPlong

Es gab folgende wichtige Veränderungen über die normalen jährlichen Aktualisierungen hinaus:

  • PKAL: Integration der $PKALOST-Datensätze
  • PL/PKAL: Einheitlich sind die Kalendarienstrings jetzt alle in PL und die monatlichen Variablen in PKAL enthalten 
  • PLUECKEL: Einführung von RYEAR und Korrektur von SYEAR, was bis jetzt RYEAR war
  • PBRUTTO: Wenn eine Variable nicht im jahrsspezifischen Brutto-Datensatz enthalten war, ist der Missing-Code jetzt von -2 auf -8 geändert worden
  • VPL: Die Fallzahl für vergangene Jahre hat sich erhöht, da Fälle ohne SOEP-Auskunftsperson nicht mehr gelöscht werden
  • KIDLONG: Das Harmonisierungskonzept wurde an das der anderen Datensätze angepasst und mehr Variablen aus $KIND-Datensätzen wurden aufgenommen (nähere Informationen unter 5.4)

3. Neuerungen in SOEPhelp

  • In SOEPhelp wurde die Verknüpfung von Topics und Variablen aus den Metadaten mit aufgenommen. In der Datensatzübersicht (Befehl: soephelp (ohne  Variable)) werden alle Topics des Datensatzes und welche Variablen zu welchem Topic gehören aufgelistet.
  • In der Variablenübersicht (Befehl: soephelp [variable]) werden die Topics dieser Variable aufgelistet (und die Beziehung der Topics/Untertopics zueinander). Die Topiclabel sind mit Paneldata.org verknüpft.
  • SOEPhelp hat eine Suchfunktion bekommen! Mit dem Befehl: soephelp, search (SUCHWORT) [verbose] werden alle Variablen aufgelistet, in deren Frage- oder Antworttext das SUCHWORT auftaucht. Die Variablen werden als Liste ausgegeben und in r (für returns) gespeichert. Die Option "verbose" listet die Variablen im Detail auf.
  • Hier noch einmal mehr  Informationen zu SOEPhelp

4. Neue Datensätze und Variablen

4.1 Frühe Kindheit

  • Neuer Datensatz BCBFK „Frühe Kindheit“ mit detaillierten geografischen Informationen über die Orte, an denen die Befragten aufgewachsen sind. Aufgrund der kleinteiligen Regionaldaten ist der Datensatz lediglich lokal im FDZ SOEP nutzbar. Der zugehörige Methodenbericht inkl. Fragebogen ist als SOEP Survey Paper 766 (PDF, 1.28 MB) erschienen.

4.2. Ihr Leben in der DDR 

  • Neuer Datensatz DDR18 „Leben in der DDR“, der zugehörige Fragebogen ist als SOEP Survey Paper 676 verfügbar.

4.3 Biografie-Nacherhebung

  • Die Variablen aus der Biographie-Nacherhebung zum Migrationsstatus wurden in den Datensatz BILELA bzw. BIOL integriert.

4.4 Neue Variable SOCURBAN im Datensatz HBRUTTO

  • SOCURBAN: Wohnadresse des Haushaltes liegt in einem Gebiet, das zum Städtebauförderprogramm "Soziale Stadt" (Stand 07/2017) gehört (Ja/nein)

4.5. Neue Variablen im Datensatz EQUIV

  • ILIB1$$: Renten/Pensionen für freie Berufe
  • ILIB2$$: Witwen-/Waisenrenten für freie Berufe

4.6. Neue Variablen im Datensatz BIOJOB

  • 2018 wurden bei Befragten neue Job-Klassifikationen und Prestige Scores erhoben. Diese Informationen sind in den folgenden neuen Variablen abgelegt: STBA10, ISCO08, EGP08, ISEI08, MPS08 und SIOPS08. Die entsprechenden Variablen in den älteren BIOJOB-Versionen STBA, EGP, ISEI, MPS und SIOPS wurden umbenannt in STBA92, EGP88, ISEI88, MPS92 und SIOPS88.

5.5. Änderungen an Datensätzen oder einzelnen Variablen

5.1. Die Gewichtungsvariable PHRF im Datensatz PPATHL

  • Die Gewichte ab 2013 wurden rückwirkend geändert in Bezug auf die Randanpassung. Die Änderungen beziehen sich auf das Zuwanderungsjahr. Zuvor wurden Personen, die vor 1955 zugewandert sind, als MigrantInnen geführt. Jetzt bilden sie - zusammen mit den neu Zugewanderten und in Deutschland Geborenen eine eigene Kategorie. Grund hierfür ist, dass Abgrenzung von AussiedlerInnen in Mikrozensus und SOEP nicht einheitlich abgebildet werden kann.

5.2. Variablen zur Vercodung von Berufsbezeichnungen

  • Seit 2013 wurden offene Berufsbezeichnungen nach ISCO-08 und KldB 2010 vercoded. In diesem Jahr sind die alten Klassifikationen nach ISCO-88 und KldB 92 erstmalig nicht mehr erhältlich. Wir haben deswegen neue Prestige-Scores eingeführt, die auf den neuen Klassifikationen beruhen, und führen die die alten nicht mehr weiter.
  • Kalendarienstrings sind von $PKAL nach $P verschoben bzw. vereinheitlicht worden.

5.3. Bildungsvariablen

  • Bis zur Version soep.v34 wurden die grundlegenden generierten Bildungsvariablen jährlich generiert und so über die Zeit kumuliert. Mit der Einführung von SOEPlong haben wir das Verfahren für generierte Variablen gründlich überarbeitet, um immer alle Bildungsvariablen für jedes Jahr zu berücksichtigen. Zusätzlich zur Tatsache, dass jetzt alle Variablen grundsätzlich aus den SOEPlong-Dateien generiert werden, haben wir noch zwei weitere Modifikationen vorgenommen:
  • Die wichtigsten Bildungsvariablen berücksichtigen jetzt Inkonsistenzen über die Zeit, im Unterschied zu den Bildungsvariablen in PGEN vor soep.v34.
  • Die Variable "Dauer der Ausbildung" ($$BILZEIT) wurde leicht verändert. Um berufliche Ausbildungen ohne Hochschulabschluss besser zu berücksichtigen, haben wir die Bildungsjahre für "Beamte" und "Andere" leicht verändert.

5.4. Datensatz KIDLONG

  • Fehler bei der Integration von Variablen wurden korrigiert, einzeln als versionierte Variablen abgelegt und harmonisierte Variablen erzeugt: Dadurch hat sich die Anzahl erhöht: von 110 Variablen in v.34 auf 267 Variablen in v.35.
  • Fehlende Variablen aus den $KIND Datensätzen wurden in KIDLONG aufgenommen.
  • Die korrigierte Version von BHKIND wurde in KIDLONG aufgenommen.
  • KIDLONG entspricht jetzt dem klassischen Harmonisierungskonzept (siehe  classic harmonization concept).

5.5. Dataset BHKIND

  • Es wurde eine Flag-Variable (BHKFLAG) zur Identifizierung von nicht realisierten Kinderfragebögen hinzugefügt.
  • Fehlende Beobachtungen wurden hinzugefügt: Erhöhung von 15.032 (v.34) auf 15.504 (v.35).
  • Fehler in der Integration von Variablen wurden korrigiert und fehlenden Variablen in BHKIND aufgenommen: Erhöhung von 85 (v.34) auf 129 Variablen (v.35).
  • Alle Variablen wurden umbenannt und entsprechen nun dem SOEP-Namenskonzept (siehe SOEP naming conventions).

5.6. Dataset BIKIND

  • Es wurde eine Flag-Variable (BIKFLAG) zur Identifizierung von nicht realisierten Kinderfragebögen hinzugefügt.
  • Alle Variablen wurden umbenannt und entsprechen nun dem SOEP-Namenskonzept (siehe SOEP naming conventions).

5.7. Variable PARID im Datensatz PPATHL

  • Partnerschaften von Befragten mit Nettocodes zwischen 40 und 49 wurden aufgelöst und erhalten künftig -2 "trifft nicht zu".

5.8. Variable HGOWNER im Datensatz HGEN

  • In den Stichproben M3-M5 in 2017 wurden in der Variable HGOWNER einige fehlende Werte durch die Information ersetzt, dass sich der Haushalt in einer Unterkunft für Geflüchtete befindet.

5.9. Datensatz INTERVIEWER

  • Das Jahr 2016 beinhaltet nun auch Informationen der Samples L2-M4.
  • Die Variable zur Länge der Interviews (LENGTHINT) wurde gestrichen und durch drei Variablen ersetzt, die jeweils die durchschnittliche Interviewlänge nur eines Instruments angeben (LENGTHINT- H / P / J).
  • Die bis dato in die Anzahl der Interviews auf Personenebene (AMOUNTINTP) einfließenden Jugendbefragungen haben eine eigene Variable bekommen (AMOUNTINTJ).

5.10. Datensatz BIOAGE17

  • Bisher enthielt BIOAGE17 die Identifier für die Mutter (BYMNR) und den Vater (BYVNR) der/des Befragten. BIOPAREN enthält die Identifier der Eltern als MNR und VNR und kann so leicht mit BIOAGE17 gemerged werden.
  • Wunschberufsvariablen ISCO88 wird von ISCO08 abgelöst. Gleiches gilt für BYKLAS: Die alte Version von 1992 wird durch die Version von 2010 abgelöst.

5.11. Datensatz BIOAGEL

  • Die interne Trennung in BIOAGE 8a und 8b bzw. 81 und 82 wurde aufgehoben, daher enthält der Datensatz BIOAGEL jetzt für die Fragebögen über die 7-8-jährigen Kinder eine Zeile pro Kind und Befragungsperson. Das heißt, wenn beide Eltern je einen Fragebogen ausgefüllt haben, dann gibt es für das entsprechende Kind in diesem Jahr zwei Zeilen (eine Zeile pro Elternteil), die sich aber durch die unterschiedliche PIDE (PID der Befragungsperson) identifizieren lassen.

(Stand April 2020)

Datensatz: bioage; Variable clref
Wir haben einen Labelfehler im Datensatz bioage bei der Variablen clref festgestellt, der zu verfälschten Analyseergebnissen führen könnte. Die Labels für die Werte [1] und [2] müssen getauscht werden.

stata [de]

label def clref ///
1 "[1] Ja, sowohl spez. Klasse als auch Regelunterricht" ///
2 "[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder", modify

stata [en]

label def clref ///
1 "[1] Yes, both special class and regular classes" ///
2 "[2] Yes, only special class for refugee children", modify

spss [de]

add value labels clref 1 '[1] Ja, sowohl spez. Klasse als auch Regelunterricht' 2 '[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder' .

spss [en]

add value labels clref 1 '[1] Yes, both special class and regular classes' 2 '[2] Yes, only special class for refugee children' .


Early: Field-de
Individual: Field-de,en Var-de Var-en
Household: Field-de,en
Household (PAPI) 2018: Var-de
Household: Var-en
Biography: Field-de,en Var-de Var-en
Catch-up Individual (PAPI) 2018: Field-de
Catch-up Individual: Var-de Var-en
Youth (16-17-year-olds, PAPI) 2018: Field-de
Youth (16-17-year-olds): Var-de Var-en
Early Youth (13-14-year-olds): Var-de Var-en
Pre-teen (11-12-year-olds, PAPI) 2018: Field-de
Pre-teen (11-12-year-olds): Var-en Var-en
Mother and Child (Newborns, PAPI) 2018: Field-de Var-de
Mother and Child (Newborns): Var-en
Mother and Child (2-3-year-olds, PAPI) 2018: Field-de Var-de
Mother and Child (2-3-year-olds): Var-en
Mother and Child (5-6-year-olds, PAPI) 2018: Field-de Var-de
Mother and Child (5-6-year-olds): Var-en
Parents and Child (7-8-year-olds, PAPI) 2018: Field-de
Parents and Child (7-8-year-olds): Var-de Var-en
Mother and Child (9-10-year-olds, PAPI) 2018: Field-de
Mother and Child (9-10-year-olds): Var-de Var-en
Deceased Individual (PAPI) 2018: Field-de
Deceased Individual: Var-de Var-en
Grip Strength 2018: Field-de
Life in the former GDR: Field-de Var-de Var-en

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) SOEP-Core v35 – Documentation of Sample Sizes and Panel Attrition in the German Socio-Economic Panel (SOEP)(1984 until 2018)

2) SOEP-Core – 2018: Sampling, Nonresponse, and Weighting in the Sample O

3) SOEP-Core v35 – PPATHL: Person-Related Meta-Dataset

4) SOEP-Core v35 – HPATHL: Household-Related Meta-Dataset

5) SOEP-Core v35 – PBRUTTO: Person-Related Gross File

6) SOEP-Core v35 – HBRUTTO: Household-Related Gross File

7) SOEP-Core v35 – PGEN: Person-Related Status and Generated Variables

8) SOEP-Core v35 – HGEN: Household-Related Status and Generated Variables

9) SOEP-Core v35 – Codebook for the $PEQUIV File 1984-2018: CNEF Variables with Extended Income Information for the SOEP

10) SOEP-Core v35 – BIOIMMIG

11) SOEP-Core v35 – HEALTH

12) SOEP-Core v35 – BIOAGEL & BIOPUPIL: Generated Variables from the "Mother & Child", "Parent", "Pre-Teen", and "Early Youth" Questionnaires

13) SOEP-Core v35 – The Couple History Files BIOCOUPLM and BIOCOUPLY, and Marital History Files BIOMARSM and BIOMARSY

14) SOEP-Core v35 – BIOAGE17: The Youth Questionnaire

15) SOEP-Core v35 – BIOSOC: Retrospective Data on Youth and Socialization

16) SOEP-Core v35 – BIOJOB: Detailed Information on First and Last Job

17) SOEP-Core v35 – BIOEDU: Data on Educational Participation and Transitions

18) SOEP-Core v35 – BIORESID: Variables on Occupancy and Second Residence

19) SOEP-Core – 2018: Documentation of the Interviewer Dataset (1984 until 2018)

20) SOEP-Core v35 – INTERVIEWER

21) SOEP-Core v35 – LIFESPELL: Information on the Pre- and Post-Survey History of SOEP-Respondents

22) SOEP-Core v35 – MIGSPELL and REFUGSPELL: The Migration-Biographies

23) SOEP-Core v35 – Activity Biography in the Files PBIOSPE and ARTKALEN

1) SOEP 2002 – Editing and Multiple Imputation of Item-Non-Response in the 2002 Wealth Module of the German Socio-Economic Panel (SOEP)

2) SOEP 2002 – Zur Erfassung der Vermögensbestände im Sozio-oekonomischen Panel (SOEP)

3) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

4) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2

5) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

6) The Request for Record Linkage in the IAB-SOEP Migration Sample

7) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

8) SOEP 2007 – Editing und multiple Imputation der Vermögensinformation 2002 und 2007 im SOEP

9) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

10) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

11) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

12) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

13) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

14) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

15) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

16) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

17) SOEP Scales Manual (updated for SOEP-Core v32.1)

18) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

19) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

20) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

21) Multi-Itemskalen im SOEP Jugendfragebogen

22) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

23) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

24) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE

25) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables

26) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

27) SOEP-Core v34: Codebook for the EU-SILC-Like Panel for Germany Based on the SOEP

28) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite