SOEP-Core v26 (Daten 1984-2009)

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002 und zuletzt 2006 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst.

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984 - 2009

DOI: 10.5684/soep.v26
Erhebungszeitraum: 1984-2009
Veröffentlichungsdatum: 17.09.2010
Primärforscher: Gert. G. Wagner, Joachim R. Frick, Jürgen Schupp, Silke Anger, Jan Goebel, Markus M. Grabka, Elke Holst, Peter Krause, Martin Kroh, Elisabeth Liebau, Henning Lohmann, Christian Schmitt, C. Katharina Spieß

Datenerhebung: TNS Infratest Sozialforschung GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

 Datensatzinformationen:

 Anzahl der Einheiten  66.189
 Anzahl der Variablen 43.155 in 322 Datensätzen
 Datenformat

 STATA, SPSS, SAS, CSV

Veröffentlichungen:

  • Jan Goebel, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, Jürgen Schupp. 2018. The German Socio-Economic Panel Study (SOEP). Jahrbücher für Nationalökonomie und Statistik / Journal of Economics and Statistics (online first), doi: 10.1515/jbnst-2018-0022
  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber (2008) Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland - Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (2008), No. 4, 301-328 (download)
  • Schupp, Jürgen (2009): 25 Jahre Sozio-oekonomisches Panel - Ein Infrastrukturprojekt der empirischen Sozial- und Wirtschaftsforschung in Deutschland, Zeitschrift für Soziologie 38(5), pp. 350-357.

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Schröder, Carsten, Johannes König, Alexandra Fedorets, Jan Goebel, Markus M. Grabka, Holger Lüthen, Maria Metzing, Felicitas Schikora, and Stefan Liebig. 2020. The economic research potentials of the German Socio-Economic Panel study. German Economic Review 21 (3), 335-371. (https://doi.org/10.1515/ger-2020-0033)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

Die Datenweitergabe 2010 mit den Daten von 1984-2009 (v26) enthält weitgehende Verbesserungen, Ergänzungen und änderungen. Neben den üblichen wellenspezifischen Datensätzen ZPBRUTTO, ZP, ZPKAL, ZPGEN, ZPAGE17, ZHBRUTTO, ZH, ZHGEN, ZKIND and YPLUECKE sowie den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren) finden Sie hier die wichtigsten änderungen

1. Beta Version des 'long'-Formats

Die SOEP-Daten werden dieses Jahr erstmalig in der Standard-Datenweitergabe in diesem nutzerfreundlicheren Format, genannt 'SOEPlong' weitergegeben - in einer Beta-Version. SOEPlong ist eine Art komprimierte Version der SOEP-Daten: Statt der Weitergabe als einzelne wellenspezifische Datensätze werden alle Jahre und Kohorten im 'long format' zusammengefasst weitergegeben.

2. Neues Sample I
Als Beitrag zu den laufenden SOEP-Innovationen begann im Herbst 2009 die Feldarbeit für eine neue Stichprobe I. Sie wurde genutzt, um den Effekt unterschiedlicher Incentivierungsstrategien auf die Beteiligungsquote zu testen und wird Teil eines umfassenderen Innovationssamples werden. Im SOEPnewsletter 89 hatten wir unsere Pläne in dieser Richtung beschrieben.

In vier zufällig ausgewählten Gruppen wurden folgende Anreizstrategien genutzt:

  1. SOEP Standard-Incentive (ein Lotterie-Los pro Antwortperson),
  2. die Wahl zwischen einem Lotterie-Los und fünf Euro pro Personeninterview,
  3. fünf Euro pro Personeninterview,
  4. zehn Euro pro Personeninterview.

Die Daten der neuen Stichprobe I sind in der aktuellen Datenweitergabe (SOEP, v26) enthalten, aber aufgrund der spezifischen Merkmale des Samples konnte kein gemeinsames Gewichtungsschema mit den anderen SOEP-Stichproben zur Verfügung gestellt werden: In Stichprobe I wurden alle Antwortverweigerer der vier Gruppen noch einmal schriftlich befragt. Die Biografie-Informationen für die TeilnehmerInnen von Stichprobe I konnten noch nicht in die Biografiedatensätze integriert werden, da diese standardmäßig erst in der 2. Welle erhoben werden. Dasselbe gilt für Biografie-Informationen im Datensatz PPFAD, so ist z.B. die Variable MIGBACK für diese Stichprobe komplett auf -2 gesetzt.

Darüber hinaus wurden folgende Ergänzungen und änderungen vorgenommen:

3. Neue und umbenannte Datensätze

  • Daten der Kognitionstests (COGDJ)
    Erstmalig sind alle vorhandenen Daten des Kognitionstests für junge Leute ("Denksport Jugend", DJ) in dieser Datenweitergabe enthalten. Seit 2006 wird dieser Test allen jungen Erstbefragten (im Alter von 16) vorgelegt.

4. Neue Variablen

4.1 Datensatz $HGEN
Es gibt zwei neue Variablen, die die Qualität einer Wohnung beschreiben :

  • EQPLIF$$: "Aufzug / Fahrstuhl im Haus"
  • EQPNRJ$$: "alternative Energiequelle"

4.2 Datensatz $PEQUIV:

  • Es gibt eine neue Variable für zusätzliche monetäre Leistungen für Kinder, zusammen mit einer Flag-Variable, die eine Imputation anzeigt (ADCHB$$ und FADCHB$$).

4.3 Datensatz $HBRUTTO - Kalenderjahr des Interviews

  • In dieser Datenweitergabe findet sich zum ersten Mal eine Variable (ZDATUMY), die das Kalenderjahr des Interviews angibt. Nötig geworden ist dies aufgrund der längeren Feldarbeit im Zusammenhang mit der Stichprobe I. Dies führte dazu, dass in einigen Fällen ein Interview erst 2010 realisiert werden konnte.

5. überarbeitete Variablen

5.1 Datensatz $HGEN  

  • Die Variablen zum Haushaltstyp TYP1HH$$ und TYP2HH$$ wurden komplett überarbeitet und auf intertemporale Konsistenz geprüft.

5.2 Datensätze $KIND – KIDLONG

  • Die Variablen wurden ebenfalls komplett überarbeitet und liegen jetzt sowohl in längsschnittlicher Form (KIDLONG) als auch weiterhin im Querschnittformat in $KIND vor. Zu beachten ist, dass die Variablennamen in KIDLONG zum Teil geändert werden mussten, um über die Zeit konsistent zu bleiben.

5.3 Datensätze BIOMARSM/BIOMARSY  

  • Die Spelldaten zum Familienstatus wurden überarbeitet.

5.4 Datensatz BIOTWIN

Der Datensatz BIOTWIN enthält ab dieser Welle Z 100 Fälle mehr. Dieser beachtliche Anstieg der Fallzahl ist das Ergebnis einer Anpassung im Datengenerierungsprozess: Im Gegensatz zum bisherigen Verfahren werden jetzt zusätzlich alle Geschwister mit identischem Geburtsjahr, bei denen die Angabe zum Geburtsmonat fehlt, als Zwillinge angesehen. Diese weniger restriktive Datengenerierung ist der Annahme geschuldet, dass zwei separate Geburten in einem einzigen Kalenderjahr extrem selten vorkommen. Da jedoch trotzdem die Gefahr besteht, dass durch fälschlicherweise als Zwillinge bezeichnete Personen aus der Gruppe mit den fehlenden Geburtsmonaten die Durchschnittswerte in BIOTWIN verzerrt werden, haben wir ein neues Label in die Variable INFOTWIN eingeführt. Dadurch kann diese besondere Gruppe der Zwillinge identifiziert werden (Code "6": Erfassung seit 2007, übereinstimmung Geburtsjahr, fehlender -monat; im Gegensatz dazu "5": Erfassung seit 2007, übereinstimmung Geburtsjahr und -monat).
In der aktuellen Datenweitergabeversion (Welle Z, besser: v26) umfasst der Datensatz BIOTWIN 250 Zwillings- und 5 Drillingspaare.

labels infotwin: 
[1] Zwillinge - nicht in 2006 (gen.)
[2] Zwillinge - 2006 (Antwort nicht verifizierbar)
[3] Zwillinge - 2006 (Antwort verweigert)
[4] Zwillinge - 2006 (Antwort validiert)
[5] Zwillinge - seit 2007 (gen.)
[6] Zwillinge - seit 2007 (gen.)

 

5.5 Kleinere Überarbeitungen

  • Korrektur in MONTH08
  • Korrektur einiger weniger Fälle im IMMIYEAR
  • Austausch der Variablennamen für die Fragen 25 und 26 in YH und ZH

06.01.2011

Im generierten Längsschnittdatensatz KIDLONG gab es bei ca. 3% der Kinder ein Problem in der Zuordnung zur korrekten aktuellen Haushaltsnummer. Die Variable HHNRAKT wurde dementsprechend korrigiert.
Zusätzlich hat sich in der Variable K_NRKID die Angabe für das Erhebungjahr 1987 für das Kind 397403 geändert.
Hierbei erhöht sich die "Anzahl der Kinder im HH unter 16 Jahren" von 1 auf 2.
Bitte melden Sie sich bei soepmail@diw.de, wenn Sie den Datensatz KIDLONG nutzen. Sowohl für den 100%-Datensatz für die EEA-Länder als auch für die weltweit nutzbare 95%-Version stellen wir eine individualisierte Downloadmöglichkeit zur Verfügung.


Bitte beachten Sie: Bei der Nutzung des korrigierten Datensatzes KIDLONG sollten Sie den Datensatz wie folgt zitieren:
Englisch:
Socio-Economic Panel (SOEP), data for years 1984-2009, version 26.1, SOEP, 2011.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2009, Version 26.1, SOEP, 2011.
Kurzversion:
SOEP v26.1.


Survey Instruments 2009: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

3) The Request for Record Linkage in the IAB-SOEP Migration Sample

4) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

8) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

12) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

13) SOEP Scales Manual (updated for SOEP-Core v32.1)

14) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

15) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

17) Multi-Itemskalen im SOEP Jugendfragebogen

18) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

19) Documentation of ISCED Generation Based on the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2 and IAB-BAMF-SOEP Survey of Refugees M3/M4 until 2017

20) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

21) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

22) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite

keyboard_arrow_up