SOEP-Core v24 (Daten 1984-2007)

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002 und zuletzt 2006 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst.

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984 – 2007

DOI: 10.5684/soep.v24
Erhebungszeitraum: 1984–2007
Veröffentlichungsdatum: 07.07.2008
Primärforscher
: Gert. G. Wagner, Joachim R. Frick, Jürgen Schupp, Silke Anger, Jan Goebel, Markus M. Grabka, Olaf Groh-Samberg, Elke Holst, Peter Krause, Martin Kroh, Henning Lohmann, Rainer Pischner, Christian Schmitt, C. Katharina Spieß, Martin Spieß

Datenerhebung: TNS Infratest Sozialforschung GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

Datensatzinformationen:

Anzahl der Einheiten 61.544
Anzahl der Variablen 39.550 in 297 Datensätzen
Datenformat STATA, SPSS, SAS, CSV

Veröffentlichungen:

  • Jan Goebel, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, Jürgen Schupp. 2018. The German Socio-Economic Panel Study (SOEP). Jahrbücher für Nationalökonomie und Statistik / Journal of Economics and Statistics (online first), doi: 10.1515/jbnst-2018-0022
  • Gert G. Wagner; Richard V. Burkhauser, and Frederike Behringer. 1993. The English Language Public Use File of the German Socio-Economic Panel Study, The Journal of Human Resources 28 (2), 429-433.

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Schröder, Carsten, Johannes König, Alexandra Fedorets, Jan Goebel, Markus M. Grabka, Holger Lüthen, Maria Metzing, Felicitas Schikora, and Stefan Liebig. 2020. The economic research potentials of the German Socio-Economic Panel study. German Economic Review 21 (3), 335-371. (https://doi.org/10.1515/ger-2020-0033)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

Die Datenweitergabe 2008 mit den Daten von 1984-2007 enthält für das Jahr 2007 die üblichen wellenspezifischen Datensätze  XPBRUTTO, XP, XPKAL, XPGEN, XHBRUTTO, XH, XHGEN, XKIND und WPLUECKE sowie die aktualisierten Datensätze mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren).

Im Befragungsjahr 2006 wurde eine repräsentative Ergänzungsstichprobe für ganz Deutschland gezogen: die Auffrischungsstichprobe H. Die biografischen Hintergrundinformationen der Befragten in Stichprobe H wurden erstmals in 2007 erhoben. Diese Daten sind nun vollständig in die relevanten Biografiedatensätze (BIOxxxx) integriert worden.

Als Teil der SOEP Innovationsprojekte führte TNS Infratest Sozialforschung im Dezember 2006 eine Nacherhebung durch. Sie wurde bei früheren SOEP-Befragten durchgeführt, die aus Haushalten stammen, die zwischen 2001 und 2004 als endgültigeVerweigerungen klassifiziert wurden. Als Nebenprodukt konnten wir die Informationen über das Geburtsjahr von 21 dieser Personen von fehlend auf einen gültigen Wert setzen. Mehr Informationen finden Sie im Methodenbericht von TNS Infratest Sozialforschung (PDF, 368.88 KB).

Darüber hinaus gibt es folgende Erweiterungen bzw. Modifikationen:

A. Neue und umbenannte Datensätze

COGNIT06:
Im Erhebungsjahr 2006 wurde mit einem Subsample des SOEP kurze Kognitionstests mit dem Ziel durchgeführt, eine Reihe robuster Instrumente zur Verfügung zu haben, die von   geschulten Interviewern nur wenige Minuten bei der Befragung beanspruchen. Nahezu 80% aller zur Teilnahme am Kognitionstest Ausgewählten gaben gültige Antworten. Das hat zur Folge, dass das SOEP jetzt zum ersten Mal Indikatoren zu kognitiven Leistungspotenzialen für mehr als 5.500 Personen bereitstellen kann, angereichert durch unterschiedliche Bildungsinformationen, die auf Abschlüssen und Qualifikationen beruhen. Die erste Wiederholung für diesen Test ist für das Erhebungsjahr 2010 geplant. Eine ausführliche Dokumentation und Auswahlanalyse finden Sie in Schupp et al. (2008) Erfassung kognitiver Leistungspotentiale Erwachsener im Sozio-oekonomischen Panel (SOEP), DIW Berlin, Data Documentation 32 | PDF, 447.63 KB .

PBR_EXIT und PBR_HHCH:
Diese beiden Datensätze ersetzen den ehemaligen Datensatz YPBRUTTO, wobei bei in dieser Datenweitergabe noch beide Varianten verfügbar sind.

MIHINC:
Dieser Datensatz enthält das multipel imputierte monatliche Netto-Haushaltseinkommen für die Jahre 1997 bis 2007. Er ist im long-Format abgelegt (Long-Format: hhnrakt, svyyear, mj, wird in Stata auch mim-Format genannt). Jede fehlende Antwort auf die Frage nach dem Netto-Haushaltseinkommen wurde 10-fach imputiert. Weitere Informationen finden Sie in der Dokumentation von HGEN | PDF, 169.14 KB .

B: Neue Variablen

B.1 Datensatz XPBRUTTO

  • XEWSTATU: Proxyinformation über den Arbeitsmarktstatus von Personen, die in Befragungshaushalten kein Interview gaben.

B.2 Datensatz $PEQUIV

  • P11101$$: Kopie der wellenspezifischen Variablen zur allgemeinen Lebenszufriedenheit

B.3 Datensatz $HGEN

  • I_HINC$$: Multiple imputierte Version von HINC$$, das monatliche Haushaltsnettoeinkommen. Imputationen 1-5 sind als Wide-Format in $HGEN abgelegt (nur für die Jahre 1996-2007), alle generierten Imputationen (10) sind in dem zusätzlichen Datensatz MIHINC in Long-Format abgelegt. Weitere Informationen finden Sie in der Dokumentation zu HGEN | PDF, 169.14 KB .
  • FHINC$$: Imputation Flag für I_HINC$$, 0 bedeutet nicht-imputiert und 1 imputiert.

C. Überarbeitete Variablen

C.1 Im Datensatz $PKAL

  • $P2D03 + $P2E03: In einigen Fällen war in den Wellen U-W (in den Jahren 2004-2006)  fälschlicherweise "keine Antwort" (-1) auf "trifft nicht zu" (-2) gesetzt worden. Dies wurde jetzt nachträglich korrigiert.

C.2 Im Datensatz HHRF/PHRF

  • WPHRF*: Alle Gewichtungsfaktoren für das Jahr 2006 sind nun an den Mikrozensus 2006 angepasst. Auch die Gewichtungsfaktoren für das Jahr 2007 sind an den Mikrozensus-Daten von 2006 angepasst worden; sie müssen deswegen als vorläufig für Personen und Haushalte in Deutschland gelten und werden voraussichtlich mit der nächsten Datenweitergabe aktualisiert.
  • VHHRF + VHHRF1: 1 Haushalt aus Sample G  musste korrigiert und auf 0 gesetzt werden.

C.3 Im Datensatz  $PGEN

  • LFS$$: Die Variable "Arbeitsmarktstatus" wurde für alle Wellen in Bezug auf  eine genauere Einordnung von Personen in den Status "nicht-erwerbstätig und älter als 65" (Kategorie 2) verbessert. Inzwischen wird die Information über den Geburtsmonat einer Person genutzt, um zu bestimmen, ob sie zur Zeit des Interviews älter als 65 Jahre war.

D. Fehlerkorrekturen

D.1 Im Datensatz VH and WH

Es gab eine Korrektur der Werte Labels für die Variablen, die auf die Eigentümer einer Wohnung hinweisen  (VH27 and WH27), bitte beachten Sie die richtigen Ausprägungen in der unten stehenden Tabelle.

Variablenname: Eigentümer der Wohnung

WertFalschRichtig

-2 Trifft nicht zu Trifft nicht zu
-1 Keine Antwort Keine Antwort
1 selbstgenutzte Wohnung Kommunale Wohnung
2 Kommunale Wohnung Genossenschaftliche Wohnung
3 Genossenschaftliche Wohnung Betriebs-/ Werkswohnung
4 Betriebs-/ Werkswohnung Privater Eigentümer
5 Privater Eigentümer Weiß nicht


D.2 Im Datensatz $PGEN

  • EGP$$: Die Variable "Erikson and Goldthorpe Class Category" (internationaler Index des beruflichen Status) wurde bezüglich der Zuordnung von Personen zur Kategorie (18) "nicht erwerbstätig - in Rente" korrigiert. Bis jetzt wurden fälschlicherweise alle Rentenempfänger, d.h. alle Empfänger von Altersrente und die Empfängerinnen von Witwen- und Waisenrenten als  "nicht erwerbstätig - in Rente" klassifiziert, falls keine andere Kategorie zutraf. In der korrigierten Generierung der EGP$$ Variable, die für alle Wellen durchgeführt wurde, werden nicht-erwerbstätige Personen nur dann in diese Kategorie eingeordnet, wenn sie Bezieher/innen von Altersrente sind oder wenn sie  Bezieher/innen von Waisen- bzw. Witwenrente UND älter als 60 Jahre sind. Darüber hinaus werden bei Fehlen der Information über Rentenbezug die Informationen aus ARTKALEN (retrospektive Information aus dem Aktivitätskalender des vorangegangenen Jahres) im Generierungsprozess genutzt, um zu bestimmen, ob eine Person zum Zeitpunkt des Interviews in Rente oder Vorruhestand ist. Alle anderen nicht arbeitenden Personen werden in Kategorie (-2) "trifft nicht zu" eingeordnet, solange sie nicht als arbeitslos registriert sind (Kategorie 15).
  • ST$$IB: Das gleiche Problem der falschen Zuordnung von Personen zur Kategorie "Rentner/in" (13) trifft auch für die Variable "Berufliche Stellung" zu und wurde für alle Wellen in der gleichen Weise wie für EGP$$ korrigiert.
  • NACE$$: Die Variable "2-stellige Branchenvercodung nach NACE" hatte bisher einige Inkonsistenzen bezüglich der Bezeichnungen. Insbesondere die Bezeichnungen für den Code (90) "Abwasser- und  Abfallbeseitigung, Sanierung oder ähnliches" und Code (95) "Private Haushalte mit Angestellten" mussten ausgetauscht werden. Einige andere Bezeichnungen waren nicht genau genug und wurden für alle Wellen präzisiert.
  • IS88$$, ISEI$$, MPS$$, SIOPS$$, KLAS$$, EGP$$: Die Frage, auf die sich diese Variablen beziehen, wird nicht allen erwerbstätigen Personen jedes Jahr gestellt. In den Befragungsjahren 1985, 1986, 1987, 1988, 1990 (West), 1992 (West), 1994, 1996, 1999, 2001, 2003, 2005 und 2006 wurde sie nur Erstbefragten oder Berufswechslern gestellt. Deswegen sollten in Jahren mit Teilbefragungen die Variablen für alle berufstätigen Personen ohne Jobwechsel die vorhandene Information des Vorjahres übernommen werden. Diese Angaben wurden fälschlicherweise für einige Personen nicht genutzt. Dieser Fehler ist nun behoben, da für alle Wellen die betroffenen Variablen in konsistenter Weise neu generiert wurden.

 04.12.2008 Im Rahmen weitergehender Prüfungen wurden einige Probleme in der aktuellen, auf DVD verfügbaren Datendistribution 1984-2007 (Wellen A-X) identifiziert.

Um einen Download-Zugang zu den korrigierten Datensätzen zu erhalten, schicken Sie bitte eine E-mail an soepmail@diw.de oder rufen Sie die SOEPhotline an unter +49 30 89789 292.

Zum Entpacken der Dateien benötigen Sie das für die aktuelle Datendistribution 1984-2007 gültige Passwort, bzw. das für den Zugriff auf die erweiterten Regionalinformationen im Datensatz GGKBOU notwendige Passwort. Sollten Sie noch nicht über die aktuelle Datenlieferung verfügen, setzen Sie sich bitte mit unserer Hotline (soepmail@diw.de) in Verbindung.

Die korrigierten Datensätze sind:
  • HHRF (Hochrechnungsfaktoren Haushalte): Bei der Bereitstellung der Hochrechnungsfaktoren für die Haushalte wurde bei den Variablen WHHRFALL und XHHRFALL fälschlicherweise eine Vorabversion weitergegeben. Diese sind jetzt durch die geprüfte Version ersetzt.
  • PBIOSPE: Wegen eines erst jetzt entdeckten Einlesefehlers wurde ein Teil der seit Welle U neu- und nacherhobenen Erwerbsbiographien nicht korrekt abgelegt. PBIOSPE wurde daher rückwirkend ab Welle U überarbeitet.
  • XHBRUTTO: Hier wurde bei der Variablen XBULA ein fehlerhafter Code für die Bundesländer in Ostdeutschland korrigiert.
  • WP: Updates wurden durchgeführt bei WKLAS, WIS88, WIS88N und WKLASN. Dies war notwendig, da zuvor einige wenige Angaben mit Missings überschrieben wurden.
  • WPGEN/XPGEN: Aufgrund der Korrekturen von WKLAS und WIS88  in WP war eine Aktualisierung der darauf basierenden Variablen IS8806, ISEI06, MPS06, SIOPS06  EGP06 und KLAS06 erforderlich. Darüber hinaus wurde in Folge der Überarbeitung von PBIOSPE (s.o.) ein Update bei EXPFT$$, EXPPT$$ undEXPUE$$ durchgeführt.
  • HBRUTT00: Auf Grund eines Konflikts der Haushaltsnummern für das erweiterte Ur-Brutto der Stichprobe F wurde bei einigen Fällen die Haushaltsnummer geändert. Dies betrifft nur Fälle, die nicht an der Befragung teilgenommen haben.
  • GGKBOU: Als Folge der Änderung in HBRUTT00 wurden in diesem Datensatz ebenfalls in einigen Fällen  die HHNR angepasst.


Survey Instruments 2007: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

3) The Request for Record Linkage in the IAB-SOEP Migration Sample

4) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

8) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

12) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

13) SOEP Scales Manual (updated for SOEP-Core v32.1)

14) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

15) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

17) Multi-Itemskalen im SOEP Jugendfragebogen

18) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

19) Documentation of ISCED Generation Based on the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2 and IAB-BAMF-SOEP Survey of Refugees M3/M4 until 2017

20) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

21) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

22) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite

keyboard_arrow_up