SOEP-Core v25 (Daten 1984-2008)

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002 und zuletzt 2006 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst.

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984 – 2008

DOI: 10.5684/soep.v25
Erhebungszeitraum: 1984–2008
Veröffentlichungsdatum: 27.10.2009
Primärforscher: Gert. G. Wagner, Joachim R. Frick, Jürgen Schupp, Silke Anger, Jan Goebel, Markus M. Grabka, Elke Holst, Peter Krause, Martin Kroh, Henning Lohmann, Christian Schmitt, C. Katharina Spieß

Datenerhebung: TNS Infratest Sozialforschung GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

Datensatzinformationen:

Anzahl der Einheiten 62.101
Anzahl der Variablen 41.348 in 309 Datensätzen
Datenformat STATA, SPSS, SAS, CSV

Veröffentlichungen:

  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber. 2008. Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland – Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (4), 301-328. (download)
  • Jan Goebel, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, Jürgen Schupp. 2018. The German Socio-Economic Panel Study (SOEP). Jahrbücher für Nationalökonomie und Statistik / Journal of Economics and Statistics (online first), doi: 10.1515/jbnst-2018-0022

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Schröder, Carsten, Johannes König, Alexandra Fedorets, Jan Goebel, Markus M. Grabka, Holger Lüthen, Maria Metzing, Felicitas Schikora, and Stefan Liebig. 2020. The economic research potentials of the German Socio-Economic Panel study. German Economic Review 21 (3), 335-371. (https://doi.org/10.1515/ger-2020-0033)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

Die Datenweitergabe 2009 mit den Daten von 1984-2008 (Welle 1-25) enthält weitgehende Verbesserungen, Ergänzungen und Änderungen. Neben den üblichen wellenspezifischen Datensätzen YPBRUTTO, YP, YPKAL, YPGEN, YHBRUTTO, YH, YHGEN, YKIND und XPLUECKE sowie den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren) finden Sie hier die wichtigsten Änderungen:

Das SOEP gibt ab sofort - in einer Beta-Version - die Daten in dem einem nutzerfreundlicheren Format, genannt 'SOEPlong' weiter. Wir haben darüber bereits im SOEPnewsletter 80/2008 berichtet und danken allen, die an diesem Projekt mitgewirkt haben.
Diese neue und vorläufige Version der SOEP-Daten im long-Format geben wir gerne auf Anfrage weiter. Wir empfehlen nur jedoch nur 'Power Usern' mit entsprechenden Vorkenntnissen der Paneldatenanalyse im allgemeinen und dem SOEP im Besonderen die Bestellung dieser Version. Sie sind herzlich eingeladen mit uns an der Verbesserung und Weiterentwicklung des Datenmanagements zu arbeiten.
Diese Version enthält alle Daten und kann deswegen im Wesentlichen schon für endgültige Analysen genutzt werden. Sie ist nichts desto trotz eine vorläufige. Wir möchten unerfahrenen Nutzerinnen und Nutzern daher vorläufig von der Verwendung dieser Version abraten. Falls Sie als 'SOEP-Neuling' mit diesem neuen Format arbeiten wollen, sollten Sie zumindest Erfahrungen mit anderen Panel-Datensätzen gesammelt haben.

A Neue und umbenannte Datensätze

A.1. Datensatz BIOAGE06
Die aktuelle Datenweitergabeversion enthält den neuen Datensatz BIOAGE06. Er stellt die 2008 das erste Mal erhobenen Daten aus dem speziellen Mutter-Kind-Fragebogen zur Verfügung, der von Müttern von 5- bis 6-jährigen Vorschulkindern ausgefüllt wurde. Die Daten ergänzen das Wissen über eine Geburtskohorte, die das erste Mal 2002/2003 mit dem gesonderten Neugeborenen-Fragebogen 'befragt' wurde.
Die neuen Daten über die Vorschulkinder erheben Gewicht und Größe der Kinder, Informationen über ihren Gesundheitszustand, die Betreuungssituation, ihre Aktivitäten mit und ohne die Mutter und ihren Medienkonsum. Insbesondere die Betreuungssituation wird detailliert erhoben. Darüber hinaus wurden zum ersten Mal valide Informationen über die Persönlichkeit des Kindes (basierend auf dem 'Big Five' Persönlichkeitsmerkmalen, die auch im Peronenfragebogen für Erwachsene erfragt werden) und über ihr sozio-emotionales Verhalten gesammelt (beobachtet mit einer modifizierten Version des „Strength-and-Difficulities Questionnaire" (SDQ) nach Goodman (1997)).

A.2 Datensatz MOVEDIST
In diesem Datensatz stellen wir Informationen zum Wohnsitzwechsel zur Verfügung. Basierend auf den Geo-Koordinaten auf Block-Ebene erhalten Sie die Daten über die Entfernung (in Metern) zwischen dem früheren und dem gegenwärtigen Wohnsitz. Allerdings gibt es diese Informationen nur für Umzüge seit 2000.

Diese Daten sind NICHT auf der Standard-Datenweitergabe-DVD enthalten, sondern wir geben diese Informationen nur im Zusammenhang mit den Raumordnungsregionen auf einer gesonderten CD-ROM weiter. Sie benötigen also einen erweiterten Datenweitergabevertrag, der ein Datenschutzkonzept beinhaltet, wenn Sie diese Daten nutzen wollen. Nach Abschluss der Vertragserweiterung erhalten Sie diese Daten auf einer (kostenlosen) CD-ROM. Bei entsprechendem Interesse wenden Sie sich bitte an SOEPmail@diw.de.

B. Neue Variablen

B.1 Datensatz PPFAD

  • MIGBACK / MIGINFO: Zwei neue Variablen zur Bestimmung des Migrationshintergrunds. MIGBACK enthält die zeitunabhängige Information über den Migrationshintergrund einer Person, die sich aus den eigenen und den Angaben der Eltern ergibt. Um eine größtmögliche Transparenz bezüglich der Generierung von MIGBACK zu gewährleisten, enthält die Variable MIGINFO Angaben zu den zugrunde liegenden Quellvariablen. Die genaue Beschreibung finden Sie in der ausführlichen Dokumentation der Biografiedaten (PDF, 0.92 MB) (im Kapitel 2.3) oder in der Dokumentation von PPFAD (PDF, 0.53 MB).

B.2 Datensatz PFLEGE

    • PAY und STUFE: Zwei neue Variablen über bezahlte Pflege (PAY) und die Pflegestufe (STUFE)

 

B.3 Datensatz PBIOSPE

    • Der Prozess der Datengenerierung von PBIOSPE wurde komplett überarbeitet, ohne die grundlegenden Prinzipien zu verändern. Daraus resultieren nur wenige, kaum wahrnehmbare Abweichungen in den Hauptvariablen, die den Konsistenzchecks der Daten geschuldet sind. Es lassen sich aber einige sichtbare Änderungen in Form von zusätzlichen Variablen oder zusätzlichen Werten bei bereits bestehenden Variablen beobachten. Die detaillierte Beschreibung finden Sie in unserer Dokumentation der Biografiedaten.

 

B.4 Datensatz BIOPAREN

  • In BIOPAREN gibt es sowohl einige neue Variablen über das Alter der Eltern zum Zeitpunkt der Biographiedatenerhebung als auch Überarbeitungen bestehender Variablen.
  • BIO: Informationsvariable, die angibt, aus welchem Datensatz die Informationen zu den Eltern stammen ($LELA oder $JUGEND)
  • ALTER / VALTER / MALTER: Alter der Befragungsperson / des Vaters / der Mutter jeweils zum Zeitpunkt des Biografie-Interviews
  • VNAT / MNAT: Neuerungen in den Variablen über die Nationalität der Eltern

  • Achtung: Bei der Datengenerierung ist erst nach der Herstellung der DVD ein Fehler entdeckt worden, der die Religionszugehörigkeit der Eltern betrifft.
    nähere Informationen

C. Überarbeitete Variablen

C.1 Datensatz PWEALTH und HWEALTH

Im Jahr 2007 wurden alle Personen, die 17 Jahre oder älter waren, über ihr Vermögen befragt, eine Wiederholung der Befragung von 2002. Diese 'Rohdaten' waren bereits mit der Welle 24 weitergegeben worden. Mit der aktuellen Datenweitergabe wurden sie nun zusammen mit den Daten von 2002 im long-Format aufbereitet und in den Datensätzen PWEALTH (für Personendaten) und HWEALTH (für Haushalte aggregierte Daten) zusammengefasst.
Fehlende Werte, die aufgrund von Antwortverweigerung bei einzelnen Fragen (item non-response) oder Nicht-Teilnahme einzelner Personen (partial unit non-response, hier: fehlende Interviews in ansonsten befragten Haushalten) entstanden sind, wurden in komplexen Prozessen multipel imputiert, unter Zuhilfenahme längsschnittlicher Informationen. Eine ausführliche Dokumentation ist in Vorbereitung. Erste Analysen wurden vorgenommen und in einem DIW Wochenbericht veröffentlicht (Joachim R. Frick und Markus M. Grabka: Gestiegene Vermögensungleichheit in Deutschland, DIW-Wochenbericht 04/2009 (PDF, 269.73 KB))

C.2 Datensatz $PEQUIV

C.3 Datensatz HHRF/PHRF

  • $HHRF/$PHRF:Die jährlichen SOEP Gewichts- und Hochrechnungsfaktoren für Querschnitte wurden umfassend überarbeitet und neu randangepasst; dabei erfolgte auch eine bessere regionale Kalibrierung der Gewichte.
    Kurzdokumentation (englisch) (PDF, 87.06 KB)

C.4 Datensatz $PGEN

  • EMPLST$$: Dieser Erwerbsstatus-Variablen wurde eine neue Kategorie hinzugefügt. Seit 1998 enthalten die SOEP-Daten Informationen über die Beschäftigung in einer beschützenden Werkstätte. Da die betroffenen Personen nicht angeben, ob sie Vollzeit, Teilzeit oder unregelmäßig arbeiten, wurde die neue Kategorie "beschützende Werkstätte" eingeführt.

C.5 Datensatz $HGEN

  • Die wohnungsbezogenen Variablen im wellenspezifischen $HGEN-Datensatz wurden komplett überarbeitet. Ergänzungen betreffen die vollständige Imputation fehlender Werte (bei item-non-response) für die wohnbezogenen Variablen zu  'Zahl der Wohnräume', 'Heizkosten in Euro', 'Nettomiete ohne Heiz-/Warmwasserkosten in Euro' sowie die neu generierte Variable 'kalte Betriebskosten in Euro'. Schließlich zeigen ggf. 'Flagvariablen' den Imputationsstatus an.
  • Hinweis für erfahrene SOEP-Nutzerinnen und -Nutzer: Die meisten Variablennamen in $HGEN wurden verändert.

C.6 Datensatz PPFAD

    • TODJAHR und TODINFO: Um Panelmortalität von demografischen Gründen des Ausscheidens aus der SOEP-Studie unterscheiden zu können, hat TNS Infratest verschiedene Studien zum gegenwärtigen Aufenthalt von Panelausfällen, d.h. früheren Teilnehmerinnen und Teilnehmern der Studie, durchgeführt. Infolgedessen wurden 17.195 Personen lokalisiert. In 981 Fällen waren die früheren Befragten verstorben. Insgesamt können im SOEP bis 2008 3.781 Verstorbene identifiziert werden (vgl. auch die Dokumentation der Variablen in der PPFAD-Dokumentation). Weitere Informationen finden Sie in dem Methodenbericht von TNS Infratest: Wiederbefragung von Panelausfällen (PDF, 368.88 KB) (2006).



10.02.2010

Fehlerkorrektur der Hochrechnungsfaktoren für Kinder in der Welle Y (2008) herunterladbar

Kinder, die 2002 geboren wurden (somit in der Befragungswelle Y (2008) 6 Jahre alt waren) und deren Eltern den für diese Kohorte neu eingeführten Fragebogen Kind ausgefüllt haben, haben versehentlich keinen gültigen Wert für die Variable zur wellenspezifischen Querschnittshochrechnung erhalten. Betroffen sind 237 Kinder (identifizierbar über YNETTO=23), bei denen die Variable YPHRF in der Datei PHRF und die Variable W1110108 in der Datei YPEQUIV, also die jeweiligen Personengewichte, korrigiert werden müssen, die Werte für die Haushaltsgewichte sind korrekt. Auch gewichtete Analysen von erwachsenen Befragten, die zum Beispiel Werte aus den YP- und YPGEN-Dateien nutzen, sind von diesem Fehler nicht betroffen. Nutzerinnen und Nutzer, die auch die 6-Jährigen in eine gewichtete Auswertung einbeziehen möchten, sollten sich die aktualisierte Version der Dateien YPHRF und YPEQUIV herunterladen.

Für weitere Informationen zum Herunterladen der Daten über eine personalisierten URL schicken Sie bitte eine E-Mail an soepmail@diw.de.

05.12.2009

Im Datensatz BIOIMMIG ist eine fehlerhafte Zuordnung zu der Variable BIGOBACK (der Variable zur Rückkehrwahrscheinlichkeit) für die Kategorien -2 ("trifft nicht zu") und 2 ("Ja, wahrscheinlich") für einige Fälle seit 2001 getroffen worden.

Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:

Skript für Stata (TXT, 320.45 KB)

Skript für SPSS (TXT, 289.2 KB)

Skript für SAS (TXT, 309.72 KB)

 09.11.2009

Kurz nach Fertigstellung der DVD ist ein Fehler bei der Datengenerierung im File BIOPAREN identifiziert worden.

Es handelt sich um die Variablen zur Religionszugehörigkeit der Eltern (MRELI, VRELI). Die Codes für die Ausprägungen „sonstige christliche Religionszugehörigkeit", „islamische Religionsgemeinschaft" sowie „andere Religionszugehörigkeit" bedürfen einer Korrektur. Die übrigen Ausprägungen der Variable sind nicht betroffen.

Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:

Skript für Stata (TXT, 75.48 KB)

Skript für SPSS (TXT, 64.96 KB)

Skript für SAS (TXT, 75.55 KB)

Sollten Sie ein Update für ein anderes Programm brauchen, wenden Sie sich bitte an die SOEP-Hotline (soepmail@diw.de).


Survey Instruments 2008: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

3) The Request for Record Linkage in the IAB-SOEP Migration Sample

4) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

8) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

12) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

13) SOEP Scales Manual (updated for SOEP-Core v32.1)

14) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

15) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

17) Multi-Itemskalen im SOEP Jugendfragebogen

18) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

19) Documentation of ISCED Generation Based on the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2 and IAB-BAMF-SOEP Survey of Refugees M3/M4 until 2017

20) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

21) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

22) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite

keyboard_arrow_up