Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002 und zuletzt 2006 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst.
Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984 – 2008
DOI: 10.5684/soep.v25
Erhebungszeitraum: 1984–2008
Veröffentlichungsdatum: 27.10.2009
Primärforscher: Gert. G. Wagner, Joachim R. Frick, Jürgen Schupp, Silke Anger, Jan Goebel, Markus M. Grabka, Elke Holst, Peter Krause, Martin Kroh, Henning Lohmann, Christian Schmitt, C. Katharina Spieß
Datenerhebung: TNS Infratest Sozialforschung GmbH
Population: Personen in Privathaushalten in der Bundesrepulik Deutschland
Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.
Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).
Datensatzinformationen:
| Anzahl der Einheiten | 62.101 |
| Anzahl der Variablen | 41.348 in 309 Datensätzen |
| Datenformat | STATA, SPSS, SAS, CSV |
Veröffentlichungen:
In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI Zur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und folgende Referenzen zitiert werden:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Migrations-Stichproben ausschliessen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Geflüchteten-Stichproben ausschliessen, dann zitieren Sie bitte auch:
Herbert Brücker, Yuliya Kosyakova, Nina Rother, Sabine Zinn, Elisabeth Liebau, Wenke Gider, Silvia Schwanhäuser, & Manuel Siegert. 2025. Exploring Integration and Migration Dynamics: The Research Potentials of a Large-Scale Longitudinal Household Study of Refugees in Germany. European Sociological Review. https://doi.org/10.1093/esr/jcaf032.
Wenn Sie bei Ihrer Analyse die Daten der SOEP-LEE2 Befragungen nutzen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse noch fachspezifischer referieren möchten, dann zitieren Sie bitte auch:
Die Datenweitergabe 2009 mit den Daten von 1984-2008 (Welle 1-25) enthält weitgehende Verbesserungen, Ergänzungen und Änderungen. Neben den üblichen wellenspezifischen Datensätzen YPBRUTTO, YP, YPKAL, YPGEN, YHBRUTTO, YH, YHGEN, YKIND und XPLUECKE sowie den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren) finden Sie hier die wichtigsten Änderungen:
Das SOEP gibt ab sofort - in einer Beta-Version - die Daten in dem einem nutzerfreundlicheren Format, genannt 'SOEPlong' weiter. Wir haben darüber bereits im SOEPnewsletter 80/2008 berichtet und danken allen, die an diesem Projekt mitgewirkt haben.
Diese neue und vorläufige Version der SOEP-Daten im long-Format geben wir gerne auf Anfrage weiter. Wir empfehlen nur jedoch nur 'Power Usern' mit entsprechenden Vorkenntnissen der Paneldatenanalyse im allgemeinen und dem SOEP im Besonderen die Bestellung dieser Version. Sie sind herzlich eingeladen mit uns an der Verbesserung und Weiterentwicklung des Datenmanagements zu arbeiten.
Diese Version enthält alle Daten und kann deswegen im Wesentlichen schon für endgültige Analysen genutzt werden. Sie ist nichts desto trotz eine vorläufige. Wir möchten unerfahrenen Nutzerinnen und Nutzern daher vorläufig von der Verwendung dieser Version abraten. Falls Sie als 'SOEP-Neuling' mit diesem neuen Format arbeiten wollen, sollten Sie zumindest Erfahrungen mit anderen Panel-Datensätzen gesammelt haben.
A Neue und umbenannte Datensätze
A.1. Datensatz BIOAGE06
Die aktuelle Datenweitergabeversion enthält den neuen Datensatz BIOAGE06. Er stellt die 2008 das erste Mal erhobenen Daten aus dem speziellen Mutter-Kind-Fragebogen zur Verfügung, der von Müttern von 5- bis 6-jährigen Vorschulkindern ausgefüllt wurde. Die Daten ergänzen das Wissen über eine Geburtskohorte, die das erste Mal 2002/2003 mit dem gesonderten Neugeborenen-Fragebogen 'befragt' wurde.
Die neuen Daten über die Vorschulkinder erheben Gewicht und Größe der Kinder, Informationen über ihren Gesundheitszustand, die Betreuungssituation, ihre Aktivitäten mit und ohne die Mutter und ihren Medienkonsum. Insbesondere die Betreuungssituation wird detailliert erhoben. Darüber hinaus wurden zum ersten Mal valide Informationen über die Persönlichkeit des Kindes (basierend auf dem 'Big Five' Persönlichkeitsmerkmalen, die auch im Peronenfragebogen für Erwachsene erfragt werden) und über ihr sozio-emotionales Verhalten gesammelt (beobachtet mit einer modifizierten Version des „Strength-and-Difficulities Questionnaire" (SDQ) nach Goodman (1997)).
A.2 Datensatz MOVEDIST
In diesem Datensatz stellen wir Informationen zum Wohnsitzwechsel zur Verfügung. Basierend auf den Geo-Koordinaten auf Block-Ebene erhalten Sie die Daten über die Entfernung (in Metern) zwischen dem früheren und dem gegenwärtigen Wohnsitz. Allerdings gibt es diese Informationen nur für Umzüge seit 2000.
Diese Daten sind NICHT auf der Standard-Datenweitergabe-DVD enthalten, sondern wir geben diese Informationen nur im Zusammenhang mit den Raumordnungsregionen auf einer gesonderten CD-ROM weiter. Sie benötigen also einen erweiterten Datenweitergabevertrag, der ein Datenschutzkonzept beinhaltet, wenn Sie diese Daten nutzen wollen. Nach Abschluss der Vertragserweiterung erhalten Sie diese Daten auf einer (kostenlosen) CD-ROM. Bei entsprechendem Interesse wenden Sie sich bitte an SOEPmail@diw.de.
B. Neue Variablen
B.1 Datensatz PPFAD
B.2 Datensatz PFLEGE
B.3 Datensatz PBIOSPE
B.4 Datensatz BIOPAREN
C. Überarbeitete Variablen
C.1 Datensatz PWEALTH und HWEALTH
Im Jahr 2007 wurden alle Personen, die 17 Jahre oder älter waren, über ihr Vermögen befragt, eine Wiederholung der Befragung von 2002. Diese 'Rohdaten' waren bereits mit der Welle 24 weitergegeben worden. Mit der aktuellen Datenweitergabe wurden sie nun zusammen mit den Daten von 2002 im long-Format aufbereitet und in den Datensätzen PWEALTH (für Personendaten) und HWEALTH (für Haushalte aggregierte Daten) zusammengefasst.
Fehlende Werte, die aufgrund von Antwortverweigerung bei einzelnen Fragen (item non-response) oder Nicht-Teilnahme einzelner Personen (partial unit non-response, hier: fehlende Interviews in ansonsten befragten Haushalten) entstanden sind, wurden in komplexen Prozessen multipel imputiert, unter Zuhilfenahme längsschnittlicher Informationen. Eine ausführliche Dokumentation ist in Vorbereitung. Erste Analysen wurden vorgenommen und in einem DIW Wochenbericht veröffentlicht (Joachim R. Frick und Markus M. Grabka: Gestiegene Vermögensungleichheit in Deutschland, DIW-Wochenbericht 04/2009 (PDF, 269.73 KB))
C.2 Datensatz $PEQUIV
C.3 Datensatz HHRF/PHRF
C.4 Datensatz $PGEN
C.5 Datensatz $HGEN
C.6 Datensatz PPFAD
10.02.2010
Fehlerkorrektur der Hochrechnungsfaktoren für Kinder in der Welle Y (2008) herunterladbar
Kinder, die 2002 geboren wurden (somit in der Befragungswelle Y (2008) 6 Jahre alt waren) und deren Eltern den für diese Kohorte neu eingeführten Fragebogen Kind ausgefüllt haben, haben versehentlich keinen gültigen Wert für die Variable zur wellenspezifischen Querschnittshochrechnung erhalten. Betroffen sind 237 Kinder (identifizierbar über YNETTO=23), bei denen die Variable YPHRF in der Datei PHRF und die Variable W1110108 in der Datei YPEQUIV, also die jeweiligen Personengewichte, korrigiert werden müssen, die Werte für die Haushaltsgewichte sind korrekt. Auch gewichtete Analysen von erwachsenen Befragten, die zum Beispiel Werte aus den YP- und YPGEN-Dateien nutzen, sind von diesem Fehler nicht betroffen. Nutzerinnen und Nutzer, die auch die 6-Jährigen in eine gewichtete Auswertung einbeziehen möchten, sollten sich die aktualisierte Version der Dateien YPHRF und YPEQUIV herunterladen.
Für weitere Informationen zum Herunterladen der Daten über eine personalisierten URL schicken Sie bitte eine E-Mail an soepmail@diw.de.
05.12.2009
Im Datensatz BIOIMMIG ist eine fehlerhafte Zuordnung zu der Variable BIGOBACK (der Variable zur Rückkehrwahrscheinlichkeit) für die Kategorien -2 ("trifft nicht zu") und 2 ("Ja, wahrscheinlich") für einige Fälle seit 2001 getroffen worden.
Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:
Skript für Stata (TXT, 320.45 KB)
Skript für SPSS (TXT, 289.2 KB)
Skript für SAS (TXT, 309.72 KB)
09.11.2009
Kurz nach Fertigstellung der DVD ist ein Fehler bei der Datengenerierung im File BIOPAREN identifiziert worden.
Es handelt sich um die Variablen zur Religionszugehörigkeit der Eltern (MRELI, VRELI). Die Codes für die Ausprägungen „sonstige christliche Religionszugehörigkeit", „islamische Religionsgemeinschaft" sowie „andere Religionszugehörigkeit" bedürfen einer Korrektur. Die übrigen Ausprägungen der Variable sind nicht betroffen.
Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:
Skript für Stata (TXT, 75.48 KB)
Skript für SPSS (TXT, 64.96 KB)
Skript für SAS (TXT, 75.55 KB)
Sollten Sie ein Update für ein anderes Programm brauchen, wenden Sie sich bitte an die SOEP-Hotline (soepmail@diw.de).
Survey Instruments 2008: 2) Erhebungsinstrumente 2008 Field-de
Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite
1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008
2) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2
3) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents
4) The Request for Record Linkage in the IAB-SOEP Migration Sample
5) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013
6) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK
7) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014
8) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32
9) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel
10) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel
11) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten
12) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version
13) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing
14) SOEP Scales Manual (updated for SOEP-Core v32.1)
15) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)
16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben
17) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben
18) Multi-Itemskalen im SOEP Jugendfragebogen
19) Dokumentation zum Entwicklungsprozess des Moduls „Einstellungen zu sozialer Ungleichheit“ im SOEP (v38)
20) SOEP-CoV: Project and Data Documentation
21) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution
22) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)
23) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE
24) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables
25) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey
26) SOEP-Core v34: Codebook for the EU-SILC-Like Panel for Germany Based on the SOEP
27) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)
28) SOEP-Core v36: Codebook for the EU-SILC-like panel for Germany based on the SOEP
Alle Dokumentationen zum Filtern finden Sie auf dieser Seite
1) SOEP 2008 – Methodenbericht zum Befragungsjahr 2008 (Welle 25) des Sozio-oekonomischen Panels