Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002 und zuletzt 2006 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst.
Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984 - 2009
DOI: 10.5684/soep.v26
Erhebungszeitraum: 1984-2009
Veröffentlichungsdatum: 17.09.2010
Primärforscher: Gert. G. Wagner, Joachim R. Frick, Jürgen Schupp, Silke Anger, Jan Goebel, Markus M. Grabka, Elke Holst, Peter Krause, Martin Kroh, Elisabeth Liebau, Henning Lohmann, Christian Schmitt, C. Katharina Spieß
Datenerhebung: TNS Infratest Sozialforschung GmbH
Population: Personen in Privathaushalten in der Bundesrepulik Deutschland
Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.
Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).
Datensatzinformationen:
| Anzahl der Einheiten | 66.189 |
| Anzahl der Variablen | 43.155 in 322 Datensätzen |
| Datenformat |
STATA, SPSS, SAS, CSV |
Veröffentlichungen:
In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI Zur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und folgende Referenzen zitiert werden:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Migrations-Stichproben ausschliessen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Geflüchteten-Stichproben ausschliessen, dann zitieren Sie bitte auch:
Herbert Brücker, Yuliya Kosyakova, Nina Rother, Sabine Zinn, Elisabeth Liebau, Wenke Gider, Silvia Schwanhäuser, & Manuel Siegert. 2025. Exploring Integration and Migration Dynamics: The Research Potentials of a Large-Scale Longitudinal Household Study of Refugees in Germany. European Sociological Review. https://doi.org/10.1093/esr/jcaf032.
Wenn Sie bei Ihrer Analyse die Daten der SOEP-LEE2 Befragungen nutzen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse noch fachspezifischer referieren möchten, dann zitieren Sie bitte auch:
Die Datenweitergabe 2010 mit den Daten von 1984-2009 (v26) enthält weitgehende Verbesserungen, Ergänzungen und änderungen. Neben den üblichen wellenspezifischen Datensätzen ZPBRUTTO, ZP, ZPKAL, ZPGEN, ZPAGE17, ZHBRUTTO, ZH, ZHGEN, ZKIND and YPLUECKE sowie den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren) finden Sie hier die wichtigsten änderungen
1. Beta Version des 'long'-Formats
Die SOEP-Daten werden dieses Jahr erstmalig in der Standard-Datenweitergabe in diesem nutzerfreundlicheren Format, genannt 'SOEPlong' weitergegeben - in einer Beta-Version. SOEPlong ist eine Art komprimierte Version der SOEP-Daten: Statt der Weitergabe als einzelne wellenspezifische Datensätze werden alle Jahre und Kohorten im 'long format' zusammengefasst weitergegeben.
2. Neues Sample I
Als Beitrag zu den laufenden SOEP-Innovationen begann im Herbst 2009 die Feldarbeit für eine neue Stichprobe I. Sie wurde genutzt, um den Effekt unterschiedlicher Incentivierungsstrategien auf die Beteiligungsquote zu testen und wird Teil eines umfassenderen Innovationssamples werden. Im SOEPnewsletter 89 hatten wir unsere Pläne in dieser Richtung beschrieben.
In vier zufällig ausgewählten Gruppen wurden folgende Anreizstrategien genutzt:
Die Daten der neuen Stichprobe I sind in der aktuellen Datenweitergabe (SOEP, v26) enthalten, aber aufgrund der spezifischen Merkmale des Samples konnte kein gemeinsames Gewichtungsschema mit den anderen SOEP-Stichproben zur Verfügung gestellt werden: In Stichprobe I wurden alle Antwortverweigerer der vier Gruppen noch einmal schriftlich befragt. Die Biografie-Informationen für die TeilnehmerInnen von Stichprobe I konnten noch nicht in die Biografiedatensätze integriert werden, da diese standardmäßig erst in der 2. Welle erhoben werden. Dasselbe gilt für Biografie-Informationen im Datensatz PPFAD, so ist z.B. die Variable MIGBACK für diese Stichprobe komplett auf -2 gesetzt.
Darüber hinaus wurden folgende Ergänzungen und änderungen vorgenommen:
3. Neue und umbenannte Datensätze
4. Neue Variablen
4.1 Datensatz $HGEN
Es gibt zwei neue Variablen, die die Qualität einer Wohnung beschreiben :
4.2 Datensatz $PEQUIV:
4.3 Datensatz $HBRUTTO - Kalenderjahr des Interviews
5. überarbeitete Variablen
5.1 Datensatz $HGEN
5.2 Datensätze $KIND – KIDLONG
5.3 Datensätze BIOMARSM/BIOMARSY
5.4 Datensatz BIOTWIN
Der Datensatz BIOTWIN enthält ab dieser Welle Z 100 Fälle mehr. Dieser beachtliche Anstieg der Fallzahl ist das Ergebnis einer Anpassung im Datengenerierungsprozess: Im Gegensatz zum bisherigen Verfahren werden jetzt zusätzlich alle Geschwister mit identischem Geburtsjahr, bei denen die Angabe zum Geburtsmonat fehlt, als Zwillinge angesehen. Diese weniger restriktive Datengenerierung ist der Annahme geschuldet, dass zwei separate Geburten in einem einzigen Kalenderjahr extrem selten vorkommen. Da jedoch trotzdem die Gefahr besteht, dass durch fälschlicherweise als Zwillinge bezeichnete Personen aus der Gruppe mit den fehlenden Geburtsmonaten die Durchschnittswerte in BIOTWIN verzerrt werden, haben wir ein neues Label in die Variable INFOTWIN eingeführt. Dadurch kann diese besondere Gruppe der Zwillinge identifiziert werden (Code "6": Erfassung seit 2007, übereinstimmung Geburtsjahr, fehlender -monat; im Gegensatz dazu "5": Erfassung seit 2007, übereinstimmung Geburtsjahr und -monat).
In der aktuellen Datenweitergabeversion (Welle Z, besser: v26) umfasst der Datensatz BIOTWIN 250 Zwillings- und 5 Drillingspaare.
labels infotwin:
[1] Zwillinge - nicht in 2006 (gen.)
[2] Zwillinge - 2006 (Antwort nicht verifizierbar)
[3] Zwillinge - 2006 (Antwort verweigert)
[4] Zwillinge - 2006 (Antwort validiert)
[5] Zwillinge - seit 2007 (gen.)
[6] Zwillinge - seit 2007 (gen.)
5.5 Kleinere Überarbeitungen
06.01.2011
Im generierten Längsschnittdatensatz KIDLONG gab es bei ca. 3% der Kinder ein Problem in der Zuordnung zur korrekten aktuellen Haushaltsnummer. Die Variable HHNRAKT wurde dementsprechend korrigiert.
Zusätzlich hat sich in der Variable K_NRKID die Angabe für das Erhebungjahr 1987 für das Kind 397403 geändert.
Hierbei erhöht sich die "Anzahl der Kinder im HH unter 16 Jahren" von 1 auf 2.
Bitte melden Sie sich bei soepmail@diw.de, wenn Sie den Datensatz KIDLONG nutzen. Sowohl für den 100%-Datensatz für die EEA-Länder als auch für die weltweit nutzbare 95%-Version stellen wir eine individualisierte Downloadmöglichkeit zur Verfügung.
Bitte beachten Sie: Bei der Nutzung des korrigierten Datensatzes KIDLONG sollten Sie den Datensatz wie folgt zitieren:
Englisch:
Socio-Economic Panel (SOEP), data for years 1984-2009, version 26.1, SOEP, 2011.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2009, Version 26.1, SOEP, 2011.
Kurzversion:
SOEP v26.1.
Survey Instruments 2009: 2) Erhebungsinstrumente 2009 Field-de
Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite
1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008
2) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2
3) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents
4) The Request for Record Linkage in the IAB-SOEP Migration Sample
5) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013
6) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK
7) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014
8) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32
9) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel
10) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel
11) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten
12) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version
13) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing
14) SOEP Scales Manual (updated for SOEP-Core v32.1)
15) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)
16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben
17) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben
18) Multi-Itemskalen im SOEP Jugendfragebogen
19) Dokumentation zum Entwicklungsprozess des Moduls „Einstellungen zu sozialer Ungleichheit“ im SOEP (v38)
20) SOEP-CoV: Project and Data Documentation
21) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution
22) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)
23) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE
24) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables
25) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey
26) SOEP-Core v34: Codebook for the EU-SILC-Like Panel for Germany Based on the SOEP
27) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)
28) SOEP-Core v36: Codebook for the EU-SILC-like panel for Germany based on the SOEP
Alle Dokumentationen zum Filtern finden Sie auf dieser Seite
1) SOEP 2009 – Methodenbericht zum Befragungsjahr 2009 (Welle 26) des Sozio-oekonomischen Panels