SOEP-Core v28 (Daten 1984-2011)

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009 und zuletzt 2011 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs.

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2011

DOI: 10.5684/soep.v28
Erhebungszeitraum: 1984-2011
Veröffentlichungsdatum: 12.11.2012
Primärforscher: Jürgen Schupp, Martin Kroh, Jan Goebel, Silke Anger, Marco Giesselmann, Markus Grabka, Peter Krause, Elisabeth Liebau, Henning Lohmann, David Richter,Christian Schmitt, Daniel Schnitzlein, Juliana Werneburg, Frauke Peter, Ingrid Tucci

Datenerhebung: TNS Infratest Sozialforschung GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

 Datensatzinformationen:

 Anzahl der Einheiten 74.137
 Anzahl der Variablen 47.933 in 360 Datensätzen
 Datenformat  STATA, SPSS, SAS, CSV
 MD5 fingerprints der einzelnen Dateien

Stata deutsch
Stata englisch
Stata deutsch+engl.
SPSS deutsch
SPSS englisch
SAS deutsch
SAS englisch
CSV
PanelWhiz

 Veröffentlichungen:

  • Schupp, Jürgen (2009): 25 Jahre Sozio-oekonomisches Panel - Ein Infrastrukturprojekt der empirischen Sozial- und Wirtschaftsforschung in Deutschland, Zeitschrift für Soziologie 38(5), pp. 350-357.
  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber (2008) Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland - Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (2008), No. 4, 301-328 (download)
  • Gert G. Wagner, Joachim R. Frick, and Jürgen Schupp (2007) The German Socio-Economic Panel Study (SOEP) - Scope, Evolution and Enhancements, Schmollers Jahrbuch (Journal of Applied Social Science Studies), Vol. 127, No. 1 (2007), pp. 139-169 (download)

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Schröder, Carsten, Johannes König, Alexandra Fedorets, Jan Goebel, Markus M. Grabka, Holger Lüthen, Maria Metzing, Felicitas Schikora, and Stefan Liebig. 2020. The economic research potentials of the German Socio-Economic Panel study. German Economic Review 21 (3), 335-371. (https://doi.org/10.1515/ger-2020-0033)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

SOEP v28 (Originaldatensatz)

SOEP v28i (Internationale Version)

SOEP v28.1 (Fehlerupdate Dez. 2012)

1. Neue zusätzliche Codierungen für fehlende Werte

Mit der Ersterhebung von Sample J wurde die Erhebung des Lebenslauffragebogens von der zweiten auf die erste Welle umgestellt und in einen integrierten Fragebogen mit dem Personenfragebogen kombiniert. Dadurch gibt es teilweise leichte Unterschiede im Erhebungsinstrument zwischen den Altstichproben A-H und dem Aufwuchssample J.

Um diese möglichen Unterschiede zu dokumentieren wurden in den Erhebungsdaten die folgenden zusätzlichen Codierungen für fehlende Werte eingeführt:

-4 "Unzulaessige Mehrfachantwort"
-5 "In Fragebogenversion nicht enthalten"
-6 "Fragebogenversion mit geänderter Filterführung"

2. Stichprobe I ist nun Teil der Innovationsstichprobe

Die Innovations-Stichprobe des SOEP ist jetzt gestartet und beinhaltet unter anderem Stichprobe I, die ab 2011 daher nicht mehr Teil der Haupterhebung ist. Nähere Informationen zur Innovationsstichprobe und der Möglichkeit, eigene Inhalte einzubringen, finden Sie auf unserer Webseite unter SOEP-IS .

3. Neue und umbenannte Datensätze

3.1 BIOCOUPLM
BIOCOUPLM ist ein monatsgenauer Spelldatensatz, der die Historie der Partnerschaften vom ersten bis zum letzten Personeninterview der Befragten enthält.

3.2 BIOCOUPLY
BIOCOUPLY ist ein jahresgenauer Spelldatensatz, der die Historie der Partnerschaften seit der Geburt der Befragten enthält. Es sind sowohl retrospektive als auch jährlich aktualisierte Angaben enthalten.

3.3 BIOSIB (beta version)
Der Datensatz BIOSIB enthält Informationen zu allen Geschwistern, die innerhalb der SOEP Haushalte leben. Insbesondere enthält der Datensatz Geschwisterzeiger für alle identifizierten Geschwister. Des Weiteren enthält der Datensatz Informationen über Geburtsjahr, Geschlecht und die Beziehung der Geschwister untereinander. Feedback und Anregungen können Sie Daniel Schnitzlein (dschnitzlein@diw.de) zukommen lassen.

3.4 BIOEDU
Der Datensatz BIOEDU enthält Informationen zu Bildungsübergängen in konsistent strukturierter Form, beginnend mit dem Eintritt in institutionelle Kinderbetreuung bis zur Universitätsausbildung.

3.5 BIOAGE long
Der neue integrierte Datensatz BIOAGE LONG (BIOAGEL) enthält die Daten der Datensätze BIOAGE01, BIOAGE03, BIOAGE06, sowie BIOAGE08a und BIOAGE08b im „long"- Format.

3.6 TRUST
Datensatz des ökonomischen Verhaltensexperiments über Vertrauen und Vertrauenswürdigkeit aus den Befragungsjahren 2003, 2004, & 2005.

Dieses Experiment, das dazu dient, Vertrauen zu messen, basiert auf einem Investitionsspiel, das Berg et al. (1995) eingeführt haben. Es handelt sich um ein Einmalspiel für zwei Akteure, die sich anonym aufeinander beziehen. Der erste Akteur erhält ein Guthaben von zehn Punkten und kann davon eine beliebige Anzahl von Punkten der zweiten Akteurin überschreiben. Jeder überschriebene Punkt wird dabei verdoppelt. Die zweite Akteurin erhält ebenfalls ein Guthaben von zehn Punkten. Nachdem sie die (verdoppelten) Punkte vom ersten Akteur übertragen bekommen hat, entscheidet sie, wieviel sie von ihrem eigenen Guthaben an den ersten Akteur überschreibt (null bis zehn Punkte). Ebenso wie beim ersten Transfer werden auch ihre Punkte beim Empfänger verdoppelt. Nach der Entscheidung der zweiten Akteurin endet das Spiel und die Mitspieler bekommen ihr Einkommen ausbezahlt (ein Punkt entspricht dabei einem Euro, die Summe wird als Scheck ein paar Tage später versandt).

Eine grundlegende Komponente des Spiels ist, dass die Teilnehmer tatsächlich entsprechend des festgelegten Auszahlungsmodus Geld erhalten, was bedeutet, dass alle Entscheidungen immer finanzielle Konsequenzen haben. Diese Version des Spiels wurde von Fehr, Fischbacher, Schupp, von Rosenbladt & Wagner (2002) entwickelt.

Die Verbindung von Repräsentativbefragung und Verhaltensexperiment wurde in den SOEP-Haupterhebungen 2003, 2004 und 2005 durchgeführt, wobei nur geringfügige Modifizierungen vorgenommen wurden. Von ursprünglich 1.432 Personen im Jahre 2003 haben 1.202 Personen auch 2004 und 2005 am Experiment teilgenommen. Die Daten werden im Datensatz „trust" im so genannten long-Format zur Verfügung gestellt. Der Datensatz enthält somit die Informationen aus allen drei Wellen, in denen das Verhaltensexperiment durchgeführt wurde.

3.6 TIMEPREF
Datensatz des ökonomisches Verhaltensexperiments zu Zeitpräferenzen im Befragungsjahr 2006 .

In diesem ökonomischen Verhaltensexperiment mussten sich die Befragten enscheiden, ob sie sich bei einem Geldgewinn (von 200 €) zeitnah an die Befragung per Scheck den Sockelbetrag ausbezahlen lassen wollen, oder aber zu späteren Zeitpunkten einen höheren Gewinnbetrag (der also einen impliziten Zinsaufschlag beinhalten würde). Durch Teilen der Stichprobe (N = 1.503 Personen) in zufällige Substichproben (Splits) war es möglich, sowohl den Zeithorizont als auch die implizite Zinsrate entsprechend zu variieren, sodass mögliche Anreizeffekte für die Wahl zwischen kurzfristiger (und niedrigerer) und späterer (höherer) Gewinnauszahlung getestet werden konnten. Die wissenschaftliche Leitung des Projekts lag bei Prof. Dr. Armin Falk, CENs, Universität Bonn.

4. Neue und überarbeitete Variablen

4.1 Datensatz $HBRUTTO 

REGTYP$$:
$$: Innerhalb des $HBRUTTO Datensatzes wird es eine neue Variable zur Unterscheidung von Stadt/Umland/Land geben. Die Einteilung basiert auf den siedlungsstrukturellen Kreisregionstypen des BBSR und bezieht sich auf den Gebietsstand 31.12.2009. Für die Typenbildung werden folgende Siedlungsstrukturmerkmale herangezogen:

  • Bevölkerungsanteil in Groß- und Mittelstädten
  • Einwohnerdichte der Kreisregion
  • Einwohnerdichte der Kreisregion ohne Berücksichtigung der Groß- und Mittelstädte

Auf diese Weise können drei Ausprägungen unterschieden werden:

  1. Städtische Regionen (Kreisfreie Städte mit mind. 100.000 Einwohnern / Kreise mit einem Bevölkerungsanteil in Groß- und Mittelstädten von mind. 50% und einer Einwohnerdichte von mind. 150 Einw./km² / Kreise mit einer Einwohnerdichte ohne Groß- und Mittelstädte von mind. 150 Einw./km²)
  2. Regionen mit Verstädterungsansätzen (Kreise mit einem Bevölkerungsanteil in Groß- und Mittelstädten von mind. 50%, aber einer Einwohnerdichte unter 150 Einw./km² / Kreise mit einem Bevölkerungsanteil in Groß- und Mittelstädten unter 50% und mit einer Einwohnerdichte ohne Groß- und Mittelstädte von mind. 100 Einw./km²)
  3. Ländliche Regionen (Kreise mit einem Bevölkerungsanteil in Groß- und Mittelstädten unter 50% und Einwohnerdichte ohne Groß- und Mittelstädte unter 100 Einw./km²)

 

4.2 Datensatz $PGEN 

BILZTCH$$ / BILZTEV$$:
BILZTCH$$ zeigt an, ob sich für die Person seit der letzten Beobachtung eine Veränderung in den Bildungsjahren ($BILZEIT) nach unten oder seit dem letzten Jahr eine mit Informationen zu weiteren Bildungsabschlüssen inkonsistente Veränderung nach oben ergeben hat.
BILZTEV$$
ist eine Flagvariable, die anzeigt, ob die Person jemals über die ganzen Beobachtungszeitraum eine inkonsistente Veränderung in $BILZEIT nach oben oder nach unten hatte.

$VEBZEIT and $UEBSTD

Um Konsistenz mit dem Datensatz FID herzustellen, wurden die fehlenden Werte der Variablen $VEBZEIT and $UEBSTD leicht recodiert: Selbständige erhalten jetzt den Missing Code –2. In den früheren Datenweitergaben erhielten die Selbstständigen den fehlenden Wert –3 ( nicht valide).

In $UEBSTD ist der Wert –3 (nicht valide) allen Personen zugewiesen, die angaben, mehr als zehn Überstunden/Woche zu arbeiten UND gleichzeitig eine Wochenarbeitszeit von über 80 Stunden vereinbart hatten ($VEBZEIT nicht valide, Wert –3) oder deren tatsächliche wöchentliche Arbeitszeit mehr als 80 Stunden/Woche betrug ($TATZEIT nicht valide, Wert –3).

4.3 Datensatz BIOPAREN

BIOPAREN enthält sieben neue Variablen:
VAORT11 and MAORT11 enthalten den aktuellen Aufenthaltsort der Eltern.
GESCHW, GESCHWUP, NUMS, NUMB und TWIN enthalten Informationen über Geschwister. GESCHW enthält die Information, ob der Befragte jemals Geschwister hatte oder aktuell hat. GESCHWUP enthält das Jahr, aus dem die Information in GESCHW stammt. NUMB und NUMS enthalten die Anzahl der Brüder und Schwestern und TWIN enthält Informationen darüber, ob einige der Geschwister Zwillingsbrüder/-schwestern (und wenn ja welcher Typ) sind.

1984-2011 (Wave BB)

19. Dez., 2012

BIOCOUPLM, BIOCOUPLY, BIOMARSM, BIOMARSY
In einigen Fällen wurden die Meldungen von einer zurückliegenden Scheidung nicht bei der Datengenerierung berücksichtigt. Darüber hinaus ist versehentlich zum Teil das angegebene Todesjahr eines ehemaligen Partners mit dem jeweils aktuellen Interviewjahr überschrieben worden. Dies beeinflusst nicht nur die Start- und Enddaten einiger Spells, sondern auch fehlende Informationen und Konsistenzprüfungen.

$FAMSTD
Das fehlerhafte Überschreiben von Daten bei der Generierung von BIOCOUPL$ beeinflusst die Konsistenzprüfungen. Die Mehrzahl der zuvor fehlenden Informationen ist jetzt vorhanden. Allerdings ist stattdessen die Zahl der unplausiblen Antworten angewachsen.

Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de.

Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:
Englisch:

Socio-Economic Panel (SOEP), data for years 1984-2011, version 28.1, SOEP, 2012.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2011, Version 28.1, SOEP, 2012.
Kurzversion:
SOEP v28.1 


Survey Instruments 2011: Field-de Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

3) The Request for Record Linkage in the IAB-SOEP Migration Sample

4) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

8) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

12) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

13) SOEP Scales Manual (updated for SOEP-Core v32.1)

14) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

15) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

17) Multi-Itemskalen im SOEP Jugendfragebogen

18) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

19) Documentation of ISCED Generation Based on the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2 and IAB-BAMF-SOEP Survey of Refugees M3/M4 until 2017

20) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

21) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

22) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite

keyboard_arrow_up