Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden.
Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009 und zuletzt 2011 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs.
Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2011
DOI: 10.5684/soep.v28
Erhebungszeitraum: 1984-2011
Veröffentlichungsdatum: 12.11.2012
Primärforscher: Jürgen Schupp, Martin Kroh, Jan Goebel, Silke Anger, Marco Giesselmann, Markus Grabka, Peter Krause, Elisabeth Liebau, Henning Lohmann, David Richter,Christian Schmitt, Daniel Schnitzlein, Juliana Werneburg, Frauke Peter, Ingrid Tucci
Datenerhebung: TNS Infratest Sozialforschung GmbH
Population: Personen in Privathaushalten in der Bundesrepulik Deutschland
Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht.
Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).
Datensatzinformationen:
Anzahl der Einheiten | 74.137 |
Anzahl der Variablen | 47.933 in 360 Datensätzen |
Datenformat | STATA, SPSS, SAS, CSV |
MD5 fingerprints der einzelnen Dateien |
Stata deutsch |
Veröffentlichungen:
In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI Zur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und folgende Referenzen zitiert werden:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Migrations-Stichproben ausschliessen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse nicht die Fälle der Geflüchteten-Stichproben ausschliessen, dann zitieren Sie bitte auch: IAB-BAMF-SOEP-Befragung Geflüchteter (M3-M5), Daten der Jahre 2016-2021,
Wenn Sie bei Ihrer Analyse die Daten der SOEP-LEE2 Befragungen nutzen, dann zitieren Sie bitte auch:
Wenn Sie bei Ihrer Analyse noch fachspezifischer referieren möchten, dann zitieren Sie bitte auch:
Mit der Ersterhebung von Sample J wurde die Erhebung des Lebenslauffragebogens von der zweiten auf die erste Welle umgestellt und in einen integrierten Fragebogen mit dem Personenfragebogen kombiniert. Dadurch gibt es teilweise leichte Unterschiede im Erhebungsinstrument zwischen den Altstichproben A-H und dem Aufwuchssample J.
Um diese möglichen Unterschiede zu dokumentieren wurden in den Erhebungsdaten die folgenden zusätzlichen Codierungen für fehlende Werte eingeführt:
-4 | "Unzulaessige Mehrfachantwort" |
-5 | "In Fragebogenversion nicht enthalten" |
-6 | "Fragebogenversion mit geänderter Filterführung" |
Die Innovations-Stichprobe des SOEP ist jetzt gestartet und beinhaltet unter anderem Stichprobe I, die ab 2011 daher nicht mehr Teil der Haupterhebung ist. Nähere Informationen zur Innovationsstichprobe und der Möglichkeit, eigene Inhalte einzubringen, finden Sie auf unserer Webseite unter SOEP-IS .
3.1 BIOCOUPLM
BIOCOUPLM ist ein monatsgenauer Spelldatensatz, der die Historie der Partnerschaften vom ersten bis zum letzten Personeninterview der Befragten enthält.
3.2 BIOCOUPLY
BIOCOUPLY ist ein jahresgenauer Spelldatensatz, der die Historie der Partnerschaften seit der Geburt der Befragten enthält. Es sind sowohl retrospektive als auch jährlich aktualisierte Angaben enthalten.
3.3 BIOSIB (beta version)
Der Datensatz BIOSIB enthält Informationen zu allen Geschwistern, die innerhalb der SOEP Haushalte leben. Insbesondere enthält der Datensatz Geschwisterzeiger für alle identifizierten Geschwister. Des Weiteren enthält der Datensatz Informationen über Geburtsjahr, Geschlecht und die Beziehung der Geschwister untereinander. Feedback und Anregungen können Sie Daniel Schnitzlein (dschnitzlein@diw.de) zukommen lassen.
3.4 BIOEDU
Der Datensatz BIOEDU enthält Informationen zu Bildungsübergängen in konsistent strukturierter Form, beginnend mit dem Eintritt in institutionelle Kinderbetreuung bis zur Universitätsausbildung.
3.5 BIOAGE long
Der neue integrierte Datensatz BIOAGE LONG (BIOAGEL) enthält die Daten der Datensätze BIOAGE01, BIOAGE03, BIOAGE06, sowie BIOAGE08a und BIOAGE08b im „long"- Format.
3.6 TRUST
Datensatz des ökonomischen Verhaltensexperiments über Vertrauen und Vertrauenswürdigkeit aus den Befragungsjahren 2003, 2004, & 2005.
Dieses Experiment, das dazu dient, Vertrauen zu messen, basiert auf einem Investitionsspiel, das Berg et al. (1995) eingeführt haben. Es handelt sich um ein Einmalspiel für zwei Akteure, die sich anonym aufeinander beziehen. Der erste Akteur erhält ein Guthaben von zehn Punkten und kann davon eine beliebige Anzahl von Punkten der zweiten Akteurin überschreiben. Jeder überschriebene Punkt wird dabei verdoppelt. Die zweite Akteurin erhält ebenfalls ein Guthaben von zehn Punkten. Nachdem sie die (verdoppelten) Punkte vom ersten Akteur übertragen bekommen hat, entscheidet sie, wieviel sie von ihrem eigenen Guthaben an den ersten Akteur überschreibt (null bis zehn Punkte). Ebenso wie beim ersten Transfer werden auch ihre Punkte beim Empfänger verdoppelt. Nach der Entscheidung der zweiten Akteurin endet das Spiel und die Mitspieler bekommen ihr Einkommen ausbezahlt (ein Punkt entspricht dabei einem Euro, die Summe wird als Scheck ein paar Tage später versandt).
Eine grundlegende Komponente des Spiels ist, dass die Teilnehmer tatsächlich entsprechend des festgelegten Auszahlungsmodus Geld erhalten, was bedeutet, dass alle Entscheidungen immer finanzielle Konsequenzen haben. Diese Version des Spiels wurde von Fehr, Fischbacher, Schupp, von Rosenbladt & Wagner (2002) entwickelt.
Die Verbindung von Repräsentativbefragung und Verhaltensexperiment wurde in den SOEP-Haupterhebungen 2003, 2004 und 2005 durchgeführt, wobei nur geringfügige Modifizierungen vorgenommen wurden. Von ursprünglich 1.432 Personen im Jahre 2003 haben 1.202 Personen auch 2004 und 2005 am Experiment teilgenommen. Die Daten werden im Datensatz „trust" im so genannten long-Format zur Verfügung gestellt. Der Datensatz enthält somit die Informationen aus allen drei Wellen, in denen das Verhaltensexperiment durchgeführt wurde.
3.6 TIMEPREF
Datensatz des ökonomisches Verhaltensexperiments zu Zeitpräferenzen im Befragungsjahr 2006 .
In diesem ökonomischen Verhaltensexperiment mussten sich die Befragten enscheiden, ob sie sich bei einem Geldgewinn (von 200 €) zeitnah an die Befragung per Scheck den Sockelbetrag ausbezahlen lassen wollen, oder aber zu späteren Zeitpunkten einen höheren Gewinnbetrag (der also einen impliziten Zinsaufschlag beinhalten würde). Durch Teilen der Stichprobe (N = 1.503 Personen) in zufällige Substichproben (Splits) war es möglich, sowohl den Zeithorizont als auch die implizite Zinsrate entsprechend zu variieren, sodass mögliche Anreizeffekte für die Wahl zwischen kurzfristiger (und niedrigerer) und späterer (höherer) Gewinnauszahlung getestet werden konnten. Die wissenschaftliche Leitung des Projekts lag bei Prof. Dr. Armin Falk, CENs, Universität Bonn.
4.1 Datensatz $HBRUTTO
REGTYP$$:
$$: Innerhalb des $HBRUTTO Datensatzes wird es eine neue Variable zur Unterscheidung von Stadt/Umland/Land geben. Die Einteilung basiert auf den siedlungsstrukturellen Kreisregionstypen des BBSR und bezieht sich auf den Gebietsstand 31.12.2009. Für die Typenbildung werden folgende Siedlungsstrukturmerkmale herangezogen:
Auf diese Weise können drei Ausprägungen unterschieden werden:
4.2 Datensatz $PGEN
BILZTCH$$ / BILZTEV$$:
BILZTCH$$ zeigt an, ob sich für die Person seit der letzten Beobachtung eine Veränderung in den Bildungsjahren ($BILZEIT) nach unten oder seit dem letzten Jahr eine mit Informationen zu weiteren Bildungsabschlüssen inkonsistente Veränderung nach oben ergeben hat.
BILZTEV$$ ist eine Flagvariable, die anzeigt, ob die Person jemals über die ganzen Beobachtungszeitraum eine inkonsistente Veränderung in $BILZEIT nach oben oder nach unten hatte.
$VEBZEIT and $UEBSTD
Um Konsistenz mit dem Datensatz FID herzustellen, wurden die fehlenden Werte der Variablen $VEBZEIT and $UEBSTD leicht recodiert: Selbständige erhalten jetzt den Missing Code –2. In den früheren Datenweitergaben erhielten die Selbstständigen den fehlenden Wert –3 ( nicht valide).
In $UEBSTD ist der Wert –3 (nicht valide) allen Personen zugewiesen, die angaben, mehr als zehn Überstunden/Woche zu arbeiten UND gleichzeitig eine Wochenarbeitszeit von über 80 Stunden vereinbart hatten ($VEBZEIT nicht valide, Wert –3) oder deren tatsächliche wöchentliche Arbeitszeit mehr als 80 Stunden/Woche betrug ($TATZEIT nicht valide, Wert –3).
4.3 Datensatz BIOPAREN
BIOPAREN enthält sieben neue Variablen:
VAORT11 and MAORT11 enthalten den aktuellen Aufenthaltsort der Eltern.
GESCHW, GESCHWUP, NUMS, NUMB und TWIN enthalten Informationen über Geschwister. GESCHW enthält die Information, ob der Befragte jemals Geschwister hatte oder aktuell hat. GESCHWUP enthält das Jahr, aus dem die Information in GESCHW stammt. NUMB und NUMS enthalten die Anzahl der Brüder und Schwestern und TWIN enthält Informationen darüber, ob einige der Geschwister Zwillingsbrüder/-schwestern (und wenn ja welcher Typ) sind.
1984-2011 (Wave BB)
19. Dez., 2012 |
BIOCOUPLM, BIOCOUPLY, BIOMARSM, BIOMARSY $FAMSTD Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de. Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:Englisch: Socio-Economic Panel (SOEP), data for years 1984-2011, version 28.1, SOEP, 2012. |
Survey Instruments 2011: Field-de Field-de
Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite
1) SOEP 2011 – Documentation on Biography and Life History Data for SOEP v28
2) SOEP 2011 – Documentation of the Person-related Meta-dataset PPFAD for SOEP v28
3) SOEP 2011 – Documentation of the Household-related Meta-dataset HPFAD for SOEP v28
4) SOEP 2011 – Documentation of Person-related Status and Generated Variables in PGEN for SOEP v28
5) SOEP 2011 – Documentation of Household-related Status and Generated Variables in HGEN for SOEP v28
6) SOEP 2011 – Documentation of Person-related Variables on Children in $KIND for SOEP v28
7) SOEP 2011 – Documentation of the Pooled Dataset on Children in $KIDLONG for SOEP v28
1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008
2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents
3) The Request for Record Linkage in the IAB-SOEP Migration Sample
5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK
6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014
7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32
9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel
10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten
11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version
13) SOEP Scales Manual (updated for SOEP-Core v32.1)
17) Multi-Itemskalen im SOEP Jugendfragebogen
20) SOEP-CoV: Project and Data Documentation
22) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables
25) SOEP-Core v36: Codebook for the EU-SILC-like panel for Germany based on the SOEP
Alle Dokumentationen zum Filtern finden Sie auf dieser Seite