Direkt zum Inhalt

SOEP-Core v33 (Daten 1984-2016)

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 zwei Flüchtlings-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v33i).

Datenerhebung: Kantar Deutschland GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland.

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht. 

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre alt oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

Datensatzinformationen:

 Anzahl der Einheiten 126.804
 Anzahl der Variablen 72.709 in 439 Datensätzen
 Datenformat STATA, SPSS, SAS, CSV

MD5 fingerprints

 

Weitergabeformat zip-Datei Einzeldatensätze
Stata zweisprachig 9d7060ce9c558bb04cb12313b3a4e301
Stata deutsch 82dd72b32c4df1537f9eea6ee5e6979e
Stata englisch eaac22439a6140535ff8aa38697a94b8
SPSS deutsch 39ebdcfd0ace11126be8adb5fac1e391
SPSS englisch bb78f99791cde312300108c1a62e2774
SAS deutsch 80ddb241799719c645b152377c69345e
SAS englisch 94b0c9c087cdfefb02fccb7c00b45212
CSV 7f59155d2e79c89cfc58ffc2831db986
GGKBOU dae7d695fc83fa783290a9b9493eb9e3
GGKBOU englisch 2d064fe8b84b42e806d231b46a8b2454
Lehrversionen
Stata deutsch 31e17d165176b7f737ee8c590b1ce5fc
Stata englisch 7987938078f2b1f6114bd176a801070a
SPSS deutsch 2a5bf6b3d7806110e9833876c9e7c853
SPSS englisch 33cde96691542e040976ffa1622d127d
SAS deutsch 80e46b7f6e1070ef7068edac369e6d56
SAS englisch efb0256ff56c97b081e0965b0160f474

 Veröffentlichungen:

  • Schupp, Jürgen (2009): 25 Jahre Sozio-oekonomisches Panel - Ein Infrastrukturprojekt der empirischen Sozial- und Wirtschaftsforschung in Deutschland, Zeitschrift für Soziologie 38 (5),  350-357 (download).
  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber (2008) Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland - Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (4), 301-328 (download).
  • Gert G. Wagner, Joachim R. Frick, and Jürgen Schupp (2007) The German Socio-Economic Panel Study (SOEP) - Scope, Evolution and Enhancements, Schmollers Jahrbuch (Journal of Applied Social Science Studies), 127 (1), 139-169 (download).

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2016

DOI: 10.5684/soep.v33
Erhebungszeitraum: 1984-2016
Veröffentlichungsdatum: 29.11.2017
Primärforscher: Jürgen Schupp, Jan Goebel, Martin Kroh, Carsten Schröder, Charlotte Bartels, Klaudia Erhardt, Alexandra Fedorets, Andreas Franken, Marco Giesselmann, Markus Grabka, Peter Krause, Hannes Kröger, Simon Kühne, Maria Metzing, Jana Nebelin, David Richter, Diana Schacht, Paul Schmelzer, Christian Schmitt, Daniel Schnitzlein, Rainer Siegers, Knut Wenzig

Datenerhebung: Kantar Deutschland GmbH

Population: Personen in Privathaushalten in der Bundesrepulik Deutschland.

Auswahlverfahren: Alle Samples des SOEP werden mittels mehrstufiger Stichprobenziehung, die regional gebündelt sind, gezogen. Die Befragten (Haushalte) werden per random-walk ausgesucht. 

Erhebungsverfahren: Die Methode der Datenerhebung des SOEP basiert auf einem Set von Fragebögen sowohl für die Haushalte als auch für die Individuen. Prinzipiell versucht ein Interviewer face-to-face-Interviews mit allen Haushaltsmitgliedern durchzuführen, die 16 Jahre alt oder älter sind. Zusätzlich wird eine Person (Haushaltsvorstand) gebeten, einen Haushaltsfragebogen zu beantworten, einschließlich Fragen zur Wohnsituation, Kosten, verschiedenen Einkommensquellen, sowie Fragen zu im Haushalt lebenden Kindern unter 16 Jahren (z.B. Besuch des Kindergartens, der Grundschule etc.).

Datensatzinformationen:

 Anzahl der Einheiten 126.804
 Anzahl der Variablen 72.709 in 439 Datensätzen
 Datenformat STATA, SPSS, SAS, CSV

MD5 fingerprints

 

Weitergabeformat zip-Datei Einzeldatensätze
Stata zweisprachig 9d7060ce9c558bb04cb12313b3a4e301
Stata deutsch 82dd72b32c4df1537f9eea6ee5e6979e
Stata englisch eaac22439a6140535ff8aa38697a94b8
SPSS deutsch 39ebdcfd0ace11126be8adb5fac1e391
SPSS englisch bb78f99791cde312300108c1a62e2774
SAS deutsch 80ddb241799719c645b152377c69345e
SAS englisch 94b0c9c087cdfefb02fccb7c00b45212
CSV 7f59155d2e79c89cfc58ffc2831db986
GGKBOU dae7d695fc83fa783290a9b9493eb9e3
GGKBOU englisch 2d064fe8b84b42e806d231b46a8b2454
Lehrversionen
Stata deutsch 31e17d165176b7f737ee8c590b1ce5fc
Stata englisch 7987938078f2b1f6114bd176a801070a
SPSS deutsch 2a5bf6b3d7806110e9833876c9e7c853
SPSS englisch 33cde96691542e040976ffa1622d127d
SAS deutsch 80e46b7f6e1070ef7068edac369e6d56
SAS englisch efb0256ff56c97b081e0965b0160f474

 Veröffentlichungen:

  • Schupp, Jürgen (2009): 25 Jahre Sozio-oekonomisches Panel - Ein Infrastrukturprojekt der empirischen Sozial- und Wirtschaftsforschung in Deutschland, Zeitschrift für Soziologie 38 (5),  350-357 (download).
  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber (2008) Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland - Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (4), 301-328 (download).
  • Gert G. Wagner, Joachim R. Frick, and Jürgen Schupp (2007) The German Socio-Economic Panel Study (SOEP) - Scope, Evolution and Enhancements, Schmollers Jahrbuch (Journal of Applied Social Science Studies), 127 (1), 139-169 (download).

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)

Wenn Sie bei Ihrer Analyse nicht die Fälle der Migrations-Stichproben ausschliessen, dann zitieren Sie bitte auch:

  • Herbert Brücker, Martin Kroh, Simone Bartsch, Jan Goebel, Simon Kühne, Elisabeth Liebau, Parvati Trübswetter, Ingrid Tucci & Jürgen Schupp (2014): The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents. SOEP Survey Paper 216 (PDF, 444.25 KB), Series C. Berlin, Nürnberg: DIW Berlin.

Wenn Sie bei Ihrer Analyse nicht die Fälle der Geflüchteten-Stichproben ausschliessen, dann zitieren Sie bitte auch: IAB-BAMF-SOEP-Befragung Geflüchteter (M3-M5), Daten der Jahre 2016-2021,

  • Herbert Brücker, Nina Rother, Jürgen Schupp. 2017. IAB-BAMF-SOEP Befragung von Geflüchteten 2016. Studiendesign, Feldergebnisse sowie Analysen zu schulischer wie beruflicher Qualifikation, Sprachkenntnissen sowie kognitiven Potenzialen. IAB Forschungsbericht 13/2017.

Wenn Sie bei Ihrer Analyse die Daten der SOEP-LEE2 Befragungen nutzen, dann zitieren Sie bitte auch:

  • Matiaske, W., Schmidt, T. D., Halbmeier, C., Maas, M., Holtmann, D., Schröder, C., Böhm, T., Liebig, S., and Kritikos, A. S. (2023). SOEP-LEE2 : Linking Surveys on Employees to Employers in Germany. Jahrbücher für Nationalökonomie und Statistik Data Observer, 1–14. https://doi.org/10.1515/jbnst-2023-0031.

Wenn Sie bei Ihrer Analyse noch fachspezifischer referieren möchten, dann zitieren Sie bitte auch:

  • Schröder, Carsten, Johannes König, Alexandra Fedorets, Jan Goebel, Markus M. Grabka, Holger Lüthen, Maria Metzing, Felicitas Schikora, and Stefan Liebig. 2020. The economic research potentials of the German Socio-Economic Panel study. German Economic Review 21 (3), 335-371. (https://doi.org/10.1515/ger-2020-0033)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)
  • Jacobsen, Jannes, Magdalena Krieger, Felicitas Schikora, and Jürgen Schupp. 2021. Growing Potentials for Migration Research using the German Socio-Economic Panel Study. Jahrbücher für Nationalökonomie und Statistik 241 (4), 527-549. (https://doi.org/10.1515/jbnst-2021-0001)
  • Fedorets, Alexandra, Stefan Kirchner, Jule Adriaans, and Oliver Giering. 2022. Data on Digital Transformation in the German Socio-Economic Panel. Jahrbücher für Nationalökonomie und Statistik 242 (5-6), 691-705. (https://doi.org/10.1515/jbnst-2021-0056)

Für die SOEP-Daten 1984-2016 (v33) -- Wellen A - BG -- stehen folgende Datensätze zur Verfügung:

soep.v33.1

soep.v33.1i (International Scientific Use Version, 95%)

soep.v33

soep.v33i (International Scientific Use Version, 95%)

SOEP-Core soep.v33

Die neue Datendistribution (1984–2016) "SOEP v33" bietet für den aktuellsten Erhebungszeitraum des Jahres 2016 die üblichen wellenspezifischen Variablen in BGPBRUTTO, BGP, BGPKAL, BGPGEN, BGHBRUTTO, BGH, BGHGEN, BGKIND, BGP_MIG und BFPLUECKE sowie die aktualisierten Variablen/Datensätze mit längsschnittlichen Komponenten (PFAD-Dateien, Biografie-Dateien, Spelldaten und Gewichtungsfaktoren). Die Besonderheiten zusätzlicher neuer Stichproben, Datensätze oder Variablen sowie Veränderungen in der Aufbereitung älterer sind hier aufgeführt.

1 Neue Stichproben aus der IAB-BAMF-SOEP-Befragung von Geflüchteten (Samples M3/M4)

Mit der Version 33 der SOEP Daten werden auch die integrierten Daten der IAB-BAMF-SOEP-Befragung von Geflüchteten 2016 in Deutschland als zwei Ergänzungsstichproben des SOEP weitergegeben. Die Stichproben stützen sich auf die Grundgesamtheit der Geflüchteten unabhängig von ihrem Aufenthaltsstatus, die vom 1. Januar 2013 bis 31. Januar 2016 nach Deutschland eingereist sind. Die Samples wurden durch eine zusätzliche Finanzierung durch BA/IAB/BMAS im Fall von M3 realisiert und durch das BMBF im Fall von M4. In Stichprobe M4 wurden besonders viele geflüchtete Familien gezogen, in denen Kinder und Jugendliche leben.

Die Datengrundlage für die Ziehung der Stichprobe bildete das Ausländerzentralregister (AZR). Es wurden im Rahmen dieser Stichprobe im Jahr 2016 4.816 erwachsene Personen in 3.554 Haushalten interviewt sowie Basisangaben von in diesen Haushalten lebenden 5.717 Minderjährigen erhoben. Zur Durchführung der Befragung wurde der Fragebogen in sieben Sprachen übersetzt, teilweise wurden SprachmittlerInnen eingesetzt. Um den besonderen Bedingungen der Zielgruppe Rechnung zu tragen, wurden darüber hinaus audiounterstützte Erhebungsinstrumente entwickelt.

Die Befragung setzt sich aus einem integrierten Personen-Lebenslauffragebogen und einem Haushaltsfragebogen sowie einem Fragebogen für InterviewerInnen zusammen. Wie schon bei den Samples M1 und M2 (IAB-SOEP-Migrationsstichproben) wurden die TeilnehmerInnen nach ihrer Zustimmung gefragt, die Befragungsdaten mit den Integrierten Erwerbsbiografien des IAB zu verknüpfen. Die verknüpften Daten werden über das Forschungsdatenzentren der BA am IAB für interessierte Forscherinnen und Forscher voraussichtlich ab Frühjahr 2018 zur Verfügung stehen.

Eine ausführlichere Beschreibung des Studiendesign in: Martin Kroh et al. 2016. Das Studiendesign der IAB-BAMF-SOEP-Befragung von Geflüchteten. SOEP Survey Papers 365: Series C. Berlin: DIW Berlin / SOEP.

 

1.1 Integration ins SOEP und die Originaldaten (BGP und BGP_REF)

Die Originaldaten der Befragungsinstrumente, die in den Stichproben M3 und M4 genutzt wurden, sind im Datensatz BGP_REF abgelegt, hier sind Personen- und Biografiedaten wie im Fragebogen kombiniert. Die Variablen sind darüber hinaus aber auch in anderen Standard- oder generierten Datensätzen abgelegt:

  • Variablen, die so auch in Personenfragebögen anderer Stichproben vorkommen, wurden in den Datensatz BGP integriert. Ebenso wurden in BGP alle diejenigen Variablen integriert, die zwar spezifisch für den Geflüchteten-Fragebogen sind, aber auch in den künftigen Wellen vorkommen werden.
  • Variablen, die so auch in den Biografiefragebögen anderer Stichproben vorkommen, wurden in die jeweiligen Biografie-Datensätze integriert (z.B. BIOMARSM).
  • Die vollständige Migrationsbiografie wurde in dem neuen Datensatz REFUGSPELL aufbereitet.

2 Neue Datensätze und Variablen

2.1 Datensätze, die auf einem Erhebungsinstrument basieren (z.B. $P und $H)

2.1.1 $PINSTRUMENT und $HINSTRUMENT

Mit der Integration der neuen Migrationsstichproben seit 2013 enthalten die $P- und $H-Datensätze die Daten aus mehr als einem Erhebungsinstrument. Basis ist nach wie vor der Papierfragebogen der Stichproben A-L1, er wird aber mit Daten aus den samplespezifischen Erhebungsinstrumenten aufgefüllt. Damit dies für die NutzerInnen einfach nachvollziehbar ist, gibt es ab der Welle BD (2013) jetzt in $H und $P jeweils eine Variable, die für jeden Fall das jeweilige Instrument identifiziert.

2.1.2. Zusätzliche Variablen bei den Berufcodes

Es gibt jetzt deutlich mehr Variablen, die kodierte Berufsinformationen in den verschiedenen fragebogenbasierenden Datensätzen ($P, $JUGEND, $LUECKE, außerdem $P_MIG und $P_REFUGEES) enthalten. Die Variablen können mit Hilfe der Suffixe identifiziert werden, welche die genutzte Klassifikation kennzeichnet. Für alle Berufe sind ISCO-88 und KldB92 verfügbar, ältere  $P-Datensätze beinhalten auch ISCO-68 und bei neueren Datensätzen sind  ISCO-08 und KldB2010 verfügbar.

2.1.3. $JUGEND

Seit 2000 (Welle Q) erhalten Erstbefragte zwischen 16 und 17 Jahren einen separaten Biographiefragebogen, mit zusätzlichen jugendspezifischen Fragen wie beispielsweise dem Verhältnis zu ihren Eltern oder zu ihrem Freizeitverhalten. Bis jetzt wurden die hieraus gewonnen Daten nur teilweise und in aufbereiteter Form durch den Datensatz BIOAGE17 zur Verfügung gestellt. Ab dieser Version werden die kompletten Daten in einzelnen $JUGEND-Datensätzen zur Verfügung stehen.

2.2. Neue Variablen in PPFAD

2.2.1. SEXOR

Die Variable SEXOR verbindet Informationen der sexuellen Orientierung von Befragten aus verschiedenen Quellen innerhalb des SOEP. Im Jahr 2016 (Welle BG) wurde zum ersten Mal im SOEP eine direkte Frage zum Thema sexueller Orientierung gestellt.

2.2.2. Geburtsregion

Die Variable gibt das Bundesland des Geburtsortes an und zwar für Personen, die nach 2012 befragt und innerhalb des Gebietes der jetzigen Bundesrepublik geboren wurden. Detailliertere Informationen zum Geburtsort bis auf die Ebene der Gemeinde kann im Rahmen eines Gastaufenthaltes am FDZ SOEP genutzt werden (hierzu bitte Email kontaktieren).

2.3. BIOAGEL

BIOAGEL beinhaltet jetzt Informationen des neuen Fragebogens für 13-14-Jährige, der 2016 (v33) eingeführt wurde. Der Fragebogen beinhaltet Variablen zu Persönlichkeit, Freizeitaktivitäten, persönlichen Kontakten, Bildungsziele und Familienleben und wird von den jungen Befragten selbst beantwortet. Viele der Fragen stammen aus dem Fragebogen für 11-12-Jährige, der im Jahr 2014 (v31) im SOEP eingeführt wurde. Für die Befragten, die diesen Fragebogen bereits ausgefüllt haben, stellen wir nun erstmals die längsschnittlichen Informationen über die Entwicklung in vielen Bereichen, beispielsweise Persönlichkeit und Bildungsziele, zur Verfügung.

2.4. REFUGSPELL

Für die Migrationsbiografien der Geflüchteten-Befragung  wurde der Spell-Datensatz REFUGSPELL erstellt. Die Variablen in MIGSPELL und REFUGSPELL wurden von verschiedenen Instrumenten abgeleitet und überschneiden sich nur teilweise. Die Datenstruktur erlaubt es, die beidenDatensätze, falls gewünscht,  miteinander zu verbinden. Eine detaillierte Dokumentation finden Sie in der Biografie-Datendokumentation des SOEP.

2.5. Neue Variablen in $PGEN

$P_RELIGION (Religious affiliation)

    Eine integrierte Version der Religionszugehörigkeit für alle in 2016 befragten Personen, da es in der Befragung der Migrationsstichproben zusätzliche Differenzierungen gibt.

PICORIG[A-C]$$ (Partei-Identifikation im Herkunftsland)

  • PICORIGA16 - Partei-Identifikation im Herkunftsland
  • PICORIGB16 - Parteien im Herkunftsland, mit der die Identifikation besteht
  • PICORIGC16 - Partei-Familie, zu der die Partei gehört

2.6 Neue Variablen in $PEQUIV

  • KIDY$$ Einkommen der Kinder im Haushalt
  • FKIDY$$ Imputationsflagge für das Einkommen von Kindern im Haushalt
  • IWITH$$ Gewinnentnahme
  • FWITH$$ Imputationsflagge für Gewinnentnahme

2.7. Greifkraft-Daten für 2016

GRIPSTR Update: Die Greifkraft-Daten der Befragung 2016 sind jetzt im GRIPSTR-Datensatz integriert.

3. Berichtigungen geänderte Datensätze oder Variablen

3.1. Variablen in PPFAD

3.1.1. GERMBORN, CORIGIN und IMMIYEAR:

Die Informationen des Geburtslandes (GERMBORN, CORIGIN) und das Jahr der Immigration (IMMIYEAR) werden nicht mehr mit den Vojahresangaben in PPFAD verglichen und entsprechend den Vorjahresangaben in PPFAD vercoded. Stattdessen sind alle verfügbaren Informationen der Befragten im SOEP gesammelt und verglichen worden, um die Variablen zu codieren. Es wurde sich bemüht (1) über alle Befragten Informationen bereitzustellen,  was zu einer erheblichen Reduzierung der fehlenden Werte und (2) Gruppenkategorien für Geburtsländer wie Osteuropa (jetzt z.B. Polen) zu vermeiden. Drei neue Variablen, GERMBORNINFO, CORIGININFO, und IMMIYEARINFO werden in v33 eingeführtt, um auf die Qualität der Informationen in GERMBORN, CORIGIN, und IMMIYEAR hinzuweisen.

3.1.2. MIGBACK und MIGINFO:

Die Änderungen in GERMBORN haben Einfluss auf MIGBACK und MIGINFO, resultierend aus einigen Werteänderungen und einem stärkeren Fokus auf die Verfügbarkeit von elterlichen Informationen in MIGINFO.

3.1.3. LOC1989:

Es wurden verschiedene Proxies genutzt, um den Wohnsitz der Befragten im Jahr 1989 zu vercoden (Variable HCLOC1989) was eine Veränderung einiger Werte zur Folge hat. Eine neue Variable LOCINFO wird in v33 eingeführt, die auf die Qualität der Informationen in der Variable HLOC1989 hinweist. 

3.2. BIOIMMIG

Die Zielpopulation und die Stichprobengröße des BIOIMMIG-Datensatzes hat sich geändert. Der Datensatz ist nicht länger bechränkt auf die Befragten, die im Ausland geboren wurden und keine deutsche Staatsbürgerschaft besitzen. Außerdem sind Fälle ohne valide BIOIMMIG-Informationen irgendeiner Welle oder Fälle, die nur valide Informationen über BISCGCF enthalten, nicht länger im Datensatz.

3.3. Update von PWEALTH und HWEALTH

Bislang waren für 2012 die ehemaligen FiD-Samples nicht integriert, obwohl diese auch den Vermögensfragebogen erhalten hatten. Mit der jetzigen Datenweitergabe sind auch diese Fälle integriert.

3.4. BIOPAREN

BIOPAREN wurde ganz neu aufgebaut. Es wurden redundante Variablen entfernt und Variablennamen einheitlich ins Englische übersetzt (das bedeutet z.B. dass VNR jetzt FNR ist, weil „Vater“ jetzt „father“ wurde). Bitte schauen Sie sich die Dokumentation an, für eine ausführliche Liste der Änderungen und eine aktualisierte Übersicht der Variablennamen.

3.5. $PGEN

Bei den Variablen DEGREE$$, FIELD$$, TRAIN[A-D]$$ ergeben sich bei einigen Personen in der Retrospektive Abweichungen. Die Systematik wurde bei inkonsistenten Mehrfachnennungen verbessert. Zudem wurde der Umsteigeschlüssel der Berufsangaben nach Klassifikation ISCO-88 zu KldB92 für TRAIN[A-D]$$ von zwei auf vier Stellen erweitert und der Umsteigeschlüssel selbst überarbeitet.

3.6. $HGEN

In der Welle BF gab es eine größere Änderung bei der Abfrage der Miete. So wurden die Mietnebenkosten in detaillierter Weise als bisher abgefragt. Ex post stellte sich heraus, dass diese Form der Befragung für einige Befragte zu komplex war und die Umstellung zu einem leichten Bruch in der Zeitreihe führte. Infolgedessen sind die Durchschnittsmieten laut SOEP – wie auch in Vergleichsstatistiken – über die Zeit systematisch angestiegen, allerdings nicht mehr in 2014 und 2015. Dieser Bruch ist über die veränderte Abfrage zu erklären. Mit der Welle BG erfolgte daher wieder eine Abfrage der Miete wie in Welle BD. Mit der Welle BG sind zudem die Geflüchtetenstichproben M3 und M4 Teil des SOEP. Da diese nicht zu Nebenkosten befragt wurden, wurde für diese keine Mietvariable generiert.

1984 - 2016 (Welle BG)

18.05.2018

1. Datensatz $PGEN: Variable casmin$$

1. Datensatz $PGEN: Variable CASMIN$$

Durch eine fehlende Klammer in der Programmierung wurden Individuen mit CASMIN Kategorie 6 ( "(2c_gen) general maturity certificate") fälschlicherweise in CASMIN Kategorie 7 ("(2c_voc) vocational maturity certificate") eingestuft.

Für die Welle BG bedeutet das, dass von den 4.553 Beobachtungen in Kategorie 7 eigentlich 1.976 in Kategorie 6 gehören und 2.577 in Kategorie 7.

Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich. Für Welle BG ist dies folgendermaßen möglich:

replace casmin16= 6 if  inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3              

replace casmin16= 7 if (inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3)  & (inlist(bgpbbila,2,3,5,6,8) | (bgpbbil01>=1 & bgpbbil01<.) | (bgpbbilo>=1 & bgpbbilo<.))

replace casmin16= 8 if inlist(bgpbbil02,1,4)                                   

replace casmin16= 9 if inlist(bgpbbil02,2,3,5,6,7,8) | inlist(bgpbbila,4,7,9)

2. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA („Vocational Degree Outside Germany“)

Die Variable _BBILA (Ausländische Abschlüsse – berufliche Bildung) wurde in der Version SOEP v33 rückwirkend erweitert um den Hinweis, ob ein Abschlusszeugnis vorlag. Bei dieser Überarbeitung sind nicht alle Teile der in verschiedenen Modulen erfassten Informationen berücksichtigt worden. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich und ist in dem folgenden Code beschrieben: Statement (TXT, 2.72 KB)

Dataset Variable Variable Label
bepgen bepbbila Vocational Degree Outside Germany
bfpgen bfpbbila Vocational Degree Outside Germany
bgpgen bgpbbila Vocational Degree Outside Germany

3. Datensatz BIOAGEL: Variable bioage

Im Datensatz BIOAGEL wurde leider für die Variable BIOAGE der Datentyp nicht angepasst. Die Variable zeigt an, aus welchem Erhebungsinstrument die entsprechende Datenzeile stammt. Da die Variable BIOAGE seit der v33 Werte > 99 beinhaltet, führte dies dazu, dass beim Einlesen in Stata Werte > 99 abgeschnitten wurden. Die abgeschnittenen Ausprägungen sind:

Variable Value Label
bioage 101 'bioage10a'
bioage 102 'bioage10b(only FID)'

4. Datensatz CIRDEF: Variable RGROUP

Die Variable RGROUP unterteilt die SOEP-Stichprobe in 20 gleich große Gruppen. Mit Hilfe der Variable wird die 50%-Stichprobe ausgewählt. Auf Grund der nicht korrekten Zuordnung der neuen Stichproben M3 und M4 sind keine Fälle aus dieser Stichprobe in der Lehrversion der SOEP-Daten enthalten.

30.1.2018 Neue Datenlieferung mit umfangreichen Änderungen, die auf der Seite 'Änderungen am Datensatz' beschrieben sind


Individual (PAPI) 2016: Field-de Field-en Var-de Var-en
Household (PAPI) 2016: Field-de Field-en Var-de Var-en
Biography (PAPI) 2016: Field-de Var-de Var-en
Catch-up Individual 2016: Field-de Var-de Var-en
Youth (16-17-year-olds, A-L1) 2016: Field-de Var-de Var-en
Early Youth (13-14-year-olds) 2016: Field-de
Pre-teen (11-12-year-olds) 2016: Field-de
Early Youth (13-14-year-olds) 2016: Var-de
Pre-teen (11-12-year-olds) 2016: Var-de
Early Youth (13-14-year-olds) 2016: Var-en
Pre-teen (11-12-year-olds) 2016: Var-en
Mother and Child (Newborns) 2016: Field-de Var-de Var-en
Mother and Child (2-3-year-olds) 2016: Field-de Var-de Var-en
Mother and Child (5-6-year-olds) 2016: Field-de Var-de Var-en
Parents and Child (7-8-year-olds) 2016: Field-de Var-de Var-en
Mother and Child (9-10-year-olds) 2016: Field-de Var-de Var-en
Deceased Individual 2016: Field-de Var-de Var-en
Grip Strength 2016: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2

2) Sampling, Nonresponse, and Integrated Weighting of the 2016 IAB-BAMF-SOEP Survey of Refugees (M3/M4) – revised version

3) SOEP-Core – Documentation of Sample Sizes and Panel Attrition (1984 until 2016)

4) SOEP-Core v33.1 – Biographical Information in the Meta File PPFAD (Month of Birth, Year of Death, Immigration Variables, Living in East or West Germany in 1989)

5) SOEP-Core v33.1 – PPFAD

6) SOEP-Core v33.1 – Documentation of the Household-related Meta-dataset HPFAD

7) SOEP-Core v33.1 – $PBRUTTO

8) SOEP-Core v33.1 – $HBRUTTO

9) SOEP-Core v33.1 – Documentation of Person-related Status and Generated Variables in $PGEN

10) SOEP-Core v33.1 – Documentation of Household-related Status and Generated Variables in $HGEN

11) SOEP 2016 – Codebook for the $PEQUIV File 1984-2016: CNEF Variables with Extended Income Information for the SOEP

12) SOEP-Core v33.1 – BIOIMMIG: Generated Variables for Foreign Nationals, Immigrants, and Their Descendants in the SOEP

13) SOEP-Core v33.1 – HEALTH

14) SOEP-Core v33.1 – BIOPAREN: Biography Information for the Parents of SOEP-Respondents

15) SOEP-Core v33.1 – BIOAGEL: Generated Variables from the “Mother & Child”, “Parent”, and “Pupils” Questionnaires

16) SOEP-Core v33.1 – BIOSIB: Information on Siblings in the SOEP

17) SOEP-Core v33.1 – The Couple History Files BIOCOUPLM and BIOCOUPLY, and Marital History Files BIOMARSM and BIOMARSY

18) SOEP-Core v33.1 – BIOAGE17: The Youth Questionnaire

19) SOEP-Core v33.1 – BIOSOC: Retrospective Data on Youth and Socialization

20) SOEP-Core v33.1 – BIOJOB: Detailed Information on First and Last Job

21) SOEP-Core v33.1 – BIOEDU: Data on Educational Participation and Transitions

22) SOEP-Core v33.1 – BIORESID: Variables on Occupancy and Second Residence

23) SOEP-Core v33.1 – BIOBIRTH: A Data Set on the Birth Biography of Male and Female Respondents

24) SOEP-Core v33.1 – BIOTWIN: TWINS in the SOEP

25) SOEP-Core v33 – INTERVIEWER: Detailed Information on SOEP Interviewers

26) SOEP-Core v33.1 – LIFESPELL: Information on the Pre- and Post-Survey History of SOEP-Respondents

27) SOEP-Core v33.1 – MIGSPELL and REFUGSPELL: The Migration-Biographies of Samples M1/M2 and M3/M4

28) SOEP-Core v33.1 – Activity Biography in the Files PBIOSPE and ARTKALEN

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

3) The Request for Record Linkage in the IAB-SOEP Migration Sample

4) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

5) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

6) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

7) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

8) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

9) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

10) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

11) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

12) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

13) SOEP Scales Manual (updated for SOEP-Core v32.1)

14) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

15) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

16) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

17) Multi-Itemskalen im SOEP Jugendfragebogen

18) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

19) Dokumentation zum Entwicklungsprozess des Moduls „Einstellungen zu sozialer Ungleichheit“ im SOEP (v38)

20) SOEP-CoV: Project and Data Documentation

21) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

22) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE

23) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables

24) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

25) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

26) SOEP-Core v36: Codebook for the EU-SILC-like panel for Germany based on the SOEP

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite

keyboard_arrow_up