SOEP-Core v33.1 - Datensatzinformation

Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 zwei Flüchtlings-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v33i).

Datensatzinformation

Titel: Sozio-oekonomisches Panel (SOEP), Daten der Jahre 1984-2016

DOI: 10.5684/soep.v33.1
Erhebungszeitraum: 1984-2016
Veröffentlichungsdatum: 30.01.2018
Primärforscher: Jürgen Schupp, Jan Goebel, Martin Kroh, Carsten Schröder, Charlotte Bartels, Klaudia Erhardt, Alexandra Fedorets, Andreas Franken, Marco Giesselmann, Markus Grabka, Peter Krause, Hannes Kröger, Simon Kühne, Maria Metzing, Jana Nebelin, David Richter, Diana Schacht, Paul Schmelzer, Christian Schmitt, Daniel Schnitzlein, Rainer Siegers, Knut Wenzig

Die vollständigen Informationen erhalten Sie unter der DOI des Originaldatensatzes https://doi.org/10.5684/soep.v33.

Datensatzinformationen:

 Anzahl der Einheiten 126.151
 Anzahl der Variablen 72.709 in 439 Datensätzen
 Datenformat STATA, SPSS, SAS, CSV

MD5 fingerprints

 

Weitergabeformat zip-Datei Einzeldatensätze
Stata zweisprachig dfe399ba3879874dbdd0096b58cbd90f  
Stata deutsch 9cbe419645ee17bdb5265df5a5662802  
Stata englisch 3a195c128e21b732d8b1f0ff64316b35  
SPSS deutsch 33763b1f68c54f790d9826b4923ac276  
SPSS englisch 0454017269b9f5601d3fe30ace13211f  
SAS deutsch 84c5124b696a552340b1d7bca79c8c15  
SAS englisch e6cb205a9d2abec3a37872f1dbf2a6e8  
CSV df524ba26e46b42ff77dd6991046485d  
GGKBOU 1fd60d2f3f1a405d508cf472ff916cc9  
GGKBOU englisch 67c43e2e72aab736e6c6dafb75da57f5  
Lehrversionen
Stata deutsch 3ecf547c653dfac561cb618c306972c8
Stata englisch 598ba143e4d7115fcc183dd1517af0d1
SPSS deutsch 0f6ffcfcbdf0982afe48582603e20f97
SPSS englisch 96adf7fef897ddb346253598a9e93242
SAS deutsch 16a66eacf4032b2ba8fe55f5e242bc3f
SAS englisch d921f61ee31459a4b54ea74d0dda9d10

 Veröffentlichungen:

  • Schupp, Jürgen (2009): 25 Jahre Sozio-oekonomisches Panel - Ein Infrastrukturprojekt der empirischen Sozial- und Wirtschaftsforschung in Deutschland, Zeitschrift für Soziologie 38 (5),  350-357 (download).
  • Gert G. Wagner, Jan Göbel, Peter Krause, Rainer Pischner, and Ingo Sieber (2008) Das Sozio-oekonomische Panel (SOEP): Multidisziplinäres Haushaltspanel und Kohortenstudie für Deutschland - Eine Einführung (für neue Datennutzer) mit einem Ausblick (für erfahrene Anwender), AStA Wirtschafts- und Sozialstatistisches Archiv 2 (4), 301-328 (download).
  • Gert G. Wagner, Joachim R. Frick, and Jürgen Schupp (2007) The German Socio-Economic Panel Study (SOEP) - Scope, Evolution and Enhancements, Schmollers Jahrbuch (Journal of Applied Social Science Studies), 127 (1), 139-169 (download).

In Publikationen, die diese Datei verwenden, soll auf die oben genannte DOI infoZur Erklärung von DOI und dessen Verwendung gibt es hier Informationen . verwiesen und eine der folgende Referenzen zitiert werden:

  • Goebel, Jan, Markus M. Grabka, Stefan Liebig, Martin Kroh, David Richter, Carsten Schröder, and Jürgen Schupp. 2019. The German Socio-Economic Panel (SOEP). Jahrbücher für Nationalökonomie und Statistik 239 (2), 345-360. (https://doi.org/10.1515/jbnst-2018-0022)
  • Giesselmann, Marco, Sandra Bohmann, Jan Goebel, Peter Krause, Elisabeth Liebau, David Richter, Diana Schacht, Carsten Schröder, Jürgen Schupp, and Stefan Liebig. 2019. The Individual in Context(s): Research Potentials of the Socio-Economic Panel Study (SOEP) in Sociology. European Sociological Review 35 (5), 738-755. (https://doi.org/10.1093/esr/jcz029)

SOEP-Core soep.v33.1

1 Löschung nicht korrekt durchgeführter Interviews in der IAB-BAMF-SOEP Befragung Geflüchteter

Im Zuge der Vorbereitung der Wiederholungsbefragung wurde vom Befragungsinstitut festgestellt, dass ein Interviewer / eine Interviewerin die Befragungen nicht ordnungsgemäß durchgeführt hat. Betroffen sind sechs Prozent der realisierten Haushaltsinterviews dieses Subsamples. Die betroffenen Haushalte wurden aus dem Datensatz entfernt, stehen aber an einem Gastarbeitsplatz im SOEP-RDC auf Nachfrage für survey-methodologische Analysen zu Verfügung. Neben der Löschung der entsprechenden Zeilen in allen betroffenen Datensätzen erfolgten noch die folgenden Anpassungen:

  • Aufgrund der Löschung der Haushalts- und Personen-Interviews war ein Update der Gewichte notwendig (Datensatz HHRF und PHRF), das nunmehr der leicht verminderten Fallzahl im Befragungsjahr 2016 Rechnung trägt.
  • Aktualisierung bzw Übernahme der neuen Gewichte im Datensatz BGPEQUIV
  • Aktualisierung der Imputation des monatlichen Haushaltsnettoeinkommen (I[1-5]HINC16) für diese Stichprobe in BGHGEN und im Datensatz MIHINC.

2 Update INTID in BG files

In den Datensätzen der aktuellen Welle BG waren zum Teil fehlerhaft zugewiesene Interviewer-IDs enthalten, diese wurde korrigiert.

3 Korrigierte Anzahl an Einträgen in $$KIND (2014-2016)

In einem Abgleich der zentralen Variablen zur Populationszugehörigkeit in PPFAD und den $$KIND-Datensätzen wurden Inkonsistenzen behoben. In den $$KIND-Datensätzen der Jahre 2014 bis 2016 gab es einen Fehler bezügich der Abgrenzung der Zielpopulation um ein Jahr. Teilweise fehlten hierdurch die folgenden Geburtsjahrgänge in den Kinderfiles:

  •   bekgjahr: 1998 für alle Stichproben
  •   bfkgjahr: 1999 für alle Stichproben
  •  bgkgjahr: 1999 nur die Stichproben M3 und M4 in 2016

Diese Korrekturen haben ebenfalls Einfluss auf die Fallzahl im File KIDLONG, der dementsprechend ebenfalls aktualisiert wurde.

3.1 Änderung der $$NETTO-Codes in 96 Fällen (Kinder) in den Jahren 2014-2016

Gleichzeitig kam es im Rahmen der Datenprüfung zum Abgleich und Korrektur der $$NETTO-Codes in PPFAD. In den Befragungsjahren 2014 bis 2016 wurden fälschlich 96 Kinder auf der Variable $$NETTO im Datensatz PPFAD der Code "20" statt "30" zugewiesen. Dieser Fehler ist in der Korrektur der Variablen $$NETTO in v33.1 behoben. Das Update hat jedoch auch eine Korrektur der Personengewichte in den betroffenen Befragungsjahren notwendig gemacht (Datensatz PHRF), da sich die Abgrenzung der Personen in realisierten Haushalten, die ein gültiges Gewicht erhalten, an der Variablen $$NETTO orientiert. Auch das Update der Gewichtung ist in v33.1 enthalten.

4 Update BIOPAREN

In BIOAPREN konnten einige Werte bei den Flag-Variablen für die (Berufs-)Ausbildung der Eltern und ggf. deren Todesjahre ergänzt werden.

5 Update MIGSPELL

Der Algorithmus zur Imputation fehlender Datumsangaben in den Spells wurde optimiert. Daher haben sich in v33.1 die imputierten Variablen sowie die aus diesen abgeleiteten Variablen verändert. Im Einzelnen: alle Variablen mit dem Zusatz _imp sowie staytime. Die Änderungen betrafen insgesamt 349 von 15.640 Spells.

6 Update AUSB16 in BGPGEN

In der Variablen AUSB16 („erforderliche Ausbildung im Beruf“) in BGPGEN wurden die fehlenden Angaben [Missings -1] für Befragte ohne Jobwechsel anhand der Information aus dem Vorjahr aufgefüllt. Sie enthält jetzt deutlich weniger Missings.

SOEP-Core soep.v33

Die neue Datendistribution (1984–2016) "SOEP v33" bietet für den aktuellsten Erhebungszeitraum des Jahres 2016 die üblichen wellenspezifischen Variablen in BGPBRUTTO, BGP, BGPKAL, BGPGEN, BGHBRUTTO, BGH, BGHGEN, BGKIND, BGP_MIG und BFPLUECKE sowie die aktualisierten Variablen/Datensätze mit längsschnittlichen Komponenten (PFAD-Dateien, Biografie-Dateien, Spelldaten und Gewichtungsfaktoren). Die Besonderheiten zusätzlicher neuer Stichproben, Datensätze oder Variablen sowie Veränderungen in der Aufbereitung älterer sind hier aufgeführt.

1 Neue Stichproben aus der IAB-BAMF-SOEP-Befragung von Geflüchteten (Samples M3/M4)

Mit der Version 33 der SOEP Daten werden auch die integrierten Daten der IAB-BAMF-SOEP-Befragung von Geflüchteten 2016 in Deutschland als zwei Ergänzungsstichproben des SOEP weitergegeben. Die Stichproben stützen sich auf die Grundgesamtheit der Geflüchteten unabhängig von ihrem Aufenthaltsstatus, die vom 1. Januar 2013 bis 31. Januar 2016 nach Deutschland eingereist sind. Die Samples wurden durch eine zusätzliche Finanzierung durch BA/IAB/BMAS im Fall von M3 realisiert und durch das BMBF im Fall von M4. In Stichprobe M4 wurden besonders viele geflüchtete Familien gezogen, in denen Kinder und Jugendliche leben.

Die Datengrundlage für die Ziehung der Stichprobe bildete das Ausländerzentralregister (AZR). Es wurden im Rahmen dieser Stichprobe im Jahr 2016 4.816 erwachsene Personen in 3.554 Haushalten interviewt sowie Basisangaben von in diesen Haushalten lebenden 5.717 Minderjährigen erhoben. Zur Durchführung der Befragung wurde der Fragebogen in sieben Sprachen übersetzt, teilweise wurden SprachmittlerInnen eingesetzt. Um den besonderen Bedingungen der Zielgruppe Rechnung zu tragen, wurden darüber hinaus audiounterstützte Erhebungsinstrumente entwickelt.

Die Befragung setzt sich aus einem integrierten Personen-Lebenslauffragebogen und einem Haushaltsfragebogen sowie einem Fragebogen für InterviewerInnen zusammen. Wie schon bei den Samples M1 und M2 (IAB-SOEP-Migrationsstichproben) wurden die TeilnehmerInnen nach ihrer Zustimmung gefragt, die Befragungsdaten mit den Integrierten Erwerbsbiografien des IAB zu verknüpfen. Die verknüpften Daten werden über das Forschungsdatenzentren der BA am IAB für interessierte Forscherinnen und Forscher voraussichtlich ab Frühjahr 2018 zur Verfügung stehen.

Eine ausführlichere Beschreibung des Studiendesign in: Martin Kroh et al. 2016. Das Studiendesign der IAB-BAMF-SOEP-Befragung von Geflüchteten. SOEP Survey Papers 365: Series C. Berlin: DIW Berlin / SOEP.

 

1.1 Integration ins SOEP und die Originaldaten (BGP und BGP_REF)

Die Originaldaten der Befragungsinstrumente, die in den Stichproben M3 und M4 genutzt wurden, sind im Datensatz BGP_REF abgelegt, hier sind Personen- und Biografiedaten wie im Fragebogen kombiniert. Die Variablen sind darüber hinaus aber auch in anderen Standard- oder generierten Datensätzen abgelegt:

  • Variablen, die so auch in Personenfragebögen anderer Stichproben vorkommen, wurden in den Datensatz BGP integriert. Ebenso wurden in BGP alle diejenigen Variablen integriert, die zwar spezifisch für den Geflüchteten-Fragebogen sind, aber auch in den künftigen Wellen vorkommen werden.
  • Variablen, die so auch in den Biografiefragebögen anderer Stichproben vorkommen, wurden in die jeweiligen Biografie-Datensätze integriert (z.B. BIOMARSM).
  • Die vollständige Migrationsbiografie wurde in dem neuen Datensatz REFUGSPELL aufbereitet.

2 Neue Datensätze und Variablen

2.1 Datensätze, die auf einem Erhebungsinstrument basieren (z.B. $P und $H)

2.1.1 $PINSTRUMENT und $HINSTRUMENT

Mit der Integration der neuen Migrationsstichproben seit 2013 enthalten die $P- und $H-Datensätze die Daten aus mehr als einem Erhebungsinstrument. Basis ist nach wie vor der Papierfragebogen der Stichproben A-L1, er wird aber mit Daten aus den samplespezifischen Erhebungsinstrumenten aufgefüllt. Damit dies für die NutzerInnen einfach nachvollziehbar ist, gibt es ab der Welle BD (2013) jetzt in $H und $P jeweils eine Variable, die für jeden Fall das jeweilige Instrument identifiziert.

2.1.2. Zusätzliche Variablen bei den Berufcodes

Es gibt jetzt deutlich mehr Variablen, die kodierte Berufsinformationen in den verschiedenen fragebogenbasierenden Datensätzen ($P, $JUGEND, $LUECKE, außerdem $P_MIG und $P_REFUGEES) enthalten. Die Variablen können mit Hilfe der Suffixe identifiziert werden, welche die genutzte Klassifikation kennzeichnet. Für alle Berufe sind ISCO-88 und KldB92 verfügbar, ältere  $P-Datensätze beinhalten auch ISCO-68 und bei neueren Datensätzen sind  ISCO-08 und KldB2010 verfügbar.

2.1.3. $JUGEND

Seit 2000 (Welle Q) erhalten Erstbefragte zwischen 16 und 17 Jahren einen separaten Biographiefragebogen, mit zusätzlichen jugendspezifischen Fragen wie beispielsweise dem Verhältnis zu ihren Eltern oder zu ihrem Freizeitverhalten. Bis jetzt wurden die hieraus gewonnen Daten nur teilweise und in aufbereiteter Form durch den Datensatz BIOAGE17 zur Verfügung gestellt. Ab dieser Version werden die kompletten Daten in einzelnen $JUGEND-Datensätzen zur Verfügung stehen.

2.2. Neue Variablen in PPFAD

2.2.1. SEXOR

Die Variable SEXOR verbindet Informationen der sexuellen Orientierung von Befragten aus verschiedenen Quellen innerhalb des SOEP. Im Jahr 2016 (Welle BG) wurde zum ersten Mal im SOEP eine direkte Frage zum Thema sexueller Orientierung gestellt.

2.2.2. Geburtsregion

Die Variable gibt das Bundesland des Geburtsortes an und zwar für Personen, die nach 2012 befragt und innerhalb des Gebietes der jetzigen Bundesrepublik geboren wurden. Detailliertere Informationen zum Geburtsort bis auf die Ebene der Gemeinde kann im Rahmen eines Gastaufenthaltes am FDZ SOEP genutzt werden (hierzu bitte Email kontaktieren).

2.3. BIOAGEL

BIOAGEL beinhaltet jetzt Informationen des neuen Fragebogens für 13-14-Jährige, der 2016 (v33) eingeführt wurde. Der Fragebogen beinhaltet Variablen zu Persönlichkeit, Freizeitaktivitäten, persönlichen Kontakten, Bildungsziele und Familienleben und wird von den jungen Befragten selbst beantwortet. Viele der Fragen stammen aus dem Fragebogen für 11-12-Jährige, der im Jahr 2014 (v31) im SOEP eingeführt wurde. Für die Befragten, die diesen Fragebogen bereits ausgefüllt haben, stellen wir nun erstmals die längsschnittlichen Informationen über die Entwicklung in vielen Bereichen, beispielsweise Persönlichkeit und Bildungsziele, zur Verfügung.

2.4. REFUGSPELL

Für die Migrationsbiografien der Geflüchteten-Befragung  wurde der Spell-Datensatz REFUGSPELL erstellt. Die Variablen in MIGSPELL und REFUGSPELL wurden von verschiedenen Instrumenten abgeleitet und überschneiden sich nur teilweise. Die Datenstruktur erlaubt es, die beidenDatensätze, falls gewünscht,  miteinander zu verbinden. Eine detaillierte Dokumentation finden Sie in der Biografie-Datendokumentation des SOEP.

2.5. Neue Variablen in $PGEN

$P_RELIGION (Religious affiliation)

    Eine integrierte Version der Religionszugehörigkeit für alle in 2016 befragten Personen, da es in der Befragung der Migrationsstichproben zusätzliche Differenzierungen gibt.

PICORIG[A-C]$$ (Partei-Identifikation im Herkunftsland)

  • PICORIGA16 - Partei-Identifikation im Herkunftsland
  • PICORIGB16 - Parteien im Herkunftsland, mit der die Identifikation besteht
  • PICORIGC16 - Partei-Familie, zu der die Partei gehört

2.6 Neue Variablen in $PEQUIV

  • KIDY$$ Einkommen der Kinder im Haushalt
  • FKIDY$$ Imputationsflagge für das Einkommen von Kindern im Haushalt
  • IWITH$$ Gewinnentnahme
  • FWITH$$ Imputationsflagge für Gewinnentnahme

2.7. Greifkraft-Daten für 2016

GRIPSTR Update: Die Greifkraft-Daten der Befragung 2016 sind jetzt im GRIPSTR-Datensatz integriert.

3. Berichtigungen geänderte Datensätze oder Variablen

3.1. Variablen in PPFAD

3.1.1. GERMBORN, CORIGIN und IMMIYEAR:

Die Informationen des Geburtslandes (GERMBORN, CORIGIN) und das Jahr der Immigration (IMMIYEAR) werden nicht mehr mit den Vojahresangaben in PPFAD verglichen und entsprechend den Vorjahresangaben in PPFAD vercoded. Stattdessen sind alle verfügbaren Informationen der Befragten im SOEP gesammelt und verglichen worden, um die Variablen zu codieren. Es wurde sich bemüht (1) über alle Befragten Informationen bereitzustellen,  was zu einer erheblichen Reduzierung der fehlenden Werte und (2) Gruppenkategorien für Geburtsländer wie Osteuropa (jetzt z.B. Polen) zu vermeiden. Drei neue Variablen, GERMBORNINFO, CORIGININFO, und IMMIYEARINFO werden in v33 eingeführtt, um auf die Qualität der Informationen in GERMBORN, CORIGIN, und IMMIYEAR hinzuweisen.

3.1.2. MIGBACK und MIGINFO:

Die Änderungen in GERMBORN haben Einfluss auf MIGBACK und MIGINFO, resultierend aus einigen Werteänderungen und einem stärkeren Fokus auf die Verfügbarkeit von elterlichen Informationen in MIGINFO.

3.1.3. LOC1989:

Es wurden verschiedene Proxies genutzt, um den Wohnsitz der Befragten im Jahr 1989 zu vercoden (Variable HCLOC1989) was eine Veränderung einiger Werte zur Folge hat. Eine neue Variable LOCINFO wird in v33 eingeführt, die auf die Qualität der Informationen in der Variable HLOC1989 hinweist. 

3.2. BIOIMMIG

Die Zielpopulation und die Stichprobengröße des BIOIMMIG-Datensatzes hat sich geändert. Der Datensatz ist nicht länger bechränkt auf die Befragten, die im Ausland geboren wurden und keine deutsche Staatsbürgerschaft besitzen. Außerdem sind Fälle ohne valide BIOIMMIG-Informationen irgendeiner Welle oder Fälle, die nur valide Informationen über BISCGCF enthalten, nicht länger im Datensatz.

3.3. Update von PWEALTH und HWEALTH

Bislang waren für 2012 die ehemaligen FiD-Samples nicht integriert, obwohl diese auch den Vermögensfragebogen erhalten hatten. Mit der jetzigen Datenweitergabe sind auch diese Fälle integriert.

3.4. BIOPAREN

BIOPAREN wurde ganz neu aufgebaut. Es wurden redundante Variablen entfernt und Variablennamen einheitlich ins Englische übersetzt (das bedeutet z.B. dass VNR jetzt FNR ist, weil „Vater“ jetzt „father“ wurde). Bitte schauen Sie sich die Dokumentation an, für eine ausführliche Liste der Änderungen und eine aktualisierte Übersicht der Variablennamen.

3.5. $PGEN

Bei den Variablen DEGREE$$, FIELD$$, TRAIN[A-D]$$ ergeben sich bei einigen Personen in der Retrospektive Abweichungen. Die Systematik wurde bei inkonsistenten Mehrfachnennungen verbessert. Zudem wurde der Umsteigeschlüssel der Berufsangaben nach Klassifikation ISCO-88 zu KldB92 für TRAIN[A-D]$$ von zwei auf vier Stellen erweitert und der Umsteigeschlüssel selbst überarbeitet.

3.6. $HGEN

In der Welle BF gab es eine größere Änderung bei der Abfrage der Miete. So wurden die Mietnebenkosten in detaillierter Weise als bisher abgefragt. Ex post stellte sich heraus, dass diese Form der Befragung für einige Befragte zu komplex war und die Umstellung zu einem leichten Bruch in der Zeitreihe führte. Infolgedessen sind die Durchschnittsmieten laut SOEP – wie auch in Vergleichsstatistiken – über die Zeit systematisch angestiegen, allerdings nicht mehr in 2014 und 2015. Dieser Bruch ist über die veränderte Abfrage zu erklären. Mit der Welle BG erfolgte daher wieder eine Abfrage der Miete wie in Welle BD. Mit der Welle BG sind zudem die Geflüchtetenstichproben M3 und M4 Teil des SOEP. Da diese nicht zu Nebenkosten befragt wurden, wurde für diese keine Mietvariable generiert.

1984 - 2016 (Welle BG)

18.05.2018

1. Datensatz $PGEN: Variable casmin$$

1. Datensatz $PGEN: Variable CASMIN$$

Durch eine fehlende Klammer in der Programmierung wurden Individuen mit CASMIN Kategorie 6 ( "(2c_gen) general maturity certificate") fälschlicherweise in CASMIN Kategorie 7 ("(2c_voc) vocational maturity certificate") eingestuft.

Für die Welle BG bedeutet das, dass von den 4.553 Beobachtungen in Kategorie 7 eigentlich 1.976 in Kategorie 6 gehören und 2.577 in Kategorie 7.

Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich. Für Welle BG ist dies folgendermaßen möglich:

replace casmin16= 6 if  inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3              

replace casmin16= 7 if (inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3)  & (inlist(bgpbbila,2,3,5,6,8) | (bgpbbil01>=1 & bgpbbil01<.) | (bgpbbilo>=1 & bgpbbilo<.))

replace casmin16= 8 if inlist(bgpbbil02,1,4)                                   

replace casmin16= 9 if inlist(bgpbbil02,2,3,5,6,7,8) | inlist(bgpbbila,4,7,9)

2. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA („Vocational Degree Outside Germany“)

Die Variable _BBILA (Ausländische Abschlüsse – berufliche Bildung) wurde in der Version SOEP v33 rückwirkend erweitert um den Hinweis, ob ein Abschlusszeugnis vorlag. Bei dieser Überarbeitung sind nicht alle Teile der in verschiedenen Modulen erfassten Informationen berücksichtigt worden. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich und ist in dem folgenden Code beschrieben: Statement (TXT, 2.72 KB)

Dataset Variable Variable Label
bepgen bepbbila Vocational Degree Outside Germany
bfpgen bfpbbila Vocational Degree Outside Germany
bgpgen bgpbbila Vocational Degree Outside Germany

3. Datensatz BIOAGEL: Variable bioage

Im Datensatz BIOAGEL wurde leider für die Variable BIOAGE der Datentyp nicht angepasst. Die Variable zeigt an, aus welchem Erhebungsinstrument die entsprechende Datenzeile stammt. Da die Variable BIOAGE seit der v33 Werte > 99 beinhaltet, führte dies dazu, dass beim Einlesen in Stata Werte > 99 abgeschnitten wurden. Die abgeschnittenen Ausprägungen sind:

Variable Value Label
bioage 101 'bioage10a'
bioage 102 'bioage10b(only FID)'

4. Datensatz CIRDEF: Variable RGROUP

Die Variable RGROUP unterteilt die SOEP-Stichprobe in 20 gleich große Gruppen. Mit Hilfe der Variable wird die 50%-Stichprobe ausgewählt. Auf Grund der nicht korrekten Zuordnung der neuen Stichproben M3 und M4 sind keine Fälle aus dieser Stichprobe in der Lehrversion der SOEP-Daten enthalten.

30.1.2018 Neue Datenlieferung mit umfangreichen Änderungen, die auf der Seite 'Änderungen am Datensatz' beschrieben sind


Individual (PAPI) 2016: Field-de Var-de Var-en
Household (PAPI) 2016: Field-de Var-de Var-en
Biography (PAPI) 2016: Field-de Var-de Var-en
Catch-up Individual 2016: Field-de Var-de Var-en
Youth (16-17-year-olds, A-L1) 2016: Field-de Var-de Var-en
Early Youth (13-14-year-olds) 2016: Field-de
Pre-teen (11-12-year-olds) 2016: Field-de
Early Youth (13-14-year-olds) 2016: Var-de
Pre-teen (11-12-year-olds) 2016: Var-de
Early Youth (13-14-year-olds) 2016: Var-en
Pre-teen (11-12-year-olds) 2016: Var-en
Mother and Child (Newborns) 2016: Field-de Var-de Var-en
Mother and Child (2-3-year-olds) 2016: Field-de Var-de Var-en
Mother and Child (5-6-year-olds) 2016: Field-de Var-de Var-en
Parents and Child (7-8-year-olds) 2016: Field-de Var-de Var-en
Mother and Child (9-10-year-olds) 2016: Field-de Var-de Var-en
Deceased Individual 2016: Field-de Var-de Var-en
Grip Strength 2016: Field-de

Alle Sample-spezifischen Fragebögen dieses Jahres und alle Fragebögen der vorherigen Befragungsjahre finden Sie auf dieser Seite

1) Sampling, Nonresponse, and Integrated Weighting of the 2016 IAB-BAMF-SOEP Survey of Refugees (M3/M4) – revised version

2) SOEP-Core – Documentation of Sample Sizes and Panel Attrition (1984 until 2016)

3) SOEP-Core v33.1 – Biographical Information in the Meta File PPFAD (Month of Birth, Year of Death, Immigration Variables, Living in East or West Germany in 1989)

4) SOEP-Core v33.1 – PPFAD

5) SOEP-Core v33.1 – Documentation of the Household-related Meta-dataset HPFAD

6) SOEP-Core v33.1 – $PBRUTTO

7) SOEP-Core v33.1 – $HBRUTTO

8) SOEP-Core v33.1 – Documentation of Person-related Status and Generated Variables in $PGEN

9) SOEP-Core v33.1 – Documentation of Household-related Status and Generated Variables in $HGEN

10) SOEP 2016 – Codebook for the $PEQUIV File 1984-2016: CNEF Variables with Extended Income Information for the SOEP

11) SOEP-Core v33.1 – BIOIMMIG: Generated Variables for Foreign Nationals, Immigrants, and Their Descendants in the SOEP

12) SOEP-Core v33.1 – HEALTH

13) SOEP-Core v33.1 – BIOPAREN: Biography Information for the Parents of SOEP-Respondents

14) SOEP-Core v33.1 – BIOAGEL: Generated Variables from the “Mother & Child”, “Parent”, and “Pupils” Questionnaires

15) SOEP-Core v33.1 – BIOSIB: Information on Siblings in the SOEP

16) SOEP-Core v33.1 – The Couple History Files BIOCOUPLM and BIOCOUPLY, and Marital History Files BIOMARSM and BIOMARSY

17) SOEP-Core v33.1 – BIOAGE17: The Youth Questionnaire

18) SOEP-Core v33.1 – BIOSOC: Retrospective Data on Youth and Socialization

19) SOEP-Core v33.1 – BIOJOB: Detailed Information on First and Last Job

20) SOEP-Core v33.1 – BIOEDU: Data on Educational Participation and Transitions

21) SOEP-Core v33.1 – BIORESID: Variables on Occupancy and Second Residence

22) SOEP-Core v33.1 – BIOBIRTH: A Data Set on the Birth Biography of Male and Female Respondents

23) SOEP-Core v33.1 – BIOTWIN: TWINS in the SOEP

24) SOEP-Core v33 – INTERVIEWER: Detailed Information on SOEP Interviewers

25) SOEP-Core v33.1 – LIFESPELL: Information on the Pre- and Post-Survey History of SOEP-Respondents

26) SOEP-Core v33.1 – MIGSPELL and REFUGSPELL: The Migration-Biographies of Samples M1/M2 and M3/M4

27) SOEP-Core v33.1 – Activity Biography in the Files PBIOSPE and ARTKALEN

1) Handgreifkraftmessung im Sozio-oekonomischen Panel (SOEP) 2006 und 2008

2) Documentation on ISCED Generation Using the CAMCES Tool in the IAB-SOEP Migration Samples M1/M2

3) The new IAB-SOEP Migration Sample: an introduction into the methodology and the contents

4) The Request for Record Linkage in the IAB-SOEP Migration Sample

5) Flowcharts for the Integrated Individual-Biography Questionnaire of the IAB-SOEP Migration Sample 2013

6) SOEP 2007 – Editing und multiple Imputation der Vermögensinformation 2002 und 2007 im SOEP

7) The Measurement of Labor Market Entries with SOEP Data: Introduction to the Variable EINSTIEG_ARTK

8) Job submission instructions for the SOEPremote System at DIW Berlin – Update 2014

9) SOEP 2015 – Informationen zu den SOEP-Geocodes in SOEP v32

10) Editing and Multiple Imputation of Item Non-response in the Wealth Module of the German Socio-Economic Panel

11) Die Vercodung der offenen Angaben zu den Ausbildungsberufen im Sozio-Oekonomischen Panel

12) Das Studiendesign der IAB-BAMF-SOEP Befragung von Geflüchteten

13) Scales Manual IAB-BAMF-SOEP Survey of Refugees in Germany – revised version

14) SOEP 2010 – Preparation of data from the new SOEP consumption module: Editing, imputation, and smoothing

15) SOEP Scales Manual (updated for SOEP-Core v32.1)

16) Kognitionspotenziale Jugendlicher - Ergänzung zum Jugendfragebogen der Längsschnittstudie Sozio-oekonomisches Panel (SOEP)

17) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der International Standard Classification of Occupations 2008 (ISCO08) - Direktvercodung - Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

18) Die Vercodung der offenen Angaben zur beruflichen Tätigkeit nach der Klassifikation der Berufe 2010 (KldB 2010): Vorgehensweise und Entscheidungsregeln bei nicht eindeutigen Angaben

19) Multi-Itemskalen im SOEP Jugendfragebogen

20) Zur Erhebung des adaptiven Verhaltens von zwei- und dreijährigen Kindern im Sozio-oekonomischen Panel (SOEP)

21) Missing Income Data in the German SOEP: Incidence, Imputation and its Impact on the Income Distribution

22) SOEP 2013 – Documentation of Generated Person-Level Long-Term Care Variables in PFLEGE

23) SOEP-Core v34 – PFLEGE: Documentation of Generated Person-level Long-term Care Variables

24) SOEP 2006 – TIMEPREF: Dataset on the Economic Behavior Experiment on Time Preferences in the 2006 SOEP Survey

25) SOEP-Core v34: Codebook for the EU-SILC-Like Panel for Germany Based on the SOEP

26) Assessing the distributional impact of "imputed rent" and "non-cash employee income" in microdata : Case studies based on EU-SILC (2004) and SOEP (2002)

Alle Dokumentationen zum Filtern finden Sie auf dieser Seite