Datensatzinformation
Die Datenweitergabe 2008 mit den Daten von 1984-2007 enthält für das Jahr 2007 die üblichen wellenspezifischen Datensätze XPBRUTTO, XP, XPKAL, XPGEN, XHBRUTTO, XH, XHGEN, XKIND und WPLUECKE sowie die aktualisierten Datensätze mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren).
Im Befragungsjahr 2006 wurde eine repräsentative Ergänzungsstichprobe für ganz Deutschland gezogen: die Auffrischungsstichprobe H. Die biografischen Hintergrundinformationen der Befragten in Stichprobe H wurden erstmals in 2007 erhoben. Diese Daten sind nun vollständig in die relevanten Biografiedatensätze (BIOxxxx) integriert worden.
Als Teil der SOEP Innovationsprojekte führte TNS Infratest Sozialforschung im Dezember 2006 eine Nacherhebung durch. Sie wurde bei früheren SOEP-Befragten durchgeführt, die aus Haushalten stammen, die zwischen 2001 und 2004 als endgültigeVerweigerungen klassifiziert wurden. Als Nebenprodukt konnten wir die Informationen über das Geburtsjahr von 21 dieser Personen von fehlend auf einen gültigen Wert setzen. Mehr Informationen finden Sie im Methodenbericht von TNS Infratest Sozialforschung.
Darüber hinaus gibt es folgende Erweiterungen bzw. Modifikationen:
A. Neue und umbenannte Datensätze
COGNIT06:
Im Erhebungsjahr 2006 wurde mit einem Subsample des SOEP kurze Kognitionstests mit dem Ziel durchgeführt, eine Reihe robuster Instrumente zur Verfügung zu haben, die von geschulten Interviewern nur wenige Minuten bei der Befragung beanspruchen. Nahezu 80% aller zur Teilnahme am Kognitionstest Ausgewählten gaben gültige Antworten. Das hat zur Folge, dass das SOEP jetzt zum ersten Mal Indikatoren zu kognitiven Leistungspotenzialen für mehr als 5.500 Personen bereitstellen kann, angereichert durch unterschiedliche Bildungsinformationen, die auf Abschlüssen und Qualifikationen beruhen. Die erste Wiederholung für diesen Test ist für das Erhebungsjahr 2010 geplant. Eine ausführliche Dokumentation und Auswahlanalyse finden Sie in Schupp et al. (2008) Erfassung kognitiver Leistungspotentiale Erwachsener im Sozio-oekonomischen Panel (SOEP), DIW Berlin, Data Documentation 32 | PDF, 447.63 KB .
PBR_EXIT und PBR_HHCH:
Diese beiden Datensätze ersetzen den ehemaligen Datensatz YPBRUTTO, wobei bei in dieser Datenweitergabe noch beide Varianten verfügbar sind.
MIHINC:
Dieser Datensatz enthält das multipel imputierte monatliche Netto-Haushaltseinkommen für die Jahre 1997 bis 2007. Er ist im long-Format abgelegt (Long-Format: hhnrakt, svyyear, mj, wird in Stata auch mim-Format genannt). Jede fehlende Antwort auf die Frage nach dem Netto-Haushaltseinkommen wurde 10-fach imputiert. Weitere Informationen finden Sie in der Dokumentation von HGEN | PDF, 169.14 KB .
B: Neue Variablen
B.1 Datensatz XPBRUTTO
- XEWSTATU: Proxyinformation über den Arbeitsmarktstatus von Personen, die in Befragungshaushalten kein Interview gaben.
B.2 Datensatz $PEQUIV
- P11101$$: Kopie der wellenspezifischen Variablen zur allgemeinen Lebenszufriedenheit
B.3 Datensatz $HGEN
- I_HINC$$: Multiple imputierte Version von HINC$$, das monatliche Haushaltsnettoeinkommen. Imputationen 1-5 sind als Wide-Format in $HGEN abgelegt (nur für die Jahre 1996-2007), alle generierten Imputationen (10) sind in dem zusätzlichen Datensatz MIHINC in Long-Format abgelegt. Weitere Informationen finden Sie in der Dokumentation zu HGEN | PDF, 169.14 KB .
- FHINC$$: Imputation Flag für I_HINC$$, 0 bedeutet nicht-imputiert und 1 imputiert.
C. Überarbeitete Variablen
C.1 Im Datensatz $PKAL
- $P2D03 + $P2E03: In einigen Fällen war in den Wellen U-W (in den Jahren 2004-2006) fälschlicherweise "keine Antwort" (-1) auf "trifft nicht zu" (-2) gesetzt worden. Dies wurde jetzt nachträglich korrigiert.
C.2 Im Datensatz HHRF/PHRF
- WPHRF*: Alle Gewichtungsfaktoren für das Jahr 2006 sind nun an den Mikrozensus 2006 angepasst. Auch die Gewichtungsfaktoren für das Jahr 2007 sind an den Mikrozensus-Daten von 2006 angepasst worden; sie müssen deswegen als vorläufig für Personen und Haushalte in Deutschland gelten und werden voraussichtlich mit der nächsten Datenweitergabe aktualisiert.
- VHHRF + VHHRF1: 1 Haushalt aus Sample G musste korrigiert und auf 0 gesetzt werden.
C.3 Im Datensatz $PGEN
- LFS$$: Die Variable "Arbeitsmarktstatus" wurde für alle Wellen in Bezug auf eine genauere Einordnung von Personen in den Status "nicht-erwerbstätig und älter als 65" (Kategorie 2) verbessert. Inzwischen wird die Information über den Geburtsmonat einer Person genutzt, um zu bestimmen, ob sie zur Zeit des Interviews älter als 65 Jahre war.
D. Fehlerkorrekturen
D.1 Im Datensatz VH and WH
Es gab eine Korrektur der Werte Labels für die Variablen, die auf die Eigentümer einer Wohnung hinweisen (VH27 and WH27), bitte beachten Sie die richtigen Ausprägungen in der unten stehenden Tabelle.
Variablenname: Eigentümer der Wohnung
WertFalschRichtig
| -2 |
Trifft nicht zu |
Trifft nicht zu |
| -1 |
Keine Antwort |
Keine Antwort |
| 1 |
selbstgenutzte Wohnung |
Kommunale Wohnung |
| 2 |
Kommunale Wohnung |
Genossenschaftliche Wohnung |
| 3 |
Genossenschaftliche Wohnung |
Betriebs-/ Werkswohnung |
| 4 |
Betriebs-/ Werkswohnung |
Privater Eigentümer |
| 5 |
Privater Eigentümer |
Weiß nicht |
D.2 Im Datensatz $PGEN
- EGP$$: Die Variable "Erikson and Goldthorpe Class Category" (internationaler Index des beruflichen Status) wurde bezüglich der Zuordnung von Personen zur Kategorie (18) "nicht erwerbstätig - in Rente" korrigiert. Bis jetzt wurden fälschlicherweise alle Rentenempfänger, d.h. alle Empfänger von Altersrente und die Empfängerinnen von Witwen- und Waisenrenten als "nicht erwerbstätig - in Rente" klassifiziert, falls keine andere Kategorie zutraf. In der korrigierten Generierung der EGP$$ Variable, die für alle Wellen durchgeführt wurde, werden nicht-erwerbstätige Personen nur dann in diese Kategorie eingeordnet, wenn sie Bezieher/innen von Altersrente sind oder wenn sie Bezieher/innen von Waisen- bzw. Witwenrente UND älter als 60 Jahre sind. Darüber hinaus werden bei Fehlen der Information über Rentenbezug die Informationen aus ARTKALEN (retrospektive Information aus dem Aktivitätskalender des vorangegangenen Jahres) im Generierungsprozess genutzt, um zu bestimmen, ob eine Person zum Zeitpunkt des Interviews in Rente oder Vorruhestand ist. Alle anderen nicht arbeitenden Personen werden in Kategorie (-2) "trifft nicht zu" eingeordnet, solange sie nicht als arbeitslos registriert sind (Kategorie 15).
- ST$$IB: Das gleiche Problem der falschen Zuordnung von Personen zur Kategorie "Rentner/in" (13) trifft auch für die Variable "Berufliche Stellung" zu und wurde für alle Wellen in der gleichen Weise wie für EGP$$ korrigiert.
- NACE$$: Die Variable "2-stellige Branchenvercodung nach NACE" hatte bisher einige Inkonsistenzen bezüglich der Bezeichnungen. Insbesondere die Bezeichnungen für den Code (90) "Abwasser- und Abfallbeseitigung, Sanierung oder ähnliches" und Code (95) "Private Haushalte mit Angestellten" mussten ausgetauscht werden. Einige andere Bezeichnungen waren nicht genau genug und wurden für alle Wellen präzisiert.
- IS88$$, ISEI$$, MPS$$, SIOPS$$, KLAS$$, EGP$$: Die Frage, auf die sich diese Variablen beziehen, wird nicht allen erwerbstätigen Personen jedes Jahr gestellt. In den Befragungsjahren 1985, 1986, 1987, 1988, 1990 (West), 1992 (West), 1994, 1996, 1999, 2001, 2003, 2005 und 2006 wurde sie nur Erstbefragten oder Berufswechslern gestellt. Deswegen sollten in Jahren mit Teilbefragungen die Variablen für alle berufstätigen Personen ohne Jobwechsel die vorhandene Information des Vorjahres übernommen werden. Diese Angaben wurden fälschlicherweise für einige Personen nicht genutzt. Dieser Fehler ist nun behoben, da für alle Wellen die betroffenen Variablen in konsistenter Weise neu generiert wurden.