SOEP-Core v23 - Änderungen am Datensatz

Änderungen am Datensatz

Datensatzinformation

Mit der Datenweitergabe 2007 (Daten 1984-2006) werden für das Beobachtungsjahr 2006 die üblichen wellenspezifischen Dateien WPBRUTTO, WP, WPKAL, WPGEN, WHBRUTTO, WH, WHGEN, WKIND und VPLUECKE sowie die aktualisierten Dateien mit Längsschnittbezug (PFAD-Dateien, Biographie-Daten, Spell-Daten und Hochrechnungsfaktoren) weitergegeben.

Im Erhebungsjahr 2006 ist das SOEP um eine weitere für Deutschland repräsentative Stichprobe (Ergänzungsstichprobe H - "Refreshment Sample") erweitert worden. Detaillierte Informationen zur Integration dieser Stichprobe und zu weiteren Änderungen in den beiden Dateien mit den Hochrechnungs- und Gewichtungsinformationen finden Sie unten (Punkt B). Eine weitere wichtige Neuerung ist die Einführung eines neuen Befragungsinstrumentes für erstbefragte Personen im Alter von 17 Jahren. Diese Personen erhalten jetzt einen erweiterten Jugendfragebogen, der neben den bisher schon erhobenen biographischen Angaben nun auch aktuelle Informationen erhebt und insofern den bisherigen Personenfragebogen für diese Gruppe obsolet macht.

Dies bedeutet allerdings auch, dass sich die Befragungspopulation für den klassischen Personenfragebogen (gespeichert in den Dateien $P) leicht geändert hat, 17-Jährige sind ab dem Befragungsjahr 2006 nicht mehr enthalten. Eine Ausnahme bildet die Erstbefragung von Sample H, hier sind die 17-Jährigen weiterhin mit dem Personenfragebogen befragt worden, da die Biographiebefragung in neuen Teilstichproben erst in der zweiten Welle erfolgt. In diesem Zusammenhang sind auch die überarbeiteten $NETTO-Variablen und die Datei $PAGE17 relevant.

Die Bildungsvariablen in den generierten Datensätzen ($PGEN) wurden überarbeitet: Neben einer verbesserten Integration von im Ausland erreichten beruflichen Bildungsabschlüssen wurden die entsprechenden Variablen einer intensiven Konsistenzprüfung im Längsschnitt unterzogen. Die betroffenen Variablen werden weiter unten näher beschrieben. Die Information über Zwillinge im SOEP wurde durch eine spezielle Befragung "potentieller" Zwillinge validiert und in den Datensatz BIOTWIN integriert.

Die im File WPEQUIV (Welle 2006) gespeicherten Variablen mit Bezug zum Vorjahreseinkommen berücksichtigen wie in jedem Jahr die verschiedenen strukturellen Veränderungen des Steuer- und Transfersystems als notwendige Rahmeninformationen zur Generierung und Simulation der Jahreseinkommen. Neben den Änderungen zum Steuertarif 2005 (Absenkung des Spitzensteuersatzes, Grundfreibetrag) sind dabei auch die neuen Regelungen zum Alterseinkünftegesetz relevant. Eine bedeutende Funktion kommt der Einführung des Arbeitslosengeldes II und den damit verbundenen weitreichenden Veränderungen im Transfersystem (Sozialhilfe, Wohngeld etc.) zu. Die generierten (Vor-)Jahreseinkommensangaben des SOEP-Erhebungsjahres 2006 wurden daher umfangreichen internen und externen Konsistenzprüfungen unterzogen.

Die Datenweitergabe erfolgt dieses Jahr erstmals auf einer DVD, die Auswahl der Sprachversion erfolgt daher noch einfacher direkt im Installationsprogramm der SOEP-Daten. Sollten Sie die Daten mit unserem Setupprogramm unter Windows Vista installieren, beachten Sie bitte die Installationsanleitung auf der DVD.

Darüber hinaus gibt es folgende Erweiterungen bzw. Modifikationen:

Neue und umbenannte Datensätze 2006

$PAGE17
Ab 2007 werden Personen, die das Erstbefragungsalter (17 Jahre) erreichen, nicht mehr mit dem normalen Personenfragebogen, sondern mit einem speziellen Jugendfragebogen befragt. Wellenspezifische Informationen, die nicht in den Biographie-Daten oder anderen generierten Datensätzen (wie $PGEN, HEALTH) vorliegen, werden im Datensatz $PAGE17 weitergegeben. Identifizierbar sind die Befragten des Jugendfragebogens mit Hilfe des neuen $NETTO-Codes "17" (siehe auch Änderung der $NETTO-Variablen in PPFAD).

DESIGN
Die Informationen zum Design der SOEP-Stichprobe, die zuvor im Datensatz VARIANZ (Spiess 2001) zusammengefasst waren, werden ab der Datenweitergabe 2007 in dem überarbeiteten und verbesserten File DESIGN zu finden sein. Nähere Informationen in dem Dokument designdoku.pdf auf der SOEP-Dokumentationseite oder der DVD.

HEALTH
Der Gesundheitsschwerpunkt im Personenfragebogen wurde 2002 überarbeitet und seitdem im 2-Jahres-Rhythmus erhoben. Im HEALTH-File finden Sie nun die generierten SF12-Variablen (zur Messung der gesundheitsbezogenen Lebensqualität) und Variablen zu Größe und Gewicht mit entsprechenden Flagvariablen zur Identifikation der imputierten Werte und einer nutzerfreundlichen, längsschnittgeprüften generierten Variablen des Body Mass Index (BMI). Die Dokumentation finden Sie in dem Dokument health.pdf auf der SOEP-Dokumentationseite oder der DVD.

PWEALTH und HWEALTH
Die Vermögensdaten des Erhebungsjahres 2002 wurden vollständig überarbeitet und auf Inkonsistenzen geprüft. Die Daten sind jetzt in zwei Datensätzen (für Personen- und Haushaltsebene) vollständig (multiple) imputiert nutzbar, mit entsprechenden Flagvariablen zur Identifikation der imputierten Werte. Die beiden Datensätze enthalten auch jeweils eine generierte Variable zum "Netto-Vermögen" (siehe SOEPpapers No. 18).

Interviewerbefragung
Der bis 2006 lediglich als "stand-alone" Version verfügbare Datensatz mit Angaben zu den InterviewerInnen ist jetzt unter dem Namen INTVIEW in die Standard-Datenweitergabe integriert und wird somit in den jeweiligen Software-Formaten (SAS, SPSS, STATA) standardmäßig abgelegt.

Querschnittshochrechnung 2006
Mit der Datenweitergabe für das Jahr 2006 ergeben sich für die Querschnittshochrechnungsfaktoren bzw. Querschnittsgewichte wichtige Neuerungen und Änderungen. Ausführlich dargestellt werden die Neuerungen in der DIW Data Documentation 22.

1. Typen der Hochrechnungsfaktoren neu definiert
Jedes Querschnittsgewicht wird mit $xHRFy bezeichnet. Dabei stellt $ das Wellenkennzeichen dar, x die Unterscheidung nach Haushalten (x = H) und Personen (x = P) und y eine Zusatzkennung, die den Typ des Hochrechnungsfaktors beschreibt.

  • $xHRF sind die von Beginn an üblichen Hochrechnungsfaktoren. Sie enthalten sämtliche Stichproben mit Ausnahme der Hocheinkommensstichprobe G.
  • $xHRF1 sind Standard-Hochrechnungsfaktoren, bei denen zusätzlich zur Nichtberücksichtigung von Sample G die Gewichte von neuen Teil-Stichproben, d.h. in der sample-spezifischen ersten Welle, auf Null gesetzt sind. Hintergrund: In den ersten Wellen weisen die Befragten bei komplexen Erhebungskonstrukten ein "schlechteres" Antwortverhalten auf als in späteren Wellen (z. B. bezüglich Lebenszufriedenheit und Jahreseinkommen). Eine Ausnahme bildet hier Stichprobe C. Da für Befragte in der DDR solche Effekte im Antwortverhalten des Jahres 1990 nicht nachweisbar waren, sind hier GxHRF und GxHRF1 identisch.
    Für Standard-Querschnittsanalysen empfehlen wir die Verwendung des Hochrechungs-Typs $xHRF1 als Standard-Hochrechnungsfaktor. Damit werden die Informationen aus den jeweils ersten Wellen der Teilstichproben automatisch nicht genutzt.
  • $xHRFALL umfassen sämtliche verfügbare Stichproben.
  • $xHRFD, $xHRFF und $xHRFG kennzeichnen die isolierten Gewichte für die Zuwanderer-Stichprobe D, für die Ergänzungsstichprobe F und für die Hocheinkommens-Stichprobe G.

2. Modifizierung Hochrechnungsrahmen
Seit dem Jahr 2005 weist das Statistische Bundesamt Angaben für das Land Berlin nicht mehr getrennt nach West und Ost aus. Dies führte zu leichten Modifizierungen des Hochrechnungsrahmens für Haushalte rückwirkend seit dem Erhebungsjahr 2005.

3. Neue Ergänzungsstichprobe H
Die neuen Haushalte der im Erhebungsjahr 2006 erstmals erhobenen Ergänzungsstichprobe H ("Refreshment Sample") wurden in die Hochrechnung integriert. Die Einbeziehung der Stichprobe H ist gegenwärtig noch vorläufig. Es wird geprüft, ob und wie die Stichprobe H an zusätzliche externe Ränder angepasst wird. Dieses Vorgehen ist allerdings nicht gravierend, da wir ohnehin empfehlen, für deskriptive (Zeitreihen-) Analysen die Hochrechnungsfaktoren WxHRF1 zu verwenden, die die Stichprobe H ausschließen.

4. Hochrechnungsfaktoren basieren auf Eckdaten des Mikrozensus von 2005
Die Hochrechnungsfaktoren für das Jahr 2006 basieren auf Eckdaten des Mikrozensus von 2005; sie sind also bezüglich der unterstellten Anzahl von Haushalten und Personen in Deutschland vorläufig.

BIOAGE01 und BIOAGE17 2006

1. BIOAGE01
Es wurden vier neue Variablen zum Schwangerschaftsstatus generiert. Basis der Generierungen sind im Wesentlichen der Interviewmonat aus $P, Geburtsmonat und -jahr des Kindes sowie Dauer der Schwangerschaft in Wochen aus BIOAGE01.

BCPREGY 'Mutter: Schwanger zum Personeninterview Welle($)?'
Value Labels:
2002 | Schwanger bei Personeninterview 2002
2003 | Schwanger bei Personeninterview 2003
2004 | Schwanger bei Personeninterview 2004
2005 | Schwanger bei Personeninterview 2005
2006 | Schwanger bei Personeninterview 2006
2007 | Schwanger bei Personeninterview 2007

BCPREGMO 'Mutter: Geschätzter Schwangerschaftsmonat zum Personeninterview Welle($)'
Value Labels:
1 | Erster Schwangerschaftsmonat
2 | Zweiter Schwangerschaftsmonat
3 | Dritter Schwangerschaftsmonat
4 | Vierte Schwangerschaftsmonat
5 | Fünfter Schwangerschaftsmonat
6 | Sechster Schwangerschaftsmonat
7 | Siebter Schwangerschaftsmonat
8 | Achter Schwangerschaftsmonat
9 | Neunter Schwangerschaftsmonat
10 | Letzter Monat schwanger oder nach Geburt

Außerdem wurden Schwangerschaftsbeginn und -ende zusätzlich als Spellinformationen abgelegt. Gezählt wird - analog beispielsweise zu BIOMARSM - ab Monat 1 = Januar 1983 bis Dezember 2007 = Monat 300. Generierungsbasis sind Geburtsmonat und Schwangerschaftsdauer in Wochen aus BIOAGE01.

PREGBEGM 'Spell - Monat Beginn Schwangerschaft / Konzeption (1 = Jan 1983)'.

PREGENDM 'Spell - Monat Ende Schwangerschaft / Geburt (1 = Jan 1983)'.

2. BIOAGE17

Den Aufbau und Inhalt finden Sie ausführlich in der Dokumentation der Biografiedaten auf der SOEP-Homepage oder der DVD.

$HGEN 2006

1. Neue Variablen
NUTS1$$
Zusätzlich zur Bundesland-Variable ist ab diesem Jahr für alle Wellen auch die entsprechende NUTS (Nomenclature des unités territoriales statistiques) Level 1-Variable verfügbar. Die Variable ist weitgehend identisch mit $BULA in $HBRUTTO, allerdings ohne die Zusammenfassung von Rheinland-Pfalz/ Saarland (ab 2000) bzw. ohne eine Differenzierung zwischen Ost- und West-Berlin.

$PGEN 2006

1. Neue Variablen
JOBCH$$
In Ergänzung zu ERWTYP$$ (und langfristig zu deren Ersatz) wurde eine Variable zur Identifikation beruflicher Wechsel generiert. Die Kategorien dieser Variable sind unabhängig davon, ob eine Erst- oder Wiederholungsbefragung vorliegt. JOBCH$$ gibt für Personen mit Wiederholungsbefragung berufliche Wechsel seit dem letzten Interview an, für erstmals Befragte bezieht sie sich auf berufliche Wechsel, die seit Beginn des Vorjahres stattgefunden haben. Erstmals erwerbstätige Personen und erwerbstätige Personen mit beruflichem Wechsel werden hierbei getrennt ausgewiesen. Im Gegensatz zu ERWTYP$$ wurde JOBCH$$ einer Längsschnittkonsistenzprüfung unterzogen. Im Längsschnitt inkonsistente Fälle, wie beispielsweise Doppelnennungen eines beruflichen Wechsels in zwei aufeinander folgenden Interviews, wurden korrigiert.
Value Labels:
1 | Nicht erwerbstätig
2 | Erwerbstätig ohne Wechsel
3 | Erwerbstätig ohne Information, ob Wechsel
4 | Erwerbstätig mit Wechsel
5 | Erstmals erwerbstätig

2. Überarbeitete Variablen
GERWZEIT, HERWZEIT
Für die Jahre 1990 und 1991 werden nun auch für Sample C (Ost) Werte für die Dauer der Betriebszugehörigkeit bereitgestellt. Aufgrund der eventuell eingeschränkten Vergleichbarkeit im Zuge des ostdeutschen Transformationsprozesses sind diese Angaben jedoch mit besonderer Vorsicht zu behandeln.

$ERWZEIT
Die Dauer der Betriebszugehörigkeit wurde aufgrund bisher auftretender Inkonsistenten zwischen verschiedenen Interviewzeitpunkten einer Längsschnittkonsistenzprüfung unterzogen. Im Längsschnitt inkonsistente Fälle wurden anhand der folgenden Vorgehensweise korrigiert:

  1. Der Beschäftigungsbeginn beim derzeitigen Arbeitgeber, der zum frühesten Befragungszeitpunkt angegeben wird, ist grundsätzlich dominant und wird in den Folgejahren fortgeschrieben, falls kein Stellenwechsel und keine Wiederaufnahme der Erwerbstätigkeit nach einer Unterbrechung vorliegt.
  2. Im Falle eines Stellenwechsels (Wechsel des Arbeitgebers/Wechsel in die Selbständigkeit) werden die aktuellen Angaben zum Zeitpunkt des Stellenwechsels verwendet und in den Folgejahren fortgeschrieben.
  3. Bei Wiederaufnahme der Erwerbstätigkeit nach einer Unterbrechung wird vermutet, dass ein Arbeitnehmer zu seinem alten Arbeitgeber zurückgekehrt ist, wenn der aktuell angegebene Beschäftigungsbeginn vor dem letzten Befragungsjahr liegt. In diesem Fall wird nicht auf den aktuellen Beschäftigungsbeginn zurückgegriffen, sondern der Beschäftigungsbeginn, der bei der letzten Befragung erhoben wurde, fortgeschrieben. Liegt die aktuelle Angabe zum Beschäftigungsbeginn nach dem letzten Befragungsjahr, wird ein Arbeitgeberwechsel seit der letzten Befragung angenommen und die aktuelle Angabe zum Beschäftigungsbeginn fortgeschrieben.

Aus dem längsschnittkonsistenten Beschäftigungsbeginn beim derzeitigen Arbeitgeber wird die Dauer der Betriebszugehörigkeit ermittelt. Bei Wiederaufnahme der Erwerbstätigkeit nach einer Unterbrechung wird für Arbeitnehmer, bei denen vermutet wird, dass sie zum alten Arbeitgeber zurückgekehrt sind, die komplette Betriebszugehörigkeitsdauer erfasst. Es erfolgt kein Abzug für die Dauer der Unterbrechung, insofern wird die implizite Messung von betriebsspezifischem Humankapital ggf. überschätzt. 

AUSB$$
Da bei der erforderlichen Ausbildung im Beruf seit 1999 zwischen Fachhochschul- und Hochschulstudium unterschieden wird, wurden für die Jahre vor 1999 und nach 1999 verschiedene Kategorien für die AUSB$$ 'erforderliche Ausbildung im Beruf' gebildet. In den aktuellen Jahren gibt es getrennte Kategorien, die explizit zwischen diesen beiden Abschlüssen unterschieden. Zudem werden Fachschule und Fachhochschule nun getrennt ausgewiesen.
Value Labels:
1 | Keine Ausbildung
2 | Einweisung
3 | Einarbeitung
4 | Kurse
5 | Berufsausbildung
6 | Fachschule, Ingenieurschule (Ost) 1990-1996
7 | (Fach-,) Hochschulstudium, bis 1998
8 | Fachhochschulstudium, ab 1999
9 | Hochschulstudium, ab 1999

MPS$$
Für die Wellen U,V und W wurden die Werte für die 'Magnitude Prestigeskala - Wegener' für Befragungspersonen ohne Haushaltsinterview ($NETTO=19) ergänzt.

ERWTYP$$
Die Variable Erwerbstypus wird mit der alten Kategorisierung beibehalten, jedoch wird aufgrund der gemeinsamen Ausprägung von erstmals Erwerbstätigen und erwerbstätigen Personen mit beruflichem Wechsel das Label dieser Kategorie geändert. Die Ausprägung 6 wird mit dem Label 'erwerbstätig mit Wechsel, auch erstmals erwerbstätig' versehen.

PPFAD 2006

Umstellung der $NETTO Codes

$NETTO
Mit der Welle W (23. Erhebungswelle) wurde im aktuellen Erhebungsjahr 2006 die Erfassung der Befragungspopulation grundlegend verändert. Bisher wurde immer bei allen Personen im Haushalt über 16 Jahren ein Personeninterview durchgeführt. Ab dem Erhebungsjahr 2006 werden reguläre Personeninterviews auf Basis des Standard-Erwachsenenfragebogens erst ein Jahr später - im Alter ab 18 Jahren - durchgeführt. Erstbefragte Jugendliche im Alter von 17 Jahren erhalten stattdessen erstmals einen erweiterten Jugendfragebogen (dies gilt für die Samples A-G; bei der neuen Stichprobe H wird der Jugendfragebogen erst im nachfolgenden Jahr erhoben, die entsprechenden 17-jährigen Jugendlichen erhielten als erstes - wie bisher - den regulären Personenfragebogen).
Die Befragungspersonen sind damit nicht mehr allein durch das Instrument des Personenfragebogens erfasst, sondern werden jetzt durch zwei Instrumente - Personen- und Jugendfragebogen - abgebildet. Zur konsistenten Abgrenzung im Zeitverlauf muss deshalb entweder die Jugendpopulation im aktuellen Jahr einbezogen werden oder die Altersabgrenzung für alle früheren Jahre erhöht werden.
Die neu überarbeitete $NETTO-Variable unterstützt beide Abgrenzungen rückwirkend für den gesamten Befragungszeitraum. Der Zusammenhang zwischen Erhebungspopulation und Befragungsinstrument wird über die Variable $NETTO in PPFAD beziehungsweise $HNETTO in HPFAD gesteuert. Infolge der Veränderung der Befragungspopulation sowie der Erweiterung der Erhebungsinstrumente zur detaillierten Erfassung biografischer Zusammenhänge wurde die entsprechende Variable $NETTO in PPFAD grundlegend überarbeitet und wird jetzt als zweistellige Variable bereitgestellt. Die bisherige - einstellige - Variable wird als Hilfestellung unter verändertem Namen $NETOLD weitergeführt; die Variable $HNETTO in HPFAD ist von dieser Umstellung nicht betroffen und bleibt unverändert.
Value Labels:
(10-19)'Befragte und Befragungspersonen mit realisierten Interviews'
10 | Befragungsperson mit realisiertem Interview
11 | Personenfragebogen ($P)
12 | Personenfragebogen und Lebenslauf
13 | Personenfragebogen und Jugendfragebogen
14 | Personenfragebogen und andere Fragebögen
15 | Personenfragebogen und Experimente, Tests
16 | Personenfragebogen, Erstbefragung, 17 Jahre
17 | Jugendfragebogen Erstbefragung, 17 Jahre
19 | Personenfragebogen ohne Haushaltsinterview

(20-29)'Kinder in realisierten Haushalten
20 | Kinder in realisierten Haushalten ($KIND)
21 | Kinder mit Mutter-Kind-Fragebogen I, 0-1 Jahr
22 | Kinder mit Mutter-Kind-Fragebogen II, 2-3 Jahre

(30-39)'Personen ohne Personen-Interview in Brutto-Haushalten'
30 | Personen in realisierten Haushalten ohne Personeninterview
31 | Realisierte Nacherhebung ($LUECKE)
32 | Realisierter Biografiefragebogen
33 | Realisierter Jugendfragebogen
34 | Realisierte Tests und Experimente

(60-69)'Nur Fragebogen ohne Personeninterview außerhalb der Brutto-Haushalte
60 | Nur Fragebogen ohne Personen- und Haushaltsinterview
61 | Nacherhobene Lücke ohne Haushaltsbezug
62 | Nacherhobene Lücke bei Ausfall
70 | Nur Teilnahme an Tests, Experimenten etc.

(80-89)'Personen ohne Austritt, aber ohne aktuelle Angabe im laufenden Jahr'
80 | Person ohne Austritt aus Panel-Population
81 | Vormals Befragte (ERSTBEF) ohne aktuellen Angaben
89 | RückkehrerInnen (zuvor Ausfälle)

(90-99)'Personenausfaelle und Austritte ($YPBRUTTO)'
90 | Personenausfälle ($YPBRUTTO)
91 | Wegzug ins Ausland
99 | Verstorben

$NETOLD
In der neuen Variable $NETOLD ist der alte $NETTO-Code weiterhin nutzbar. Personen im Alter von 17 Jahren, die entweder einen Jugendfragebogen (n=307) oder einen Personenfragebogen (Sample H, n=31) ausgefüllt haben, sind jeweils mit dem Wert 1 codiert. Somit ist die Abgrenzung (WNETTO == 1 | WNETTO == 5) nicht identisch ist mit der Population in WP.

$PEQUIV 2006

1. Neue Variablen
ALG2$$: Betrag der im Haushalt im Vorjahr empfangenen Transfers aus Arbeitslosengeld II.
FALG2$$: Flag zur Identifikation von Imputationen des Arbeitslosengeld II (ALG2$$).
IDEMY$$: Betrag der im Vorjahr empfangenen Zahlungen aus Abfindungen (Indemnity).
FDEMY$$: Flag zur Identifikation von Imputationen von Abfindungszahlungen (IDEMY$$).
ITRAY$$: Betrag der im Vorjahr empfangenen Fahrtkostenzuschüsse (commuting and travel grants).
FTRAY$$: Flag zur Identifikation von Imputationen von Fahrtkostenzuschüssen (ITRAY$$).

2. Überarbeitete Variablen
I11105$$

Die Variable (Mietwert selbstgenutzten Wohneigentums = Imputed Rent) wurde bisher nur für Personen in selbstgenutztem Wohneigentum generiert. Entsprechend aktueller Forschungsergebnisse und auch der Vorschläge der Europäischen Kommission zur Generierung von Imputed Rent in EU-SILC wird dieser fiktive Einkommensvorteil nun auch für Personen in Mieterhaushalten generiert, die angeben, keine marktgerechte Miete für ihren Wohnraum zu entrichten. Dies sind Personen in mietfreiem Wohnraum, Mieter in Wohnungen des sozialen Wohnungsbaus und Mieter mit verbilligt überlassenem Wohnraum (z.B. vom Arbeitgeber verbilligt überlassene Werkswohnung, von Verwandten oder sonstigen Dritten verbilligt überlassener Wohnraum).

W11101$$ und W11102$$
Aufgrund der Umstellung der Hochrechnungsfaktoren in den Files PHRF und HHRF beinhaltet die Variable W11101$$ nun den Personenhochrechnungsfaktor $PHRF1 (aus dem File PHRF) und die Variable W11102$$ den Haushaltshochrechnungsfaktor $HHRF1 (aus dem File HHRF). Befragte des SOEP weisen in ihrer ersten Befragungswelle einen signifikant höheren Anteil von Item-non-Response auf, der mittels Imputation nicht adäquat korrigiert werden kann. Daher vernachlässigen diese beiden Gewichte jeweils die erste Welle eines jeden neuen Subsamples des SOEP. Des Weiteren wird das Subsample G (Hocheinkommensbezieher) aus dem Gewichtungsschema ausgeschlossen, um Strukturbrüche in der Analyse von Einkommen im Vergleich zu Ergebnissen ohne Subsample G zu vermeiden. Diese beiden Gewichtungsvariablen sind daher besonders geeignet, eine konsistente Analyse einer Zeitreihe von Einkommen oder deren Verteilung zu unterstützen.

W11105$$
Die Variable W11105$$ beinhaltet nun den Personenhochrechnungsfaktor $PHRFALL (aus dem File PHRF). Diese Gewichtungsvariable berücksichtigt alle Subsamples des SOEP.

E11105$$
Der Inhalt der Variable E11105$$ besteht nun aus der Berufsklassifizierung nach dem internationalen Standard "ISCO88".

E11106$$ und E111076$$
Die Variablen E11106$$ und E11107$$ geben nun die Branchenzugehörigkeit in Form eines 1 bzw. 2-Stellers im internationalen Standard "NACE" wieder.

keyboard_arrow_up