Direkt zum Inhalt

SOEP-Core v20 - Änderungen am Datensatz

Änderungen am Datensatz

Datensatzinformation

Mit der Datenweitergabe 2004 werden für das Beobachtungsjahr 2003 die üblichen wellenspezifischen Dateien TPBRUTTO, TP, TPKAL, TPGEN, THBRUTTO, TH, THGEN, TKIND und SPLUECKE sowie die aktualisierten Dateien mit Längsschnittbezug (Biographie-Daten und Hochrechnungsfaktoren) weitergegeben.
Die in 2003 erstmals erhobenen Biographie-Informationen für Sample G ("Hocheinkommens-Stichprobe") wurden vollständig in die nutzungsfreundlichen Biographie-Datensätze integriert.
Die Daten-CD-Rom #2 enthält mit diesem Release erstmals auch alle SOEP-Daten mit englischsprachigen Variablennamen und Werte-Labels (inklusive der Daten der Vermögensbilanz 1988 in der Datei EV). 

Darüber hinaus gibt es folgende Erweiterungen bzw. Modifikationen:

Sample G "High Income Sample" (Start 2002)

Die Revision des sampling designs (Erhöhung der Einkommensschwelle) führt zu geringeren Fallzahlen in Welle 2.
Ansprechpartner: Jürgen Schupp

Neue Rectypes 2003

Es gibt jetzt weitere Dateien:
1) BIOCHILD Informationen aus dem Mutter-Kind-Fragebogen:
In diesem neuen File werden künftig jährlich Informationen über die im SOEP Neugeborenen abgelegt (siehe weitere Dokumentation in Biographiedaten). Ansprechpartner: Jürgen Schupp

2) BIORESID Informationen zum Zweitwohnsitz bei der Erstbefragung:
Im Datensatz BIORESID sind Angaben zur Wohndauer und zum Zweitwohnsitz abgelegt. Die Informationen stammen aus dem Biographie-Fragebogen, der seit 1994 konsistente Fragen hierzu enthält (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Thorsten Schneider

3) BIOBRTHM Geburtsbiographie für Männer - ab 2001:
Dieser neue Datensatz enthält geburtsbiographische Angaben für Männer, die seit 2001 mit dem diesbezüglich modifizierten Biographie-Fragebogen befragt werden. BIOBRTHM ist analog zu BIOBIRTH für Frauen aufgebaut (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Christian Schmitt

4) BIOTWIN Datei zur Identifikation von "Mehrlingen":
BIOTWIN umfasst die Population aller im SOEP identifizierbaren Mehrlingsgeburten. Gespeichert sind die Identifikatoren (PERSNR) zu Mutter und Geschwistern (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Jürgen Schupp und Christian Schmitt

5) HBRUTT98:
Dieses neue File unterstützt Ausfall-Analysen für die Startwelle von Sample E, in dem die komplette Brutto-Population dieser Teilstichprobe zur Verfügung gestellt wird.
Ansprechpartner: Peter Krause

BIOPAREN 2003

Variablen zur Nationalität der Eltern wurden korrigiert (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Jürgen Schupp

PGEN 2003

MODE$$und MONTH$$
Für alle Wellen wurden rückwirkend zwei neue Variablen zur Beschreibung von Interview-Methode und Monat generiert (MODE$$ bzw. MONTH$$, siehe auch zusätzliche Dokumentation).
Ansprechpartner: Jürgen Schupp

$PSBIL
Die Variable $PSBIL wurde aktualisiert. Bei Ausländern musste für das Jahr 2000 die Kategorie "Ohne Abschluss verlassen" [Code 6] aktualisiert werden; hieraus ergab sich Aktualisierungsbedarf bei $BILZEIT, ISCED$$ und CASMIN$$.
AnsprechpartnerIn: Bettina Isengard und Peter Krause

$FAMSTD
Die Variable wurde aktualisiert.

HGEN 2003

HMODE$$ und HMONTH$$
Für alle Wellen wurden rückwirkend zwei neue Variablen zur Beschreibung von Interview-Methode und Monat generiert (HMODE$$ bzw. HMONTH$$, siehe auch zusätzliche Dokumentation).
Ansprechpartner: Jürgen Schupp

PPFAD 2003

GEBMONAT
Die zentralen demographischen Informationen in PPFAD wurden um den Geburtsmonat (Variable GEBMONAT) ergänzt. Diese Angabe wurde inzwischen von allen noch in der Stichprobe enthaltenen Befragungspersonen und Kindern erhoben (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Christian Schmitt

Die Variablen EINTRITT, ERSTBEFR, AUSTRITT, LETZTBEF wurden aktualisiert. Zum Update siehe Dokumentation.
Ansprechpartner: Peter Krause

BIOBIRTH 2003

Die geburtsbiographischen Informationen für Frauen wurden ergänzt um Angaben aus dem Jugend-Fragebogen, den inzwischen 16-17jährige Erstbefragungspersonen anstelle des Standard-Biographiefragebogens erhalten (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Christian Schmitt

BIOIMMIG 2003

Diese Daten wurden wegen einer fehlerhaften Vercodung in den zurückliegenden Jahren infolge einer Vertauschung der Itemreihenfolge korrigiert. Dies betrifft die Variablen BIEXPRLV, BIEXPRAC und BIEXPRAN (siehe weitere Dokumentation in Biographiedaten).
Ansprechpartner: Jan Goebel

PFLEGE 2003

Für die Jahre ab 1999, also für die Wellen P bis T, gibt es eine neue Variable PNRCARE. PNRCARE ist eine unveränderliche Personennummer und bezeichnet die Person im Haushalt, die vornehmlich die Pflege übernimmt. In drei Fällen waren pflegende und zu pflegende Personen identisch. In diesen Fällen wurde PNRCARE auf -3 gesetzt (unplausibler Wert). Für die Wellen vor 1999 hat PNRCARE den Wert -2.

YPBRUTTO 2003

Überarbeitung von HHNRAKT und HHNROLD bei doppelt geführten Personen im alten Haushalt.
Ansprechpartner: Peter Krause

$PEQUIV bzw. SOEP-CNEF 2003

Alle Einkommensangaben seit 1984 sind in EURO vercodet.

In Ergänzung zu den bisher zur Verfügung gestellten jährlichen Einkommensaggregaten (Summe aller Einkommen die von allen HHMitgliedern bezogen wurden, Variablen I111xx$$) sind nun auch die individuellen Einkommensbestandteile mit wellenübergreifend konsistenten Variablennamen verfügbar.

Alle aufgrund von item-non-response fehlenden Angaben bei Einkommensvariablen wurden imputiert und sind mit Hilfe entsprechender Flag-Variablen identifizierbar.

Alle Einkommensvariablen sind auch für Sample G enthalten, jedoch wurden die Standard-Hochrechnungfaktoren auf Basis der Teilstichproben A-F verwendet.
Siehe auch die Dokumentation.
Ansprechpartner: Markus Grabka

keyboard_arrow_up