SOEP-Core v34 (2017) - Fehlerupdates

Fehlerupdates

Datensatzinformation

1984-2017 (Welle BH)

Übersicht:

  1. Datensatz: pl; Variablen: plb0186_v2, plb0186_h

    Die Variablen plb0186_v2 und plb0186_h haben für das Ostsample im Jahr 1990 um den Faktor 10 zu kleine Werte.

  2. Datensatz: bhh; Variablen: bhh_37_01, bhh_37_02

    Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigen Namenskonzept des SOEP. Die beiden Variablen werden in der nächsten Version umbenannt.

  3. Datensatz: migspell

    Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert.

  4. Datensatz: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege; Variablen: pid, hid, cid

    Die neuen Identifier wurde nicht befüllt und müssen aus den alten Identifiern befüllt werden.

Details:

1. Datensatz: pl
Variablen: plb0186_v2, plb0186_h

Die Variablen plb0186_v2 „Tatsächliche Arbeitszeit mit Überstunden (1990-2017)“ und plb0186_h „Tatsächliche Arbeitszeit mit Überstunden (harmonisiert)“ haben für das Ostsample im Jahr 1990 falsche Werte.

Die Variable plb0186_h setzt sich aus den Variablen plb0186_v1 (1984-1989) und plb0186_v2 (1990-2017) zusammen. Hierfür wurden alle Werte von plb0186_v1 direkt übernommen und die gültigen Werte der plb0186_v2 wurden durch 10 geteilt. Der Harmonisierungsprozess muss erfolgen, weil für das Erhebungsjahr 1990 zwei Raw-Variablen genutzt werden, die unterschiedlich geliefert wurden.

gpost: gp3601e (zweistellig ohne Komma)
gp: gp39 (dreistellig ohne Komma)

Die Raw-Variable gp3601e aus gpost wurde der Variable plb0186_v2 zugewiesen, obwohl sie nicht durch 10 geteilt werden muss. So wurden alle Werte der Ostdeutschen-Population für das Jahr 1990 fälschlicherweise durch 10 geteilt. Der einfachste Weg dieses Problem zu lösen ist es, wenn Sie die gültigen Werte der Ostpopulation mit 10 multiplizieren. 

cd "Datenpfad"
use "pl.dta"
tabstat plb0186_*,by(syear)
clonevar rep_plb0186_h=plb0186_h
replace rep_plb0186_h = rep_plb0186_h*10 if inputdataset == "gpost" & rep_plb0186_h > 0

Genauere Informationen zum allgemeinen Harmonisierungsprozess von Variablen finden Sie hier:

Versionierung und Harmonisierung

Das Arbeiten mit harmonisierten Variablen

2. Datensatz: bhh
Variablen: bhh_37_01, bhh_37_02

Der  Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigem Namenskonzept des SOEP. Die beiden Variablen müssten umbenannt werden:

bhh_37_01 „Stromkosten in Mietpreis enthalten“  -> bhh_33
bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“  -> bhh_37

Wie Raw-Variablen im SOEP benannt werden, können Sie im SOEPcompanion nachlesen:

Namensschema von Variablen und Datensätzen

3. Datensatz: migspell

Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert. Interessenten des Datensatzes können sich telefonisch an die SOEPhotline wenden oder eine Mail an soepinfo schreiben, um die aktuelle Version zu erhalten.

4. Datensätze: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Variablen: pid, cid, hid

Im Zuge der "Zusammenlegung" von SOEP-Long und SOEP-Core sollten alle SOEPlong-ID-Variablen (pid, hid, cid) auch in die Raw-Datensätze geschrieben werden, damit das Mergen für die Nutzenden vereinfacht wird. Bei einigen Datensätzen wurden nur die ID-Variablen angelegt, aber nicht mit den entsprechenden IDs gefüllt.

Leere pid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Leere hid: bioimmig, bioresid, biosoc
Leere cid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege

Benutzen Sie bei diesen Datensätzen bitte weiterhin persnr, hhnrakt, hhnr, bzw. kopieren Sie den Inhalt in die entsprechende neue ID-Variable.

clonevar pid = persnr
clonevar hid = hhnrakt
clonevar cid = hhnr

Genauere Informationen zu den SOEP-Identifiern finden Sie hier:

Datensatz Identifier

keyboard_arrow_up