1984-2017 (Welle BH)
Übersicht:
Die Variablen plb0186_v2 und plb0186_h haben für das Ostsample im Jahr 1990 um den Faktor 10 zu kleine Werte.
Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigen Namenskonzept des SOEP. Die beiden Variablen werden in der nächsten Version umbenannt.
Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert.
Die neuen Identifier wurde nicht befüllt und müssen aus den alten Identifiern befüllt werden.
Details:
1. Datensatz: pl
Variablen: plb0186_v2, plb0186_h
Die Variablen plb0186_v2 „Tatsächliche Arbeitszeit mit Überstunden (1990-2017)“ und plb0186_h „Tatsächliche Arbeitszeit mit Überstunden (harmonisiert)“ haben für das Ostsample im Jahr 1990 falsche Werte.
Die Variable plb0186_h setzt sich aus den Variablen plb0186_v1 (1984-1989) und plb0186_v2 (1990-2017) zusammen. Hierfür wurden alle Werte von plb0186_v1 direkt übernommen und die gültigen Werte der plb0186_v2 wurden durch 10 geteilt. Der Harmonisierungsprozess muss erfolgen, weil für das Erhebungsjahr 1990 zwei Raw-Variablen genutzt werden, die unterschiedlich geliefert wurden.
gpost: gp3601e (zweistellig ohne Komma)
gp: gp39 (dreistellig ohne Komma)
Die Raw-Variable gp3601e aus gpost wurde der Variable plb0186_v2 zugewiesen, obwohl sie nicht durch 10 geteilt werden muss. So wurden alle Werte der Ostdeutschen-Population für das Jahr 1990 fälschlicherweise durch 10 geteilt. Der einfachste Weg dieses Problem zu lösen ist es, wenn Sie die gültigen Werte der Ostpopulation mit 10 multiplizieren.
|
cd "Datenpfad" |
Genauere Informationen zum allgemeinen Harmonisierungsprozess von Variablen finden Sie hier:
Versionierung und Harmonisierung
Das Arbeiten mit harmonisierten Variablen
2. Datensatz: bhh
Variablen: bhh_37_01, bhh_37_02
Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigem Namenskonzept des SOEP. Die beiden Variablen müssten umbenannt werden:
bhh_37_01 „Stromkosten in Mietpreis enthalten“ -> bhh_33
bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ -> bhh_37
Wie Raw-Variablen im SOEP benannt werden, können Sie im SOEPcompanion nachlesen:
Namensschema von Variablen und Datensätzen
3. Datensatz: migspell
Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert. Interessenten des Datensatzes können sich telefonisch an die SOEPhotline wenden oder eine Mail an soepinfo schreiben, um die aktuelle Version zu erhalten.
4. Datensätze: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Variablen: pid, cid, hid
Im Zuge der "Zusammenlegung" von SOEP-Long und SOEP-Core sollten alle SOEPlong-ID-Variablen (pid, hid, cid) auch in die Raw-Datensätze geschrieben werden, damit das Mergen für die Nutzenden vereinfacht wird. Bei einigen Datensätzen wurden nur die ID-Variablen angelegt, aber nicht mit den entsprechenden IDs gefüllt.
Leere pid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Leere hid: bioimmig, bioresid, biosoc
Leere cid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Benutzen Sie bei diesen Datensätzen bitte weiterhin persnr, hhnrakt, hhnr, bzw. kopieren Sie den Inhalt in die entsprechende neue ID-Variable.
|
clonevar pid = persnr |
Genauere Informationen zu den SOEP-Identifiern finden Sie hier: