SOEP-Core v33.1 - Fehlerupdates

Fehlerupdates

Datensatzinformation

1984 - 2016 (Welle BG)

18.05.2018

1. Datensatz $PGEN: Variable casmin$$

1. Datensatz $PGEN: Variable CASMIN$$

Durch eine fehlende Klammer in der Programmierung wurden Individuen mit CASMIN Kategorie 6 ( "(2c_gen) general maturity certificate") fälschlicherweise in CASMIN Kategorie 7 ("(2c_voc) vocational maturity certificate") eingestuft.

Für die Welle BG bedeutet das, dass von den 4.553 Beobachtungen in Kategorie 7 eigentlich 1.976 in Kategorie 6 gehören und 2.577 in Kategorie 7.

Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich. Für Welle BG ist dies folgendermaßen möglich:

replace casmin16= 6 if  inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3              

replace casmin16= 7 if (inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3)  & (inlist(bgpbbila,2,3,5,6,8) | (bgpbbil01>=1 & bgpbbil01<.) | (bgpbbilo>=1 & bgpbbilo<.))

replace casmin16= 8 if inlist(bgpbbil02,1,4)                                   

replace casmin16= 9 if inlist(bgpbbil02,2,3,5,6,7,8) | inlist(bgpbbila,4,7,9)

2. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA („Vocational Degree Outside Germany“)

Die Variable _BBILA (Ausländische Abschlüsse – berufliche Bildung) wurde in der Version SOEP v33 rückwirkend erweitert um den Hinweis, ob ein Abschlusszeugnis vorlag. Bei dieser Überarbeitung sind nicht alle Teile der in verschiedenen Modulen erfassten Informationen berücksichtigt worden. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich und ist in dem folgenden Code beschrieben: Statement

Dataset Variable Variable Label
bepgen bepbbila Vocational Degree Outside Germany
bfpgen bfpbbila Vocational Degree Outside Germany
bgpgen bgpbbila Vocational Degree Outside Germany

3. Datensatz BIOAGEL: Variable bioage

Im Datensatz BIOAGEL wurde leider für die Variable BIOAGE der Datentyp nicht angepasst. Die Variable zeigt an, aus welchem Erhebungsinstrument die entsprechende Datenzeile stammt. Da die Variable BIOAGE seit der v33 Werte > 99 beinhaltet, führte dies dazu, dass beim Einlesen in Stata Werte > 99 abgeschnitten wurden. Die abgeschnittenen Ausprägungen sind:

Variable Value Label
bioage 101 'bioage10a'
bioage 102 'bioage10b(only FID)'

4. Datensatz CIRDEF: Variable RGROUP

Die Variable RGROUP unterteilt die SOEP-Stichprobe in 20 gleich große Gruppen. Mit Hilfe der Variable wird die 50%-Stichprobe ausgewählt. Auf Grund der nicht korrekten Zuordnung der neuen Stichproben M3 und M4 sind keine Fälle aus dieser Stichprobe in der Lehrversion der SOEP-Daten enthalten.

30.1.2018 Neue Datenlieferung mit umfangreichen Änderungen, die auf der Seite 'Änderungen am Datensatz' beschrieben sind

keyboard_arrow_up