Direkt zum Inhalt

SOEP-Core v20 - Fehlerupdates

Fehlerupdates

Datensatzinformation

Nach Abschluss der SOEP-Datenweitergabe 1984-2003 sind folgende Variablen korrigiert bzw. überarbeitet worden; bei Bedarf können Sie die Korrekturen durch ein Updateprogramm vornehmen lassen.

  1. Bei der Generierung der monatlichen Familienstandsbiographien (BIOMARSM) hat sich ein systematischer Fehler eingeschlichen, der sich teilweise auf die jährlichen Familienstandsbiographien (BIOMARSY) und auf die generierten jährlichen Familienstandsvariablen $FAMSTD in den Rekords $PGEN auswirkt.
    Hier werden Ihnen zwei neues Archive - BIOMARSM und BIOMARSY - zur Verfügung gestellt.
  2. Die integrierte Hochrechnung auf der ausgelieferten CD-ROM war - wie angekündigt - vorläufig und ist inzwischen überarbeitet worden. Die integrierten Hochrechnungsfaktoren A-G finden Sie jetzt gesondert in neuen Rekords HHRFAG (Integrierte Haushaltsgewichte)und PHRFAG (Integrierte Personengewichte).
  3. Im NEWSPELL-Archiv SPEL_100.EXE der ausgelieferten CD ROM sind nicht die aktuellen Daten, sondern nur die für die Jahre 1984-2001 (Wellen A -R) ausgewiesen. Hier wird Ihnen ein neues Archiv SPEL_100.EXE zur Verfügung gestellt.

    Die Korrekturen für die nachfolgenden Punkte 4 bis 6 können Sie über ein Updateprogramm automatisch in Ihren entpackten SOEP-Daten-Files vornehmen.
  4. Für nicht realisierte Haushalte war die Variable TPOP im Rekord PPFAD anders als im Vorjahr abgegrenzt. Dies wurde korrigiert.
  5. Einige Inkompatibilitäten zwischen den Variablen $BULA (Bundesland) , $SAMPREG (Stichprobenregion) sind bereinigt worden.
  6. Einige Ungereimtheiten zeigten sich in der Variablen $TYPHH2 (Haushaltstypologien) in Rekords $HGEN Zum Redaktionsschluss war noch nicht geklärt, ob diese schon jetzt mit diesem Update oder erst mit der nächsten Welle bereinigt werden.

Sämtliche Korrekturen können Sie für SPSS, SAS und STATA sowohl auf Windows-Ebene als auch auf UNIX durchführen. Das Update-Verfahren ist einfach anzuwenden und wurde datenschutzrechtlich als unbedenklich eingestuft. Für den Datenzugang über das Internet benötigen Sie ein Windows-System mit CD-ROM-Laufwerk sowie das Passwort und die CD-ROM Nr. 3 der aktuellen Datenweitergabe 1984-2003 (Wellen A-T).

Die folgende Merkwürdigkeit gilt möglicherweise nur für STATA unter Windows 2000:

Man betrachte z.B. die Variable swum1 aus shbrutto im Browser mit den Befehlen
use swum1 shbrutto, clear
br , nol

Die Variable wird im Fenster unschön halblogarithmisch als

                             x.000000000.e+00

anstatt einfach
                                        x

mit x = 0,...,9

dargestellt. Auch Ausgaben über outfile enthalten das selbe Format. Für die meisten Anwendungen ist dieser Fehler bedeutungslos. Er tritt wahrscheinlich auch nur dann auf, wenn das Display-Format exakt als %21.0g definiert ist.
Die Definition dieses Display-Formats wird automatisch über die maximale Länge der Value-Labels bestimmt. Deshalb gilt diese Beobachtung z.B. auch für twum1 aus thbrutto, die die selben Value-Labels wie swum1 aufweist.

Dieser Fehler ist bisher nur unter Windows 2000 beobachtet worden, z.B. nicht unter Windows XP. Es ist also offensichtlich kein STATA- sondern ein Windows-2000-Fehler.

Mit dem Befehl

                           format swum1 %g22.0g

wird das Problem speziell behoben.

Allgemein empfiehlt es sich vor jeder outfile Ausgabe, den Befehl

                          format _all %22.0g

voranzustellen (statt 22 kann jede andere Zahl ~= 21 verwendet werden).

keyboard_arrow_up