Fehlerupdates


SOEP v35

1984-2018 (Welle BI)
(Stand April 2020)

Datensatz: bioage; Variable clref
Wir haben einen Labelfehler im Datensatz bioage bei der Variablen clref festgestellt, der zu verfälschten Analyseergebnissen führen könnte. Die Labels für die Werte [1] und [2] müssen getauscht werden.

stata [de]

label def clref ///
1 "[1] Ja, sowohl spez. Klasse als auch Regelunterricht" ///
2 "[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder", modify

stata [en]

label def clref ///
1 "[1] Yes, both special class and regular classes" ///
2 "[2] Yes, only special class for refugee children", modify

spss [de]

add value labels clref 1 '[1] Ja, sowohl spez. Klasse als auch Regelunterricht' 2 '[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder' .

spss [en]

add value labels clref 1 '[1] Yes, both special class and regular classes' 2 '[2] Yes, only special class for refugee children' .

SOEP v34

1984-2017 (Welle BH)

Übersicht:

  1. Datensatz: pl; Variablen: plb0186_v2, plb0186_h

    Die Variablen plb0186_v2 und plb0186_h haben für das Ostsample im Jahr 1990 um den Faktor 10 zu kleine Werte.

  2. Datensatz: bhh; Variablen: bhh_37_01, bhh_37_02

    Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigen Namenskonzept des SOEP. Die beiden Variablen werden in der nächsten Version umbenannt.

  3. Datensatz: migspell

    Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert.

  4. Datensatz: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege; Variablen: pid, hid, cid

    Die neuen Identifier wurde nicht befüllt und müssen aus den alten Identifiern befüllt werden.

Details:

1. Datensatz: pl
Variablen: plb0186_v2, plb0186_h

Die Variablen plb0186_v2 „Tatsächliche Arbeitszeit mit Überstunden (1990-2017)“ und plb0186_h „Tatsächliche Arbeitszeit mit Überstunden (harmonisiert)“ haben für das Ostsample im Jahr 1990 falsche Werte.

Die Variable plb0186_h setzt sich aus den Variablen plb0186_v1 (1984-1989) und plb0186_v2 (1990-2017) zusammen. Hierfür wurden alle Werte von plb0186_v1 direkt übernommen und die gültigen Werte der plb0186_v2 wurden durch 10 geteilt. Der Harmonisierungsprozess muss erfolgen, weil für das Erhebungsjahr 1990 zwei Raw-Variablen genutzt werden, die unterschiedlich geliefert wurden.

gpost: gp3601e (zweistellig ohne Komma)
gp: gp39 (dreistellig ohne Komma)

Die Raw-Variable gp3601e aus gpost wurde der Variable plb0186_v2 zugewiesen, obwohl sie nicht durch 10 geteilt werden muss. So wurden alle Werte der Ostdeutschen-Population für das Jahr 1990 fälschlicherweise durch 10 geteilt. Der einfachste Weg dieses Problem zu lösen ist es, wenn Sie die gültigen Werte der Ostpopulation mit 10 multiplizieren. 

cd "Datenpfad"
use "pl.dta"
tabstat plb0186_*,by(syear)
clonevar rep_plb0186_h=plb0186_h
replace rep_plb0186_h = rep_plb0186_h*10 if inputdataset == "gpost" & rep_plb0186_h > 0

Genauere Informationen zum allgemeinen Harmonisierungsprozess von Variablen finden Sie hier:

Versionierung und Harmonisierung

Das Arbeiten mit harmonisierten Variablen

2. Datensatz: bhh
Variablen: bhh_37_01, bhh_37_02

Der  Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigem Namenskonzept des SOEP. Die beiden Variablen müssten umbenannt werden:

bhh_37_01 „Stromkosten in Mietpreis enthalten“  -> bhh_33
bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“  -> bhh_37

Wie Raw-Variablen im SOEP benannt werden, können Sie im SOEPcompanion nachlesen:

Namensschema von Variablen und Datensätzen

3. Datensatz: migspell

Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert. Interessenten des Datensatzes können sich telefonisch an die SOEPhotline wenden oder eine Mail an soepinfo schreiben, um die aktuelle Version zu erhalten.

4. Datensätze: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Variablen: pid, cid, hid

Im Zuge der "Zusammenlegung" von SOEP-Long und SOEP-Core sollten alle SOEPlong-ID-Variablen (pid, hid, cid) auch in die Raw-Datensätze geschrieben werden, damit das Mergen für die Nutzenden vereinfacht wird. Bei einigen Datensätzen wurden nur die ID-Variablen angelegt, aber nicht mit den entsprechenden IDs gefüllt.

Leere pid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Leere hid: bioimmig, bioresid, biosoc
Leere cid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege

Benutzen Sie bei diesen Datensätzen bitte weiterhin persnr, hhnrakt, hhnr, bzw. kopieren Sie den Inhalt in die entsprechende neue ID-Variable.

clonevar pid = persnr
clonevar hid = hhnrakt
clonevar cid = hhnr

Genauere Informationen zu den SOEP-Identifiern finden Sie hier:

Datensatz Identifier

SOEP v33

1984 - 2016 (Welle BG)

18.05.2018

1. Datensatz $PGEN: Variable casmin$$

1. Datensatz $PGEN: Variable CASMIN$$

Durch eine fehlende Klammer in der Programmierung wurden Individuen mit CASMIN Kategorie 6 ( "(2c_gen) general maturity certificate") fälschlicherweise in CASMIN Kategorie 7 ("(2c_voc) vocational maturity certificate") eingestuft.

Für die Welle BG bedeutet das, dass von den 4.553 Beobachtungen in Kategorie 7 eigentlich 1.976 in Kategorie 6 gehören und 2.577 in Kategorie 7.

Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich. Für Welle BG ist dies folgendermaßen möglich:

replace casmin16= 6 if  inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3              

replace casmin16= 7 if (inlist(bgpsbil,3,4) |  bgpsbila==3 |  bgpsbilo==3)  & (inlist(bgpbbila,2,3,5,6,8) | (bgpbbil01>=1 & bgpbbil01<.) | (bgpbbilo>=1 & bgpbbilo<.))

replace casmin16= 8 if inlist(bgpbbil02,1,4)                                   

replace casmin16= 9 if inlist(bgpbbil02,2,3,5,6,7,8) | inlist(bgpbbila,4,7,9)

2. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA („Vocational Degree Outside Germany“)

Die Variable _BBILA (Ausländische Abschlüsse – berufliche Bildung) wurde in der Version SOEP v33 rückwirkend erweitert um den Hinweis, ob ein Abschlusszeugnis vorlag. Bei dieser Überarbeitung sind nicht alle Teile der in verschiedenen Modulen erfassten Informationen berücksichtigt worden. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich und ist in dem folgenden Code beschrieben: Statement (TXT, 2.72 KB)

Dataset Variable Variable Label
bepgen bepbbila Vocational Degree Outside Germany
bfpgen bfpbbila Vocational Degree Outside Germany
bgpgen bgpbbila Vocational Degree Outside Germany

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany" 

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")

3. Datensatz BIOAGEL: Variable bioage

Im Datensatz BIOAGEL wurde leider für die Variable BIOAGE der Datentyp nicht angepasst. Die Variable zeigt an, aus welchem Erhebungsinstrument die entsprechende Datenzeile stammt. Da die Variable BIOAGE seit der v33 Werte > 99 beinhaltet, führte dies dazu, dass beim Einlesen in Stata Werte > 99 abgeschnitten wurden. Die abgeschnittenen Ausprägungen sind:

Variable Value Label
bioage 101 'bioage10a'
bioage 102 'bioage10b(only FID)'

4. Datensatz CIRDEF: Variable RGROUP

Die Variable RGROUP unterteilt die SOEP-Stichprobe in 20 gleich große Gruppen. Mit Hilfe der Variable wird die 50%-Stichprobe ausgewählt. Auf Grund der nicht korrekten Zuordnung der neuen Stichproben M3 und M4 sind keine Fälle aus dieser Stichprobe in der Lehrversion der SOEP-Daten enthalten.

30.1.2018 Neue Datenlieferung mit umfangreichen Änderungen, die auf der Seite 'Änderungen am Datensatz' beschrieben sind

SOEP v32

1984 - 2015 (Welle BF)

15. Februar 2017 Umfangreiche Änderungen, die auf der Seite der Version soep.v32.1 beschrieben sind

SOEP v31

1984-2014 (Welle BE)

06. Juni 2016 Im generierten Längsschnittdatensatz KIDLONG in SOEP-Core v31.1 mussten wir noch eine Korrektur vornehmen: Einige wenige Daten, die nur in der FiD-Studie erhoben wurden, sind nicht korrekt mit berücksichtigt worden.
Dies betrifft die Variablen KA06$$ (Aktivitäten der Kinder unter 6 Jahren) und KA16$$ (Aktivitäten der Kinder zwischen 6 und 16 Jahren).
Wenn Sie diese Variablen analysieren, haben Sie drei Möglichkeiten, die vollständigen Daten zu nutzen:
  1. Sie nutzen die Originaldaten aus SOEP-Core (in den Datensätzen $$KIND).
  2. Sie nutzen den Datensatz KIDL in SOEPlong (dort sind die Daten korrekt integriert)
  3. Sie können über unserer Hotline (soepmail@diw.de) den korrigierten Datensatz KIDLONG v31.1 anfordern. Wir stellen dann eine individualisierte Downloadmöglichkeit zur Verfügung.
18. März 2016 Umfangreiche Änderungen, die auf der Seite der Version soep.v31.1 beschrieben sind

SOEP v29

1984-2012 (Wave BC)

27. Mär., 2014

HGEN

Die Imputation der Strom-, Heiz- und Nebenkosten für Mieten war in der aktuellen Datenweitergabe fehlerhaft und lieferte zu hohe Werte. Dieser Fehler wirkt sich auch auf die Generierung der Bruttokaltmiete aus. Betroffen sind die Variablen electr$$, heat$$, util$$, rent$$ und frent$$ der Jahre 2008 bis 2012. Des Weiteren gibt es für 2 Haushalte Änderungen in typ1hh12 sowie typ2hh12.

BCPKAL

Darüber hinaus wurden im Erhebungsjahr 2012 im Personenfragebogen nach der Aufhebung der Wehrpflicht auch die darauf bezogenen Kalenderinformationen neu gefasst. Diese Änderung wurde zwar bei den ursprünglichen Personendaten im Erhebungsjahr 2012 aktualisiert, nicht aber in den damit korrespondierenden Kalenderdaten – diese Daten sind jetzt rückwirkend für die Datenlieferung v29 aktualisiert.

Beide Fehler wurden korrigiert und ein entsprechendes Update steht auf Nachfrage bei der SOEPhotline zum Download zur Verfügung. Sollten Sie diese aktualisierten Versionen bei Ihren Analysen nutzen, verweisen Sie bei Publikationen bitte durch die Verwendung der Versionsnummer SOEP v29.1 darauf (besser noch doi: 10.5684/soep.v29.1).

SOEP v28

1984-2011 (Wave BB)

19. Dez., 2012

BIOCOUPLM, BIOCOUPLY, BIOMARSM, BIOMARSY
In einigen Fällen wurden die Meldungen von einer zurückliegenden Scheidung nicht bei der Datengenerierung berücksichtigt. Darüber hinaus ist versehentlich zum Teil das angegebene Todesjahr eines ehemaligen Partners mit dem jeweils aktuellen Interviewjahr überschrieben worden. Dies beeinflusst nicht nur die Start- und Enddaten einiger Spells, sondern auch fehlende Informationen und Konsistenzprüfungen.

$FAMSTD
Das fehlerhafte Überschreiben von Daten bei der Generierung von BIOCOUPL$ beeinflusst die Konsistenzprüfungen. Die Mehrzahl der zuvor fehlenden Informationen ist jetzt vorhanden. Allerdings ist stattdessen die Zahl der unplausiblen Antworten angewachsen.

Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de.

Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:
Englisch:

Socio-Economic Panel (SOEP), data for years 1984-2011, version 28.1, SOEP, 2012.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2011, Version 28.1, SOEP, 2012.
Kurzversion:
SOEP v28.1 

SOEP v27

SOEP 1984-2010 (Welle BA)

 30. März 2012

BIOAGE03
Das Alter der Kinder war nicht korrekt und musste neu berechnet werden. Zudem hatten einige fehlende Werte für das Gewicht und die Größe der Kinder den falschen Wert "0" und mussten rekodiert werden. Und schließlich war versehentlich die Zahl der Arztbesuche in den Befragungsjahren 2005 und 2006 auf "0" gesetzt worden. Auch hier sind die richtigen Werte nachgetragen worden.

BIOAGE06
Die fehlenden Geburtsmonate für 14 Kinder, die aus früheren Befragungen bekannt waren, wurden nachgetragen. Darüber hinaus wurden eine falsche Personennummer und eine falsche Haushaltsnummer korrigiert.

BIOAGE08
Das Alter der Kinder war falsch berechnet worden und ist jetzt korrigiert.

LIFESPELL
Im Update des Datensatzes LIFESPELL werden für den Zeitraum 2006-2010 etwa 100 Emigrations-Fälle rekodiert, die in der Datenlieferungs-Version v27 fälschlicherweise als Inlands-Spell geführt wurden. In dem revidierten LIFESPELL-Datensatz werden zusätzlich neue Informationen über das Todesjahr für eine kleine Anzahl an Personen bereitgestellt. Nähere Informationen erhalten Sie bei Hannes Neiss (hneiss@diw.de). 

Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de.

Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:
Englisch:
Socio-Economic Panel (SOEP), data for years 1984-2010, version 27.2, SOEP, 2012.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2010, Version 27.2, SOEP, 2012.
Kurzversion:
SOEP v27.2.

2. Jan. 2012

 COGDJ
Im File COGDJ waren in der ausgelieferten Datenversion die Daten für 2010 noch nicht aktualisiert. 

 Englische Labels
In den Datensätzen ZHBRUTTO und BAHBRUTTO sind leider Teile der englischen Labels in ihrer Zuordnung verrutscht und müssen neu definiert werden. Dies betrifft die folgenden Variablen:

ZHBRUTTO
BAHBRUTTO
SAMPLE1  
ZBULA  
ZDATUMMO  
ZHAND  
ZHERGS  
ZHTYP BAHTYP
ZSAMPREG

In den $PGEN-Datensätzen wurden für die neuen Variablen zu Studienrichtung, -Abschluss und Ausbildungsabschlüssen vor dem Eintritt ins Panel keine englischen Value-Labels generiert. Dies betrifft die englischen Labels der folgenden Variablen:
FIELD$$, DEGREE$$ und TRAINA$$–TRAIND$$.

 PPFADL in SOEPlong
Für die folgenden beiden Variablen fehlen auf der Datenweitergabe-DVD SOEP v27 die Werte für 2010:

HID - Haushaltsidentifikator
NETT1 - Kurzversion der Tracking-Variable NETTO

Die korrigierten Datensätze werden in unterschiedlichen Dateien mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de.

Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:
Englisch:
Socio-Economic Panel (SOEP), data for years 1984-2010, version 27.1, SOEP, 2012.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2010, Version 27.1, SOEP, 2012.
Kurzversion:
SOEP v27.1. 

SOEP v26

SOEP 1984-2009 (Welle Z)

 

 06.01.2011  Im generierten Längsschnittdatensatz KIDLONG gab es bei ca. 3% der Kinder ein Problem in der Zuordnung zur korrekten aktuellen Haushaltsnummer. Die Variable HHNRAKT wurde dementsprechend korrigiert.
Zusätzlich hat sich in der Variable K_NRKID die Angabe für das Erhebungjahr 1987 für das Kind 397403 geändert.
Hierbei erhöht sich die "Anzahl der Kinder im HH unter 16 Jahren" von 1 auf 2.
Bitte melden Sie sich bei soepmail@diw.de, wenn Sie den Datensatz KIDLONG nutzen. Sowohl für den 100%-Datensatz für die EEA-Länder als auch für die weltweit nutzbare 95%-Version stellen wir eine individualisierte Downloadmöglichkeit zur Verfügung.

Bitte beachten Sie: Bei der Nutzung des korrigierten Datensatzes KIDLONG sollten Sie den Datensatz wie folgt zitieren:
Englisch:
Socio-Economic Panel (SOEP), data for years 1984-2009, version 26.1, SOEP, 2011.
Deutsch:
Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2009, Version 26.1, SOEP, 2011.
Kurzversion:
SOEP v26.1.

1984-2008 (Welle Y)

 

 10.02.2010

Fehlerkorrektur der Hochrechnungsfaktoren für Kinder in der Welle Y (2008) herunterladbar

Kinder, die 2002 geboren wurden (somit in der Befragungswelle Y (2008) 6 Jahre alt waren) und deren Eltern den für diese Kohorte neu eingeführten Fragebogen Kind ausgefüllt haben, haben versehentlich keinen gültigen Wert für die Variable zur wellenspezifischen Querschnittshochrechnung erhalten. Betroffen sind 237 Kinder (identifizierbar über YNETTO=23), bei denen die Variable YPHRF in der Datei PHRF und die Variable W1110108 in der Datei YPEQUIV, also die jeweiligen Personengewichte, korrigiert werden müssen, die Werte für die Haushaltsgewichte sind korrekt. Auch gewichtete Analysen von erwachsenen Befragten, die zum Beispiel Werte aus den YP- und YPGEN-Dateien nutzen, sind von diesem Fehler nicht betroffen. Nutzerinnen und Nutzer, die auch die 6-Jährigen in eine gewichtete Auswertung einbeziehen möchten, sollten sich die aktualisierte Version der Dateien YPHRF und YPEQUIV herunterladen.

Für weitere Informationen zum Herunterladen der Daten über eine personalisierten URL schicken Sie bitte eine E-Mail an soepmail@diw.de.

 05.12.2009

Im Datensatz BIOIMMIG ist eine fehlerhafte Zuordnung zu der Variable BIGOBACK (der Variable zur Rückkehrwahrscheinlichkeit) für die Kategorien -2 ("trifft nicht zu") und 2 ("Ja, wahrscheinlich") für einige Fälle seit 2001 getroffen worden.

Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:

Skript für Stata (TXT, 320.45 KB)

Skript für SPSS (TXT, 289.2 KB)

Skript für SAS (TXT, 309.72 KB)

 

 09.11.2009

Kurz nach Fertigstellung der DVD ist ein Fehler bei der Datengenerierung im File BIOPAREN identifiziert worden.

Es handelt sich um die Variablen zur Religionszugehörigkeit der Eltern (MRELI, VRELI). Die Codes für die Ausprägungen „sonstige christliche Religionszugehörigkeit", „islamische Religionsgemeinschaft" sowie „andere Religionszugehörigkeit" bedürfen einer Korrektur. Die übrigen Ausprägungen der Variable sind nicht betroffen.

Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:

Skript für Stata (TXT, 75.48 KB)

Skript für SPSS (TXT, 64.96 KB)

Skript für SAS (TXT, 75.55 KB)

 

Sollten Sie ein Update für ein anderes Programm brauchen, wenden Sie sich bitte an die SOEP-Hotline (soepmail@diw.de).

nach oben

1984-2007 (Welle X)

 04.12.2008 Im Rahmen weitergehender Prüfungen wurden einige Probleme in der aktuellen, auf DVD verfügbaren Datendistribution 1984-2007 (Wellen A-X) identifiziert.

Um einen Download-Zugang zu den korrigierten Datensätzen zu erhalten, schicken Sie bitte eine E-mail an soepmail@diw.de oder rufen Sie die SOEPhotline an unter +49 30 89789 292.

Zum Entpacken der Dateien benötigen Sie das für die aktuelle Datendistribution 1984-2007 gültige Passwort, bzw. das für den Zugriff auf die erweiterten Regionalinformationen im Datensatz GGKBOU notwendige Passwort. Sollten Sie noch nicht über die aktuelle Datenlieferung verfügen, setzen Sie sich bitte mit unserer Hotline (soepmail@diw.de) in Verbindung.

Die korrigierten Datensätze sind:
  • HHRF (Hochrechnungsfaktoren Haushalte): Bei der Bereitstellung der Hochrechnungsfaktoren für die Haushalte wurde bei den Variablen WHHRFALL und XHHRFALL fälschlicherweise eine Vorabversion weitergegeben. Diese sind jetzt durch die geprüfte Version ersetzt.
  • PBIOSPE: Wegen eines erst jetzt entdeckten Einlesefehlers wurde ein Teil der seit Welle U neu- und nacherhobenen Erwerbsbiographien nicht korrekt abgelegt. PBIOSPE wurde daher rückwirkend ab Welle U überarbeitet.
  • XHBRUTTO: Hier wurde bei der Variablen XBULA ein fehlerhafter Code für die Bundesländer in Ostdeutschland korrigiert.
  • WP: Updates wurden durchgeführt bei WKLAS, WIS88, WIS88N und WKLASN. Dies war notwendig, da zuvor einige wenige Angaben mit Missings überschrieben wurden.
  • WPGEN/XPGEN: Aufgrund der Korrekturen von WKLAS und WIS88  in WP war eine Aktualisierung der darauf basierenden Variablen IS8806, ISEI06, MPS06, SIOPS06  EGP06 und KLAS06 erforderlich. Darüber hinaus wurde in Folge der Überarbeitung von PBIOSPE (s.o.) ein Update bei EXPFT$$, EXPPT$$ undEXPUE$$ durchgeführt.
  • HBRUTT00: Auf Grund eines Konflikts der Haushaltsnummern für das erweiterte Ur-Brutto der Stichprobe F wurde bei einigen Fällen die Haushaltsnummer geändert. Dies betrifft nur Fälle, die nicht an der Befragung teilgenommen haben.
  • GGKBOU: Als Folge der Änderung in HBRUTT00 wurden in diesem Datensatz ebenfalls in einigen Fällen  die HHNR angepasst.

nach oben

1984-2006 (Welle W)

 03.04.2008 Die Labels der Variablen (VH27 und WH27) "Eigentümer des Hauses bzw. der Wohnung" sind fehlerhaft. Die Mikrodaten als solche sind korrekt, lediglich die Labels sind quasi um eine Stelle verrutscht.
Mit der nächsten Datenweitergabe wird dieser Fehler natürlich behoben sein.

Variable Label: Eigentuemer der WohnungValueFalschRichtig
-2 trifft nicht zu trifft nicht zu
-1 keine Angabe keine Angabe
1 Selbst genutztes Wohneigentum Kommunale Wohnung
2 Kommunale Wohnung Genossenschaftliche Wohnung
3 Genossenschaftliche Wohnung Betriebs-,Werkswohnung
4 Betriebs-,Werkswohnung Privater Eigentuemer
5 Privater Eigentuemer Weiss nicht
 31.03.2008

In den Bildungsinformationen enthalten die Daten 2005 und 2006 über Schulabschlüsse und  abgeschlossene Berufsausbildung Fehler. In der Datenweitergabe 1984-2007 (Welle X) sind deswegen die Variablen PSBIL und PBBIL01-03 in den Files VPGEN und WPGEN korrigiert worden. Falls Sie nicht über die aktuelle Welle verfügen, wenden Sie sich bitte an Henning Lohmann oder Peter Krause

 28.09.2007

Beim Einlesen der überarbeiteten Variablen ERWZEIT wurden versehentlich die in den früheren Jahren spaltengleich abgelegten Variablen VEBZEIT überschrieben. Beide Variablen wurden deshalb jetzt in den PGEN-files der Jahre 1984-1997 (Wellen A-N) korrigiert. Wer für seine Analysen auf Daten vor 1998 zurückgreifen möchte, sollte auf jeden Fall PGEN neu einlesen.
Die aktualisierten Daten werden in den verschiedenen Formaten auf einer Downloadseite bereitgestellt. Bitte erfragen Sie das Passwort für diese Seite bei der SOEP-Hotline

nach oben

1984-2005 (Welle V)

 14.07.2006 In BIOPAREN sind die Werte für folgende Variablen fehlerhaft:
  • VAORTAKT : 'Aktueller Aufenthaltsort des Vaters'
  • MAORTAKT : 'Aktueller Aufenthaltsort der Mutter'
  • VAORTUP : 'Zeitpunkt des Updates - VAORTAKT'
  • MAORTUP 'Zeitpunkt des Updates - MAORTAKT'

Sollten Sie diese Variablen benötigen, wenden Sie sich bitte an unsere Hotline soepmail@diw.de

 13.07.2006

In BIOAGE01 fehlen die Labels für die Variable BCKSTOER. 

value labels
(-1)'k.A.'
(0)'keine dieser Stoerungen'
(1)'Wahrnehmung'
(2)'Motorik'
(3)'Neurologische Stoerung'
(4)'Sprache'
(5)'Regulation'
(6)'chronische Krankheit'
(7)'koerperliche Behinderung'
(8)'geistige Behinderung'
(11)'Motorik+Regulation'
(12)'Wahrnehmung+Motorik+Sprache'
(13)'Wahrnehmung+Motorik+chron.Krankheit'
(14)'Wahrnehmung+Motorik'
(15)'Wahrn.+Motorik+neur.St.+Spr.+koerperl.Beh'  

 12.07.2006

Unter Windows werden auf der CD 3 leider die Verweise (links) auf Dokumentennamen, die "-en" enthalten (also z.B. die Links zur englischsprachigen Dokumentation der generierten Variablen) nicht korrekt aufgelöst. Sie gelangen bei einer Fehlermeldung zu dem gewünschten Dokument, wenn Sie in der Adresszeile ihres Browsers "-en" zu "_en" ändern. Unter Linux und Unix sollten Sie keine Probleme haben. 

nach oben

1984-2004 (Welle U)

 24.08.2005 Im Jahr 2005 erfolgte in enger Kooperation mit dem Erhebungsinstitut TNS Infratest Sozialforschung eine detaillierte Prüfung aller raumbezogenen Informationen im SOEP (Kreise, Raumordnungsregionen, Bundesländer), die es zudem ermöglichte, fehlende Werte bei Regionalidentifikatoren vergangener Jahre durch gültige Angaben zu ersetzen. Dies hatte in einigen Fällen auch eine Korrektur der Regionalidentifikatoren $BULA und $SAMPREG in früheren Wellen zur Folge. Damit sollten nun alle Informationen zu raumbezogenen Kennziffern im SOEP konsistent sein.

Da die o.g. Prüfung erst nach Produktion der aktuellen CD-Rom (Welle U, 2004) erfolgreich beendet wurde, können interessierte Nutzerinnen und Nutzer ihren Datensatz mit den folgenden Statements (TXT, 9.92 KB) entsprechend korrigieren.

1984-2003 (Welle T)

 18.02.2005

In STATA tritt eine Darstellungsmerkwürdigkeit auf (möglicherweise nur unter Windows 2000). 

 10.12.2004

Nach Abschluss der SOEP-Datenweitergabe 1984-2003 sind einige Variablen korrigiert bzw. überarbeitet worden. 

Fehlerupdates vorheriger Wellen

 19.12.2003

POP - Variablen
Versehentlich sind vorläufige Werte der generierten Variablen Populationszugehörigkeit (SPOP und SHPOP) weitergegeben worden. Wir werden ein Update Anfang nächsten Jahres bereitstellen. Die von den POP - Variablen abhängigen Hochrechnungsfaktoren sind mit den korrekten Daten berechnet worden und somit nicht betroffen. 

 18.12.2003

Um mit Stata oder SPSS auf die Datei "BIOJOB" zugreifen zu können, muss diese mit einem programmspezifischen Befehl "zu Fuß" installiert werden.
Folgende Schritte sind erforderlich:

  • In das work-directory für die SOEP-Daten gehen.
  • Die SOEP19 CD#1 in das Laufwerk einlegen (hier im Beispiel mit D: gekennzeichnet, wenn das Laufwerk bei Ihnen einen anderen Buchstaben hat, bitte entsprechend ändern).
  • Mit dem Befehl
    d:\data\gsoep\sta_100.exe -pass=********biojob.* (Stata-Files),
    d:\data\gsoep\por_100.exe -pass=********biojob.* (SPSS-Portable-Files) oder
    d:\data\gsoep\sps_100.exe -pass=********biojob.* (SPSS-SAV-Files)
    wird BIOJOB für das jeweilige Statistikpaket installiert.
    (******* ist das Passwort)
 04.11.2003 Bei der Prüfung der Daten ist im File BIOPAREN ein kleiner Value-Label-Fehler nicht vor der Datenweitergabe entdeckt worden. Er betrifft die Variablen VNAT und MNAT.

Das Label für die Ausprägung 2 muss heißen "andere Staatsangehörigkeit als deutsch" und nicht "türkisch".

 03.05.2002 THE FOLLOWING ONLY AFFECTS THE ENGLISH LANGUAGE VERSION of the GSOEP. THE GERMAN VERSION IS NOT AFFECTED!

Unfortunately we have found a few more LABEL bugs in the English distribution the Person Files. The data is ok but incorrectly labeled.

You can download (ZIP, 2.56 KB)code in STATA, SPSS and SAS which can be copied and run. Simply edit the pathname of where you installed the data, at the top of the code chunk.

That will patch things up quickly. Sorry for any hassles caused.

John Haisken-DeNew

 28.02.2002 THE FOLLOWING ONLY AFFECTS THE ENGLISH LANGUAGE VERSION. THE GERMAN VERSION IS NOT AFFECTED !!!!!

Unfortunately we have found a few more VAR LABEL bugs in the english distribution of QP (Person File 2000). The data is ok but incorrectly labeled (var labels).

Attached is code in STATA, SPSS and SAS which can be copied and run. Simply edit the pathname of where you installed the data, at the top of the code chunk (AND at the bottom for SPSS only).

That will patch things up quickly. Sorry for any hassles caused.

===================== STATA ============================
use c:\gsoep17\qp
label variable qp03 "Maternity, Paternity Leave"
label variable qp04 "Registered As Unemployed"
label variable qp6301 "Second Job, Earnings"
label variable qp6302 "Gross Amt Second Job Monthly Income"
label variable qp6303 "Old-Age,Invalid Pension"
label variable qp6304 "Gross Amt. Of Old-Age,Invalid Pension,Mo"
label variable qp6305 "Widow-Er,Orphan Benefit"
label variable qp6306 "Gross Amt Of Widow-Er,Orphan Benefit,Mo"
label variable qp6307 "Unemployment Benefit"
label variable qp6308 "Gross Amt.Of Unemployment Benefit,Mo"
label variable qp6309 "Unemployment Relief"
label variable qp6310 "Gross Amt.Of Unemployment Relief, Mo"
label variable qp6311 "Subsistence Allowance"
label variable qp6312 "Gross Amt. Of Subsistence Allowance,Mo"
label variable qp6313 "Transition Money, etc."
label variable qp6314 "Gross Amt. Of Transition Money, etc."
label variable qp6315 "Early Retirement Benefits"
label variable qp6316 "Gross Amt. Of Early Rtiremnt Benefits,Mo"
label variable qp6317 "Maternity Benefit"
label variable qp6318 "Gross Amount Of Maternity Benefit"
label variable qp6319 "Student Grant"
label variable qp6320 "Gross Amount Of Student Grant,Mo"
label variable qp6321 "Military,Civilian Payments"
label variable qp6322 "Gross Amt. Military,Civilian Pay,Mo"
label variable qp6323 "Income From Persons Not In Household"
label variable qp6324 "Gross Amt. Income-Persons Not In HH,Mo"
label variable qp6325 "No Other Income Besides Earned Income"
save, replace
 
===================== SPSS ============================
get file='c:\gsoep17\qp.sav'.
var label qp03 "Maternity, Paternity Leave".
var label qp04 "Registered As Unemployed".
var label qp6301 "Second Job, Earnings".
var label qp6302 "Gross Amt Second Job Monthly Income".
var label qp6303 "Old-Age,Invalid Pension".
var label qp6304 "Gross Amt. Of Old-Age,Invalid Pension,Mo".
var label qp6305 "Widow-Er,Orphan Benefit".
var label qp6306 "Gross Amt Of Widow-Er,Orphan Benefit,Mo".
var label qp6307 "Unemployment Benefit".
var label qp6308 "Gross Amt.Of Unemployment Benefit,Mo".
var label qp6309 "Unemployment Relief".
var label qp6310 "Gross Amt.Of Unemployment Relief, Mo".
var label qp6311 "Subsistence Allowance".
var label qp6312 "Gross Amt. Of Subsistence Allowance,Mo".
var label qp6313 "Transition Money, etc.".
var label qp6314 "Gross Amt. Of Transition Money, etc.".
var label qp6315 "Early Retirement Benefits".
var label qp6316 "Gross Amt. Of Early Rtiremnt Benefits,Mo".
var label qp6317 "Maternity Benefit".
var label qp6318 "Gross Amount Of Maternity Benefit".
var label qp6319 "Student Grant".
var label qp6320 "Gross Amount Of Student Grant,Mo".
var label qp6321 "Military,Civilian Payments".
var label qp6322 "Gross Amt. Military,Civilian Pay,Mo".
var label qp6323 "Income From Persons Not In Household".
var label qp6324 "Gross Amt. Income-Persons Not In HH,Mo".
var label qp6325 "No Other Income Besides Earned Income".
save outfile='c:\gsoep17\qp.sav'.
 
===================== SAS ============================
libname soep 'c:\gsoep17';
libname library 'c:\gsoep17';
options compress=no ls=80 errors=1 nofmterr nodate nocenter;
data soep.qp;
set soep.qp;
label
QP03 = "Maternity, Paternity Leave"
QP04 = "Registered As Unemployed"
QP6301 = "Second Job, Earnings"
QP6302 = "Gross Amt Second Job Monthly Income"
QP6303 = "Old-Age,Invalid Pension"
QP6304 = "Gross Amt. Of Old-Age,Invalid Pension,Mo"
QP6305 = "Widow-Er,Orphan Benefit"
QP6306 = "Gross Amt Of Widow-Er,Orphan Benefit,Mo"
QP6307 = "Unemployment Benefit"
QP6308 = "Gross Amt.Of Unemployment Benefit,Mo"
QP6309 = "Unemployment Relief"
QP6310 = "Gross Amt.Of Unemployment Relief, Mo"
QP6311 = "Subsistence Allowance"
QP6312 = "Gross Amt. Of Subsistence Allowance,Mo"
QP6313 = "Transition Money, etc."
QP6314 = "Gross Amt. Of Transition Money, etc."
QP6315 = "Early Retirement Benefits"
QP6316 = "Gross Amt. Of Early Rtiremnt Benefits,Mo"
QP6317 = "Maternity Benefit"
QP6318 = "Gross Amount Of Maternity Benefit"
QP6319 = "Student Grant"
QP6320 = "Gross Amount Of Student Grant,Mo"
QP6321 = "Military,Civilian Payments"
QP6322 = "Gross Amt. Military,Civilian Pay,Mo"
QP6323 = "Income From Persons Not In Household"
QP6324 = "Gross Amt. Income-Persons Not In HH,Mo"
QP6325 = "No Other Income Besides Earned Income";
run;
 

====================================================

John Haisken-DeNew

nach oben

keyboard_arrow_up