1984-2018 (Welle BI)
(Stand April 2020)
Datensatz: bioage; Variable clref
Wir haben einen Labelfehler im Datensatz bioage bei der Variablen clref festgestellt, der zu verfälschten Analyseergebnissen führen könnte. Die Labels für die Werte [1] und [2] müssen getauscht werden.
stata [de]
label def clref ///
1 "[1] Ja, sowohl spez. Klasse als auch Regelunterricht" ///
2 "[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder", modify
stata [en]
label def clref ///
1 "[1] Yes, both special class and regular classes" ///
2 "[2] Yes, only special class for refugee children", modify
spss [de]
add value labels clref 1 '[1] Ja, sowohl spez. Klasse als auch Regelunterricht' 2 '[2] Ja, ausschliessl. spez. Klasse fuer gefluechtete Kinder' .
spss [en]
add value labels clref 1 '[1] Yes, both special class and regular classes' 2 '[2] Yes, only special class for refugee children' .
1984-2017 (Welle BH)
Übersicht:
Die Variablen plb0186_v2 und plb0186_h haben für das Ostsample im Jahr 1990 um den Faktor 10 zu kleine Werte.
Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigen Namenskonzept des SOEP. Die beiden Variablen werden in der nächsten Version umbenannt.
Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert.
Die neuen Identifier wurde nicht befüllt und müssen aus den alten Identifiern befüllt werden.
Details:
1. Datensatz: pl
Variablen: plb0186_v2, plb0186_h
Die Variablen plb0186_v2 „Tatsächliche Arbeitszeit mit Überstunden (1990-2017)“ und plb0186_h „Tatsächliche Arbeitszeit mit Überstunden (harmonisiert)“ haben für das Ostsample im Jahr 1990 falsche Werte.
Die Variable plb0186_h setzt sich aus den Variablen plb0186_v1 (1984-1989) und plb0186_v2 (1990-2017) zusammen. Hierfür wurden alle Werte von plb0186_v1 direkt übernommen und die gültigen Werte der plb0186_v2 wurden durch 10 geteilt. Der Harmonisierungsprozess muss erfolgen, weil für das Erhebungsjahr 1990 zwei Raw-Variablen genutzt werden, die unterschiedlich geliefert wurden.
gpost: gp3601e (zweistellig ohne Komma)
gp: gp39 (dreistellig ohne Komma)
Die Raw-Variable gp3601e aus gpost wurde der Variable plb0186_v2 zugewiesen, obwohl sie nicht durch 10 geteilt werden muss. So wurden alle Werte der Ostdeutschen-Population für das Jahr 1990 fälschlicherweise durch 10 geteilt. Der einfachste Weg dieses Problem zu lösen ist es, wenn Sie die gültigen Werte der Ostpopulation mit 10 multiplizieren.
cd "Datenpfad" |
Genauere Informationen zum allgemeinen Harmonisierungsprozess von Variablen finden Sie hier:
Versionierung und Harmonisierung
Das Arbeiten mit harmonisierten Variablen
2. Datensatz: bhh
Variablen: bhh_37_01, bhh_37_02
Der Variablenname der Raw-Variablen bhh_37_01 „Stromkosten in Mietpreis enthalten“ und bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ entspricht nicht dem gängigem Namenskonzept des SOEP. Die beiden Variablen müssten umbenannt werden:
bhh_37_01 „Stromkosten in Mietpreis enthalten“ -> bhh_33
bhh_37_02 „Beurteilung Belastung durch Wohnkosten (Miete und Nebenkosten)“ -> bhh_37
Wie Raw-Variablen im SOEP benannt werden, können Sie im SOEPcompanion nachlesen:
Namensschema von Variablen und Datensätzen
3. Datensatz: migspell
Beim Datensatz migspell wurde fälschlicherweise die Version aus der vorherigen Datenweitergabe ausgeliefert. Interessenten des Datensatzes können sich telefonisch an die SOEPhotline wenden oder eine Mail an soepinfo schreiben, um die aktuelle Version zu erhalten.
4. Datensätze: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Variablen: pid, cid, hid
Im Zuge der "Zusammenlegung" von SOEP-Long und SOEP-Core sollten alle SOEPlong-ID-Variablen (pid, hid, cid) auch in die Raw-Datensätze geschrieben werden, damit das Mergen für die Nutzenden vereinfacht wird. Bei einigen Datensätzen wurden nur die ID-Variablen angelegt, aber nicht mit den entsprechenden IDs gefüllt.
Leere pid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Leere hid: bioimmig, bioresid, biosoc
Leere cid: biobirth, bioimmig, biojob, bioparen, bioresid, biosib, biosoc, biotwin, pflege
Benutzen Sie bei diesen Datensätzen bitte weiterhin persnr, hhnrakt, hhnr, bzw. kopieren Sie den Inhalt in die entsprechende neue ID-Variable.
clonevar pid = persnr |
Genauere Informationen zu den SOEP-Identifiern finden Sie hier:
1984 - 2016 (Welle BG)
18.05.2018 |
1. Datensatz $PGEN: Variable casmin$$1. Datensatz $PGEN: Variable CASMIN$$ Durch eine fehlende Klammer in der Programmierung wurden Individuen mit CASMIN Kategorie 6 ( "(2c_gen) general maturity certificate") fälschlicherweise in CASMIN Kategorie 7 ("(2c_voc) vocational maturity certificate") eingestuft. Für die Welle BG bedeutet das, dass von den 4.553 Beobachtungen in Kategorie 7 eigentlich 1.976 in Kategorie 6 gehören und 2.577 in Kategorie 7. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich. Für Welle BG ist dies folgendermaßen möglich:
2. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA („Vocational Degree Outside Germany“) Die Variable _BBILA (Ausländische Abschlüsse – berufliche Bildung) wurde in der Version SOEP v33 rückwirkend erweitert um den Hinweis, ob ein Abschlusszeugnis vorlag. Bei dieser Überarbeitung sind nicht alle Teile der in verschiedenen Modulen erfassten Informationen berücksichtigt worden. Eine Korrektur ist mit den vorhanden Variablen in den $PGEN Daten direkt möglich und ist in dem folgenden Code beschrieben: Statement (TXT, 2.72 KB)
1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany"1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")1. Datensatz [BE-BG]PGEN: Variable [BE-BG]PBBILA ("Vocational Degree Outside Germany")3. Datensatz BIOAGEL: Variable bioage Im Datensatz BIOAGEL wurde leider für die Variable BIOAGE der Datentyp nicht angepasst. Die Variable zeigt an, aus welchem Erhebungsinstrument die entsprechende Datenzeile stammt. Da die Variable BIOAGE seit der v33 Werte > 99 beinhaltet, führte dies dazu, dass beim Einlesen in Stata Werte > 99 abgeschnitten wurden. Die abgeschnittenen Ausprägungen sind:
4. Datensatz CIRDEF: Variable RGROUP Die Variable RGROUP unterteilt die SOEP-Stichprobe in 20 gleich große Gruppen. Mit Hilfe der Variable wird die 50%-Stichprobe ausgewählt. Auf Grund der nicht korrekten Zuordnung der neuen Stichproben M3 und M4 sind keine Fälle aus dieser Stichprobe in der Lehrversion der SOEP-Daten enthalten. |
||||||||||||||||||||||
30.1.2018 | Neue Datenlieferung mit umfangreichen Änderungen, die auf der Seite 'Änderungen am Datensatz' beschrieben sind |
1984 - 2015 (Welle BF)
15. Februar 2017 | Umfangreiche Änderungen, die auf der Seite der Version soep.v32.1 beschrieben sind |
1984-2014 (Welle BE)
06. Juni 2016 | Im generierten Längsschnittdatensatz KIDLONG in SOEP-Core v31.1 mussten wir noch eine Korrektur vornehmen: Einige wenige Daten, die nur in der FiD-Studie erhoben wurden, sind nicht korrekt mit berücksichtigt worden. Dies betrifft die Variablen KA06$$ (Aktivitäten der Kinder unter 6 Jahren) und KA16$$ (Aktivitäten der Kinder zwischen 6 und 16 Jahren). Wenn Sie diese Variablen analysieren, haben Sie drei Möglichkeiten, die vollständigen Daten zu nutzen:
|
18. März 2016 | Umfangreiche Änderungen, die auf der Seite der Version soep.v31.1 beschrieben sind |
1984-2012 (Wave BC)
27. Mär., 2014 |
HGEN Die Imputation der Strom-, Heiz- und Nebenkosten für Mieten war in der aktuellen Datenweitergabe fehlerhaft und lieferte zu hohe Werte. Dieser Fehler wirkt sich auch auf die Generierung der Bruttokaltmiete aus. Betroffen sind die Variablen electr$$, heat$$, util$$, rent$$ und frent$$ der Jahre 2008 bis 2012. Des Weiteren gibt es für 2 Haushalte Änderungen in typ1hh12 sowie typ2hh12. BCPKAL Darüber hinaus wurden im Erhebungsjahr 2012 im Personenfragebogen nach der Aufhebung der Wehrpflicht auch die darauf bezogenen Kalenderinformationen neu gefasst. Diese Änderung wurde zwar bei den ursprünglichen Personendaten im Erhebungsjahr 2012 aktualisiert, nicht aber in den damit korrespondierenden Kalenderdaten – diese Daten sind jetzt rückwirkend für die Datenlieferung v29 aktualisiert. Beide Fehler wurden korrigiert und ein entsprechendes Update steht auf Nachfrage bei der SOEPhotline zum Download zur Verfügung. Sollten Sie diese aktualisierten Versionen bei Ihren Analysen nutzen, verweisen Sie bei Publikationen bitte durch die Verwendung der Versionsnummer SOEP v29.1 darauf (besser noch doi: 10.5684/soep.v29.1). |
1984-2011 (Wave BB)
19. Dez., 2012 |
BIOCOUPLM, BIOCOUPLY, BIOMARSM, BIOMARSY $FAMSTD Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de. Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren:Englisch: Socio-Economic Panel (SOEP), data for years 1984-2011, version 28.1, SOEP, 2012. |
SOEP 1984-2010 (Welle BA)
30. März 2012 |
BIOAGE03 BIOAGE06 BIOAGE08 LIFESPELL Die korrigierten Datensätze werden mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de. Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren: |
||||||||||||||
2. Jan. 2012 |
COGDJ Englische Labels
In den $PGEN-Datensätzen wurden für die neuen Variablen zu Studienrichtung, -Abschluss und Ausbildungsabschlüssen vor dem Eintritt ins Panel keine englischen Value-Labels generiert. Dies betrifft die englischen Labels der folgenden Variablen: PPFADL in SOEPlong HID - Haushaltsidentifikator Die korrigierten Datensätze werden in unterschiedlichen Dateien mit personalisiertem link zum Download bereitgestellt. Bitte wenden Sie sich bei Bedarf an soepmail@diw.de. Bitte beachten Sie: Bei der Nutzung einer dieser korrigierten Datensätze sollten Sie den Datensatz wie folgt zitieren: |
SOEP 1984-2009 (Welle Z)
06.01.2011 | Im generierten Längsschnittdatensatz KIDLONG gab es bei ca. 3% der Kinder ein Problem in der Zuordnung zur korrekten aktuellen Haushaltsnummer. Die Variable HHNRAKT wurde dementsprechend korrigiert. Zusätzlich hat sich in der Variable K_NRKID die Angabe für das Erhebungjahr 1987 für das Kind 397403 geändert. Hierbei erhöht sich die "Anzahl der Kinder im HH unter 16 Jahren" von 1 auf 2. Bitte melden Sie sich bei soepmail@diw.de, wenn Sie den Datensatz KIDLONG nutzen. Sowohl für den 100%-Datensatz für die EEA-Länder als auch für die weltweit nutzbare 95%-Version stellen wir eine individualisierte Downloadmöglichkeit zur Verfügung. Bitte beachten Sie: Bei der Nutzung des korrigierten Datensatzes KIDLONG sollten Sie den Datensatz wie folgt zitieren: Englisch: Socio-Economic Panel (SOEP), data for years 1984-2009, version 26.1, SOEP, 2011. Deutsch: Sozio-oekonomisches Panel (SOEP), Daten für die Jahre 1984-2009, Version 26.1, SOEP, 2011. Kurzversion: SOEP v26.1. |
10.02.2010 |
Fehlerkorrektur der Hochrechnungsfaktoren für Kinder in der Welle Y (2008) herunterladbar Kinder, die 2002 geboren wurden (somit in der Befragungswelle Y (2008) 6 Jahre alt waren) und deren Eltern den für diese Kohorte neu eingeführten Fragebogen Kind ausgefüllt haben, haben versehentlich keinen gültigen Wert für die Variable zur wellenspezifischen Querschnittshochrechnung erhalten. Betroffen sind 237 Kinder (identifizierbar über YNETTO=23), bei denen die Variable YPHRF in der Datei PHRF und die Variable W1110108 in der Datei YPEQUIV, also die jeweiligen Personengewichte, korrigiert werden müssen, die Werte für die Haushaltsgewichte sind korrekt. Auch gewichtete Analysen von erwachsenen Befragten, die zum Beispiel Werte aus den YP- und YPGEN-Dateien nutzen, sind von diesem Fehler nicht betroffen. Nutzerinnen und Nutzer, die auch die 6-Jährigen in eine gewichtete Auswertung einbeziehen möchten, sollten sich die aktualisierte Version der Dateien YPHRF und YPEQUIV herunterladen. Für weitere Informationen zum Herunterladen der Daten über eine personalisierten URL schicken Sie bitte eine E-Mail an soepmail@diw.de. |
05.12.2009 |
Im Datensatz BIOIMMIG ist eine fehlerhafte Zuordnung zu der Variable BIGOBACK (der Variable zur Rückkehrwahrscheinlichkeit) für die Kategorien -2 ("trifft nicht zu") und 2 ("Ja, wahrscheinlich") für einige Fälle seit 2001 getroffen worden. Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:
|
09.11.2009 |
Kurz nach Fertigstellung der DVD ist ein Fehler bei der Datengenerierung im File BIOPAREN identifiziert worden. Es handelt sich um die Variablen zur Religionszugehörigkeit der Eltern (MRELI, VRELI). Die Codes für die Ausprägungen „sonstige christliche Religionszugehörigkeit", „islamische Religionsgemeinschaft" sowie „andere Religionszugehörigkeit" bedürfen einer Korrektur. Die übrigen Ausprägungen der Variable sind nicht betroffen. Zur Korrektur laden Sie bitte das für Ihr Statistikprogramm (SAS, SPSS oder Stata) entsprechende Skript herunter und lassen Sie es nach Anpassung Ihrer lokalen Pfade laufen:
Sollten Sie ein Update für ein anderes Programm brauchen, wenden Sie sich bitte an die SOEP-Hotline (soepmail@diw.de). |
04.12.2008 | Im Rahmen weitergehender Prüfungen wurden einige Probleme in der aktuellen, auf DVD verfügbaren Datendistribution 1984-2007 (Wellen A-X) identifiziert. Um einen Download-Zugang zu den korrigierten Datensätzen zu erhalten, schicken Sie bitte eine E-mail an soepmail@diw.de oder rufen Sie die SOEPhotline an unter +49 30 89789 292. Zum Entpacken der Dateien benötigen Sie das für die aktuelle Datendistribution 1984-2007 gültige Passwort, bzw. das für den Zugriff auf die erweiterten Regionalinformationen im Datensatz GGKBOU notwendige Passwort. Sollten Sie noch nicht über die aktuelle Datenlieferung verfügen, setzen Sie sich bitte mit unserer Hotline (soepmail@diw.de) in Verbindung. Die korrigierten Datensätze sind:
|
03.04.2008 | Die Labels der Variablen (VH27 und WH27) "Eigentümer des Hauses bzw. der Wohnung" sind fehlerhaft. Die Mikrodaten als solche sind korrekt, lediglich die Labels sind quasi um eine Stelle verrutscht. Mit der nächsten Datenweitergabe wird dieser Fehler natürlich behoben sein. Variable Label: Eigentuemer der WohnungValueFalschRichtig
|
|||||||||||||||||||||
31.03.2008 |
In den Bildungsinformationen enthalten die Daten 2005 und 2006 über Schulabschlüsse und abgeschlossene Berufsausbildung Fehler. In der Datenweitergabe 1984-2007 (Welle X) sind deswegen die Variablen PSBIL und PBBIL01-03 in den Files VPGEN und WPGEN korrigiert worden. Falls Sie nicht über die aktuelle Welle verfügen, wenden Sie sich bitte an Henning Lohmann oder Peter Krause. |
|||||||||||||||||||||
28.09.2007 |
Beim Einlesen der überarbeiteten Variablen ERWZEIT wurden versehentlich die in den früheren Jahren spaltengleich abgelegten Variablen VEBZEIT überschrieben. Beide Variablen wurden deshalb jetzt in den PGEN-files der Jahre 1984-1997 (Wellen A-N) korrigiert. Wer für seine Analysen auf Daten vor 1998 zurückgreifen möchte, sollte auf jeden Fall PGEN neu einlesen. |
14.07.2006 | In BIOPAREN sind die Werte für folgende Variablen fehlerhaft:
Sollten Sie diese Variablen benötigen, wenden Sie sich bitte an unsere Hotline soepmail@diw.de. |
13.07.2006 |
In BIOAGE01 fehlen die Labels für die Variable BCKSTOER. value labels |
12.07.2006 |
Unter Windows werden auf der CD 3 leider die Verweise (links) auf Dokumentennamen, die "-en" enthalten (also z.B. die Links zur englischsprachigen Dokumentation der generierten Variablen) nicht korrekt aufgelöst. Sie gelangen bei einer Fehlermeldung zu dem gewünschten Dokument, wenn Sie in der Adresszeile ihres Browsers "-en" zu "_en" ändern. Unter Linux und Unix sollten Sie keine Probleme haben. |
24.08.2005 | Im Jahr 2005 erfolgte in enger Kooperation mit dem Erhebungsinstitut TNS Infratest Sozialforschung eine detaillierte Prüfung aller raumbezogenen Informationen im SOEP (Kreise, Raumordnungsregionen, Bundesländer), die es zudem ermöglichte, fehlende Werte bei Regionalidentifikatoren vergangener Jahre durch gültige Angaben zu ersetzen. Dies hatte in einigen Fällen auch eine Korrektur der Regionalidentifikatoren $BULA und $SAMPREG in früheren Wellen zur Folge. Damit sollten nun alle Informationen zu raumbezogenen Kennziffern im SOEP konsistent sein.
Da die o.g. Prüfung erst nach Produktion der aktuellen CD-Rom (Welle U, 2004) erfolgreich beendet wurde, können interessierte Nutzerinnen und Nutzer ihren Datensatz mit den folgenden Statements (TXT, 9.92 KB) entsprechend korrigieren. |
18.02.2005 |
In STATA tritt eine Darstellungsmerkwürdigkeit auf (möglicherweise nur unter Windows 2000). |
10.12.2004 |
Nach Abschluss der SOEP-Datenweitergabe 1984-2003 sind einige Variablen korrigiert bzw. überarbeitet worden. |
19.12.2003 |
POP - Variablen |
18.12.2003 |
Um mit Stata oder SPSS auf die Datei "BIOJOB" zugreifen zu können, muss diese mit einem programmspezifischen Befehl "zu Fuß" installiert werden.
|
04.11.2003 | Bei der Prüfung der Daten ist im File BIOPAREN ein kleiner Value-Label-Fehler nicht vor der Datenweitergabe entdeckt worden. Er betrifft die Variablen VNAT und MNAT.
Das Label für die Ausprägung 2 muss heißen "andere Staatsangehörigkeit als deutsch" und nicht "türkisch". |
03.05.2002 | THE FOLLOWING ONLY AFFECTS THE ENGLISH LANGUAGE VERSION of the GSOEP. THE GERMAN VERSION IS NOT AFFECTED!
Unfortunately we have found a few more LABEL bugs in the English distribution the Person Files. The data is ok but incorrectly labeled. You can download (ZIP, 2.56 KB)code in STATA, SPSS and SAS which can be copied and run. Simply edit the pathname of where you installed the data, at the top of the code chunk. That will patch things up quickly. Sorry for any hassles caused. John Haisken-DeNew |
28.02.2002 | THE FOLLOWING ONLY AFFECTS THE ENGLISH LANGUAGE VERSION. THE GERMAN VERSION IS NOT AFFECTED !!!!!
Unfortunately we have found a few more VAR LABEL bugs in the english distribution of QP (Person File 2000). The data is ok but incorrectly labeled (var labels). Attached is code in STATA, SPSS and SAS which can be copied and run. Simply edit the pathname of where you installed the data, at the top of the code chunk (AND at the bottom for SPSS only). That will patch things up quickly. Sorry for any hassles caused. ===================== STATA ============================ ===================== SPSS ============================ ===================== SAS ============================
John Haisken-DeNew |