Die Datenweitergabe 2009 mit den Daten von 1984-2008 (Welle 1-25) enthält weitgehende Verbesserungen, Ergänzungen und Änderungen. Neben den üblichen wellenspezifischen Datensätzen YPBRUTTO, YP, YPKAL, YPGEN, YHBRUTTO, YH, YHGEN, YKIND und XPLUECKE sowie den aktualisierten Datensätzen mit Längsschnitt-Komponenten (PFAD-Dateien, Biografiedaten, Spelldaten und Hochrechnungsfaktoren) finden Sie hier die wichtigsten Änderungen:
Das SOEP gibt ab sofort - in einer Beta-Version - die Daten in dem einem nutzerfreundlicheren Format, genannt 'SOEPlong' weiter. Wir haben darüber bereits im SOEPnewsletter 80/2008 berichtet und danken allen, die an diesem Projekt mitgewirkt haben.
Diese neue und vorläufige Version der SOEP-Daten im long-Format geben wir gerne auf Anfrage weiter. Wir empfehlen nur jedoch nur 'Power Usern' mit entsprechenden Vorkenntnissen der Paneldatenanalyse im allgemeinen und dem SOEP im Besonderen die Bestellung dieser Version. Sie sind herzlich eingeladen mit uns an der Verbesserung und Weiterentwicklung des Datenmanagements zu arbeiten.
Diese Version enthält alle Daten und kann deswegen im Wesentlichen schon für endgültige Analysen genutzt werden. Sie ist nichts desto trotz eine vorläufige. Wir möchten unerfahrenen Nutzerinnen und Nutzern daher vorläufig von der Verwendung dieser Version abraten. Falls Sie als 'SOEP-Neuling' mit diesem neuen Format arbeiten wollen, sollten Sie zumindest Erfahrungen mit anderen Panel-Datensätzen gesammelt haben.
A Neue und umbenannte Datensätze
A.1. Datensatz BIOAGE06
Die aktuelle Datenweitergabeversion enthält den neuen Datensatz BIOAGE06. Er stellt die 2008 das erste Mal erhobenen Daten aus dem speziellen Mutter-Kind-Fragebogen zur Verfügung, der von Müttern von 5- bis 6-jährigen Vorschulkindern ausgefüllt wurde. Die Daten ergänzen das Wissen über eine Geburtskohorte, die das erste Mal 2002/2003 mit dem gesonderten Neugeborenen-Fragebogen 'befragt' wurde.
Die neuen Daten über die Vorschulkinder erheben Gewicht und Größe der Kinder, Informationen über ihren Gesundheitszustand, die Betreuungssituation, ihre Aktivitäten mit und ohne die Mutter und ihren Medienkonsum. Insbesondere die Betreuungssituation wird detailliert erhoben. Darüber hinaus wurden zum ersten Mal valide Informationen über die Persönlichkeit des Kindes (basierend auf dem 'Big Five' Persönlichkeitsmerkmalen, die auch im Peronenfragebogen für Erwachsene erfragt werden) und über ihr sozio-emotionales Verhalten gesammelt (beobachtet mit einer modifizierten Version des „Strength-and-Difficulities Questionnaire" (SDQ) nach Goodman (1997)).
A.2 Datensatz MOVEDIST
In diesem Datensatz stellen wir Informationen zum Wohnsitzwechsel zur Verfügung. Basierend auf den Geo-Koordinaten auf Block-Ebene erhalten Sie die Daten über die Entfernung (in Metern) zwischen dem früheren und dem gegenwärtigen Wohnsitz. Allerdings gibt es diese Informationen nur für Umzüge seit 2000.
Diese Daten sind NICHT auf der Standard-Datenweitergabe-DVD enthalten, sondern wir geben diese Informationen nur im Zusammenhang mit den Raumordnungsregionen auf einer gesonderten CD-ROM weiter. Sie benötigen also einen erweiterten Datenweitergabevertrag, der ein Datenschutzkonzept beinhaltet, wenn Sie diese Daten nutzen wollen. Nach Abschluss der Vertragserweiterung erhalten Sie diese Daten auf einer (kostenlosen) CD-ROM. Bei entsprechendem Interesse wenden Sie sich bitte an SOEPmail@diw.de.
B. Neue Variablen
B.1 Datensatz PPFAD
B.2 Datensatz PFLEGE
B.3 Datensatz PBIOSPE
B.4 Datensatz BIOPAREN
C. Überarbeitete Variablen
C.1 Datensatz PWEALTH und HWEALTH
Im Jahr 2007 wurden alle Personen, die 17 Jahre oder älter waren, über ihr Vermögen befragt, eine Wiederholung der Befragung von 2002. Diese 'Rohdaten' waren bereits mit der Welle 24 weitergegeben worden. Mit der aktuellen Datenweitergabe wurden sie nun zusammen mit den Daten von 2002 im long-Format aufbereitet und in den Datensätzen PWEALTH (für Personendaten) und HWEALTH (für Haushalte aggregierte Daten) zusammengefasst.
Fehlende Werte, die aufgrund von Antwortverweigerung bei einzelnen Fragen (item non-response) oder Nicht-Teilnahme einzelner Personen (partial unit non-response, hier: fehlende Interviews in ansonsten befragten Haushalten) entstanden sind, wurden in komplexen Prozessen multipel imputiert, unter Zuhilfenahme längsschnittlicher Informationen. Eine ausführliche Dokumentation ist in Vorbereitung. Erste Analysen wurden vorgenommen und in einem DIW Wochenbericht veröffentlicht (Joachim R. Frick und Markus M. Grabka: Gestiegene Vermögensungleichheit in Deutschland, DIW-Wochenbericht 04/2009)
C.2 Datensatz $PEQUIV
C.3 Datensatz HHRF/PHRF
C.4 Datensatz $PGEN
C.5 Datensatz $HGEN
C.6 Datensatz PPFAD