Wir sind sehr daran interessiert, dass die SOEP-Daten auch in der Lehre benutzt werden. Dazu bieten wir Ihnen einen sehr vereinfachten Stata-Übungsdatensatz (zum direkten Herunterladen) und die Bestellung des Lehrdatensatzes (teaching version).
Dieser im STATA-Format abgelegte Datensatz basiert auf originalen SOEP-Daten, stellt diese aber stark verfremdet und völlig anonymisiert dar - daher kann der Übungsdatensatz unabhängig von Datenweitergabe-Verträgen und Nutzungsvereinbarungen verwendet werden. Der Übungsdatensatz speist sich aus originalen Variablen, umspannt fünf Zeitpunkte und liegt im „long-format" vor. Der Datensatz wird in deutscher und englischer Sprache zur Verfügung gestellt.
Wir bieten zwei Übungsdatensätze an, die sich in der Variablenanzahl und Zeitspanne unterscheiden. Die aktuellere Version beinhaltet u.a. Einkommensvariablen sowie das do-file, welches zur Erstellung des Datensatzes genutz wurde:
1. Daten der Jahre 2000-2004, 9 Variablen
Datensatz deutsch (ZIP, 69.74 KB)
Datensatz englisch (ZIP, 69.73 KB)
2. Daten der Jahre 2015-2019, 15 Variablen, DOI:10.5684/soep.practice.v36
Datensatz deutsch (ZIP, 357.37 KB)
Datensatz englisch (ZIP, 355.33 KB)
Bei der Verfremdung der Variablen wurde ein Algorithmus angewendet, der die Längsschnittkonsistenz der Originaldaten weitestgehend erhält. Im Rahmen didaktischer Veranstaltungen zu deskriptiven Methoden eignet der Übungsdatensatz sich daher dazu, panel-spezifische univariate Statistiken (intra- und interindividuelle Korrelationsmuster, Übergangsraten) zu erstellen. Entsprechende Programm-Kommandos moderner Statistikprogramme, wie die STATA xt-Familie, erzeugen hier realistische Ergebnisse.
Im Kontext von multivariaten Analysen ist der Datensatz auf die Ausbildung in (Panel-)Regressionstechniken ausgerichtet. Auch hierbei lassen sich die Eigenschaften von Panel-Daten und die Wirkung verschiedener Analyseverfahren (z.B. Fixed Effects, Random Effects) bei Verwendung entsprechender Programmkommandos realitätsnah abbilden. Trotz der Limitationen der Übungsdaten ermöglichen sie zudem die Illustration von Interaktions- und Mediationstechniken.
Ausführliche Beispielsanalysen zum Datensatz der Jahre 2000-2004 finden sich in dem Lehrbuch 'Regressionsmodelle zur Analyse von Paneldaten' (Marco Giesselmann und Michael Windzio, Springer VS).
Keinesfalls sollte der Datensatz allerdings für reale Analysen verwendet werden, denn aufgrund der Verfremdungsprozedur bildet er die tatsächlichen Zusammenhänge im SOEP nur näherungsweise ab. Auch Techniken der Datenaufbereitung lassen sich, wegen des stark limitierten Ausschnitts aus den Originaldaten, nur sehr begrenzt illustrieren und trainieren. In solchen Fällen ist der Rückgriff auf den SOEP-Lehrdatensatz weiterhin unabdingbar.
Aus datenschutzrechtlichen Gründen ist das Vorliegen eines Datenweitergabevertrages mit dem DIW Berlin Voraussetzung für die Nutzung des Lehrdatensatzes. Die Unterzeichnerin/ der Unterzeichner ist für die strikte Einhaltung des Datenschutzes verantwortlich!
Aus datenschutzrechtlichen Gründen dürfen aus dem Originaldatensatz für die Lehre nur maximal 50 Prozent der Fälle ausgewählt werden. Wir stellen unseren DatennutzerInnen ab Version 35 der SOEP-Core-Daten (Daten der Jahre 1984-2018) eine Lehrversion zur Verfügung, die (bis auf den EU-SILC-Klon) die gleiche Datenstruktur wie die original SOEP-Core-Daten enthält, allerdings eben mit nur der Hälfte der Fälle.Technisch erfolgt diese Auswahl über die Random-Group-Variable, die den Datenbestand in 20 Teilstichproben einteilt. Die Variable RGROUP20, die im File CIRDEF.DAT zu finden ist, hat 20 Ausprägungen. Für die Lehre dürfen Sie nur die Fälle mit der Ausprägung 11 bis 20 benutzen. Studierende dürfen in der Lehre auf keinen Fall Zugriff zu den Daten der Random-Groups 1-10 erhalten. Der Zugriff auf den Original-Datenbestand des SOEP verbietet sich daher von selbst.
Der den Studierenden bereitgestellte „Lehrdatensatz" muss auf einem gesonderten Plattenbereich liegen, dessen Zugang kontrolliert wird. Studierende dürfen selbstverständlich keine Daten mit nach Hause nehmen oder „irgendwo" innerhalb der Universität installieren.
Gern können Sie unsere SOEPtutorials für die Gestaltung Ihrer Lehrveranstaltung nutzen.
Im SOEPcompanion gibt es im Kapitel Working with SOEP Data praktische Einführungen und Übungen mit Stata-Skripten.
Folgende Lehrbücher nutzen den SOEP-Datensatz mehr oder weniger ausführlich als Anschauungsmaterial: