Direkt zum Inhalt

SOEP in der Lehre

Wir sind sehr daran interessiert, dass die SOEP-Daten auch in der Lehre benutzt werden. Dazu bieten wir Ihnen einen sehr vereinfachten Stata-Übungsdatensatz (zum direkten Herunterladen) und die Bestellung des Lehrdatensatzes (teaching version).

Dieser im STATA-Format abgelegte Datensatz basiert auf originalen SOEP-Daten, stellt diese aber stark verfremdet und völlig anonymisiert dar - daher kann der Übungsdatensatz unabhängig von Datenweitergabe-Verträgen und Nutzungsvereinbarungen verwendet werden. Der Übungsdatensatz speist sich aus originalen Variablen, umspannt fünf Zeitpunkte und liegt im „long-format" vor. Der Datensatz wird in deutscher und englischer Sprache zur Verfügung gestellt.

Wir bieten zwei Übungsdatensätze an, die sich in der Variablenanzahl und Zeitspanne unterscheiden. Die aktuellere Version beinhaltet u.a. Einkommensvariablen sowie das do-file, welches zur Erstellung des Datensatzes genutz wurde:

1. Daten der Jahre 2000-2004, 9 Variablen

Datensatz deutsch
Datensatz englisch

2. Daten der Jahre 2015-2019, 15 Variablen, DOI:10.5684/soep.practice.v36

Datensatz deutsch
Datensatz englisch

Bei der Verfremdung der Variablen wurde ein Algorithmus angewendet, der die Längsschnittkonsistenz der Originaldaten weitestgehend erhält. Im Rahmen didaktischer Veranstaltungen zu deskriptiven Methoden eignet der Übungsdatensatz sich daher dazu, panel-spezifische univariate Statistiken (intra- und interindividuelle Korrelationsmuster, Übergangsraten) zu erstellen. Entsprechende Programm-Kommandos moderner Statistikprogramme, wie die STATA xt-Familie, erzeugen hier realistische Ergebnisse.

Im Kontext von multivariaten Analysen ist der Datensatz auf die Ausbildung in (Panel-)Regressionstechniken ausgerichtet. Auch hierbei lassen sich die Eigenschaften von Panel-Daten und die Wirkung verschiedener Analyseverfahren (z.B. Fixed Effects, Random Effects) bei Verwendung entsprechender Programmkommandos realitätsnah abbilden. Trotz der Limitationen der Übungsdaten ermöglichen sie zudem die Illustration von Interaktions- und Mediationstechniken.

Ausführliche Beispielsanalysen zum Datensatz der Jahre 2000-2004 finden sich in dem Lehrbuch 'Regressionsmodelle zur Analyse von Paneldaten' (Marco Giesselmann und Michael Windzio, Springer VS).

Keinesfalls sollte der Datensatz allerdings für reale Analysen verwendet werden, denn aufgrund der Verfremdungsprozedur bildet er die tatsächlichen Zusammenhänge im SOEP nur näherungsweise ab. Auch Techniken der Datenaufbereitung lassen sich, wegen des stark limitierten Ausschnitts aus den Originaldaten, nur sehr begrenzt illustrieren und trainieren. In solchen Fällen ist der Rückgriff auf den SOEP-Lehrdatensatz weiterhin unabdingbar.

Aus datenschutzrechtlichen Gründen ist das Vorliegen eines Datenweitergabevertrages mit dem DIW Berlin Voraussetzung für die Nutzung des Lehrdatensatzes. Die Unterzeichnerin/ der Unterzeichner ist für die strikte Einhaltung des Datenschutzes verantwortlich!

Aus datenschutzrechtlichen Gründen dürfen aus dem Originaldatensatz für die Lehre nur maximal 50 Prozent der Fälle ausgewählt werden. Wir stellen unseren DatennutzerInnen ab Version 35 der SOEP-Core-Daten (Daten der Jahre 1984-2018) eine Lehrversion zur Verfügung, die (bis auf den EU-SILC-Klon) die gleiche Datenstruktur wie die original SOEP-Core-Daten enthält, allerdings eben mit nur der Hälfte der Fälle.infoTechnisch erfolgt diese Auswahl über die Random-Group-Variable, die den Datenbestand in 20 Teilstichproben einteilt. Die Variable RGROUP20, die im File CIRDEF.DAT zu finden ist, hat 20 Ausprägungen. Für die Lehre dürfen Sie nur die Fälle mit der Ausprägung 11 bis 20 benutzen. Studierende dürfen in der Lehre auf keinen Fall Zugriff zu den Daten der Random-Groups 1-10 erhalten. Der Zugriff auf den Original-Datenbestand des SOEP verbietet sich daher von selbst.


Der den Studierenden bereitgestellte „Lehrdatensatz" muss auf einem gesonderten Plattenbereich liegen, dessen Zugang kontrolliert wird. Studierende dürfen selbstverständlich keine Daten mit nach Hause nehmen oder „irgendwo" innerhalb der Universität installieren.

Gern können Sie unsere SOEPtutorials für die Gestaltung Ihrer Lehrveranstaltung nutzen.

Im SOEPcompanion gibt es im Kapitel Working with SOEP Data praktische Einführungen und Übungen mit Stata-Skripten.

Folgende Lehrbücher nutzen den SOEP-Datensatz mehr oder weniger ausführlich als Anschauungsmaterial:

  • Andreß, Hans-Jürgen, Katrin Golsch und Alexander W. Schmidt. 2013. Applied Panel Data Analysis for Economic and Social Surveys. Heidelberg: Springer. (https://doi.org/10.1007/978-3-642-32914-2).
  • Christof Wolf und Henning Best (Hrsg.). 2010. Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesbaden: VS Verlag für Sozialwissenschaften. (https://doi.org/10.1007/978-3-531-92038-2)
  • Giesselmann, Marco, and Michael Windzio. 2012. Regressionsmodelle zur Analyse von Paneldaten (Studienskripten zur Soziologie). Wiesbaden: VS Verlag für Sozialwissenschaften. (https://doi.org/10.1007/978-3-531-18695-5).
  • Hübler, Olaf. 2005. Einführung in die empirische Wirtschaftsforschung - Probleme, Methoden und Anwendungen. München u. Wien: Oldenbourg.
  • Klein, Thomas. 2016. Sozialstrukturanalyse: Eine Einführung. Weinheim, Basel: Beltz Juventa.   
  • Kohler, Ulrich und Frauke Kreuter. 2016. Datenanalyse mit Stata - Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. 5., aktualisierte und überarbeitete Auflage. Berlin: De Gruyter Oldenbourg. (https://doi.org/10.1515/9783110469509).
  • Kohler, Ulrich, and Frauke Kreuter. 2012. Data Analysis Using Stata, Third Edition. Texas: Stata Press.
  • Ludwig-Mayerhofer, Wolfgang, Uta Liebeskind und Ferdinand Geißler. 2014. Statistik: Eine Einführung für Sozialwissenschaftler. Weinheim und Basel: Beltz Juventa.
  • Reinecke, Jost. 2005. Strukturgleichungsmodelle in den Sozialwissenschaften. München und Wien: Oldenbourg.
  • Schwarze, Johannes und Susanne Elsas. 2013. Analyse von Einkommensverteilungen - Ansätze und Empirie. Bamberg: University of Bamberg Press.
  • Winkelmann, Rainer. 2008. Econometric Analysis of Count Data. 5th Edition. Berlin: Springer. (https://doi.org/10.1007/978-3-540-78389-3).

Ansprechpartner

SOEPhotline

Philipp Kaminsky und Antonia Meier
Nutzerberatung und Vertragsangelegenheiten des FDZ SOEP in der Infrastruktureinrichtung Sozio-oekonomisches Panel

keyboard_arrow_up