Fragen und Antworten (FAQ)

Wir möchten den Einstieg in die Arbeit mit unseren Daten so einfach wie möglich gestalten. Da es sich aber wegen der Vielzahl der abgefragten Themen und der Längsschnittstruktur um sehr komplexe Datensätze handelt, versuchen wir auf dieser Seite die wichtigsten Fragen zu beantworten.

Wie komme ich an die Daten?

Nein, denn die Daten unterliegen einer Zweckbindung. Wir haben unseren Befragten zugesichert, dass ihre Antworten ausschließlich für wissenschaftliche Studien genutzt werden dürfen. Das setzen wir um, indem wir uns dies ebenso wie die Einhaltung von Datenschutzmaßnahmen vor Weitergabe der Daten durch einen Vertrag zusichern lassen. Wir schließen diesen Vertrag nur mit Angehörigen einer wissenschaftlich arbeitenden Institution.
Ist der Vertrag erst einmal geschlossen, können alle von uns angebotenen Datensätze bestellt werden.

Die Erhebung und Aufbereitung der Daten werden mit vorwiegend von der öffentlichen Hand finanziert. Deswegen können wir sie ohne Kosten oder Gebühren weitergeben.

Wir hoffen, dass wir alle relevanten Aspekte dazu auf der Seite Datenzugang aufgeschrieben haben.
Wenn noch Fragen offen geblieben sind, haben wir dort auch den Kontakt zu unserer SOEPhotline hinterlegt. Unser Mitarbeiter dort hilft Ihnen gern weiter.

Am Anfang

Über Inhalt und Aufbau von SOEP-Core informiert Sie der SOEPcompanion, hilfreich ist eventuell auch ein Blick in unsere Fragebögen oder paneldata.org.  Im Metadatenportal paneldata.org können Sie gezielt nach Themenbereichen und Schlagworten suchen und einen Überblick über alle erhobenen Variablen (inkl. Häufigkeitsauszählungen) und Fragebögen erhalten. Dies funktioniert auf Quer- und Längsschnittdatenebene.

Aufsätze zu Analysemöglichkeiten haben wir auf dieser Seite zusammengestellt

Auf unserer Seite Getting Started haben wir verschiedene Angebote zusammengestellt. So können Sie schnell und auf einen Blick den für Sie passenden Einstieg auswählen.

Wir geben die SOEP-Daten immer nur als „Gesamtpaket“ weiter: Alle Antworten auf alle Fragen in allen Jahren.
Das wird von uns zwar möglichst nutzerfreundlich aufbereitet, zum Beispiel durch generierte Variablen und Nutzung des long-Formats. Nichts desto trotz ist die Nutzung eines Statistikprogramms (SPSS, Stata, R, SAS usw.) dringend empfohlen und Sie sollten damit umgehen können.

Für unser Hauptprodukt, die SOEP-Core-Daten, können Sie sich über die Struktur dieses „Gesamtpakets“ in unserem SOEPcompanion informieren.

Ja. Unsere Codebücher sind die Fragebögen „mit Verweis auf Variablen“, die wir online zur Verfügung stellen. Sie basieren auf Metadaten und beinhalten den Verweis auf Variablen, Variablenlabel und die Datensätze, in denen sie enthalten sind, sowie die Ausprägungen der Items und Filterführungen im Fragebogen.

Eine ausführliche Erklärung zur Anwendung der Codebücher finden Sie in unserem SOEPcompanion.

Generierte Variablen dienen ebenso wie Status-Variablen der Vereinfachung der Arbeit mit den SOEP-Daten. Wir bieten generierte Datensätze zu bestimmten Themen an (z.B. BIOJOB „Detailed Information on first and last job“) oder bestimmte Befragungsgruppen, wie z.B. BIOPAREN („Biography Information für the Parents of SOEP-Respondents“), an.

Eine Auflistung der Datensätze mit generierten Variablen und jeweils eine kurze Beschreibung finden Sie für SOEP-Core im SOEPcompanion

Bei einer Generierung fließen spezifische Annahmen ein, die Sie der jeweiligen Dokumentation entnehmen können.

Vereinfacht gesagt: Weil wir auch von den Befragten so viel wissen wollen. Gegenwärtig sind allein in den Hauptsamples bis zu 13 Fragebögen im Einsatz. Die Informationen, die wir so ‚einsammeln‘, wollen wir zum einen möglichst unverfälscht weitergeben. Zum anderen bereiten wir sie wir dort, wo es uns sinnvoll erscheint, als generierte Variablen auf (s. Frage oben) und legen sie wieder in eigenen Datensätzen ab. Im SOEPcompanion findet sich eine sehr gute Übersicht der verschiedenen Typen von Datensätzen, welche Informationen sie enthalten und wie damit umzugehen ist.

Sowohl im SOEPcompanion für SOEP-Core als auch im SOEP-IScompanion für das Innovationssample gibt es jeweils ein Kapitel „Survey Design“, in dem wir versuchen diese Fragen ausführlich zu beantworten.

Das kommt darauf an. Wir haben leider nicht die Kapazitäten, alle Informationen zweisprachig zur Verfügung zu stellen. Deswegen sind wir vermehrt dazu übergegangen, viele Informationen nur noch auf englisch bereitzustellen. Generell lässt sich folgendes sagen:

Fragebögen: Sie gibt es für SOEP-Core oft als ‚Feldversion‘. In den entsprechenden Dokumenten sind sowohl die deutsche PAPI-Version des Fragebogens, wie er im Feld genutzt wurde, als auch die englische Übersetzung veröffentlicht. Für SOEP-IS und einige andere Studien gibt es nur die ‚Version mit Variablen‘, jeweils in einer deutschen und einer englischen Version.

Datensatzdokumentationen: Liegen jeweils nur in einer Sprachversion vor. Zum größten Teil ist dies englisch, nur ganz vereinzelt gibt es (alte) Datensatz- oder Spezialdokumentationen, die auf deutsch geschrieben sind.

Methodenberichte: Die vom Umfrageinstitut erstellten Methodenberichte über die Feldarbeit gab es bis einschließlich Erhebungsjahr 2017 (Ausnahme SOEP-IS: Haupfeld engl., Zusatzerhebung deutsch) ausschließlich in deutsch. In den jeweiligen Wave Reports der Jahre 2011-2017 gibt es eine Kurzfassung auf englisch.

Studienbeschreibungen: Gibt es auf unserer Webseite auf deutsch und englisch. Bitte nutzen Sie den Sprachumschalter in der Menüleiste für die jeweils andere Sprache.

Companions: Ausschließlich auf englisch.

Paneldata.org: lediglich die Labels gibt es zweisprachig, alle anderen Informationen sind auf englisch.

Hilfen zum Arbeiten mit den Daten

Unsere Empfehlung ist, für die Arbeit mit den SOEP-Daten einen Arbeitsspeicher von 16GB zu nutzen. Für NutzerInnern mit weniger leistungsstarken Rechnern ist die Nutzung der Daten natürlich ebenfalls möglich, hier sind aber Anpassungen hilfreich.

Sie können sich

[a] mit „describe using pl.dta“ die Variablen anzeigen lassen, ohne dass diese geladen werden und

[b] die Variablen selektiv einlesen: „use pid syear plVARS using pl.dta [if syear>=xxxx]“.

Somit kann auch mit größeren Datensätzen effektiv und mit geringen Leistungsanforderungen an die Hard- bzw. Software gearbeitet werden.

Um sich in Stata alle deutschen Variablenlabels auf Englisch anzeigen zu lassen, nutzen Sie bitte den Befehl: label language EN.

Fragen zu Veröffentlichungen

Ja, sehr gerne.
Die Fragebögen des SOEP werden grundsätzlich unter der Creative Commons Attribution-ShareAlike 4.0 International License (nähere Informationen auf der Seite von creative commons) veröffentlicht.
Unter der Bedingung, dass angemessene Urheber- und Rechteangaben gemacht werden und die genutzen Fragen und Items ebenfalls unter diese CC-Lizenz gestellt werden, können Sie sie (auch in Teilen) nutzen und natürlich auch verändern.

Jede SOEP-Datenweitergabe seit 2007 hat ihren eigenen Digital Object Identifier, die so genannte DOI. Mit dem bei der Datensatzinformation (Edition) genannten Titel des Datensatzes und der DOI können Leserinnen und Leser einer Veröffentlichung den Datensatz identifizieren und bei Bedarf über die DOI nähere Informationen einholen. Bitte geben Sie diese Informationen auch an, wenn Sie nicht alle Jahre des Datensatzes nutzen.

Hier finden Sie alle unsere Editionen

Nein, dies verstößt in den allermeisten Fällen gegen die Datenschutzregelungen, zu denen Sie sich mit dem Datenweitergabevertrag bzw. der Datenschutzerklärung für die SOEP-Daten verpflichtet haben.
Bitte informieren Sie sich auf der Seite unseres Reanalyse-Archivs über die Möglichkeiten, die Ihnen zur Verfügung stehen.

Sehr gerne. Wir sind davon überzeugt, dass eine offen zugängliche Forschung der Wissenschaft insgesamt zugute kommt. Gern stellen wir Ihre Syntax auch auf unserer Webseite zur Verfügung. Nähere Informationen gibt es auf der Seite unseres Reanalyse-Archivs.

Ja, dazu haben Sie sich mit der Unterzeichnung des Datenweitergabevertrages verpflichtet. Darüber hinaus steht uns sogar ein Belegexemplar dieser Veröffentlichung zu. Bitte schicken Sie uns entweder

  • per E-Mail an soeplit@diw.de einen Link zu einer Open-Access-Veröffentlichung oder
  • per E-Mail an soeplit@diw.de ein PDF-Dokument der Veröffentlichung oder
  • per Post ein Belegexemplar an: DIW Berlin, SOEP, 10108 Berlin.

Wir nehmen die Angaben zur Ihrer Veröffentlichung dann in unsere Datenbank SOEPlit auf und stellen sie unter https://www.diw.de/soeplit oder https://paneldata.org/search/publications zur Recherche zur Verfügung.

Nein. Wir haben unsere Discussion Paper-Serie ins Leben gerufen, um auch auf diese Weise die Forschungsergebnisse auf Grundlage der SOEP-Daten gebündelt und zum Teil vor einer Veröffentlichung in einer Fachzeitschrift bzw. zusätzlich als Open Access-Variante zur Verfügung zu stellen.
Wir laden Sie herzlich ein, davon unkompliziert Gebrauch zu machen (nähere Informationen). Wir sind uns aber auch bewusst darüber, dass dies auch einer Veröffentlichung in einem Verlagsprodukt entgegenstehen kann.

keyboard_arrow_up