SOEP Daten

Möglichkeiten der Verknüpfung mit anderen Datensätzen


Regionaldaten

Das SOEP bietet vielfältige Möglichkeiten raum- und regionalbezogener Analysen. Über die anonymisierte regionale Zuordnung des Wohnortes der SOEP-Haushalte bzw. der Personen in diesen Haushalten ist es möglich, eine Vielzahl von regionalen Indikatoren auf der Ebene der Bundesländer, der Raumordnungsregionen, der Kreise und der Postleitzahlen dem SOEP zuzuspielen, wobei wegen der datenschutzrechtlichen Sensibilität dieser Regionalinformationen bestimmte Sicherheitsvorkehrungen einzuhalten sind (siehe Übersicht). Sie können auf diese Weise keine Aussagen zu spezifischen Wohnorten oder Landkreisen machen, jedoch wertvolle Hintergrundinformationen in Ihre Mikroanalysen einfügen.


Werden zusätzlich tiefer gegliederte Daten zur Verfügung gestellt?

Regionalbezogene Analysen mit dem SOEP im Überblick

Im Standarddatensatz ist die Variable $BULA (= Bundesland) enthalten. Sollten Sie tiefer gegliederte Regionalinformationen für Ihre Forschungsarbeit benötigen, beispielsweise Gemeindegrößenklassen, benötigen Sie einen erweiterten Datenweitergabevertrag, dessen Hauptbestandteil ein von Ihnen zu erstellendes Datenschutzkonzept ist.

Für die Nutzung der Raumordnungsregionen (Geocodes) ist neben einem erweiterten Datenweitergabevertrag auch ein erweitertes Datenschutzkonzept erforderlich. Erst nach Vertragsabschluss können Sie diese Daten erhalten.

Im Rahmen von Forschungsaufenthalten am DIW Berlin oder über den Fernrechenzugang mit Hilfe von SOEPremote besteht die Möglichkeit für Analysen auf der Ebene der – datenschutzrechtlich besonders sensitiven – kleinräumigen Kreiskennziffern (KKZ).

Voraussetzung für die Nutzung von SOEPremote ist wiederum der Abschluss eines erweiterten Datenweitergabevertrages und ein Antrag für SOEPremote | PDF, 69.54 KB als Addendum des Vertrages. Nach der Freischaltung können Sie über den so genannten "remote access" ihre Auswertungssyntax (derzeit nur im STATA Format) per E-Mail an unseren Rechner übersenden. Dieser arbeitet den Auftrag - nach Prüfung auf Datenschutzerfordernisse - automatisch ab und übersendet Ihnen wieder per E-Mail die Ergebnisse in einer Protokoll-Datei (log-File).

Mit den Gemeindekennziffern und auf Postleitzahlebene kann - um Missbrauch zu vermeiden - ausschließlich am DIW Berlin gearbeitet werden.


Sind Bundesländer repräsentativ auswertbar?

Die bevölkerungsstarken Bundesländer, beispielsweise Baden-Württemberg, Bayern und Nordrhein-Westfalen, sind aufgrund ihrer Stichprobengröße sinnvoll auswertbar. Prinzipiell besteht die Gefahr, dass bei tiefer gegliederten Strukturanalysen die bundesländerspezifischen Fallzahlen einzelner Zellen für statistisch signifikante Aussagen zu klein werden. Auswertbar sind die Daten jedoch für "Pools" einzelner kleiner Bundesländer (z. B. Ländertypen).


Datenschutzkonzept

Im Datenschutzkonzept für die Nutzung der Gemeindegrößenklassen sollten folgende Punkte berücksichtigt werden:

  • Wer wird mit den Daten arbeiten? (Zugriffskontrolle)
  • Verfahren zum regelmäßigen Wechsel von Passwörtern (Zugangskontrolle)
  • Beschreibung des Ortes/Rechnertyps, auf dem die Daten gespeichert werden sollen (Zutrittskontrolle)
  • Prozedur zur Verhinderung der Nutzung der Daten auf anderen Rechnern (auch nicht auf dem heimischen PC) (Zugangskontrolle)


Dieses Konzept muss zudem von der/dem Datenschutzbeauftragten Ihrer Einrichtung unterzeichnet sein.

Für die Nutzung der Raumordnungsregionen (Geocodes) sind darüber hinaus noch folgende Punkte zu berücksichtigen:

  • Einzelplatzrechner (nicht vernetzt)
  • Mindestens zweifacher Zugriffsschutz für Dateien
  • Berechtigte(r) muss erkennen können, ob Zugriffe durch Dritte stattgefunden haben bzw. versucht wurden (Protokollierung)
  • Prozedur zur Verhinderung der Nutzung der Daten auf anderen Rechnern (auch nicht auf dem heimischen PC)
  • Beschränkung des Zugangs zu zentralen DV-Einrichtungen
  • Regelmäßige Kontrollen durch die/den Datenschutzbeauftragte(n)


Dieses Datenschutzkonzept muss von der/dem Datenschutzbeauftragten Ihrer Einrichtung unterzeichnet sein. Ein Beispiel für solch ein Datenschutzkonzept, das natürlich noch an Ihre Einrichtung angepasst werden muss, finden Sie hier | PDF, 69.69 KB .

Sie können uns gerne Ihren Entwurf für das Datenschutzkonzept vorab per schicken.

Dokumentation

Einen guten Überblick über die Möglichkeiten regionalbezogener Analysen mit dem Sozio-oekonomischen Panel (SOEP) bieten die folgenden, z.T.  in der Publikationsreihe Data Documentation des DIW Berlin erschienenen Papers:


Gundi Knies und C. Katharina Spieß:
Regional Data in the German Socio-Economic Panel Study (SOEP) | PDF, 1.66 MB

Jan Goebel, C. Katharina Spieß, Nils R. J. Witte und Susanne Gerstenberg:
Die Verknüpfung des SOEP mit MICROM-Indikatoren: Der MICROM-SOEP Datensatz | PDF, 0.75 MB

Peter Hintze, Tobia Lakes:
Data Documentation 46: Geographically Referenced Data in Social Science: A Service Paper for SOEP Data Users | PDF, 3.56 MB

C. Katharina Spieß:
Das Sozio-oekonomische Panel (SOEP) und die Möglichkeiten regionalbezogener Analysen | PDF, 2.22 MB

Jan Goebel:
Kurzinformationen zum SOEP-Geocode | PDF, 454.45 KB

Jan Goebel, Bernd Pauer:
Datenschutzkonzept zur Nutzung von SOEPgeo im Forschungsdatenzentrum SOEP am DIW Berlin

Jan Goebel:
Job submission instructions for the SOEPremote System at DIW Berlin

Merkblätter zu den Raum- und Regionaldaten, die Richtlinien zum Datenschutz sowie Anträge für SOEPremote finden Sie bei den Formularen

Ansprechpartner: Dr. Jan Goebel

Tel.: +49 30 89789‑377

Fax: +49 30 89789‑109

SOEP-LEE

In den Wirtschafts- und Sozialwissenschaften setzt sich zunehmend die Erkenntnis durch, dass die Ebene der Organisation in der eine Person arbeitet, von wesentlicher Bedeutung für die Erklärung von individuellem Lebenserfolg ist. Dies gilt unter anderem für die ökonomische und soziologische Arbeitsmarktforschung, die Netzwerk- und Sozialkapitalforschung, die Gesundheitsforschung, die Forschung zu Bildungs- und Kompetenzerwerbsprozessen, zur Lohnbildung, zum Work-Life-Interface und für die Ungleichheitsforschung insgesamt. Daher richtet sich das Interesse vermehrt auf sogenannte „Linked-Employer-Employee“ (LEE) Datensätze, bei denen Individualdaten von Beschäftigten mit Informationen über ihre Betriebe verknüpft werden.

Die im Rahmen des Projekts SOEP-LEE erhobenen Betriebsdaten werden die Informationen zum Arbeitskontext und zu den Arbeitsbedingungen der Befragten des  Sozio-oekonomischen Panels (SOEP) entscheidend erweitern. In der Umsetzung des Projekts wurden sämtliche abhängig Erwerbstätigen der SOEP-Stichproben nach den Kontaktdaten der lokalen Betriebseinheit gefragt, in der sie im Jahr 2011 tätig waren. Diese Betriebskontaktdaten stellen die Grundlage für eine gesondert durchgeführte, standardisierte Betriebsbefragung dar. Die darin erhobenen Betriebsinformationen können anschließend mit den Individual- und Haushaltsdaten des SOEP verknüpft werden. Dieses neue Angebot eines verknüpften Personen-Betriebsdatensatz eröffnet neue Potentiale für eine Vielzahl von Sekundäranalysen mit innovativen Fragestellungen in den Sozial- und Wirtschaftswissenschaften. Eine weitere Besonderheit liegt in der Messung und Analyse der Datenqualität der Betriebsbefragung durch die Erfassung von Meta- und Paradaten im Verlauf der Datenerhebung. Damit leistet dieses Projekt auch einen Beitrag zur Fortentwicklung der Surveymethodologie im Bereich der Organisationsstudien.

Der thematische Fokus der Betriebsbefragung besteht in einer ungleichheitstheoretischen Perspektive. Die zentrale Frage lautet, wie über die Ebene des Betriebs Ungleichheiten in Bezug auf zentrale Ressourcen und Lebenschancen generiert werden. Als zentrale Dimensionen der Ungleichheit gelten dabei Einkommen, Bildung und Verwirklichungschancen im Sinne von Auf- und Abstiegsmöglichkeiten, Wiedereinstieg in den Beruf und Vereinbarkeit von Beruf und Familie. Wir gehen dabei davon aus, dass sich für unterschiedliche Beschäftigtengruppen in Betrieben jeweils auch unterschiedliche Restriktionen und Opportunitäten ergeben, d.h. Angebote zu Weiterbildungsmöglichkeiten oder zur Vereinbarkeit von Beruf und Familie für unterschiedliche Beschäftigtengruppen jeweils unterschiedlich ausfallen. Des Weiteren ist analysierbar, welche Folgen sich aus unterschiedlichen Heterogenitätsbedingungen in Betrieben (z.B. Beschäftigungsformen im Sinne von Befristung, Einsatz von Leiharbeit und ähnlichen „atypischen“ Beschäftigungsformen, Geschlechterzusammensetzung der Belegschaft, Altersstruktur, Ausbildungsstruktur) für die Generierung von Ungleichheiten ergeben.

Eine ausführliche Darstellung des Projekts finden Sie hier.

Dokumentation

Fragebogen:

Fragebogen "Arbeitgeber in Deutschland" | PDF, 0.63 MB

Publikationen:

Michael Weinhardt, Alexia Meyermann, Stefan Liebig, Jürgen Schupp
The Linked Employer-Employee Study of the Socio-Economic Panel (SOEP-LEE): Project Report

Sebastian Bechmann, Kerstin Sleik
Methodenbericht der Betriebsbefragung des Sozio-oekonomischen Panels

Michael Weinhardt
Datenhandbuch der Betriebsbefragung des Sozio-oekonomischen Panels

TNS Infratest Sozialforschung, Michael Weinhardt
Erhebungsinstrumente und Datenkodierung der Betriebsbefragung des Sozio-oekonomischen Panels

Alexia Meyermann, Jennifer Elsner, Jürgen Schupp, Stefan Liebig
Pilotstudie einer surveybasierten Verknüpfung von Personen- und Betriebsdaten: Durchführung sowie Generierung einer Betriebsstudie als nachgelagerte Organisationserhebung zur SOEP-Innovationsstichprobe 2007 | PDF, 0.72 MB

Ansprechpartner: Prof. Dr. Jürgen Schupp

Phone: +49 30 89789-238

Fax: +49 30 89789-9238

K2ID-SOEP

Titel: K²ID-SOEP extension study

DOI: 10.5684/k2id-soep-2013-15/v1
Erhebungszeitraum: 2013-2015
Publikationsdatum:2017-09-08
PrimärforscherInnen: Pia S. Schober, C. Katharina Spieß
SekundärforscherInnen: Juliane F. Stahl, Georg F. Camehl

Unter dem Titel "Kinder und Kitas in Deutschland" (kurz: K2ID) wurden 2013-2015 bei ausgewählten Befragungshaushalten des Sozio-oekonomischen Panels (SOEP), in denen Kinder in Kindertageseinrichtungen betreut wurden, neue Daten erhoben.

In einem ersten Schritt wurden die Eltern zur Wahl der Betreuungseinrichtung ihrer Kinder und der Einschätzung der Betreuungsqualität befragt. Im zweiten Schritt fand eine schriftliche Befragung der LeiterInnen und GruppenleiterInnen der entsprechenden Betreuungseinrichtungen zu Indikatoren der Struktur- und Prozessqualität der Betreuungseinrichtungen sowie ihrer persönlichen pädagogischen Orientierung statt.

Die Datenerhebung fand im Rahmen des DIW-Forschungsprojektes „Qualität frühkindlicher Bildung und Betreuung im Sozio-oekonomischen Panel“ statt und wurde 2013-2016 von der Jacobs Foundation gefördert.

Einen Überblick über die Studie und weitere erhobene Daten bietet die Projekthomepage k2id.de (in englisch).

Seit Oktober 2017 werden die Daten der K2ID-SOEP-Befragung im Rahmen des FDZ SOEP weitergegben.

Dokumentation und Fragebögen

Questionnaires are only available in German by now, English versions will follow.

Fragebogen für Eltern:

Fragebogen für ErzieherInnen:

Fragebogen für Kita-LeiterInnen:

SOEP-Record-Linkage

Die Befragung von Zuwanderern der Sozialversicherungsstatistik im Längsschnitt

Im Bereich zweier Zukunftsthemen der Migrations- und Integrationsfor­schung besteht derzeit ein Defizit an belastbaren empirischen Daten: Zur Integration von a) in Deutschland geborenen Nachkommen von Migran­tInnen und b) Zugewanderten aus den seit 2004 neu beigetretenen EU-Staaten. In Kooperation mit dem Institut für Arbeitsmarkt- und Berufsforschung wurden zwei Stichproben von MigrantInnen in Deutschland auf Basis administrativer Daten der Bun­desagentur für Arbeit gezogen und im Rahmen des SOEP als längsschnittliche Haushaltsbefragung weitergeführt.

Es ist für die beiden Migrationsstichproben möglich, die Daten der SOEP-Erhebung mit administrativen Arbeitsmarkt- und Einkommensdaten zu verknüpfen, falls für die jeweiligen Befragten eine explizite Zustimmung zur Registerverknüpfung vorliegt. Weil aber diese verknüpften Datensätze Sozialdaten enthalten und nur schwach anonymisiert sind, ist ein Zugang nur direkt im Forschungsdatenzentrum der Bundesanstalt für Arbeit im IAB (FDZ IAB) möglich. Forscherinnen und Forscher erhalten Zugriff auf die FDZ IAB-Daten entweder während eines Gastaufenthaltes am IAB oder über einen kontrollierten Fernrechenzugang, der ebenfalls vom IAB eingerichtet wird. Anfragen für den Datenzugang müssen direkt an das FDZ IAB gestellt werden, zumal auch ein Datennutzungsvertrag mit dem IAB erforderlich ist (weitere Informationen).

Dokumentation:

Philipp Simon Eisnecker, Klaudia Erhardt, Martin Kroh, Parvati Trübswetter
The Request for Record Linkage in the IAB-SOEP Migration Sample | PDF, 433.04 KB

Philipp Eisnecker, Martin Kroh
The Informed Consent to Record Linkage in Panel Studies: Optimal Starting Wave, Consent Refusals, and Subsequent Panel Attrition

Nähere Informationen zu den erhältlichen Daten

microm

Der „Microm-SOEP-Datensatz“ macht eine Verknüpfung der Daten des Sozio-oekonomischen Panels (SOEP) mit kleinräumigen Indikatoren des Mikromarketing-Unternehmens microm möglich. Die Microm-Indikatoren wurden auf der Basis von Häuserblocks dem SOEP zugespielt. Aus datenschutzrechtlichen Gründen erfolgte diese Verknüpfung bei Infratest Sozialforschung, welches die Feldarbeit für das SOEP durchführt und allein die Adresse der Befragten kennt.
Die Anonymität der Befragungshaushalte wird dabei voll gewahrt. Wegen der Kleinräumigkeit der Zusatzinformationen ist jedoch aus Sicherheitsgründen eine Analyse nur auf speziell gesicherten Geräten bei der SOEP-Gruppe im DIW Berlin möglich.

Jan Goebel, C. Katharina Spieß, Nils R. J. Witte, Susanne Gerstenberg
Die Verknüpfung des SOEP mit MICROM-Indikatoren: Der MICROM-SOEP-Datensatz | PDF, 0.75 MB

Ansprechpartner: Dr. Jan Goebel

Tel.: +49 30 89789‑377

Fax: +49 30 89789‑109

SOEP-RV

Dieses Projekt ist ein Kooperationsprojekt mit dem Forschungsdatenzentrum der deutschen  Rentenversicherung (FDZ-RV). Das Projekt zielt auf ein record linkage der Befragungsdaten des Sozio-oekonomischen Panels (SOEP) mit individuellen Administrativdaten der Deutschen Rentenversicherung, welche Erwerbs- bzw. Rentenbiografien auf monatlicher Basis für abhängig Beschäftigte ab Alter 14 enthalten.

Durch die Verknüpfung beider Datenquellen können wir einerseits die Biografiedaten des SOEP vervollständigen und andererseits die individuellen Versicherungsbiografien mit zahlreichen sozioökonomischen Variablen auf Haushalts- und Personenebene anreichern. Der verknüpfte Datensatz (SOEP-RV) wird Forschenden zur lokalen Nutzung auf ihren Computern zur Verfügung gestellt. Wir erwarten, dass dieser Datensatz ein hervorragendes Instrument für die empirische Forschung darstellt - insbesondere für Fragestellungen zum Lebenszyklus privater Haushalte, zu Entscheidungen im  Arbeits- und Rentenkontext oder zur Verteilung von Einkommen und Renten.

Für mehr Informationen klicken Sie hier

Ansprechpartner: Holger Lüthen

Tel.: +49 30 89789‑431

Nachbarschaftspanel

Im Rahmen des Projektes "Nachbarschaftseffekte" wurden bestehende Individualdatensätze mit Nachbarschaftsinformationen, die aus verschiedenen externen Datenquellen gewonnen werden, auf kleinräumiger Ebene angereichert.

Kooperationspartner:

FDZ der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung
Rheinisch-Westfälisches Institut für Wirtschaftsforschung e. V.

Dokumentation

Elisabeth Bügelmayer, Sandra Schaffner, Norbert Schanne, Theresa Scholz
Das DIW-IAB-RWI-Nachbarschaftspanel: ein Scientific-Use-File mit lokalen Aggregatdaten und dessen Verknüpfung mit dem deutschen Sozio-oekonomischem Panel

Weitere Informationen zum Projekt

Ansprechpartner: Dr. Jan Goebel

Tel.: +49 30 89789‑377

Fax: +49 30 89789‑109