Direkt zum Inhalt

Verknüpfungsmöglichkeiten

Kurzportrait

Die Studien des SOEP, z.B. SOEP-Core und SOEP-IS, können in unterschiedlicher Weise mit administrativen oder Kontextdaten verknüpft werden. Hier stellen wir die uns bekannten Verknüpfungsmöglichkeiten vor, die beispielsweise raum- oder regionalbezogene Analysen ermöglichen.

microm

Der „Microm-SOEP-Datensatz“ macht eine Verknüpfung der Daten des Sozio-oekonomischen Panels (SOEP) mit kleinräumigen Indikatoren des Mikromarketing-Unternehmens microm möglich. Die Microm-Indikatoren wurden auf der Basis von Häuserblocks dem SOEP zugespielt. Aus datenschutzrechtlichen Gründen erfolgte diese Verknüpfung bei Infratest Sozialforschung, welches die Feldarbeit für das SOEP durchführt und allein die Adresse der Befragten kennt.
Die Anonymität der Befragungshaushalte wird dabei voll gewahrt. Wegen der Kleinräumigkeit der Zusatzinformationen ist jedoch aus Sicherheitsgründen eine Analyse nur auf speziell gesicherten Geräten bei der SOEP-Gruppe im DIW Berlin möglich.

Jan Goebel, C. Katharina Spieß, Nils R. J. Witte, Susanne Gerstenberg
Die Verknüpfung des SOEP mit MICROM-Indikatoren: Der MICROM-SOEP-Datensatz (PDF, 0.75 MB)

Nachbarschaftseffekte

Im Rahmen des Projektes "Nachbarschaftseffekte" sollen bestehende Individualdatensätze mit Nachbarschaftsinformationen, die aus verschiedenen externen Datenquellen gewonnen werden, auf kleinräumiger Ebene angereichert werden. In einem zweiten Schritt soll die Rolle von Nachbarschaftseffekten für verschiedene Ergebnisvariablen im sozialen Kontext empirisch analysiert werden. Denkbar sind hier unter anderem die Untersuchung der Bedeutung von Nachbarschaftseffekten auf den individuellen Arbeitsmarkterfolg oder die individuelle Wahrscheinlichkeit des Bezugs staatlicher Transferleistungen.
Ziel des Projektes ist es einen um regionale Informationen auf kleinräumiger Ebene angereicherten Individualdatensatz zu erstellen, der nach einer Wartezeit der Wissenschaft zur Verfügung gestellt werden soll. Weiterhin soll mit dem erstellten Datensatz die Bedeutung von Nachbarschaftseffekten im sozialen Kontext für Deutschland empirisch analysiert werden.

Kooperationspartner:

FDZ der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung:

Stefan Bender (Projektleiter)
Theresa Scholz (Wiss. Mitarbeiterin)


Rheinisch-Westfälisches Institut für Wirtschaftsforschung e. V.:

Matthias Vorell (Wiss. Mitarbeiter)
Thomas K. Bauer (Wiss. Mitarbeiter)

Die Daten sind unter dem Namen RWI-GEO-LAB zugänglich über das FDZ Ruhr, Metadaten unter DOI 10.7807/DIWIABRWI:V1

SOEP-CMI-ADIAB

Befragungsdaten des SOEP verknüpft mit administrativen Daten des IAB (SOEP-CMI-ADIAB)

Das Record Linkage Datenprodukt SOEP-CMI-ADIAB wird gemeinsam vom Sozio-oekonomischen Panel (SOEP) am Deutschen Institut für Wirtschaftsforschung (DIW Berlin) und dem Institut für Arbeitsmarkt- und Berufsforschung (IAB) angeboten. SOEP-CMI-ADIAB setzt sich zusammen aus in Interviews erhobenen Informationen von Befragten des SOEP und deren Personendaten aus den administrativen Daten des IAB – sofern die Befragten ihre Zustimmung zur Verknüpfung der Daten erteilt haben und in den Daten des IAB identifiziert werden konnten. Die Befragungsdaten in SOEP-CMI-ADIAB umfassen die Daten der SOEP-Core- und IAB-SOEP Migrationsstichprobe, der IAB-BAMF-SOEP Befragung von Geflüchteten sowie das SOEP-Innovationssample.

Mithilfe von SOEP-CMI-ADIAB können also nun Forschungsfragen untersucht werden, für die sowohl die vielseitigen soziodemographischen Informationen des SOEP als auch sehr genaue Einkommensdaten im Lebensverlauf seit 1975 erforderlich sind.

Da der verknüpfte Datensatz schwach anonymisierte Sozialdaten enthält, ist ein Zugang nur direkt im Forschungsdatenzentrum der Bundesagentur für Arbeit im IAB (FDZ IAB) möglich. Forschende erhalten Zugang zu den Daten entweder während eines Gastaufenthaltes an einem der Standorte des FDZ IAB oder über die kontrollierte Datenfernverarbeitung.

 

Für den Datenzugang muss sowohl ein gültiger Datenweitergabevertrag mit dem SOEP als auch ein Datennutzungsvertrag mit dem FDZ des IAB vorliegen. Weitere Informationen zum Datenprodukt und zum Datenzugang finden sich beim FDZ IAB.

DOI: 10.5164/IAB.FDZD.2303.de.v1

Antoni, Manfred; Beckmannshagen, Mattis; Grabka, Markus M.; Keita, Sekou; Trübswetter, Parvati (2023): Befragungsdaten der SOEP-Core-, IAB-SOEP Migrationsstichprobe, IAB-BAMF-SOEP Befragung von Geflüchteten und SOEP-Innovationssample verknüpft mit administrativen Daten des IAB (SOEP-CMI-ADIAB) 1975-2020. FDZ-Datenreport, 03/2023 (de), Nürnberg.

Ansprechpartner

Mattis Beckmannshagen
Mattis Beckmannshagen

Wissenschaftlicher Mitarbeiter in der Infrastruktureinrichtung Sozio-oekonomisches Panel

Markus M. Grabka
Markus M. Grabka

Senior Researcher in der Infrastruktureinrichtung Sozio-oekonomisches Panel

SOEP-RV

Befragungsdaten des SOEP verknüpft mit individuellen Administrativdaten der Deutschen Rentenversicherung (SOEP-RV)

SOEP-RV ist ein gemeinsames Projekt des Forschungsdatenzentrums der Rentenversicherung (FDZ-RV) mit dem Deutschen Institut für Wirtschaftsforschung (DIW). Es wurde initiativ vom Forschungsnetzwerk Alterssicherung (FNA) gefördert. Im Projekt werden Daten des Sozio-oekonomischen Panels (SOEP) mit anonymisierten FDZ-RV-Daten verknüpft. Da die Sozialversicherungsdaten eine lange Lebensspanne umfassen, entstehen für Forschende einzigartige Möglichkeiten, Fragen nach langfristiger sozialer Ungleichheit oder nach Effekten von politischen Reformen nachzugehen. Insbesondere im Bereich der Renten und Alter(n)sforschung bietet SOEP-RV großes Potenzial ebenso wie für methodische Fragen, beispielsweise nach der Zuverlässigkeit von Selbstauskünften in Umfragedaten im Vergleich zu Prozessdaten. Das Projekt wurde mittlerweile verstetigt, sodass es zum einen jährliche (RTBN) bzw. zwei-jährliche (VSKT) Updates der SOEP-RV-Daten geben wird und zum anderen daran gearbeitet wird, die Stichprobe mit jeder SOEP-Befragung zu erweitern.

Die notwendige Voraussetzung für die Aufnahme von Befragten des SOEP in die SOEP-RV-Stichprobe ist das schriftliche Einverständnis der Befragten zur Verlinkung ihrer Befragungsdaten mit ihrem Rentenversicherungskonto. Damit erlauben sie der Deutschen Rentenversicherung, ihre Daten aus dem Versichertenkonto für SOEP-RV bereitzustellen. Bisher haben rund 14.500 SOEP-Core und SOEP-IS Befragte dem sogenannten "record linkage" zugestimmt.

Von Seiten des Forschungsdatenzentrums der Deutschen Rentenversicherung werden Längsschnittdaten im Format der Versicherungskontenstichprobe (VSKT) sowie der Versichertenrentenbestand (RTBN) als Querschnittsdaten zur Verfügung gestellt:

  • Die Daten im Format der Versicherungskontenstichprobe (VSKT) bestehen aus einem fixen Teil, welcher demografische Merkmale und einige rentenbezogene Variablen enthält, und einem Längsschnittmodul zu den Zeiten der Versicherung in der gesetzlichen Rentenversicherung. Die VSKT bietet monatliche Informationen über alle sozialversicherungspflichtigen Tätigkeiten sowie daraus resultierende Entgeltpunkte. Nicht erfasst werden allerdings Beschäftigungen als Beamte und berufliche Tätigkeiten ohne Versicherungspflicht von Selbstständigen.
  • Der Versichertenrentenbestand (RTBN) bietet Informationen über Renten. Darin enthalten sind beispielsweise die Merkmale „Rentenbeginn“, „Eckwerte der Rentenberechnung“ sowie „erworbene Entgeltpunkte“.

Die Daten dürfen ausschließlich zu wissenschaftlichen Forschungszwecken verwendet werden. Hierfür werden sie in Form von Scientific-Use-Files sowohl in deutscher als auch in englischer Sprache für die Auswertungsprogramme Stata und SPSS angeboten. Bitte beachten Sie, dass die SOEP-Daten und die administrativen Daten der Rentenversicherung separat bestellt werden müssen. Die Daten können dann leicht von den Nutzer*innen selbst verknüpft werden. Für beide Datensätze muss auf der Webseite des jeweiligen Forschungsdatenzentrums ein Antrag gestellt und ein Nutzungsvertrag geschlossen werden. Im Anschluss werden die Daten zum Download bereitgestellt.

Einen Nutzungsantrag für die administrativen Daten der Rentenversicherung können Sie beim FDZ-RV stellen.

DOI: 10.1515/jbnst-2021-0020

Lüthen, Holger; Schröder, Carsten; Grabka, Markus M.; Goebel, Jan; Mika, Tatjana; Brüggmann, Daniel; Ellert, Sebastian; Penz, Hannah (2022): SOEP-RV: Linking German Socio-Economic Panel Data to Pension Records. Jahrbücher für Nationalökonomie und Statistik 242 (2022), 2, S. 291-307.

Codebooks zu den Datensätzen von SOEP-RV finden sich beim FDZ-RV.

SOEP-LEE und SOEP-LEE2

Die Projekte SOEP-LEE und SOEP-LEE2 umfassen mehrere Erhebungen von Betriebsdaten, die mit den Individualdaten des SOEP-Core verknüpfbar sind. Bei beiden Projekten stehen insbesondere Befragungen von jenen Betrieben im Vordergrund, die SOEP-Core-Befragte beschäftigen. Die erste SOEP-LEE-Studie erhob eine Welle derartiger Daten im Jahr 2012, während SOEP-LEE2 zwei weitere Wellen in den Jahren 2022 und 2024 (geplant) hinzufügte. Darüber hinaus umfasst SOEP-LEE2 eine Befragung der selbstständigen SOEP-Core-Teilnehmenden zu ihrer unternehmerischen Tätigkeit. Diese Selbstständigenbefragung wurde im Jahr 2022 und 2024 (geplant) durchgeführt und ergänzt damit eine frühere Erhebung aus dem Jahr 2020, die für die INNOMSME-Studie realisiert wurde. Außerdem wurden für SOEP-LEE2 Betriebe befragt, die nicht mit dem SOEP-Core verknüpfbar sind. Diese Betriebe haben den gleichen Fragebogen erhalten wie die Betriebsstätten der SOEP-Core-Befragten, sodass es möglich ist, beide Befragungen zu vergleichen.

Die beiden SOEP-LEE-Studien haben Daten zu unterschiedlichen Themen erfasst. Die erste SOEP-LEE-Studie konzentrierte sich auf die Organisation und das Management, die Personalpolitik, Löhne und Ungleichheit sowie die finanzielle Situation der Betriebe. SOEP-LEE2 hielt an einigen dieser Themen fest, fokussierte sich jedoch thematisch auf die Digitalisierung der Arbeitswelt, die Organisation der Arbeit, Personalmanagement und -entwicklung sowie in seiner 2022er-Welle auf die COVID-19-Pandemie. Mit der 2024er-Welle wurde zusätzlich ein stärkerer Fokus auf den Arbeitskräftemangel und Fragen zur Cybersicherheit gelegt. Die Selbstständigenbefragung befasste sich in der 2020er-Welle mit den Themen Innovation und Produktivität, Forschung und Entwicklung, (immaterielles) Betriebskapital sowie die subjektive Wahrnehmung der eigenen unternehmerischen Tätigkeit. Die Welle von 2022 setzte diese Themen fort, übernahm jedoch einige Fragen aus der SOEP-LEE2-Betriebsstättenbefragung, um eine größere Vergleichbarkeit zu erreichen.

Datenzugang

Forschende, die mit den Daten arbeiten möchten, können diese entweder als Teil der SOEP-Core EU-Edition bestellen (siehe SOEP-Datenzugang) oder vor Ort im Forschungsdatenzentrum SOEP darauf zugreifen (siehe SOEP-in-Residence). Im FDZ SOEP kann die Onsite-Edition genutzt werden, die einige Variablen der SOEP-LEE2-Daten mit detaillierteren Ausprägungen und Kategorien enthält. Die Daten des ersten SOEP-LEE-Projekts sind alleinig im FDZ SOEP verfügbar.

Datenstruktur und Verknüpfung mit SOEP-Core

Die Daten der ersten SOEP-LEE-Studie sind in den Datensätzen slee_estab und slee_sample enthalten. slee_estab beinhaltet die Erhebungsdaten der Betriebsbefragung, während slee_sample die Verknüpfungsdatei ist, mit der die Betriebsdaten und die Individualdaten des SOEP-Core zusammengeführt werden können.

Die Daten der SOEP-LEE2-Betriebsstättenbefragung sind in den Datensätzen lee2estab, lee2brutto und lee2person abgelegt. lee2estab enthält die Umfragedaten selbst, während lee2brutto zusätzliche Informationen zur Feldarbeit beinhaltet. lee2person ist die Verknüpfungsdatei, mit der die Betriebsdaten und die Individualdaten des SOEP-Core zusammengeführt werden können. Leider ist es nicht möglich, die Betriebsbefragung des ersten SOEP-LEE-Projekts mit den darauf folgenden Befragungen von SOEP-LEE2 zu einem einzigen Paneldatensatz zu kombinieren. In den beiden Projekten wurde aus datenschutzrechtlichen Gründen den Betrieben unterschiedliche Betriebsidentifikatoren (eid) zugeordnet, auch dann, wenn dieselben Betriebe befragt wurden.

Die Erhebungsdaten der Selbstständigenbefragung sind im selfempl-Datensatz gespeichert. Der Datensatz enthält den SOEP-Core-Personenidentifikator (pid), sodass für die Verknüpfung mit dem SOEP-Core keine Verknüpfungsdatei erforderlich ist.


Zitierung

Wenn Sie die Daten der ersten SOEP-LEE-Studie verwenden, zitieren Sie bitte: Weinhardt, M.; Meyermann, A.; Liebig, S.; Schupp, J. (2017). The Linked Employer-Employee Study of the Socio-Economic Panel (SOEP-LEE): Content, Design and Research Potential. Jahrbücher für Nationalökonomie und Statistik 237(5), 457–467. https://doi.org/10.1515/jbnst-2015-1044.

Wenn Sie die Daten von SOEP-LEE2 verwenden, zitieren Sie bitte: Matiaske, W., Schmidt, T. D., Halbmeier, C., Maas, M., Holtmann, D., Schröder, C., Böhm, T., Liebig, S., and Kritikos, A. S. (2023). SOEP-LEE2 : Linking Surveys on Employees to Employers in Germany. Jahrbücher Für Nationalökonomie Und Statistik Data Observer, 1–14. https://doi.org/10.1515/jbnst-2023-0031

Alle Survey-Fragen und Variablen sind als Teil von SOEP-Core auf paneldata.org dokumentiert. Darüber hinaus steht derzeit für die Datensätze folgende Dokumentation zur Verfügung:

slee_estab, 2012:

  • Fragebogen, PAPI, PDF (de (PDF, 2.76 MB))
  • Codebook (de (PDF, 335.4 KB))
  • Methodenbericht (de (PDF, 3.1 MB))
  • Projektbericht (en (PDF, 1.45 MB))

lee2estab, 2022

  • Fragebogen, PAPI, PDF (de (PDF, 459.86 KB))
  • Fragebogen, technisch mit Variablennamen, PDF (de (PDF, 212.49 KB))

selfempl 2020
Fragebogen, technisch mit Variablennamen, PDF (de)

K2ID-SOEP

Titel: K²ID-SOEP extension study

DOI: 10.5684/k2id-soep-2013-15/v1
Erhebungszeitraum: 2013-2015
Publikationsdatum:2017-09-08
Primärforscher: Pia S. Schober, C. Katharina Spieß
Sekundärforscher: Juliane F. Stahl, Georg F. Camehl

Unter dem Titel "Kinder und Kitas in Deutschland" (kurz: K2ID) wurden 2013-2015 bei ausgewählten Befragungshaushalten des Sozio-oekonomischen Panels (SOEP), in denen Kinder in Kindertageseinrichtungen betreut wurden, neue Daten erhoben.

In einem ersten Schritt wurden die Eltern zur Wahl der Betreuungseinrichtung ihrer Kinder und der Einschätzung der Betreuungsqualität befragt. Im zweiten Schritt fand eine schriftliche Befragung der LeiterInnen und GruppenleiterInnen der entsprechenden Betreuungseinrichtungen zu Indikatoren der Struktur- und Prozessqualität der Betreuungseinrichtungen sowie ihrer persönlichen pädagogischen Orientierung statt.

Die Datenerhebung fand im Rahmen des DIW-Forschungsprojektes „Qualität frühkindlicher Bildung und Betreuung im Sozio-oekonomischen Panel“ statt und wurde 2013-2016 von der Jacobs Foundation gefördert.

Seit Oktober 2017 werden die Daten der K2ID-SOEP-Befragung im Rahmen des FDZ SOEP weitergegeben.

Dokumentation und Fragebögen

Fragebögen für Eltern:

Fragebögen für ErzieherInnen:

Fragebögen für Kita-LeiterInnen:

Ansprechpartner

SOEP Community Management

Philipp Kaminsky und Antonia Meier
Nutzerberatung und Vertragsangelegenheiten des FDZ SOEP in der Infrastruktureinrichtung Sozio-oekonomisches Panel

keyboard_arrow_up