Spezialfragen | FAQ

Fragen zu Analysen mit dem SOEP


SOEP Quicklinks:  

SOEPinfo

SOEPlit

SOEPnewsletter

SOEPmonitor

SOEPdata Dokumente

SOEPdata FAQ

Sind die von mir gesuchten Variablen im SOEP enthalten?

Mit dem interaktiven Programm SOEPinfo können Sie gezielt nach Themenbereichen und Schlagworten suchen und einen Überblick über alle erhobenen Variablen (inkl. Häufigkeitsauszählungen) und Fragebögen erhalten.

nach oben


Werden zusätzlich tiefer gegliederte Regionaldaten zur Verfügung gestellt?

Ausführliche Informationen dazu unter dem Punkt Regionaldaten.

nach oben


Sind Bundesländer repräsentativ auswertbar?

Ausführliche Informationen dazu unter dem Punkt Regionaldaten.

nach oben


Was sind generierte Variablen und wann greife ich am besten auf sie zurück?

Generierte Variablen dienen ebenso wie Status-Variablen der Vereinfachung der Arbeit mit den SOEP-Daten. Bei ihrer Generierung fließen jeweils spezifische Annahmen ein, die Sie der Dokumentation entnehmen können. Schauen Sie die Dokumentation für die Files $PGEN | PDF, 0.66 MB und $HGEN | PDF, 0.64 MB an (Joachim Frick).

nach oben


Wie kann ich deutsche Variablenlabels in Stata auf Englisch anzeigen lassen?

Um sich in Stata alle deutschen Variablenlabels auf Englisch anzeigen zu lassen nutzen Sie bitte den Befehl: label language EN.

nach oben


Wie kann ich Rentnerinnen und Rentner im Datensatz identifizieren?

Je nach Fragestellung bieten sich hierzu verschiedene Möglichkeiten an:

  • Selbstauskunft der Befragten zum Erwerbsstatus im Vorjahr. Diese Information ist im Kalenderfile $PKAL abgelegt und umfasst die Art des Erwerbsstatus als Rentner/Pensionär [mit Hilfe der Variablen $P1E01 und $P1E02] bzw. den Bezug von Altersrente / Pension im Vorjahr [mit Hilfe der Variablen $P2D01 bis $P2D03]
  • Alter der Befragungsperson (z.B. ableitbar aus der Variablen GEBJAHR in PPFAD)
  • Berücksichtigung des aktuellen Erwerbsstatus (nicht erwerbstätig), ggf. in Kombination mit der Altersangabe. Beachten Sie hierbei bitte, dass Rentner mit Arbeitsvertrag beim zentralen Erwerbsfilter (z.B. UP09) als erwerbstätig gelten
  • Personen, die erst seit kurzem den Status als Rentner / Pensionär innehaben, sind identifizierbar über den Grund für die Beendigung des letzten Beschäftigungsverhältnisses (z.B. Variable UP75, Code 6: "Erreichen der Altersgrenze / Rente / Pension")
  • Darüber hinaus sind natürlich auch Kombinationen dieser genannten Varianten möglich wie z.B. "Alter > 65 Jahre" und gleichzeitig "Bezug einer Altersrente"

nach oben


Kann sich die Stichproben-Zugehörigkeit im Laufe der Zeit verändern? Bleibt eine Befragungsperson der Ausländer-Stichprobe auch dann in diesem Sample, wenn die Staatsbürgerschaft gewechselt wurde?

Die Stichprobenzugehörigkeit (Variablen PSAMPLE in PPFAD bzw. HSAMPLE in HPFAD) verändert sich grundsätzlich nicht. Weder durch den Wechsel der Staatsbürgerschaft noch durch den Umzug in eine andere Sample-Region (von West- nach Ostdeutschland oder umgekehrt). Die Person bleibt trotzdem in der Ausländer-, bzw. West- oder Oststichprobe. Die aktuelle Nationalität (NATION$$) bzw. Regionalzugehörigkeit ($SAMPREG) ist leicht erkennbar.

nach oben


Welche Variable enthält eine korrekte regionale Zuordnung der Befragten ($SAMPREG vs. PSAMPLE bzw. HSAMPLE)?

Mittlerweile sind zahlreiche Befragte von Ost- nach Westdeutschland und - in geringerem Umfang von West- nach Ostdeutschland - umgezogen. Analysen, die auf regionale Bezüge abstellen, werden durch Verwendung der Variablen PSAMPLE, die die Stichprobenzugehörigkeit angibt, zum Teil erheblich verzerrt (PSAMPLE befindet sich in PPFAD: 1 = Subsample A, 2 = Subsample B, 3 = Subsample C, 4= Subsample D (Zuwanderer), 5 = Subsample E (Ergänzungsstichprobe ab 1998), 6 = Subsample F (Innovationsstichprobe ab 2000)).

Eine korrekte regionale Zuordnung der Stichprobenmitglieder wird nur über die zeitabhängigen Variablen $SAMPREG in PPFAD und HPFAD erreicht (1 = Westdeutschland, 2 = Ostdeutschland).

In $SAMPREG wird seit 1990 für jedes Jahr die west- bzw. ostdeutsche Population unabhängig von der Sample-Zugehörigkeit ermittelt. Wir empfehlen, immer diese Variable für regionale Analysen zu verwenden!

Die verlinkte Tabelle | PDF, 5.69 KB , bei der eine Kreuztabellierung von $SAMPREG und PSAMPLE vorgenommen wurde, gibt einen Einblick über das Ausmaß der regionalen Mobilität seit 1990 (Basis: alle Personen mit $NETTO=1 (Personen-Interviews) oder $NETTO=2 (Kinder bis 16 Jahren) in befragten Haushalten).

nach oben


Welche Variable enthält eine korrekte Zuordnung von deutschen und nicht-deutschen Befragten in den einzelnen Stichproben A-F (NATION$$ vs. PSAMPLE)?

Analog zum o.g. Phänomen ($SAMPREG vs.P SAMPLE) wird häufig auch eine Identität des Samples B mit der Population der im SOEP interviewten Gruppe der "Ausländer" unterstellt, während Sample A mit "Deutschen" gleichgesetzt wird. Dies trifft zwar im großen und ganzen zu, ist jedoch nicht exakt und wird im Zeitverlauf immer weniger genau.
Zu Beginn des SOEP im Jahre 1984 war es die Nationalität des Haushaltsvorstands, die eine Zugehörigkeit in die beiden Samples A und B festlegte. Nichtdestotrotz konnten weitere Haushaltsmitglieder mit einer anderen Nationalität als derjenigen des Vorstandes in diesen Haushalten leben. Zudem enthielt auch Sample A AusländerInnen, sofern sie nicht einer der durch Sample B repräsentierten Nationalitäten angehörten. Deutlich verstärkt wird das Auseinanderklaffen von SAMPLE-Zugehörigkeit und (zeitpunktbezogener) Nationalitätsinformation insbesondere durch das Einbürgerungsverhalten von Personen im Sample B.
Während Sample C auch bis zum Jahr 2000 fast ausnahmslos aus Personen mit deutscher Nationalität besteht, enthält Sample D aufgrund des hohen Anteils an Aussiedlern verhältnismäßig viele Deutsche.
In den neueren Samples E und F ist eine ex-ante Zuordnung der entsprechenden Personen zu "Deutschen" oder "Nicht-Deutschen" aufgrund des Stichproben-Ziehungsdesigns schlichtweg nicht möglich.

Die verlinkte Tabelle | PDF, 6.3 KB , bei der eine Kreuztabellierung der recodierten Information von NATION$$ (1=Deutsche, 2=Nicht-Deutsche incl. Item-Non-Response) und PSAMPLE vorgenommen wurde, gibt einen Einblick über die Heterogenität der SOEP-Samples bezüglich der Nationalitäts-Zusammensetzung seit 1984 (Basis: alle Personen mit $NETTO=1 (Personen-Interviews).

nach oben


Umstellung von PAPI auf CAPI

In rund der Hälfte der Fälle in Stichprobe E wird - im Rahmen eines zufälligen Splittings der Stichprobe - seit dem Jahr 2000 die für das SOEP neue Erhebungsmethode CAPI (=Computer Assisted Personal Interview) angewandt. Sie identifizieren diese Interviews in der Variablen $PFORM* in $PBRUTTO bzw. $HFORM* in $HBRUTTO.

Erste erhebungsmethodische Analysen zeigten keine signifikanten Methodeneffekte. D.h., für die inhaltlichen Ergebnisse scheint die Form der Datenerhebung keinerlei eigenständige Einflüsse auszuüben. Weitere Analysen zur Erhebungsmethode durch Nutzer/innen sind natürlich sinnvoll.

Seit dem Jahr 2001 wird diese Erhebungsmethode zunehmend auch in den Alt-Stichproben A bis D sowie F eingesetzt.

nach oben