Abgeschlossenes Projekt
Die Nachnutzung von Forschungsdaten ist ein wichtiger Bestandteil der Forschungspraxis in den Sozial- und Wirtschaftswissenschaften. Um geeignete Daten zu finden, brauchen Forschende gut funktionierende Suchmöglichkeiten. Eine übergreifende inhaltliche Suche nach Forschungsdaten, die nicht auf einzelne Umfragen beschränkt ist, wird jedoch durch eine uneinheitliche oder fehlende semantische Erschließung der Daten erschwert. Da die einzelnen Erhebungsprogramme eine jeweils eigene Terminologie nutzen, um ihre Daten zu beschreiben, und in der Dokumentation oft eine Verbindung zwischen den gemessenen theoretischen Konzepten und den Daten fehlt, ist es für Forschende aufwendig, relevante oder vergleichbare Daten zu identifizieren. Aus Nutzendensicht behindert die Fragmentierung in der Datendokumentation die Datensuche und schränkt deshalb das Forschungspotential existierender Bestände erheblich ein. Die spezifische Herausforderung für eine Verbesserung der Datensuche ist deshalb die konzeptorientierte Erschließung von Forschungsdaten. Weil eine semantische Modellbildung für die inhaltliche Erschließung bislang fehlt, wird eine Technologie für eine einheitliche, semantische Indexierung der Forschungsdaten benötigt. Mit der LORDInfrastruktur soll diese Lücke geschlossen werden.
Die zu entwickelnde Concept Registry sozial- und wirtschaftswissenschaftlicher Konzepte wird, den FAIR Prinzipien entsprechend, der Scientific Community für die Datendokumentation bereitgestellt. Das ‚LORDpilot‘-Projekt prüft die Umsetzbarkeit einer solchen Concept Registry für die Sozial- und Wirtschaftswissenschaften, entwickelt dafür ein grundlegendes Datenmodell sowie eine nutzerfreundliche Eingabemaske. Dafür werden exemplarisch für eine Auswahl sich überschneidender Messinstrumente der zentralen Datenkollektionen der Disziplinen (ALLBUS, SOEP, Nacaps) Konzepte identifiziert, Fragen und Variablen mit den Konzepten verknüpft und Beziehungen über die Konzepte zwischen den Datenkollektionen hergestellt. Die Identifizierung der theoretischen Konzepte erfolgt über eine intellektuelle Analyse und einen Vergleich sowie durch Recherche zu Messinstrumenten und datensatzbezogenen Publikationen. Für die technische Umsetzung werden Standards des Semantic Web eingesetzt. Durch die Verknüpfung der Konzepte mit Deskriptoren aus den SKOS-konformen Thesauri „Thesaurus Sozialwissenschaften“ (TheSoz) und „Standard-Thesaurus Wirtschaft“ (STW) wird die Suche in der Konzept-Datenbank unterstützt und das Konzeptvokabular unmittelbar in die Linked Open Data (LOD)-Cloud eingebunden. Zur Erstellung des Datenmodells wird die Modellierungssprache UML (United Modeling Language) verwendet. Die Verknüpfungen werden in Form von sogenannten RDF-Triples erstellt und verwaltet.
Für weitere Informationen schreiben Sie gerne eine E-Mail an lord@gesis.org.