Forschen mit archivierten Datensätzen: Wie ein Datenarchiv die Bildungsforschung vorantreibt

Von Mario Eich, Fitore Morina und Christian Fischer

Das Forschungsdatenzentrum (FDZ) am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) archiviert die Datensätze von großen nationalen und internationalen Schulleistungsstudien sowie kleinerer lokaler Studien und stellt sie der Wissenschaft zur Verfügung. Für die Bildungsforschung liefert die Datenbank damit wahre Datens(ch)ätze, um neue Erkenntnisse zu generieren. Auch für Studierende und Promovierende werden so ambitionierte Forschungsprojekte greifbar.

Sollte es eine Liste aller Forschungsprojekte geben, die eigentlich undenkbar sind, würden die folgenden Studien auf jeden Fall dazu gehören: Eine Bachelorarbeit, in der Daten von über 900 Schülerinnen und Schülern analysiert wurden, eine Masterarbeit, die eine Längsschnittstudie mit drei Messzeitpunkten und 4.000 Schülerinnen und Schüler unter die Lupe nimmt und die Untersuchung der Lernausgangslage von über 4.000 Schülerinnen und Schülern mit Förderbedarf. Was diese Forschungsprojekte gemein haben, ist die Tatsache, dass sie die Menge an Daten in ihrer kurzen Entstehungszeit nicht selbst erheben können. Um solche Projekte dennoch zu realisieren, kann die Bildungsforschung auf das  Forschungsdatenzentrum (FDZ) am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) zurückgreifen.

Seit der Gründung 2007 als Abteilung des IQB baut sich das Forschungsdatenzentrum stetig weiter aus. Seine Kernaufgabe ist die Aufbereitung und Archivierung von Daten aus nationalen und internationalen Schulleistungsstudien. Wissenschaftlerinnen und Wissenschaftler können diese Daten jedoch nicht nur für die eigene Forschung nutzen und auswerten, sondern gleichzeitig auch eigene Daten am FDZ archivieren, um weitere Forschungsprojekte zu ermöglichen. Die Mitarbeiterinnen und Mitarbeiter am FDZ verfassen in der Regel ihre jeweiligen und thematisch verschiedenen Qualifikationsarbeiten ebenfalls mit FDZ-Daten, sind also selbst wissenschaftlich tätig. Daher haben sie nicht nur Expertise in der Aufbereitung und Archivierung der Daten, sondern auch in deren Nutzung für konkrete Forschungsprojekte.

Welche Daten bietet das Forschungsdatenzentrum?

Insgesamt verfügt das Forschungsdatenzentrum aktuell über 64 Studien. Neben den groß angelegten und bekannten Schulleistungsstudien wie PISA, TIMSS oder dem IQB-Bildungstrend verfügt das FDZ auch über kleinere Studien. Diese konzentrieren sich auf thematisch spezifische Inhalte, wie beispielsweise die Sprachförderung im Sachunterricht von Grundschulen oder nehmen eine lokale Region Deutschlands genauer in den Blick. Der Datensatz zum Forschungsprojekt „Kompetenzerwerb und Lernvoraussetzungen (KuL)“ beschäftigt sich zum Beispiel mit der Interaktion zwischen Lehrpersonen und frisch eingeschulten Grundschulkindern und umfasst Angaben von etwa 1.000 Schülerinnen und Schülern, 840 Eltern und 69 Lehrkräften aus 39 Schulen in Nordrhein-Westfalen.

Alle Daten – sowohl aus den großen Erhebungen des Bundes und der Länder sowie entsprechende Datenspenden – werden nach Erhalt am Forschungsdatenzentrum geprüft, aufbereitet und je nach Sensibilität der Daten einer von drei Zugangskategorien zugeteilt. Je stärker die Daten anonymisiert werden, desto stärker wird zumeist auch das Analysepotenzial der Datensätze eingeschränkt. Der Kompromiss, der hierbei getroffen wird, um einerseits die Teilnehmerinnen und Teilnehmer der Studien zu schützen und gleichzeitig das Potential für weitere Analysen nicht einzuschränken, wird daher meist über eine Reglementierung für den Zugriff auf die Daten oder ein ausführlicheres Antragsverfahren umgesetzt, wie Abbildung 1 systematisch zeigt:

Abbildung 1: Grafik in Anlehnung an Statistisches Bundesamt (www.forschungsdatenzentrum.de)

Wie ist ein Zugang zu den verschiedenen Datensätzen möglich?

Die Frage, wie interessierte Forscherinnen und Forscher Zugang zu den Datens(ch)ätzen erhalten, lässt sich anhand von drei Kategorien beantworten, denen die Daten zugeordnet sind und die sich je in der Art der Antragsstellung unterscheiden: (1) Campus Files, (2) Scientific Use Files und (3) Daten mit Fernrechenzugang.

Campus Files (CFs) sind teilsynthetisch generierte Daten, die zwar die Struktur von ‚echten‘ Daten abbilden, jedoch künstlich erzeugt wurden. Dafür wird die Struktur und Verteilung eines empirischen Datensatzes verwendet und mit Zufallszahlen repliziert. Auf diese Weise enthalten Campus Files keine ‚echten‘ Werte von Personen mehr, die Analyse ist jedoch weiterhin wie mit ‚echten‘ Daten möglich. Für den Einsatz in der Lehre bieten Campus Files daher einiges an Potenzial und kaum Einschränkungen. Insbesondere der Vorteil der datenschutzrechtlichen Unbedenklichkeit liegt auf der Hand. Da die Werte künstlich generiert wurden, eignen sich diese Datensätze jedoch nicht für die Beantwortung von Forschungsfragen. Um mit Campus Files zu arbeiten, genügt ein verkürztes Antragsverfahren, das aus einer Online-Registrierung mit einer gültigen universitären E-Mail-Adresse besteht, die zum Download der Daten berechtigt.

Scientific Use Files (SUFs) bilden den Hauptbestandteil der Datensammlung. Um Zugriff auf diese Datensätze zu erhalten, ist ein regulärer Antrag einzureichen, der die Daten aller am (Forschungs-)Projekt beteiligten Personen sowie die Absichten für die Verwendung der Daten erfasst. Auch ein Datennutzungsvertrag muss abgeschlossen werden, um die sachgemäße Verwendung der Daten sicherzustellen. Anschließend erhalten die Nutzerinnen und Nutzer den Datensatz (in typischen Formaten wie z.B. SPSS) und weitere Dokumentationsmaterialien.

Zu den Daten mit Fernrechenzugang (IZAs) gehören alle sensiblen Datensätze, die lediglich über einen Fernrechenzugang analysiert werden können. Dieses Angebot ermöglicht die vertiefende Analyse von Daten, die aus Gründen des Datenschutzes nicht weitergegeben werden dürfen und oft detaillierte Inhalte enthalten. Wie der Namensbestandteil ‚Fernrechenzugang‘ bereits aussagt, werden die Datensätze in dieser Kategorie nicht zum Download zur Verfügung gestellt, sondern können lediglich syntaxbasiert analysiert werden. In der Praxis bedeutet dies, dass der Code zur Analyse und Aggregation der Daten über einen Zugang verschickt wird. Dadurch sind für die Arbeit mit Daten aus dieser Kategorie auch Erfahrungen im Schreiben von Analysecodes erforderlich und Programme wie „R“ oder „Stata“ notwendig. Anschließend wird geprüft, ob der Output – insbesondere welcher veröffentlicht werden soll – der beantragten und vertraglich festgelegten Fragstellung entspricht, um eine Verbreitung der sensiblen Daten zu verhindern.

Wie profitiert die Bildungsforschung von der Archivierung der Forschungsdaten?

Der Ruf nach „OpenScience“ seitens der Wissenschaftsgemeinschaft wird immer lauter. Viele Institute schließen sich zusammen, um Daten zugänglich, Forschung reproduzierbar und für die Scientific Community nutzbar zu machen. Diesem Gedanken folgt auch das Forschungsdatenzentrum seit mittlerweile über 20 Jahren. Die Datenbasis ermöglicht breite Sekundärdatenanalysen und Replikationsstudien und trägt dabei zur Nutzung des bestehenden Datenpotenzials und zur Qualitätssicherung von Forschung bei.

Im Bildungsbereich profitieren auch Schülerinnen und Schüler und Lehrkräfte von der Verwendung bereits bestehender Daten. Schulen können entlastet werden, indem die Beanspruchung von Unterrichtszeit und der Organisationsaufwand für Studien möglichst geringgehalten und gleichzeitig der größtmögliche Nutzen aus den Daten durch breite Zugangsmöglichkeiten erzielt wird. Diese Entlastung kann dann wiederum den Feldzugang für diejenigen Studien erleichtern, die Datensätze zu Themenfeldern erheben, zu denen noch keine Daten vorliegen.

Einen weiteren Vorteil, den das Angebot des Forschungsdatenzentrums bietet, ist die Kombination von mehreren Datensätzen. Dadurch lassen sich robuste Studien durchführen, die durch eine größere Stichprobe weniger sensibel für Messfehler sind und dadurch die Generalisierbarkeit der Ergebnisse erhöhen. Wenn mehrere Datensätze zur Verfügung stehen, lassen sich häufig auch mehr Hypothesen erforschen als es mit lediglich einem Datensatz möglich ist. Beispielsweise konnte durch die Verwendung der am Forschungsdatenzentrum archivierten PISA-Daten ein Vergleich der fächer- und länderspezifischen Schulleistungen im Zuge der G8-Reform erfolgen, ohne dass hierfür eigene Daten erhoben werden mussten.

Durch sein großes Datenarchiv und den meist leichten Zugang öffnet das Forschungsdatenzentrum am IQB der Bildungsforschung Türen zu Forschungsmaterial, die einen wichtigen Beitrag zu „OpenScience“ darstellen. Das breite Angebot der Studien ermöglicht es unter anderem auch Studierenden und Promovierenden mit echten und großen Datensätzen zu arbeiten und auf diese Weise neue Erkenntnisse für die Bildungsforschung zu generieren – wie wäre es zum Beispiel mit einer Masterarbeit, die eine Längsschnittstudie zu Grundschülerinnen und Grundschülern mit Förderbedarf genauer untersucht? Dadurch könnte die Fragestellung in jedem Fall auch aus der Liste mit Forschungsprojekten gestrichen werden, die eigentlich undenkbar sind.

Dieser Beitrag ist im Rahmen der virtuellen Studienfahrt des Masterstudiengangs Empirische Bildungsforschung und Pädagogische Psychologie im Sommersemester 2021 nach Berlin entstanden.

Über die Autorinnen und Autoren:

Mario Eich studiert Empirische Bildungsforschung und Pädagogische Psychologie am Hector-Institut an der Universität Tübingen.

Fitore Morina ist wissenschaftliche Mitarbeiterin am Hector-Institut für Empirische Bildungsforschung an der Universität Tübingen.

Christian Fischer ist Tenure-Track-Professor für Educational Effectiveness am Hector-Institut für Empirische Bildungsforschung an der Universität Tübingen.

Zum Weiterlesen

  • Institut zur Qualitätsentwicklung im Bildungswesen (IQB, 2021). Forschungsdatenzentrum am IQB, Internet: https://www.iqb.hu-berlin.de/fdz
  • Verbund Forschungsdaten Bildung (VerbundFDB, 2021), Internet: https://www.forschungsdaten-bildung.de/ (abgerufen am 24.06.2021)
  • Forschungsdatenzentrum (2021), Internet: www.forschungsdatenzentrum.de (abgerufen am 24.06.2021)
  • Rüdiger, C., Jansen, M., & Rjosk, C. (2021). Paul ist nicht so gut in Deutsch “. Geschlechtsdifferenzielle Benotung im Fach Deutsch – eine Sekundäranalyse der Daten des IQB-Bildungstrends 2015. Psychologie in Erziehung und Unterricht, 68, Open Access. https://doi.org/10.2378/peu2021.art08d
  • Kocaj, A., Jansen, M., Kuhl, P., & Stanat, P. (2020). Zusammenhänge der Klassenkomposition an Förderschulen und allgemeinen Schulen mit schulischen Kompetenzen, akademischem Selbstkonzept und Interesse. In C. Gresch, P. Kuhl, M. Grosche, C. Sälzer, & P. Stanat (Hrsg.), Schüler* innen mit sonderpädagogischem Förderbedarf in Schulleistungserhebungen (pp. 213-262). Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-27608-9_8

Verwendete Schlagwörter

Möchten Sie zur Diskussion beitragen?
Einen Kommentar schreiben
Bitte rechnen Sie 2 plus 4.

Verwandte Beiträge

Blog

Veröffentlicht am

Studie zeigt: Je häufiger Studierende Online-Kurse belegen, desto schneller und effizienter erreichen sie ihren Bachelorabschluss.

Mehr lesen
Blog

Veröffentlicht am

Warum der Einsatz von digitalen Lernplattformen zur Unterstützung von forschendem Lernen im Unterricht auch kritisch reflektiert werden sollte

Mehr lesen
Blog

Veröffentlicht am

Experimente funktionieren nicht nur im Klassenzimmer: Eine neue Studie zeigt, wie Schülerinnen und Schüler auch vor dem Bildschirm experimentieren und ihr Wissen erweitern können.

Mehr lesen
Blog

Veröffentlicht am

Die Digitalisierung verändert nicht nur das Lernen an Schulen, sondern auch die empirische Bildungsforschung. Besonders von Vorteil sind dabei virtuelle Realitäten.

Mehr lesen
Blog

Veröffentlicht am

Eine Studie zeigt, wie wichtig die persönliche Beziehung im Distanzunterricht für den Lernerfolg von Schülerinnen und Schülern ist.

Mehr lesen
Blog

Veröffentlicht am

Gute Noten in einem Fach beeinflussen, wie Schülerinnen und Schüler andere Fächer bewerten: Neue Erkenntnisse zeigen, welche Faktoren in das Feedback von Schülerinnen und Schülern einfließen.

Mehr lesen
Blog

Veröffentlicht am

Das Stichwort Hochbegabung erzeugt in vielen Köpfen das Klischee, Menschen mit einem hohen IQ seien sozial schwierig und emotional labil - aktuelle Forschungserkenntnisse deuten jedoch in eine andere Richtung.

Mehr lesen
Blog

Veröffentlicht am

Bildungsforschung praktisch: Das Forschungsdatenzentrum (FDZ) liefert wahre Datens(ch)ätze um neue Erkenntnisse zu gewinnen.

Mehr lesen
Blog

Veröffentlicht am

Vergleichsarbeiten bieten Schulleitungen und Lehrkräften die Möglichkeit, Lernprozesse zu verbessern. Voraussetzung dafür ist, dass die Ergebnisse richtig eingeordnet werden.

Mehr lesen
Blog

Veröffentlicht am

Was macht eine gute Schulleitung aus? Mit entsprechenden Weiterbildungsangeboten wollen Unis Führungkräfte im Schul- und Bildungsbereich ausbilden und in ihren Kompetenzen unterstützen.

Mehr lesen
Junge mit Kopfhörern sitzt mit einem Stift in der Hand vor einem Computerbildschirm
Blog

Veröffentlicht am

Digitale Lernumgebungen können die kognitive Entwicklung von Schülerinnen und Schülern unterstützen - besonders, wenn sie dabei die Tiefenstrukturen des Lernen berücksichtigen.

Mehr lesen
Ein Kind bedient auf dem Tablet das Lerntool "Scratch"
Blog

Veröffentlicht am

Richtig eingesetzt, lernen Schülerinnen und Schüler mit Lerntools für digitales Storytelling auch spielerisch Kenntnisse im Programmieren.

Mehr lesen
Startbildschirm der App "Twitter"
Blog

Veröffentlicht am

Auf sozialen Plattformen können sich Lehrkräfte mitunter erfolgreicher weiterbilden als in Präsenzveranstaltungen. Worauf es dabei ankommt und was es zu beachten gilt.

Mehr lesen
Blog

Veröffentlicht am

An der Universität Tübingen untersucht ein neues Forschungsprojekt, wie kontextbasierter Physikunterricht den Lernerfolg beeinflusst.

Mehr lesen
Blog

Veröffentlicht am

Verstehen und Anwenden anstatt Auswendig lernen: Beim Forschenden Lernen entdecken Lernende naturwissenschaftliche Zusammenhänge selbst – sowohl im Unterricht, als auch virtuell im Netz.

Mehr lesen
Blog

Veröffentlicht am

Videospiele machen süchtig, faul und gewalttätig? Neuere Erkenntnisse zeigen: Aus Videospielen lässt sich viel über Motivation lernen.

Mehr lesen
Blog

Veröffentlicht am

Ein neues Unterrichtskonzept für das Schulfach Physik knüpft gezielt an die Alltagserfahrungen von Schülerinnen und Schülern an, um ihnen ein besseres Verständnis der elektrischen Spannung und von einfachen Stromkreisen zu ermöglichen.

Mehr lesen
Blog

Veröffentlicht am

Mit der Lernapp 'Prosodiya' lernen Grundschülerinnen und Grundschüler ihre Rechtschreibschwäche spielerisch zu überwinden.

Mehr lesen
Blog

Veröffentlicht am

Im virtuellen Klassenzimmer überprüft die Bildungsforschung welche Bedigungen eine effektive Lernumgebung ausmachen.

Mehr lesen
Blog

Veröffentlicht am

Interview - Wenn begabte und hochbegabte Kinder unter ihren Möglichkeiten bleiben, spricht man in der Psychologie und Pädagogik von „Underachievement“. Untersuchungen gehen davon aus, dass etwa 15 Prozent aller Hochbegabten betroffen sind. Luisa Wottrich gibt Einblicke in die aktuelle Forschung.

Mehr lesen
Blog

Veröffentlicht am

In Deutschland distanziert, in Taiwan freundschaftlich: Die Lehrer-Schüler-Beziehung hat einen Einfluss auf die Motivation im Schulalltag.

Mehr lesen
Blog

Veröffentlicht am

Weltweit halten digitale Medien Einzug in Klassenräume und verändern das Lernen und Lehren im Schulalltag. Auf dem Weg ins digitale Klassenzimmer braucht es jedoch nicht nur die technische Infrastruktur, die Kompetenzen von Lehrerinnen und Lehrern spielen eine entscheidende [...]

Mehr lesen
Blog

Veröffentlicht am

Mit dem digitalen Programmierkurs „Spielplatz Informatik“ können kleine Informatiker - und die, die es noch werden wollen - auch bei geschlossenen Schulen Programmieren lernen.

Mehr lesen
Blog

Veröffentlicht am

Für den Lernerfolg spielt Begabung eine wichtige Rolle. Aber diese ist bei weitem nicht allein entscheidend.

Mehr lesen
Blog

Veröffentlicht am

Mit dem lebensgroßen Brettspiel „Schildkröten & Krabben“ unternehmen Grundschulkinder erste Schritte im Programmieren.

Mehr lesen
Blog

Veröffentlicht am

Der Big Fish-Little-Pond-Effekt beschreibt das Phänomen, dass Schülerinnen und Schüler in einer leistungsschwächeren Klasse ein besseres schulisches Selbstkonzept besitzen - aber ziehen leistungsstarke Schülerinnen und Schüler schwächere Kinder immer mit?

Mehr lesen
Blog

Veröffentlicht am

Interessen haben einen großen Einfluss darauf, was wir in (und aus) unserem Leben machen. Am Hector-Institut für Empirische Bildungsforschung werden Interessen als wichtiger Schlüssel zum Lernerfolg untersucht.

Mehr lesen
Blog

Veröffentlicht am

Spielerisch Mathe lernen, das klingt vielversprechend. Am Fachbereich Mathematik der Universität Tübingen haben wir mit Ganita ein Lernspiel für den Mathematikunterricht entwickelt und seine Wirkweise untersucht.

Mehr lesen
Blog

Veröffentlicht am

Im Gespräch: Benjamin Fauth über seine Arbeit am Institut für Bildungsanalysen Baden-Württemberg (IBBW) und das Verhältnis von Bildungsforschung, Bildungspraxis und Bildungspolitik.

Mehr lesen
Blog

Veröffentlicht am

Digitale Medien halten zunehmend Einzug in deutsche Klassenzimmer. Dabei ergibt sich die Frage, wie lernwirksame Medien und Einsatzmöglichkeiten aussehen.

Mehr lesen
Blog

Veröffentlicht am

Obwohl sich die Mathematikleistungen von Jungen und Mädchen in der Regel nicht oder nur kaum voneinander unterscheiden, sind Mädchen häufig weniger motiviert für Mathematik als Jungen. Eine Erklärung für diese Unterschiede können unterschiedliche geschlechtsstereotype [...]

Mehr lesen
Blog

Veröffentlicht am

Egal, ob eine Karte gelesen, ein Zimmer umgeräumt oder ein Kofferraum beladen werden soll – für all diese und viele andere Herausforderungen im Alltag wird gutes räumliches Denken benötigt. Ergebnisse aus internationalen Studien deuten sogar darauf hin, dass gutes [...]

Mehr lesen
Blog

Veröffentlicht am

Verantwortungsvolle Schülerinnen und Schüler haben nicht nur bessere Noten, sondern sind auch später im Beruf erfolgreicher und haben ein höheres Einkommen. „Sekundärtugenden“ wie Fleiß oder Verantwortungsgefühl scheinen daher einen erheblichen Einfluss auf das spätere [...]

Mehr lesen
Blog

Veröffentlicht am

Die Meldungen der Empirischen Bildungsforscher aus Tübingen erregen immer wieder Aufmerksamkeit - ein Gespräch mit dem Direktor des Tübinger Hector-Instituts, Ulrich Trautwein.

Mehr lesen
Blog

Veröffentlicht am

Wo lernen Schülerinnen und Schüler mehr – in der Schule oder in einem Schülerlabor? Lohnt sich der Aufwand für Lehrkräfte, einen außerschulischen Lernort zu besuchen? Wissenschaftlich belastbare Erkenntnisse zu diesen Fragen gibt es bisher wenig.

Mehr lesen
Blog

Veröffentlicht am

Drei Fragen an Claudia Diehl - In der öffentlichen Debatte um die Integration von Zuwanderern rückte in den letzten Jahren immer mehr die Religion in den Blickpunkt. Besonders der Islam wird als Barriere gesehen, auch für die Integration muslimischer Schülerinnen und Schüler in das [...]

Mehr lesen
Blog

Veröffentlicht am

Würden Schülerinnen und Schüler von einem späteren Unterrichtsbeginn profitieren? Ein Blogbeitrag über den Einfluss der inneren Uhr auf die Schulleistung.

Mehr lesen
Blog

Veröffentlicht am

Mobbing und Hate-Speech machen auch vor Schulen keinen Halt. Wie können wirksame Mobbing-Präventionsprogramme an Schulen aussehen? Sieben Schlüsselfaktoren sollen Mobbing reduzieren.

Mehr lesen
Blog

Veröffentlicht am

Kinder, die in der Schule fleißig, gewissenhaft und leistungsorientiert sind, leben wahrscheinlich länger als ihre Mitschülerinnen und Mitschüler. Die Erklärung kann in einem verantworterungsbewussten Lebensstil liegen.

Mehr lesen

Verwandte Veranstaltungen

Online und Präsenz (verschiedene Orte)

Ziel ist es, die Kompetenzen von Lehrpersonen beim Einsatz von digitalen Medien im Unterricht zu stärken. Dabei werden nicht nur die Grundlagen zum Lehren und Lernen mit digitalen Medien vermittelt, sondern auch die fachspezifische Erprobung digitaler Medien im Unterrichtskontext gefördert. Anmeldung möglich ab September 2022.

10 Jahre LEAD - Jubiläumsretreat

Museumsgesellschaft Tübingen, Wilhelmstraße 3, 72074 Tübingen

Save the Date! LEAD feiert 10-jähriges Bestehen mit einem großen Jubiläums-Retreat in Tübingen.

Mehr in Kürze....

Bildungshorizonte: Befunde aus der Bildungsforschung – verständlich und kompakt.

Das Magazin Bildungshorizonte erscheint einmal im Jahr und berichtet kurz und prägnant über aktuelle Ergebnisse aus der Bildungsforschung in der Regel mit einem Themenschwerpunkt.

Magazine erkunden