
Die sogenannten VERgleichsArbeiten (kurz VERA) sind weitestgehend standardisierte Kompetenztests. Mit ihnen wird geprüft, welchen Lernstand und welche Kompetenzen Schülerinnen und Schüler in der 3. und 8. Jahrgangsstufe erreicht haben. Für Schulleitungen und Lehrkräfte sind sie eine Möglichkeit, den Lernprozess ihrer Schülerinnen und Schüler zu verbessern – vorausgesetzt, die Ergebnisse werden richtig eingeordnet.
Seit dem Pisa-Debakel im Jahr 2000, stellen sich Schülerinnen und Schüler in Deutschland einmal im Jahr die gleichen Fragen: Was ist dieser besondere Test, der „VERA“ (oder auch „Lernstandserhebungen“ in Hessen und Nordrhein-Westfalen, „KERMIT“ in Hamburg und „Kompetenztest“ in Sachsen und Thüringen) heißt? Wer denkt sich solche Aufgaben eigentlich aus? Und warum muss ausgerechnet ich sie bearbeiten? Und auch Lehrkräfte sind nicht ganz unbefangen, wenn es um das Thema Vergleichsarbeiten geht. Für viele Lehrkräfte binden die Tests zu viele Arbeitskapazitäten. Anlässlich des 10-jährigen Bestehens der Vergleichsarbeiten im Jahr 2014 äußerste die damalige Vorsitzende der Gewerkschaft Erziehung und Wissenschaft (GEW), Marlis Tepe, Kritik am Nutzen der Vergleichsarbeiten: Die Tests würden „für die Schulentwicklung – insbesondere mit Blick auf die Umsetzung der Inklusion – wenig bringen“, denn diesbezüglich seien Standardfragen nicht mehr zeitgemäß. Warum also schreiben deutsche Schülerinnen und Schüler überhaupt jährlich in mehreren Fächern Vergleichsarbeiten? Und wie entsteht aus der Aufgabenstellung ein zuverlässiges Tool zur Unterrichtsentwicklung?
Um diese Fragen zu beantworten, ist ein kleiner Sprung in der Zeit notwendig: In den 1990er-Jahren und Anfang der 2000er-Jahre legte die Teilnahme Deutschlands an internationalen Schulleistungsstudien wie TIMSS (Trends in International Mathematics and Science Study) und PISA (Programme for International Student Assessment) erhebliche Defizite des deutschen Schulsystems offen. Die TIMS-Studie offenbarte beispielsweise unzureichende Ergebnisse der achten Klassen im mathematisch-naturwissenschaftlichen Bereich, die Ergebnisse der PISA-Studie aus dem Jahr 2000 wies auf große Unterschiede zwischen Schülerinnen und Schülern aus unterschiedlichen sozialen Schichten hin.
2006 verabschiedete die Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland daher eine länderübergreifende Gesamtstrategie zum Bildungsmonitoring, die das Erreichen der mit den Bildungsstandards festgelegten Kompetenzziele in einer bestimmten Jahrgangsstufen messbar machen sollte – VERA ist ein Teil davon.
Einordnung in Kompetenzstufen
In 15 Bundesländern* werden jährlich Schülerinnen und Schüler der dritten (VERA-3) und achten (VERA-8) Jahrgangsstufe in verschiedenen Kompetenzbereichen der Fächer Deutsch und Mathematik getestet. In der achten Klasse erfolgt zusätzlich eine Überprüfung in der Fremdsprache (Englisch bzw. Französisch). Seit 2010 werden Vergleichsarbeiten auch in Südtirol und in der deutschsprachigen Gemeinschaft Belgiens durchgeführt.
Durch Vergleichsarbeiten erhalten Lehrkräfte mithilfe eines wissenschaftlichen Instruments Informationen zum Kompetenzstand ihrer Schülerinnen und Schüler. Auf Grundlage verbindlich festgelegter Bildungsstandards zeigen die Ergebnisse, wie viele Schülerinnen und Schüler einer Klasse, Schule oder auch eines Bundeslandes sich auf welcher Kompetenzstufe (unter Mindeststandard, Mindeststandard, Regelstandard, Regelstandard Plus, Optimalstandard) befinden. Durch Vergleichsarbeiten erhalten insbesondere Lehrkräfte und Schulen somit Hinweise darauf, welche Kompetenzen bei ihren Schülerinnen und Schülern bereits gut entwickelt sind, aber auch, in welchen Kompetenzbereichen eine zusätzliche Förderung notwendig ist.
Die Ergebnisse der Vergleichsarbeiten dienen somit vor allem als Ausgangspunkt, um Maßnahmen für die Unterrichts- und Schulentwicklung abzuleiten. Ob oder inwieweit die Ergebnisse genutzt werden, liegt in der Verantwortung der Schulleitungen, Lehrkräfte und Länder. In einer Studie, die ein Team um den Schulforscher Sebastian Wurster in den Bundesländern Berlin und Brandenburg durchgeführt hat, zeigt sich jedoch, dass die Ergebnisse der Vergleichsarbeiten von drei Vierteln der befragten Schulleitungen durchaus für eine Weiterentwicklung der Lehr- und Lernprozesse genutzt werden.
Aufgabenentwicklung
Auf die – zumindest aus Sicht von Schülerinnen und Schülern – häufig gestellte Frage ‚Wer denkt sich solche Aufgaben eigentlich aus?‘ gibt es eine relativ kurze Antwort: Lehrkräfte aus verschiedenen Bundesländern, die für das Institut zur Qualitätsentwicklung im Bildungswesen (IQB) arbeiten. In enger Zusammenarbeit mit renommierten Fachdidaktikerinnen und Fachdidaktikern sowie mit Fachvertretungen aus den Ländern entwickeln sie die Aufgaben für die Vergleichsarbeiten. Bevor also Schülerinnen und Schüler die offiziellen VERA-Aufgaben bearbeiten, werden diese in einem mindestens zweieinhalbjährigen Prozess von Mitarbeitenden des IQB, Lehrkräften, Fachdidaktikerinnen und -didaktikern erprobt, überarbeitet, ausgewertet und finalisiert. Eine Übersicht über den Entwicklungsprozess liefert folgende Abbildung:

Die Aufgabenentwicklung beginnt mit dem Auftakttreffen am IQB. Hierbei tauschen sich Lehrkräfte der Länder, fachdidaktische Beraterinnen und -berater und Mitarbeitende des IQB aus und beginnen mit der Entwicklung der VERA-Aufgaben in Arbeitsgruppen (AE-Gruppen). Die ersten Entwürfe dieser Aufgaben werden anschließend von Fachdidaktikerinnen und -didaktikern bewertet und kommentiert und von den AE-Gruppen weiter überarbeitet.
In der darauffolgenden Phase werden die Aufgaben erstmals in der Praxis vorerprobt – meist in den Klassen derjenigen Lehrkräfte, die auch an der Aufgabenentwicklung mitwirken. Nach der Auswertung der Ergebnisse dieser Präpilotierung, werden die Aufgaben schließlich präzisiert, von Fachvertretungen der Bundesländer begutachtet und im Anschluss nochmals vom IQB überarbeitet, bevor sie in zwei Gruppen von acht bzw. sieben Ländern erprobt werden. In jährlichem Wechsel wird die Erprobung (Pilotierung) von VERA-8 in den Fächern Deutsch, Mathematik und Englisch in einem Teil der Bundesländer (Baden-Württemberg, Bremen, Hamburg, Nordrhein-Westfalen, Saarland, Sachsen-Anhalt, Thüringen) durchgeführt, während in den anderen Bundesländern (Bayern, Berlin, Brandenburg, Hessen, Mecklenburg-Vorpommern, Rheinland-Pfalz, Sachsen, Schleswig-Holstein) gleichzeitig die Erprobung von VERA-3 erfolgt. Da Französisch als erste Fremdsprache nicht in jedem Bundesland an genügend Schulen angeboten wird, findet die Erprobung jedes Jahr in den Bundesländern Baden-Württemberg, Berlin, Hessen, Nordrhein-Westfalen, Rheinland-Pfalz, Saarland und Schleswig-Holstein statt.
Die Ergebnisse der Erprobung werden am IQB in Zusammenarbeit mit Fachdidaktikerinnen und ‑didaktikern ausgewertet. Welche Aufgaben schlussendlich den Ländern zur Testung bereitgestellt werden, ist oft keine leichte Entscheidung. Aufgaben, die gute wissenschaftliche Kennwerte aufweisen (z. B. eine „zuverlässige“ Aufgabe, die Kompetenzen sehr genau misst), können durch inhaltliche Mängel verworfen werden und anders herum. Um valide und durchführbare Vergleichsarbeiten zur Verfügung zu stellen, müssen Wissenschaft und Praxis daher Hand in Hand arbeiten.
Durchführung und Ergebnisrückmeldung
Um den Ländern mehr Flexibilität einzuräumen, stellt das IQB seit 2020 nicht mehr wie bisher feste Testhefte, sondern Testmodule bereit. Aus diesen können die Bundesländer verschiedene Module auswählen, um eine passgenaue Zusammenstellung an Kombinationen für verschiedene Schulformen bzw. Leistungsgruppen zu treffen. In den kommenden Jahren soll die Flexibilität durch einen Umstieg auf eine digitale Erhebung noch weiter ausgebaut werden. Die bislang (physischen) Testhefte wurden bisher und werden zum Teil noch durch die Länder gedruckt und versandt. Einige Länder bieten den Schulen schon seit ein paar Jahren die VERA-Test auch online an. Auch das IQB entwickelt die VERA-Tests sukzessive auch als Onlinetests.
Die Durchführung und Dateneingabe finden durch die Lehrkräfte vor Ort statt, die Auswertung und Rückmeldung an die einzelnen Schulen liegen wiederum in der Verantwortung der Länder, meist erfolgt diese durch eine beauftragte Einrichtung (bspw. Landesinstitut). Rückmeldungen erfolgen in manchen Bundesländern auf Schul- bzw. individueller Ebene, in jedem Bundesland jedoch auf Klassenebene – und zwar jeweils durch die Einteilung in die oben genannten unterschiedlichen Kompetenzstufen von „unter Mindeststandard“ bis „Optimalstandard“. In den meisten Bundesländern gibt es auch eine Rückmeldung auf Aufgabenebene, d. h. die Lehrkräfte erhalten eine Rückmeldung darüber, mit welchen Aufgaben und Bildungsstandards ihre Klasse noch besondere Probleme hat und welche Kompetenzen bereits gut ausgeprägt sind. Vergleichsarbeiten bieten für Lehrkräfte und Schulleitungen daher im Anschluss an die Rückmeldung das Potential, für ihre Schülerinnen und Schüler, ganze Klassenverbände und sogar auf Schulebene, gezielte Förder- oder Fördermaßnahmen zu entwickeln und damit Lernprozesse zu verbessern. Mit didaktischen Handreichungen, die das IQB inklusive ausführlicher Hinweise zur Weiterarbeit im Unterricht bereitstellt, sollen Lehrkräfte zudem bei der Ableitung von Maßnahmen für den Unterricht unterstützt werden.
* Niedersachen nimmt seit 2020 nicht mehr teil.
Dieser Beitrag ist im Rahmen der virtuellen Studienfahrt des Masterstudiengangs Empirische Bildungsforschung und Pädagogische Psychologie entstanden.
- Weiterführende Literatur
- Institut zur Qualitätsentwicklung im Bildungswesen (IQB) (2020.11.12). VERA – Ein Überblick. https://www.iqb.hu-berlin.de/vera/ueberblick/
- Institut zur Qualitätsentwicklung im Bildungswesen (IQB) (10.02.2021). Welche Ziele werden mit VERA verfolgt? https://www.iqb.hu-berlin.de/vera/ueberblick/ziele/
- Institut zur Qualitätsentwicklung im Bildungswesen (IQB) (2021.05.28). Beispiel Ergebnisrückmeldung für eine Klasse, Präsentation: Arbeitsschwerpunkte des Instituts zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin. https://www.iqb.hu-berlin.de/vera/ueberblick/ziele/
- Wurster, S., Richter, D., Schliesing, A., & Pant, H. A. (2013). Nutzung unterschiedlicher
Evaluationsdaten an Berliner und Brandenburger Schulen. Rezeption und Nutzung
von Ergebnissen aus Schulinspektion, Vergleichsarbeiten und interner Evaluation
im Vergleich. In I. van Ackeren, M. Heinricht, & F. Thiel (Hrsg.), Evidenzbasierte
Steuerung im Bildungssystem? Befunde aus dem BMBF-SteBis-Verbund (Die
Deutsche Schule. Zeitschrift für Erziehungswissenschaft, Bildungspolitik und päda-
gogische Praxis, Beiheft 12, 19–50). Münster: Waxmann.