Pädagogische Diagnostik im Bildungsprozess. Testen als Methode der pädagogischen Kontrolle

Pädagogische Diagnostik im Bildungsprozess.  Testen als Methode der pädagogischen Kontrolle
Pädagogische Diagnostik im Bildungsprozess. Testen als Methode der pädagogischen Kontrolle

Vorlesung 8. Pädagogische Tests, ihre Art und Zweck.

1. Normativ-orientierte und kriterienorientierte Ansätze in pädagogischen Dimensionen.

2. Testaufgaben und Testarten.

3. Klassifizierung der Arten pädagogischer Tests.

4. Konzeptioneller Apparat: Vortestaufgabe, Testaufgabe, pädagogischer Test.

1. Normativ-orientierte und kriterienorientierte Ansätze in pädagogischen Dimensionen

Allgemeine Ansätze zur Interpretation der Ergebnisse pädagogischer Messungen. Bei der pädagogischen Messung kann die Interpretation der Schülerergebnisse variieren, je nachdem, wie die Schülerergebnisse verglichen werden. Ein Ansatz vergleicht die Punktzahl jedes Schülers mit den Ergebnissen einer bestimmten Gruppe – einer Stichprobe von Schülern, die denselben Test absolviert haben –, um zu bestimmen, wo die einzelnen Punkte im Verhältnis zum Gruppendurchschnitt stehen (normbasierter Ansatz). Nach einem anderen Ansatz werden die Ergebnisse der Testpersonen in Bezug auf den in den Test einbezogenen Inhaltsbereich interpretiert und mit bestimmten Leistungskriterien versehen (kriterienorientierter Ansatz).

Beide Ansätze liefern Informationen über die Vorbereitung der Studierenden, sind jedoch unterschiedlicher Natur. Entsprechend dieser Ansätze zur Interpretation von Testergebnissen werden normativ orientierte und kriterienorientierte Tests unterschieden.

Regulierungsorientierter Ansatz und Normen. Standardisierung von Tests . Das Hauptziel normativer Tests besteht darin, Testteilnehmer anhand der Testergebnisse zu differenzieren. Bei der Interpretation der Ergebnisse kann die relative Position des Probanden anders beurteilt werden, da er im Vergleich zu einer schwächeren Gruppe besser aussieht als zu einer stärkeren Gruppe. Um die Testergebnisse richtig zu interpretieren, muss die Punktzahl jedes Schülers verglichen werden Standards für die Durchführung des Tests.

Normen sind eine Reihe von Indikatoren, die die Testergebnisse einer klar definierten Stichprobe von Testteilnehmern widerspiegeln – einer relevanten normativen Gruppe, die repräsentativ für die allgemeine Population der getesteten Studenten ist. Zu den Normen gehören in der Regel der Durchschnittswert der Testergebnisse und ein Indikator für die Streuung (Variabilität) um den Durchschnittswert aller anderen Ergebnisse, die von einer repräsentativen Stichprobe getesteter Schüler erzielt wurden (Methoden zur Berechnung des Durchschnittswerts und Variabilitätsindikatoren werden in Kapitel 9 beschrieben). Mithilfe von Standards können Sie die Position jedes Ergebnisses im Verhältnis zur durchschnittlichen Punktzahl im Test ermitteln und sehen, um wie viel das Ergebnis des Schülers über oder unter dem Durchschnitt liegt.

Der Prozess der Definition von Standards wird aufgerufen Standardisierung des Tests. Die Standardisierung erfolgt stets an einer repräsentativen Probandenstichprobe, deren Bildung ein zwingender Schritt bei der Festlegung von Testnormen ist.

Relativität von Normen und Stichprobenstandardisierung . Teststandards, die zur Interpretation der Ergebnisse aller Schüler bei jedem Test geeignet sind; existiert nicht. Der Geltungsbereich einer Norm ist auf einen bestimmten Test und eine bestimmte Gruppe von Probanden beschränkt, daher sind die Normen nicht absolut und nicht konstant. Sie spiegeln die Ergebnisse der Standardisierungsstichprobe zum Zeitpunkt der Testerstellung wider und unterliegen einer systematischen Aktualisierung und Überprüfung.

Für die Standards gelten folgende Anforderungen:

Die Standards müssen differenziert werden. Beispielsweise müssen Tests für allgemeinbildende und spezialisierte Schulen anhand unterschiedlicher Stichproben standardisiert werden, was höchstwahrscheinlich zu deutlich unterschiedlichen Normen führen wird;

Die Standards müssen die reale Bevölkerung und die aktuellen Anforderungen an die Qualität der Bildungsleistungen widerspiegeln, die sich aus der aktuellen Bildungssituation ergeben;

Normen müssen repräsentativ sein, daher werden sie stets empirisch anhand der Ergebnisse der Prüfung einer Normungsstichprobe ermittelt (bundesweit – für das Einheitliche Staatsexamen, kommunal – für die Zertifizierung von Schulen, schulintern – für die Zertifizierung von Schülern in der Schule) .

„Norm“ ist ein relativer Begriff und steht in engem Zusammenhang mit der Qualität der zur Standardisierung verwendeten Stichprobe. Die Stichprobe muss genau die Kategorie (oder Kategorien) von Personen widerspiegeln, für die der Test bestimmt ist, und sie muss groß und ausgewogen genug sein, um sicherzustellen, dass der Standardfehler so klein ist, dass er im Teststandardisierungsprozess vernachlässigbar sein kann. Daher müssen bei der Bildung einer Standardisierungsstichprobe zwei Variablen berücksichtigt werden – Volumen und Repräsentativität, die zusammen eine hohe Genauigkeit bei der Bewertung von Testleistungsstandards gewährleisten.

Stichprobenschichtung. Um eine gleichmäßige Vertretung verschiedener Studierendengruppen in der Testpopulation sicherzustellen, kommt ein spezielles Verfahren zum Einsatz – die Stratifizierung. Unter Stratifizierung versteht man die Schichtung der Stichprobe in Schichten, deren Größe proportional zur Größe der entsprechenden Populationen in der allgemeinen Studierendenpopulation sein sollte. Grundlage für die Schichtung sind in der Regel die Faktoren, die am stärksten mit der Messvariablen verbunden sind. Bei der Einheitlichen Staatsprüfung zählen zu diesen Faktoren der soziale Status der Eltern des Absolventen, die Region, in der sich die Schule befindet, ob es sich um eine ländliche oder städtische Schule handelt usw.

Das Vorhandensein vieler Schichtungsfaktoren, die Notwendigkeit, die Anteile der allgemeinen Probandenpopulation zu analysieren und Pilottests zur Festlegung von Standards durchzuführen, machen die Arbeit zur Standardisierung von Tests zu einem ziemlich teuren und zeitaufwändigen Verfahren. Der aktuelle Entwicklungsstand der Testtechnologien ermöglicht es, Tests mit vorhersehbaren Standards zu simulieren IRT , eine Datenbank kalibrierter Testobjekte und spezieller Programme zur computergestützten Generierung von Testoptionen.

Begleitende Informationen zu standardisierten Tests . Der standardisierte Test muss Folgendes umfassen:

Testleistungsstandards, die anhand einer Standardisierungsprobe ermittelt werden;

Die Größe der Standardisierungsstichprobe, die Grundlage für ihre Schichtung und den Zeitraum ihrer Verwendung;

Rohtestergebnisse für die Standardisierungsprobe.

Ein Vergleich von Normen für verschiedene Tests ist nur möglich, wenn Gründe für die Behauptung der Angemessenheit von Standardisierungsproben vorliegen.

Kriterienbasierter Ansatz in pädagogischen Dimensionen . Bei einem kriterienbasierten Ansatz zur pädagogischen Messung werden die Ergebnisse der Studierenden in Bezug auf den Inhaltsbereich oder die für die akademische Leistung festgelegten Anforderungen interpretiert. Bei dichotome Beurteilung(„1“ oder „0“) der Ergebnisse der Erledigung einzelner Aufgaben wird die Punktzahl jedes Schülers berechnet, indem der Prozentsatz der richtig erledigten Aufgaben ins Verhältnis zur Gesamtzahl der Prüfungsaufgaben umgerechnet wird. Im Fall von polytome Beurteilungen Das Verhältnis der Rohpunktzahl des Schülers bei den Aufgaben zur maximal möglichen Punktzahl im Test wird in einen Prozentsatz umgewandelt. Der für jeden Schüler erzielte Prozentsatz wird mit Leistungsstandards verglichen – Kriterien, die von Experten festgelegt und während des Testaufbauprozesses empirisch validiert wurden.

Mit einem kriterienorientierten Ansatz, basierend auf Testergebnissen, können Sie:

- Ermitteln Sie beherrschte und nicht beherrschte Kenntnisse, Fähigkeiten und Fertigkeiten und erstellen Sie für jeden Schüler einen individuellen Bildungsweg.

Ordnen Sie die Testteilnehmer nach Abschlussprozentsatz und erstellen Sie Bewertungsskalen.

Teilen Sie die Fächer anhand eines Kriteriumspunkts in zwei Gruppen oder anhand mehrerer Kriteriumspunkte in mehrere Gruppen ein und geben Sie beispielsweise Schulnoten an – „zwei“, „drei“, „vier“, „fünf“.

Nachteile des kriterienorientierten Ansatzes. Der kriterienbasierte Ansatz hat Nachteile, da er den gesamten Inhalt, der als 100 % angenommen wird, in einem Test abdecken muss. Kriterienbasierte Zertifizierungstests fallen oft sehr lang aus – von 150 bis 300 Aufgaben, die selbst im Gymnasium mit einer einmaligen Präsentation einfach nicht zu bewältigen sind. Daher kommt bei der Zertifizierung häufig adaptives Testen zum Einsatz, das durch die Optimierung der Schwierigkeit der Aufgaben eine deutliche Verkürzung der Testdauer ermöglicht. Sie nutzen auch eine Reduzierung des Testinhalts durch Minimierung der Bewertungsziele. Zu diesem Zweck werden häufig kriterienorientierte Tests zur Prüfung einer oder zweier Fähigkeiten oder Fertigkeiten eingesetzt, bei der Abdeckung heterogenerer Inhalte werden normativ orientierte Tests gewählt.

Auch kriterienbasierte Tests haben einen eher begrenzten Anwendungsbereich. Sie eignen sich dort, wo es möglich ist, Kenntnisse, Fähigkeiten und Fertigkeiten in einem bestimmten Inhaltsbereich klar zu definieren und deren Ober- und Untergrenzen festzulegen, um die Kriterien für die Durchführung von Tests korrekt zu bestimmen. In komplexeren und weniger strukturierten Wissensgebieten zur Lösung kreativer Probleme ist es oft unmöglich, die Obergrenze zu bestimmen.

Manchmal lässt sich ein Schüler bei der Ausführung solcher Aufgaben von Wissen leiten, aber häufiger entscheiden Einfallsreichtum und Vermutungen über alles. Daher sollte man bei der Erstellung von Tests zur Überwachung der Leistung kreativer Aufgaben einem normativ orientierten Ansatz den Vorzug geben oder versuchen, beide Ansätze in einem Test zu kombinieren.

Unterschiede zwischen normorientierten und kriterienorientierten Ansätzen. Normativ orientierte und kriterienorientierte Tests unterscheiden sich im Erstellungszweck, in der Methodik zur Auswahl der Inhalte, in der Art der Verteilung empirischer Ergebnisse, in der Prüfung, in den Methoden ihrer Verarbeitung, in den Qualitätskriterien von Tests und Testaufgaben und vor allem in die Interpretation der Ergebnisse der Probanden, die den Test abgeschlossen haben.

Bei kriterienbasierten Tests zur Zertifizierung sind die Aufgaben recht einfach, da Lehrer immer versuchen, den Prozentsatz der „Zweier“ einzuplanen und die Anzahl der nicht zertifizierten Schüler zu begrenzen. Wenn beispielsweise „Zweier“ 10 % nicht überschreiten sollen und das Kriterium für die Aussortierung erfolgloser Studierender auf 70 % festgelegt werden soll (jeder, der weniger als 70 % der Prüfungsaufgaben erledigt hat, erhält eine „Zwei“), dann erfolgt der Test muss mindestens 70 % leichte Aufgaben umfassen, die von 90 % der getesteten Studierenden gelöst werden können (Abb. 9). Normativ orientierte Tests sind in der Regel deutlich schwieriger. Sie umfassen 50 bis 70 % der Aufgaben mittleren Schwierigkeitsgrades, d.h. diejenigen, die nur die Hälfte der getesteten Studierenden richtig lösen konnte (Abb. 10).

Reis. 9. Aufgabenverteilung nach Schwierigkeitsgrad in einem normativen Test

Reis. 10. Aufgabenverteilung nach Schwierigkeitsgrad in einem kriterienbezogenen Test

Da die Verteilungen der Rohwerte einer repräsentativen Probandenstichprobe bei normativen und kriterienorientierten Tests in der Regel unterschiedliche Formen aufweisen (Abb. 11), ist es erforderlich, unterschiedliche Methoden zur Beurteilung der Reliabilität und Validität anzuwenden der Ergebnisse pädagogischer Messungen, Skalierungs- und Ausrichtungstechniken.

Reis. 11. Typische Verteilung der Testergebnisse für eine repräsentative Stichprobe

Studentenproben

Die wichtigsten Unterschiede zwischen normativen und kriterienorientierten Tests sind in der Tabelle dargestellt. 1.

Tabelle 1

Unterschiede zwischen normbezogenen und kriterienbezogenen Tests

Eigenschaften

Regulierungsorientierte Tests

Kriterienbasierte Tests

Typische durchschnittliche Anzahl von Schülern, die fast alle Prüfungsaufgaben richtig lösen

Bereich zum Vergleich der Schülerergebnisse

Ergebnisse anderer Studenten

Umfang der Prüfungsziele

Breit, deckt ab viele Ziele und Arten von Lernaktivitäten

Eng, deckt in der Regel mehrere Kontrollziele ab

Repräsentativität der thematischen Inhaltsabdeckung

Mäßig, fragmentiert – meist sind nicht alle Abschnitte enthalten

Normalerweise groß alles einbeziehen, was zu 100 % operationalisiert und angenommen werden kann

Streuung der Schülerergebnisse (Score-Variabilität)

Hoch, da der Hauptzweck des Tests darin besteht, die Testteilnehmer zu differenzieren Ausbildungsstand

Niedrig, innerhalb der Ergebnisse der Gruppe von Studenten, die übertroffen haben entsprechend seinen Ergebnissen Kriteriumspunktzahl, nahezu keine Variabilität

Auswahl der Aufgaben nach Schwierigkeitsgrad

Die Verteilung der Schwierigkeitsgrade ist nahezu normal. Hauptsächlich Manche Aufgaben haben einen Schwierigkeitsgrad von 40-60 %

Die Verteilung ist schief. Der Hauptteil der Aufgaben hat einen Schwierigkeitsgrad von 80-90 %

Für einen Lehrer ist die Situation am informativsten, wenn sich beide Ansätze ergänzen. Deshalb einige Tests werden mit der Erwartung konzipiert, dass die Leistung der Schüler sowohl mit Normen als auch mit Testinhalten in Zusammenhang gebracht werden kann. Ein Beispiel sind Kontroll- und Messmaterialien (CMM) des Einheitlichen Staatsexamens.

2. Testaufgaben und Testarten

Allgemeine Klassifizierung der durch Tests gelösten Probleme . Entsprechend den Kontrollarten während der Prüfung können wir unterscheiden:

Ziele am Einstieg in die Ausbildung (Eingabekontrolle);

Aktuelle Aufgaben (aktuelle Kontrolle);

Aufgaben, die dem Ende eines bestimmten Zeitraums des Bildungsprozesses entsprechen (Abschlusskontrolle).

Prüfung in der Eingangskontrolle . Der Beginn der Ausbildung entspricht einem Aufnahmetest, der es uns ermöglicht, den Grad der Beherrschung der Grundkenntnisse, Fähigkeiten und Fertigkeiten zu ermitteln, die für den Beginn der Ausbildung erforderlich sind, und den Grad der Beherrschung neuer Materialien zu bestimmen, bevor sie im Klassenzimmer erlernt werden . Die letzte Situation scheint für die Schule nicht typisch zu sein, es genügt jedoch, sich an das klassische Beispiel zu erinnern, wenn Kinder, die gut lesen, in die erste Klasse kommen und sich im Unterricht zu langweilen beginnen.

Wareneingangsprüfungen, üblicherweise genannt Vortests(Vorversuche) werden in zwei Typen unterteilt. Vortests erster Art ermöglichen es uns, die Bereitschaft zu erkennen, neues Wissen im Klassenzimmer zu erlernen. Sie werden im Rahmen eines kriterienorientierten Ansatzes entwickelt und enthalten Aufgaben zur Prüfung der grundlegenden Kenntnisse, Fähigkeiten und Fertigkeiten, die zur Beherrschung neuer Materialien erforderlich sind. Grundsätzlich sind diese Vortests für die schwächsten Schüler gedacht, die sich an der Grenze zwischen eindeutig vorbereitet und eindeutig nicht bereit befinden, mit dem Erlernen neuen Materials zu beginnen. Basierend auf den Ergebnissen des Vortests werden die Testteilnehmer in zwei Gruppen eingeteilt, von denen eine diejenigen umfasst, die weitermachen können, und die andere diejenigen, die zusätzliche Arbeit und Ratschläge von einem Lehrer benötigen.

Vortests der zweiten Art werden im Rahmen eines normativ orientierten Ansatzes entwickelt. Sie decken die geplanten Ergebnisse der bevorstehenden Schulung ab und basieren vollständig auf neuem Material. Basierend auf den Ergebnissen des Vortests trifft der Lehrer eine Entscheidung, die es ihm ermöglicht, Elemente der Individualisierung in den Massenbildungsprozess einzuführen. Wenn ein Student einige Vorkenntnisse in neuem Material gezeigt hat, muss sein Lehrplan umstrukturiert werden und mit mehr beginnen hohes Level damit das Unterrichtsmaterial für ihn einen echten Neuheitscharakter hat. Manchmal übernimmt der Abschlusstest die Rolle des Eingangsvortests, der zur späteren Beurteilung der Ergebnisse der Beherrschung neuer Stoffe nach Abschluss des Studiums dient.

In Abb. Abbildung 12 zeigt mögliche Funktionen von Inputtests im Bildungsprozess.

Reis. 12. Vereinfachtes Modell der Eingabetestfunktionen im Bildungsbereich

Prozess, korreliert mit den Aufgaben des Lehrers.

Prüfung in Stromregelung . Für die laufende Überwachung werden Korrektur- und Diagnosetests entwickelt. Korrekturtests sind in der Regel kriterienorientiert: Wenn der Prozentsatz der Fehler eines Schülers die Kriteriumspunktzahl übersteigt, muss sein Wissen korrigiert werden. Mit Hilfe von Korrekturtests können Sie Schwächen in der Vorbereitung der Studierenden aufdecken und Bereiche individueller Unterstützung bei der Beherrschung neuer Stoffe identifizieren.

Korrekturtests sind nicht mit Mitteln zur laufenden Wissenskontrolle von Studierenden zu verwechseln, liegen aber zumindest im Hinblick auf die Anwendungszwecke einigermaßen nahe beieinander. Es bestehen jedoch erhebliche technologische und inhaltliche Unterschiede zwischen dem ersten und dem zweiten Mittel. Herkömmliche Mittel zur Stromkontrolle sind weniger effektiv und konzentrieren sich hauptsächlich auf die Prüfung und systematische Bewertung des Wissens der Schüler anhand kleiner Einheiten von Lehrmaterial. Korrekturtests sollen Wissenslücken in einer Gruppe von Bildungseinheiten identifizieren, die den Inhalt mehrerer Themen oder sogar Abschnitte umfassen. Sie enthalten in der Regel Aufgaben, die in steigendem Schwierigkeitsgrad angeordnet sind, um erste Probleme bei der Bewältigung des Lehrstoffs zu erkennen.

Wenn die Schwierigkeiten des Schülers bei der Lösung von Aufgaben systematisch sind, kann der Lehrer auf Hilfe zurückgreifen Diagnosetest. Das Hauptziel der Diagnostik – die Ursachen von Wissenslücken der Studierenden zu ermitteln – wird durch eine spezielle Auswahl der Aufgabeninhalte in Prüfungen erreicht. In der Regel handelt es sich dabei um inhaltlich leicht variierende Aufgaben, die je nach Darstellungsform darauf ausgelegt sind, die einzelnen Bearbeitungsschritte der einzelnen Aufgaben des Korrekturtests nachzuvollziehen. Detaillierte Detaillierung ermöglicht es uns, die Ursachen für anhaltende Fehler von Schülern zu identifizieren, die Art der auftretenden Schwierigkeiten zu präzisieren und Rückschlüsse auf die Unreife bestimmter pädagogischer Fähigkeiten zu ziehen.

Eine Multiple-Choice-Aufgabe aus einem Mathe-Nachhilfetest für die Grundschule könnte beispielsweise so aussehen:

2+6:3 8:4=

A.2

B. 3

B.1

G 4

Maximale Anzahl von DiagnosejobsDer Test wird durch die Anzahl der Aktionen bei der Durchführung einer korrigierenden Testaufgabe bestimmt. Für den betreffenden numerischen Ausdruck können Sie beispielsweise vier Aufgaben anbieten, wenn der Lehrer die Kenntnisse des Schülers über das Verfahren nicht testen möchte:

1) 6:3= A. 3 B. 2 C. 4

2) 8:4= A. 2 B. 4 C. 1

3) 2+6:3= A. 5 B. 6 C. 4

4) 2+6:3-8:4 = A. 3 B. 2 C. 0

Die Auswahl der Aufgaben für den Diagnosetest erfolgt individualisiert, abhängig von den Aufgaben was jeder Schüler im Nachhilfetest falsch gemacht hat. Besonders effektiv sind Korrektur- und Diagnoseverfahren mit computergestützter Erstellung und Präsentation von Tests in Kombination mit Schulungsmodulen für jede Einheit ungelernten Lehrmaterials. In diesem Fall erfolgt die Korrektur sofort, da der Computer nach dem Erkennen der nächsten Lücke und der Feststellung der Ursache selbst das Schulungsmodul auswählt und es sofort an den Studierenden ausgibt.

Ein vereinfachtes Modell der aktuellen Testfunktionen ist in Abb. dargestellt. 13.

Reis. 1Z. Modell von Testfunktionen in der Stromsteuerung

Abschließende Prüfung. Das Hauptziel der Abschlussprüfung ist eine objektive Bewertung der Lernergebnisse, die sich an den Merkmalen der Beherrschung der Studieninhalte (kriterienorientierte Tests) bzw. an der Differenzierung der Studierenden (normativ orientierte Tests) orientiert. In Abb. Abbildung 14 zeigt ein Modell der endgültigen Testfunktionen.

Reis. 14. Modell der endgültigen Testfunktionen

Abschlusstests unterliegen in der Regel einer Standardisierung, da sie am häufigsten für Verwaltungsentscheidungen im Bildungswesen verwendet werden. Wenn die Durchführung von Aufnahme- und laufenden Tests die Aufgabe des Lehrers ist, werden Abschlusstests häufig von externen Strukturen durchgeführt und haben den Charakter von unabhängige Kontrollen. Ein Beispiel für unabhängige Abschlussprüfungen in Russland ist das Einheitliche Staatsexamen, die Prüfung für die Schulzertifizierung usw. Innerhalb einer Schule können Abschlusstests bei der Versetzung von Schülern von Klasse zu Klasse, bei der Auswahl schwächerer Schüler für die Einweisung in Justizvollzugsklassen usw. eingesetzt werden.

3. Klassifizierung der Arten pädagogischer Tests

Grundlegende Ansätze zur Testklassifizierung. In der in- und ausländischen Literatur gibt es unterschiedliche Ansätze zur Klassifizierung pädagogischer Tests, die sich in den Merkmalen unterscheiden, die der Typenabgrenzung zugrunde liegen. Entsprechend dem Ansatz zur Dateninterpretation gibt es normativ orientiert Und kriterienbezogene Tests.

Entsprechend der Dimension des Konstrukts werden pädagogische Tests unterteilt in homogen(nur eine Variable messend und daher inhaltlich homogen) und heterogen (mehr als eine Variable messend – der Fall eines mehrdimensionalen Konstrukts) Tests. Heterogene Tests sind multidisziplinär und interdisziplinär. Multidisziplinäre Tests bestehen aus homogenen Teiltests in einzelnen Disziplinen. Die Ergebnisse der Schüler bei Untertests werden kombiniert, um die Endergebnisse für den gesamten multidisziplinären Test zu berechnen. Zur Bewältigung interdisziplinärer Prüfungsaufgaben ist der Einsatz generalisierter, interdisziplinärer, integrativer Kenntnisse und Fähigkeiten erforderlich. Interdisziplinäre Tests sind immer mehrdimensional; ihre Entwicklung erfordert den Rückgriff auf faktorielle Methoden der Datenanalyse, mathematische und statistische Methoden der mehrdimensionalen Skalierung usw.

Basierend auf der Art der gemessenen Variablen werden sie unterschieden Tests zum Testen von Wissen, pädagogischen, praktischen Fähigkeiten und Auch Kompetenztests. Manchmal werden sie in eine separate Gruppe eingeteilt Geschwindigkeitstests, Es wird ein strenges Zeitlimit für die Erledigung jeder Aufgabe verlangt und es wird immer eine übermäßige Anzahl an Aufgaben enthalten, die es nicht ermöglicht, den gesamten Test abzuschließen. Je nach Präsentationsform gibt es leer Und Computer, mündlich Und schriftliche Prüfungen.

Am meisten allgemeine Einteilung Tests im Bildungsprozess ermöglichen es uns, sie in zwei ungleiche Gruppen einzuteilen: standartisierte Tests, Compliance-Standards haben und nicht standardisierte Tests Davon gibt es noch viel mehr, da jeder Lehrer sie für den Einsatz im alltäglichen Bildungsprozess vorbereitet. Nicht standardisierte Tests werden oft als Lehrertests oder Autorentests bezeichnet.

Einteilung nach Steuerungsarten, deren Funktionen und der Art der zu lösenden Aufgaben. Wenn wir als Abgrenzungszeichen die Arten der Kontrolle und die Art der vom Lehrer mithilfe von Tests gelösten Aufgaben auswählen, erhalten wir eine in Abb. dargestellte Klassifizierung der Arten pädagogischer Tests. 15.

Reis. 15. Klassifizierung pädagogischer Tests

Die Analyse der Klassifizierungstabelle ermöglicht es uns, vier Arten pädagogischer Tests als grundlegend zu identifizieren, unter denen die abschließenden normativen Tests hinsichtlich ihres Einsatzbereichs die größte Bedeutung haben.

Der zunehmende Einfluss von Tests auf Managemententscheidungen auf der Grundlage von Daten aus der Überwachung und Analyse der Bildungsqualität hat in vielen Ländern dazu geführt 21. Jahrhundert . zur Entstehung einer neuen Art von Tests für Verwaltungs- und Managementzwecke (in der englischen Literatur - High-Stakes-Tests ). Daten aus Verwaltungs- und Managementtests sind eine wichtige Informationsquelle für die Analyse der Folgen von Bildungsreformen und Bildungsinnovationen, für die Durchführung vergleichender Studien zur Qualität der Vorbereitung von Absolventen aus verschiedenen Regionen Russlands, für die Zertifizierung von Bildungseinrichtungen und für die Bewertung der Wirksamkeit ihrer Aktivitäten.

4. Grundlegende Definitionen des Begriffsapparats

Konzeptioneller Apparat zur Entwicklung und Verwendung von Tests. Die Notwendigkeit, einen klaren konzeptionellen Rahmen für die Entwicklung von Tests zu schaffen, ist praktizierenden Lehrern nicht immer klar. Dies lässt sich teilweise durch die scheinbare Einfachheit der Konzepte selbst erklären, da oft jede Reihe von Aufgaben in Testform mit einem Test im Kopf des Lehrers verbunden ist. Solche Pseudotests werden häufig in Spezialsammlungen veröffentlicht. Sie können in der Routineüberwachung eingesetzt werden, nicht jedoch in der Arbeit von Zertifizierungsstellen.

Die Inkonsistenz von Pseudotests mit wissenschaftlich fundierten Qualitätskriterien kann zu einem erheblichen Fehlanteil bei der Beurteilung der Schülervorbereitung führen, der zu falschen Rückschlüssen auf die Leistungsfähigkeit einzelner Lehrkräfte oder Lehrteams führt. Daher ist ein konzeptioneller Apparat notwendig, da er dazu dient, Tests von dem zu trennen, was oft als solche angesehen wird.

Aufgabe vor dem Test . Die Definition eines Vortestgegenstands ist grundlegend und enthält spezifische Anforderungen, um ihn von einem herkömmlichen Testgegenstand zu unterscheiden. Eine Vorprüfungsaufgabe ist eine Einheit von Prüfungsmaterialien, deren Inhalt, logischer Aufbau und Darstellungsform einer Reihe von Anforderungen gerecht wird und durch standardisierte Prüfungsregeln eine eindeutige Beurteilung der Leistungsergebnisse gewährleistet.

In Vorprüfungsaufgaben werden die wesentlichsten unterstützenden Elemente der Fachinhalte geprüft. In jeder Vortestaufgabe wird ermittelt, was eindeutig als richtige Antwort mit dem geplanten Vollständigkeitsgrad angesehen wird.

Anforderungen an die Form der Vorprüfungsaufgaben , kann in spezielle, die die Besonderheiten der Form widerspiegeln, und allgemeine, die in Bezug auf die gewählte Form invariant sind, unterteilt werden. Gemäß den allgemeinen Anforderungen muss die Aufgabe über eine bestimmte Seriennummer, Standardanweisungen für die Umsetzung, eine angemessene Form, einen Standard für die richtige Antwort, standardisierte Regeln für die Bewertung der Ergebnisse ihrer Umsetzung usw. verfügen usw. . (Siehe Vorlesung 10). Es gibt zahlreiche spezielle Anforderungen an die Form, die teilweise in Vorlesung 10 vorgestellt werden, die sich den Formen von Vorprüfungsaufgaben widmet.

Die Vorteile von Pre-Test-Aufgaben im Vergleich zu herkömmlichen Kontrollaufgaben werden durch eine extreme Standardisierung in der Darstellung und Bewertung ihrer Ergebnisse gewährleistet, was insgesamt die Objektivität der Testergebnisse der Studierenden erhöht.

Prüfen . Vortestaufgaben müssen einer obligatorischen empirischen Prüfung unterzogen werden, nach deren Ergebnissen ein Teil davon in Testaufgaben umgewandelt und der verbleibende Teil aus dem ursprünglichen Satz von Testaufgaben entfernt wird. Eine Vortestaufgabe wird zu einer Testaufgabe, wenn quantitative Bewertungen ihrer Eigenschaften bestimmte Kriterien erfüllen, die darauf abzielen, die inhaltliche, formale und systembildende Qualität von Vortestaufgaben empirisch zu überprüfen.

In der Regel sind mindestens zwei bis drei Tests erforderlich, auf deren Grundlage Inhalt, Form, Schwierigkeitsgrad der Aufgabe, ihre Gültigkeit und statistische Eigenschaften, die die Qualität ihrer Arbeit charakterisieren, sowie andere Testaufgaben korrigiert werden. Die Untersuchung der systembildenden Eigenschaften der Testaufgabe erfolgt auf Basis einer Analyse der deskriptiven Statistik sowie Methoden der Korrelations-, Faktoren- und latenten Strukturanalyse. Die Interpretation von Analyseergebnissen ist immer eine komplexe analytische Arbeit, deren Ergebnisse von vielen Bedingungen abhängen, einschließlich der Art des zu erstellenden Tests. Statistische Merkmale von Testaufgaben und Anforderungen an deren Qualität werden in Vorlesung 12 besprochen .

Es sind vor allem die Abschlusstests, die für Managemententscheidungen im Bildungswesen verwendet werden, die langwierige Prüfungen und Korrekturen erfordern. Bei der Entwicklung von Lehrertests zur laufenden Überwachung sind beispielsweise keine Korrelations- und Faktorenanalysen erforderlich, aber auch deskriptive Statistiken, die es ermöglichen, gültige Aufgaben mit akzeptablem Schwierigkeitsgrad einfach auszuwählen, sind sehr nützlich.

Pädagogischer Test. Im Gegensatz zu den ersten beiden Definitionen, die hinsichtlich der Testzwecke und der zu lösenden Aufgaben unveränderlich sind, sollte sich die Definition eines pädagogischen Tests auf eine bestimmte Art von Test konzentrieren. Insbesondere handelt es sich bei dem abschließenden normativ orientierten Test um ein System von Testaufgaben, die innerhalb einer bestimmten Präsentationsstrategie angeordnet sind und solche Merkmale aufweisen, die eine hohe Differenzierung, Genauigkeit und Validität der Beurteilung der Qualität von Bildungsleistungen gewährleisten.

Aus dieser Definition ergeben sich zwei wichtige Schlussfolgerungen. Erstens: Es gibt und kann überhaupt keine qualitativ hochwertigen Tests geben, da die Beurteilung der differenzierenden Wirkung des Tests, der Genauigkeit von Messungen (Reliabilität) und ihrer Angemessenheit an die gesetzten Ziele (Validität) nicht nur von den Eigenschaften von abhängt von den Testaufgaben, sondern auch von den Merkmalen der zu testenden Studierendenpopulation. Zweitens: Um die Qualität eines Tests beurteilen zu können, sind empirische Testdaten notwendig, die aus einer repräsentativen Stichprobe von Studierenden gewonnen werden. Die Arbeit an der Testkorrektur festigt das System der Testaufgaben – die interne Verbindung und Integrität, die Integrativität des Systems nimmt sukzessive zu und es erfolgt ein Übergang von einer Reihe von Vortestaufgaben zu einem professionell entwickelten Test.

Der abschließende kriterienorientierte Test ist ein System von Testaufgaben, die im Rahmen einer bestimmten Präsentationsstrategie angeordnet sind und solche Merkmale aufweisen, die eine valide, aussagekräftige Interpretation von Bildungsleistungen in Bezug auf festgelegte, statistisch abgesicherte Leistungskriterien ermöglichen. Die Definition spezifiziert nicht den grundlegenden Inhaltsbereich, der beim Dolmetschen verwendet wird, was die Verwendung für verschiedene Arten von kriterienorientierten Tests ermöglicht.

THEMA: Testen als Form der pädagogischen Kontrolle

Einführung

Kapitel 1 Theoretische Grundlagen pädagogischer Tests als Mittel zur Überwachung des Wissens der Studierenden

1.1 Pädagogische Kontrolle und ihre Funktionen

1.2 Prüfung in der pädagogischen Kontrolle

1.3 Psychologische und pädagogische Aspekte des Testens

Kapitel 2 Pädagogische Tests, ihr Inhalt, Aufbau, Formen und Typen

2.1 Historische Grundlagen pädagogischer Prüfung

2.2 Klassifizierung pädagogischer Prüfungen

2.3 Anforderungen an pädagogische Tests, ihre Vor- und Nachteile

Abschluss

Literaturverzeichnis

Einführung

Derzeit stehen alle Länder der Welt vor dem Problem, die Zuverlässigkeit und Effizienz der Bildungsqualitätskontrolle zu erhöhen. Um dieses Problem zu lösen, werden verschiedene pädagogische Überwachungssysteme entwickelt und getestet, die hauptsächlich auf der normativen Testüberwachung des Wissens der Schüler basieren. Es werden international vergleichende Studien zu den Bildungsleistungen von Studierenden in verschiedenen Wissensgebieten durchgeführt. Als Instrument zur objektiven Wissensbewertung haben sich Testtechnologien in der internationalen Bildungspraxis fest etabliert. Im letzten Jahrzehnt ist das inländische Bildungssystem diesem Weg gefolgt und hat Testtechnologien aktiv gemeistert.

Die Entwicklung staatlicher Bildungsstandards sowie die Einführung neuer Technologien zur Vermittlung und Überwachung des Wissens der Schüler haben das Interesse der breiteren pädagogischen Gemeinschaft an Tests geweckt. Als Teil vieler pädagogischer Innovationen ermöglichen Tests eine objektive Beurteilung des Wissensstandes, die Überprüfung der Übereinstimmung der Anforderungen der Graduiertenausbildung mit vorgegebenen Standards und die Identifizierung von Lücken in der Ausbildung der Studierenden.

Tests sind ein wichtiger Schritt in der Entwicklung von Methoden zur Überwachung der Aufnahme von Lehrmaterial durch Schüler. Die Einführung von Tests ermöglicht einen reibungslosen Übergang von subjektiven und weitgehend intuitiven Bewertungen zu objektiven. Allerdings muss dieser Schritt, wie jede andere pädagogische Innovation auch, strikt durchgeführt werden wissenschaftliche Basis, basierend auf den Ergebnissen pädagogischer Experimente und wissenschaftlicher Forschung. Tests sollten herkömmliche Methoden der pädagogischen Kontrolle nicht ersetzen, sondern diese nur teilweise ergänzen.

Der Zweck des Aufsatzes besteht darin, die Merkmale pädagogischer Tests als Mittel zur Überwachung des Wissens der Schüler zu untersuchen.

Entsprechend der Zielsetzung werden die folgenden Zielsetzungen des Abstracts formuliert.

Erstens, die theoretischen Grundlagen pädagogischer Tests als Mittel zur Überwachung des Wissens der Schüler zu studieren;

Zweitens analysieren Sie die psychologischen und pädagogischen Aspekte des Testens;

Drittens berücksichtigen Sie pädagogische Tests, deren Inhalt, Struktur, Formen und Typen;

Viertens: Ziehen Sie entsprechende Schlussfolgerungen.

Die methodische Grundlage für das Verfassen des Abstracts bildeten wissenschaftliche Arbeiten in- und ausländischer Wissenschaftler.

Kapitel 1 Theoretische Grundlagen pädagogischer Tests als Mittel zur Überwachung des Wissens der Studierenden

1.1 Pädagogische Kontrolle und ihre Funktionen

In der traditionellen Hausdidaktik werden folgende Begriffe verwendet: Kontrolle, Überprüfung, Bewertung und Erfassung von Wissen. Betrachten wir kurz den Inhalt dieser Definitionen.

Kontrolle – Inspektion sowie ständige Beobachtung zum Zweck der Überprüfung oder Überwachung. In der häuslichen Pädagogik wird unter Lernkontrolle Folgendes verstanden: ein administratives und formales Verfahren zur Überprüfung der Arbeit eines Lehrers und von Institutionen; Führungsfunktion, deren Ergebnisse dazu dienen, Führungsentscheidungen zu treffen; Komponente, ein Bestandteil des Lernprozesses, der durch dessen Verständnis, Festigung und Anwendung organisch mit dem Studium des Programmmaterials verbunden ist; Bildung von Fähigkeiten und Fertigkeiten. Der Kern der Lernergebniskontrolle besteht darin, den Grad des Wissenserwerbs der Studierenden zu ermitteln, der dem staatlichen Bildungsstandard in einem bestimmten Wissensbereich (Programm, Fach) entsprechen muss. Gegenstand der Kontrolle an einer Hochschule ist die Bewertung der Ergebnisse des dort organisierten pädagogischen Prozesses.

In der kybernetischen Sichtweise wird Kontrolle als ein Rückkopplungsprinzip betrachtet, das für die Steuerung eines selbstregulierenden Systems charakteristisch ist. Die Kontrolle der Bildungsaktivitäten der Schüler erfolgt durch externes Feedback (Kontrolle durch den Lehrer) und internes Feedback (Selbstkontrolle der Schüler). Sie findet in allen Phasen (Stufen, Verbindungen, Zyklen) der Ausbildung statt, erlangt jedoch nach dem Studium eines beliebigen Abschnitts des Programms und dem Abschluss der Ausbildungsphase eine besondere Bedeutung.

Kontrolle wird in der Didaktik als pädagogische Diagnostik interpretiert. In diesem Fall wichtige Rolle Dabei spielt das Setzen von Lernzielen eine Rolle. V.P. Bespalko ist der Ansicht, dass das Ziel des pädagogischen Prozesses diagnostisch festgelegt wird, wenn folgende Bedingungen erfüllt sind:

1. eine so genaue und eindeutige Beschreibung der sich bildenden Persönlichkeitsqualität gegeben ist, dass sie genau und eindeutig von allen anderen Persönlichkeitsqualitäten unterschieden werden kann;

2. es gibt eine Methode, ein „Werkzeug“, um die diagnostizierte Persönlichkeitsqualität im Prozess der objektiven Überwachung ihrer Entstehung eindeutig zu identifizieren;

3. es ist möglich, die Intensität der diagnostizierten Qualität anhand von Kontrolldaten quantitativ zu messen;

4. Es gibt eine Qualitätsbewertungsskala basierend auf Messergebnissen.

Lernkontrolle als Teil didaktischer Prozess und das didaktische Verfahren wirft Probleme über die Funktionen des Testens, seinen Inhalt, seine Arten, Methoden und Formen der Kontrolle, über Messungen, über den Lernerfolg und das Scheitern von Studierenden auf.

Es ist allgemein bekannt, dass die Hauptziele der Kontrolle darin bestehen, Lücken in der Ausbildung zu ermitteln; seine Korrektur; Planung der anschließenden Ausbildung; Empfehlungen zur Vermeidung von Studienversagen.

Pädagogische Anforderungen an die Kontrolle im Training, um hohe Ergebnisse sicherzustellen:

1. individueller Charakter der Kontrolle;

2. systematische und regelmäßige Überwachung in allen Phasen der Ausbildung, kombiniert mit anderen Aspekten der Bildungsaktivitäten der Schüler;

3. eine Vielzahl von Kontrollformen, die die Erfüllung von Bildungs-, Ausbildungs- und Entwicklungsfunktionen sicherstellen;

4. Umfassende Kontrolle. Es sollte alle Abschnitte des Lehrplans abdecken und die Prüfung theoretischer Kenntnisse und praktischer Fähigkeiten gewährleisten.

5. differenzierter Ansatz unter Berücksichtigung der Besonderheiten jedes Studienfachs sowie der individuellen typologischen Merkmale und intellektuellen Fähigkeiten des Studierenden;

6. Einheitlichkeit der Anforderungen an Lehrer, die die pädagogische Arbeit der Schüler einer bestimmten Gruppe (Klasse) überwachen;

7. sparsam im Hinblick auf die Zeit von Lehrern und Schülern, da die Analyse der Testarbeiten und deren Bewertung in relativ kurzer Zeit möglich sind;

8. objektiv und vernünftig.

Laut V.S. Avanesov umfassen die Prinzipien der pädagogischen Kontrolle: das Prinzip der Verbindung von Kontrolle mit Erziehung, Bildung und Ausbildung; Grundsatz der Objektivität; der Grundsatz der Fairness und Transparenz; das Prinzip der Wissenschaft und Effizienz; das Prinzip der Systematik und Vollständigkeit.

In der pädagogischen Praxis stellt sich bei der Ausübung von Kontrolle meist die Frage, was genau im Unterricht mit Hilfe der Kontrolle überprüft wird. In der Hauspädagogik ist es allgemein anerkannt, dass die Kenntnisse und Fähigkeiten der Schüler einer Prüfung unterzogen werden. Sie werden sowohl auf der allgemeindidaktischen, überfachlichen Ebene als auch auf der Fachebene beschrieben, in der Regel in Form von Materialien für das Studium des Studienfaches.

In der westlichen Pädagogik werden überprüfbare Lernergebnisse als kognitive, soziale und emotionale Lernziele beschrieben. Laut P.I. Pidkasisty, darauf zielen die Bemühungen der modernen Hausdidaktik.

Eines seiner Probleme besteht darin, dass die Lernziele, die auch die zu überprüfenden Ergebnisse sind, über das Verhalten, die beobachtbaren Lernhandlungen der Studierenden, gebildet werden. In diesem Fall kann ihr Vorhandensein und ihre Manifestation in der einen oder anderen Form aufgezeichnet werden. Sie können gemessen werden, d.h. der Entwicklungsstand von Wissen, Fertigkeiten und Fähigkeiten (Kompetenzen) kann ermittelt werden.

Seit den 50er Jahren Genau auf dieser Grundlage wurde seit dem letzten Jahrhundert eine Taxonomie von Auslandsstudienzielen entwickelt (B. Blum): Diagnostisch gesetzte Ziele ermöglichen eine objektive Erfassung und Beurteilung des Standes ihrer Erreichung.

Im kognitiven Bereich: Auswendiglernen und Reproduzieren von Lehrmaterial, Leistungsfähigkeit verschiedene Aktionen mit ihm. Inhalte der Leistungsprüfung sind neben den Kenntnissen:

1) soziale und allgemeine psychologische Entwicklung der Studierenden;

2) die Bildung von Lern- und Aktivitätsmotiven, wie z soziale Qualitäten, wie Verantwortungsbewusstsein, moralische Standards und Verhalten.

Die Kontrollfunktionen bestehen darin, den Grad des Wissenserwerbs in allen Phasen der Ausbildung zu ermitteln und die Wirksamkeit des pädagogischen Prozesses zu messen. In der Pädagogik werden folgende Kontrollfunktionen unterschieden:

1. Diagnose. Ziel ist es, das interessierende Phänomen zu identifizieren, es zu bewerten und auf der Grundlage der Kontrollergebnisse eine Managemententscheidung zu treffen. Die pädagogische Diagnostik ist der wichtigste Teil des wissenschaftlichen Systems der pädagogischen Kontrolle.

2. Organisieren. Manifestiert sich in seiner Identifikation mit der Organisation der Ausbildung. Abhängig von den Ergebnissen der Kontrolle wird über die Notwendigkeit entschieden, zusätzliche Lehrveranstaltungen und Beratungen durchzuführen, erfolglosen Studierenden methodische Hilfestellungen zu geben und hart gearbeitete Studierende und Lehrende zu fördern.

3. Verifizierungsfunktion (Inspektor). Kontrollindikatoren dienen als Hauptgrundlage für die Analyse der Übungsergebnisse. Kontrolldaten ermitteln nicht nur die Ergebnisse und die Bewertung der Aktivitäten einzelner Schüler und Lehrer, sondern auch den Stand der pädagogischen Arbeit der gesamten Bildungskontrolle.

4. Pädagogisch. Bei der Durchführung von Steuerungsaufgaben wird das erworbene Wissen wiederholt und durch dessen Verdeutlichung, Ergänzung und/oder Umdenken gefestigt. Kontrolle lehrt auch, wie man Bildungsaktivitäten rational organisiert.

5. Entwicklung. Es liegt darin, dass Kontrolle mehr Möglichkeiten für die Entwicklung der Persönlichkeit und der kognitiven Fähigkeiten des Schülers bietet. Jede Form der Kontrolle erfordert, dass eine Person ihre Aufmerksamkeit, ihr Gedächtnis, ihr Denken, ihre Vorstellungskraft und die Fähigkeit, vorhandenes Wissen zu vergleichen und zu systematisieren, schärft.

6. Pädagogisch. Die Prüfung von Wissen betrifft immer die emotionale Sphäre des Einzelnen, da die individuellen Bemühungen, Lehrinhalte zu beherrschen, Gegenstand öffentlicher Beurteilung werden. Oftmals hängen der Ruf des Schülers und sein Status im Team (Gruppe, Klasse) von den Noten ab. Kontrolle diszipliniert, fördert das Verantwortungsbewusstsein für die eigene Arbeit und regt einen gewissenhaften Umgang damit an. Kompetente Kontrolle ermutigt die Schüler, ihre Kenntnisse und Fähigkeiten zu verbessern und selbstbewertende Urteile zu entwickeln.

7. Methodisch. Es liegt darin, dass das Testen nicht nur den Schüler, sondern auch den Lehrer lehrt, indem es ihm ermöglicht, seine eigenen Fehler zu erkennen und die besten Lernoptionen auszuwählen.

In der pädagogischen Literatur werden üblicherweise folgende Kontrollarten zeitlich unterschieden: vorläufig, aktuell, Meilenstein (periodisch) und endgültig.

1. Für eine erfolgreiche Steuerung des Bildungsprozesses ist eine vorläufige (diagnostische) Kontrolle erforderlich. Damit können Sie den anfänglichen Grad der Vorbereitung der Schüler bestimmen, um sich auf die akzeptable Komplexität des Unterrichtsmaterials zu konzentrieren. Die Analyse vorläufiger Kontrolldaten ermöglicht es dem Lehrer auch, Änderungen an didaktischem Material, Lehrmethoden usw. vorzunehmen.

2. Die aktuelle Kontrolle liefert kontinuierliche Informationen über den Fortschritt und die Qualität der Beherrschung des Lehrmaterials und nimmt zeitnah Änderungen an der Ausbildung vor. Bei der aktuellen Inspektion handelt es sich weniger um eine Inspektion als vielmehr um eine Schulung, da sie mit der Vertiefung, Wiederholung und Analyse von Lehrmaterial verbunden ist. Es gibt zwei Anforderungen an die aktuelle Kontrolle: a) Sie sollte nicht auf das formale, mechanische Auswendiglernen von Lehrmaterial reduziert werden; b) es muss systematisch und regelmäßig durchgeführt werden. Die aktuelle Kontrolle ist operativ, flexibel und vielfältig in Methoden, Formen und Mitteln.

3. Mit der (periodischen) Zwischenkontrolle können Sie die Qualität des Lernmaterials der Studierenden in einer bestimmten Disziplin (Abschnitt, Thema, Modul usw.) bestimmen. In der Regel wird es 3-4 mal im Semester (Quartal) durchgeführt.

Ein Beispiel für eine Zwischenkontrolle können Kolloquien, Prüfungsaufgaben, Abstracts zum Thema, grafische Arbeiten, Tests usw. sein. Dabei werden auch aktuelle Überwachungsdaten berücksichtigt.

4. Die Endkontrolle dient der Ermittlung der endgültigen Lernergebnisse in einer bestimmten akademischen Disziplin oder einem bestimmten Zyklus von Disziplinen. Seine Aufgabe besteht darin, ein Mindestmaß an Vorbereitung zu erfassen, das die weitere Ausbildung gewährleistet. Die letzte Kontrolle ist die Integration. Es dient der Beurteilung der Gesamtleistungen der Studierenden. Sie wird in der Regel bei Übertritts- und Semesterprüfungen, Eignungsprüfungen, Staats- und Abschlussprüfungen, der Verteidigung einer Diplomarbeit etc. durchgeführt.

Kontrollmethoden sind Methoden, mit denen die Wirksamkeit der Bildungsaktivitäten der Schüler und der pädagogischen Arbeit des Lehrers bestimmt wird. Unter Kontrollmethoden werden auch Methoden der diagnostischen Tätigkeit verstanden, die eine Rückmeldung während des Lernprozesses ermöglichen, um Daten über den Lernerfolg und die Wirksamkeit des pädagogischen Prozesses zu erhalten. Sie müssen sicherstellen, dass sie systematisch, vollständig, genau und zeitnah Informationen über den Fortschritt des Lernprozesses erhalten.

Z.B. Skibitsky, V.V. Egorov, S.M. Udartseva, G.M. Smirnova, I.I. Erakhtina, V.V. Gotting bietet folgende Kontrollmethoden an:

1. Mündliche Kontrolle – Monolog-Antwort der Schüler oder Frage-und-Antwort-Form – Konversation. Die mündliche Kontrolle wird derzeit in jeder Unterrichtsstunde (je nach Klasse) in Einzel-, Frontal- oder kombinierter Form durchgeführt.

2. Die individuelle Befragung der Schüler ermöglicht es dem Lehrer, vollständigere und genauere Daten über den Grad der Beherrschung zu erhalten. Allerdings lässt er andere Schüler im Unterricht passiv.

3. Test und mündliche Prüfung sind die aktivste und gründlichste Wissensüberprüfung für einen bestimmten Studienzeitraum (Nachteile: Lotterie, Subjektivität).

5. Aktuelle Wissenskontrolle – Beobachtung, systematische Untersuchung von Studierenden in der Ausbildung, Erkennung vieler Indikatoren und Verhaltensmanifestationen, die auf die Entwicklung von Wissen, Fähigkeiten und anderen Lernergebnissen hinweisen, sind weit verbreitet. Die Ergebnisse der Beobachtungen werden nicht in offiziellen Dokumenten festgehalten, sondern von der Lehrkraft bei der Anpassung des Unterrichts berücksichtigt.

Eine relativ neue Methode (Mittel) zur Prüfung von Lernergebnissen sind didaktische Tests. Sie stellen eine Reihe standardisierter Aufgaben für ein bestimmtes Lehrmaterial dar und ermitteln den Grad seiner Beherrschung durch die Schüler.

1.2 TestenVpädagogischMKontrollee

Derzeit verbreiten sich im Bildungssystem nicht-traditionelle Lehr- und Kontrollformen. Diese Formulare umfassen pädagogische Tests. Beim Einsatz von Tests stehen Lehrkräfte jedoch vor vielen Problemen objektiver und subjektiver Natur. Probleme subjektiver Natur hängen in erster Linie mit der Persönlichkeit des Lehrers selbst und seiner Einstellung zum Einsatz von Tests zusammen. Probleme objektiver Natur sind mit einer unzureichenden Menge an methodischer Literatur verbunden, die es dem Lehrer ermöglichen würde, zu lernen, wie man Tests schreibt, die bestimmte Anforderungen erfüllen.

Das Wort „Test“ Englischer Herkunft und bedeutet in der Originalsprache „Test“, „Test“.

V.S. Avanesov gibt eine klare Definition eines pädagogischen Tests: „Ein pädagogischer Test ist eine Reihe miteinander verbundener Aufgaben von zunehmender Komplexität, die es ermöglichen, Wissen und andere für einen Lehrer interessante Persönlichkeitsmerkmale zuverlässig und valide einzuschätzen.“

IN diese Definition Der Schwerpunkt liegt auf einem System miteinander verbundener Aufgaben zunehmender Komplexität.

V.S. Avanesov weist auf die lexikalischen Merkmale des pädagogischen Tests hin: „In wissenschaftlichen Definitionen wird der Begriff „pädagogischer Test“ in zwei bestehenden Bedeutungen betrachtet:

Als Methode der pädagogischen Messung;

Als Ergebnis der Verwendung eines Tests als Messmethode, die aus einer begrenzten Anzahl von Aufgaben besteht.“

V.S. Avanesov hebt insbesondere die sogenannten traditionellen Tests hervor, die die Einheit dreier Systeme darstellen:

Ein formales System von Aufgaben mit zunehmendem Schwierigkeitsgrad;

Statistische Merkmale Aufgaben und Themen.

Es gibt verschiedene Definitionen des Begriffs „Test“, die sich voneinander unterscheiden, aber alle enthalten die folgenden wesentlichen Merkmale dieses Begriffs: ein speziell vorbereiteter und getesteter Aufgabenkomplex bestimmter Form und zunehmender Komplexität; Das Aufgabensystem ermöglicht eine qualitative Beurteilung der Wissensstruktur der Studierenden. den Lernstand der Schüler effektiv messen. Es ist bezeichnend, dass viele Wissenschaftler-Lehrer bei der Betrachtung des Wesens des vorgesehenen Konzepts den Inhalt dieses Konzepts erheblich erweitern, einschließlich der Struktur des Tests und der Technologie seiner Umsetzung als Merkmale (V. V. Zinoviev, V. P. Levin, A. N. Mayorov, usw. .). Viele der Autoren stützten sich auf das Konzept von V. S. Avanesov über das Wesentliche des Konzepts des „pädagogischen Tests“ als ein System miteinander verbundener Aufgaben zunehmender Komplexität, das eine zuverlässige und gültige Bewertung von Kenntnissen und Fähigkeiten in einem bestimmten Inhaltsbereich ermöglicht.

Der pädagogische Test wird genau als System betrachtet, als eine geordnete Reihe von Testaufgaben. Aufgaben sind die Elemente, die die „Bausteine“ eines pädagogischen Tests bilden.

Die Einstellung zu Tests im Bildungsbereich ist nicht eindeutig. Aufgrund des Informationsreichtums des Bildungsprozesses spart die Testform der Wissenskontrolle die Subjektivität der Benotung erheblich ein und ermöglicht in vielen Fällen, sie zu überwinden und die Motivationsseite des Lernens zu steigern. Anwendung Testkontrolle fördert die Berücksichtigung der Leistungen der Schüler beim Übergang von einer Lernstufe zur anderen.

1.3 Psychologische und pädagogische Aspekte des Testens

Die Einführung einer neuen Form des Kontrolltests in den Lernkontext führt zunächst zu einer Veränderung der Wahrnehmung und Einstellung der Kontrolle; die gesamte Situation verändert sich, einschließlich der psychologischen Situation, die mit der Bildung einer positiven Einstellung ihnen gegenüber verbunden ist unter den Testteilnehmern, mit Annahme, Genehmigung oder Ablehnung, Ablehnungstests als eine Form der Kontrolle.

N. F. Efremova führte eine diagnostische Studie durch, die darauf abzielte, die Bewertung traditioneller und Testkontrollmethoden zu ermitteln (daran nahmen etwa 500 Personen teil). Folgendes wurde enthüllt:

    Die höchste Wertung erhielten die Objektivität des Prüfungsverfahrens und die Unabhängigkeit der Beurteilung von der Meinung des Lehrers sowie das Postulat der Geheimhaltung der Beurteilungen;

    Zu den Vorteilen der herkömmlichen Steuerung zählten: die Möglichkeit der Hilfeleistung und das geringe Maß an Aufgabenschwierigkeiten.

Viele Studien haben die Bedeutung der psychologischen Vorbereitung auf Tests hervorgehoben:

    Der Grad der Verbesserung der Prüfungsergebnisse hängt von den Fähigkeiten und Kenntnissen der Studierenden, der Anzahl und Art der Vorkurse sowie den Merkmalen der Prüfungen ab.

    Die Prüfungsvorbereitung ist für schwache Schüler am nützlichsten, sie hat jedoch kaum Auswirkungen auf die Ergebnisse starker Schüler.

    Der Grad des positiven Einflusses der Vorvorbereitung auf Veränderungen der Prüfungsergebnisse hängt direkt von der Enge des Zusammenhangs zwischen den Inhalten der Trainingsaufgaben und den Inhalten der Prüfung ab.

    Eine vorbereitende Vorbereitung reduziert das Angstverhalten der Probanden während des Tests und motiviert sie, den Test abzuschließen.

    Das Training vor dem Test hilft den Gedächtnismechanismen, in einem streng zeitlich begrenzten Kontrollereignis zu funktionieren.

Von nicht geringer Bedeutung ist Motivation als einheitliches System von Zielen und Bedürfnissen (der dynamische Prozess der Steuerung menschlichen Verhaltens), der den Einzelnen dazu ermutigt, Lernen und Kontrolle bewusst als integralen Bestandteil zu betrachten und sich aktiv an der pädagogischen und kognitiven Arbeit zu beteiligen. Motivation erfüllt in der Bildung folgende Funktionen: motivierend, leitend, organisierend und semantisch. Bei der Durchführung von Tests ist die Motivation einer der wichtigsten psychologischen Faktoren für eine erfolgreiche Kontrolle.

Der Grad der Motivation für pädagogische und kognitive Aktivitäten wird immer von Komplexen objektiver Faktoren (wie der Geschichte des Studienfachs, der Autorität des Lehrers) und subjektiven Faktoren (Lebensentwürfe einer Person, Wunsch nach Selbstverwirklichung, der Wunsch nach guten Noten). Der Prozess, eine Person zu einem Test zu bewegen, erweist sich häufig als sehr komplexer sozialpsychologischer, intellektueller, emotionaler und willentlicher Akt. Wer Erfahrung in der Durchführung von Tests hat, hat gegenüber denjenigen, die zum ersten Mal an Tests teilnehmen, einen entscheidenden Vorteil: Schließlich hat er das Gefühl der Unsicherheit überwunden und Vertrauen in sich selbst und seine Fähigkeiten entwickelt. Die amerikanische Psychologin Anna Anastasi geht davon aus, dass eine Person, die Erfahrung im Umgang mit Aufgaben im Testformat hat, um elf Prozent höhere Ergebnisse erzielt als unerfahrene Probanden.

Gleichzeitig werden zwei wichtige Komponenten der Prüfungsangst unterschieden – emotionale und beschäftigte Angst. Zur emotionalen Komponente der Prüfungsangst zählen Gefühle und physiologische Reaktionen wie Anspannung. Unter Sorgen versteht man negative Gedanken, die Erwartung, bei einer Prüfung zu scheitern, und die Beschäftigung mit den Folgen eines Scheiterns. In diesem Zusammenhang entwickeln Psychologen die Technologie der „Verhaltenstherapie“.

Untersuchungen der Psychologin Anna Anastasi und einer Reihe anderer Psychologen zeigen, dass Prüfungsangst ohne „therapeutische Intervention“ nachlassen kann. Prüfungsangst ist ein komplexes Phänomen, das aus vielen, im Wesen und Inhalt unterschiedlichen und für jeden einzelnen Menschen spezifischen Gründen hervorgerufen wird. Zu den Möglichkeiten, diese Art von Angst zu überwinden, gehören die Verbesserung der Sprachkommunikation und der Sprechfähigkeiten sowie die korrekte Entwicklung von Anweisungen und Testleitfäden.

Die Testmethodik sollte sich an der Persönlichkeit der Lehrkräfte orientieren, aber nicht nur derjenigen, die als Experten an der Erstellung des Tests beteiligt sind, sondern auch derjenigen, die an der Durchführung dieser Form der Kontrolle beteiligt sind. Deshalb ist es notwendig, über ethische Standards und Grundsätze der Prüfung im Bildungsbereich zu sprechen. Es ist erwähnenswert, dass sie in erster Linie durch den Berufsethikkodex des Lehrers bestimmt werden sollten. Als Teil einer Reihe universeller menschlicher Normen, die das Verhalten eines Lehrers während der Prüfung gemäß den Anforderungen der Pflicht, der beruflichen Integrität und den Prinzipien des Humanismus regeln, werden sie zu Grundprinzipien bei der Standardisierung einer Prüfung.

Zu dieser recht großen Gruppe von Grundsätzen gehören:

    Der Grundsatz der Vertraulichkeit – legt die Regeln für die Geheimhaltung von Informationen über Testergebnisse ohne Zustimmung der Testperson fest.

    Der Grundsatz der Zugänglichkeit ist mit dem Recht der Probanden verbunden, Zugang zu einer aussagekräftigen Beschreibung und vollständigen Interpretation der Testergebnisse zu erhalten und Informationen zu erhalten, die als Ergebnis der Analyse von Problemen und Fehlern identifiziert wurden, die bei der Durchführung einzelner Testaufgaben festgestellt wurden.

    Das Prinzip der Validität und dynamischen Reflexion der Entwicklung bestimmt die systematische Aktualisierung der durch Tests gewonnenen Daten zur Vorbereitung der Studierenden (Monitoring).

    Der Grundsatz der Einwilligung nach Aufklärung setzt die Einwilligung der Probanden zur Durchführung von Tests und Befragungen voraus.

    Das Prinzip der Inhaltsauswahl – der Inhalt der Prüfung wird als eine völlig optimale Widerspiegelung des Inhalts des Stoffes der wissenschaftlichen Disziplin im System der erstellten Prüfungsaufgaben definiert.

    Der Grundsatz der wissenschaftlichen Zuverlässigkeit – der Test umfasst nur den Inhalt des zu prüfenden Materials, der objektiv wissenschaftlich wahr ist und einer rationalen Argumentation unterliegt.

Psychologische und pädagogische Tests im Bildungsbereich weisen tiefgreifende Unterschiede auf. Anna Anastasi schreibt, dass pädagogische Tests die Ergebnisse der Beherrschung eines allen Studierenden gemeinsamen Programmkurses bewerten und psychologische Tests darauf ausgelegt sind, die individuelle Wahrnehmung widerzuspiegeln Lebenserfahrung, die sich in den sozialen und wirtschaftlichen Bedingungen ihres Erwerbs unterscheiden.

Die Ergebnisse psychologischer Tests werden hauptsächlich zur Vorhersage des Erfolgs einer Aktivität verwendet, abhängig von den erhaltenen qualitativen und quantitativen Einschätzungen persönlicher Eigenschaften und Neigungen, oder haben beratenden Charakter bei der Identifizierung persönlicher Probleme, um Wege zu deren Überwindung zu ermitteln.

Pädagogische Tests, insbesondere in der Abschlusskontrolle, geben dem Lehrer Aufschluss über eine quantitative Einschätzung des aktuellen Vorbereitungsstandes des Schülers, der vor allem für Verwaltungs- und Managemententscheidungen gedacht ist.

Es gibt eine Reihe äußerlicher Unterschiede zwischen psychologischen und pädagogischen Tests im Bildungswesen:

    Die Formulierung von Aufgaben (bei psychologischen Tests ist sie meist indirekter Natur, bei pädagogischen Tests ist sie direkter Natur)

    Diagnostik (bei psychologischen Tests gibt es keine „richtigen“ Antworten; es werden Persönlichkeitsmerkmale ermittelt, während bei pädagogischen Tests Wissen geprüft wird und daher eine strikte Übereinstimmung der Antwort des Probanden mit der richtigen Antwort erforderlich ist).

    Interpretationsziele (bei psychologischen Tests werden Persönlichkeitsmerkmale ermittelt, bei pädagogischen Tests wird der Wissenserwerbsstand der Testperson offengelegt).

Manchmal können die Grenzen zwischen den betrachteten Testarten verschwimmen, insbesondere wenn die Tests darauf abzielen, das logische Denken und die kreativen Fähigkeiten der Schüler zu testen.

Da es sich beim Testen um eine einzigartige Methode zur Überwachung und Bewertung von Wissen handelt, die qualitative und quantitative Messungen des Wissensstandes, der psychologischen Merkmale und Präferenzen des Testsubjekts ermöglicht, ist es notwendig, beim Testteilnehmer eine solche psychologische Atmosphäre zu schaffen, dass wird ihm ermöglichen, sich vollständig zu öffnen. Deshalb ist die Entwicklung von Methoden, Anforderungen und Regeln für die Prüfung heute eine wichtige Aufgabe zur Verbesserung der Qualität des Bildungsprozesses.

Gleichzeitig hat die Testform der Wissenskontrolle Gegner, darunter J. Raven.

Raven kritisiert das Testen auf sehr scharfe Weise und weist sowohl auf die wissenschaftlichen als auch auf die ethischen Aspekte der Ausweitung der Testologie im Bildungsbereich hin. Seiner Meinung nach ist die Weigerung von Fachleuten, den Schaden zu berücksichtigen, den die Testpraxis für das Schicksal von Kindern und die Interessen der Gesellschaft verursacht, „äußerst unmoralisch“. Dabei geht es nicht nur um die fehlende Validität und Vorhersagesicherheit kriterienorientierter Tests als solchen, sondern um die Entstehung einer neuen Art der Psychodiagnostik. Neue Diagnosetechniken – darunter J. Raven, darunter die Technik deskriptiver Schlussfolgerungen, Ereignis-Verhaltensinterviews, das Verfahren zur Ermittlung von Werterwartungen – müssen im Vergleich zu allgemein anerkannten Testmessungen eine Reihe grundsätzlich anderer Anforderungen erfüllen: Sensibilität für die Merkmale von die erworbene Erfahrung (Kompetenzsatz), über die jedes Kind verfügen wird; dürfen nur verwendet werden, wenn für das betreffende Kind ein angemessenes Bildungsumfeld geschaffen wird; seine individuellen Fähigkeiten, Interessen und Werte berücksichtigen; die Dynamik der Entwicklung individueller Fähigkeiten aufzeichnen; gewährleisten die Identifizierung unterschiedlicher Begabungstypen von Kindern.

Einen besonderen Platz im Werk von J. Raven nimmt seine Argumentation zur Änderung der Ideologie des Bildungssystems ein, die seiner Meinung nach auf die Bildung einer kompetenten Persönlichkeit abzielen sollte.

Bei J. Raven fungiert der Kompetenzbegriff als führende inhaltliche Grundlage, die es uns ermöglicht, die vier wichtigsten Schlussfolgerungen zum Bedarf zu formulieren: erstens eine Revision der Ansichten über die Fähigkeiten jedes Kindes, denn alle Schüler können durch die Umsetzung ihrer Kompetenzen kompetent werden Auswahl in einer breiten Palette von Aktivitäten; Dementsprechend muss der Lehrer lernen, jedes Kind aus der Sicht seiner einzigartigen Eigenschaften zu sehen, die für den Erfolg in einem bestimmten Spezialbereich wichtig sind; zweitens, Neuformulierung der Bildungsziele; die Aufgabe der Persönlichkeitsentwicklung auf der Grundlage der Individualisierung des Lernens steht im Vordergrund; drittens Veränderungen in den Lehrmethoden, die dazu beitragen sollen, die Kompetenzen der Studierenden entsprechend ihren persönlichen Neigungen und Interessen zu erkennen und weiterzuentwickeln; Als wichtigstes didaktisches Instrument wird die Verwendung der Projektmethode vorgeschlagen; viertens eine radikale Ablehnung traditioneller Verfahren zur Prüfung von Schülern und zur Bewertung von Bildungsprogrammen.

Kapitel 2 Pädagogische Tests, ihr Inhalt, Aufbau, Formen und Typen

2.1 Historische Grundlagen pädagogischer Prüfung

Moderne pädagogische Tests haben ihre eigene Geschichte.

F. Galton (1882-1911) untersuchte individuelle Unterschiede und verwendete bestimmte Techniken (zur Bestimmung der Hör- und Sehempfindlichkeit, der Reaktionszeit usw.). F. Galton identifizierte drei Grundprinzipien der Testtheorie, die derzeit verwendet werden:

    Anwenden einer Reihe identischer Tests auf eine große Anzahl von Probanden.

    Statistische Verarbeitung der Ergebnisse.

    Identifizierung von Bewertungsstandards.

F. Galton nannte die in seinem Labor durchgeführten Tests mentale Tests.

James McKean Cattell (1860-1944) machte den Begriff mit seinem Artikel „Mental Tests and Measurements“ aus dem Jahr 1890 populär. Er entwickelte und nutzte Aufgabenstellungen zur Bestimmung der „intellektuellen Physiognomie“. J. Cattell war ein glühender Befürworter und Förderer der Testmethode; er glaubte, dass der Test nur dann ein Mittel zur Durchführung eines wissenschaftlichen Experiments sei, wenn die entsprechenden Voraussetzungen erfüllt seien:

    Identische Bedingungen für alle Probanden – das Prinzip ist die Grundlage für die Standardisierung des Testverfahrens;

    Begrenzung der Testzeit;

    Identische Anweisungen und ein klares Verständnis der Probanden darüber, was zu tun ist – das Prinzip bildet die Grundlage für die Standardisierung des Prüfverfahrens;

    Abwesenheit von Zuschauern im Labor, in dem das Experiment durchgeführt wird;

    Zum Testen verfügbare Ausrüstung;

    Durchführung statistische Analyse Testergebnisse – das Prinzip wird in Methoden der statistischen Analyse und Modellierung umgesetzt.

Die von J. Cattell identifizierten Anforderungen bilden die Grundlage der modernen Testologie.

Die Arbeit des französischen Psychologen Alfred Binet (1857-1911) zur Diagnose des Entwicklungsstandes der Intelligenz gab der Entwicklung der Testologie einen wesentlichen Impuls. Im Jahr 1904 trat Binet der Kommission für die Schaffung in Paris bei Sonderschulen für geistig behinderte Kinder. Es galt, lernfähige, aber lernfaule und lernunwillige Kinder von angeborenen Defekten zu trennen. Tatsächlich war die Verwendung dieses Tests der erste Versuch, individuelle Unterschiede zwischen Kindern durch Messung ihrer Kinder festzustellen geistige Entwicklung.

Lange Zeit wurden Tests als Hilfsmittel für Einzelmessungen entwickelt. Es bestand die Notwendigkeit, von Einzeltests zu Gruppentests überzugehen. 1917-1919 Die ersten Gruppentests für die Armee fanden in den USA statt. Die beliebtesten Tests waren die von Arthur Sintos Otis (1866-1963) entwickelten Tests. Die bei der Zusammenstellung dieser Tests verwendeten Grundprinzipien bildeten die Grundlage für die gesamte Methodik der Gruppentests:

    Das Prinzip der zeitlichen Begrenzung.

    Das Prinzip der detaillierten Anleitung sowohl in Bezug auf die Prüfung als auch in Bezug auf die Ergebnisberechnung.

    Es wurden Tests mit einer selektiven Methode zur Generierung einer Antwort eingeführt.

    Auswahl der Tests nach sorgfältiger statistischer Verarbeitung und experimenteller Prüfung.

Gleichzeitig werden Methoden zur Verarbeitung von Testergebnissen und zur Erstellung von Testsystemen entwickelt:

    Methode des statistischen Vergleichs zweier Variablenreihen und Einführung eines gemeinsamen Verhältnisindex – Korrelationskoeffizient (F. Galton);

    Konstruktion von Regressionslinien einer Variablen auf eine andere (F. Galton);

    Korrelationstheorie (K. Pearson, C. Spearman);

    Faktorenanalyse (L. Thurstone).

V. McCall unterteilte die Tests in pädagogische, deren Hauptaufgabe darin bestand, den Erfolg von Schülern in Schulfächern über einen bestimmten Studienzeitraum sowie den Erfolg der Anwendung bestimmter Lehrmethoden zu messen, und in psychologische – um a zu bestimmen bestimmten Entwicklungsstand.

Die Entwicklung des ersten pädagogischen Tests gehört dem amerikanischen Psychologen E. Tondike. Das Ergebnis davon Forschungsarbeit Auf dem Gebiet der Messung und Verwendung der Testmethode in der Pädagogik erschien das Buch „Einführung in die Theorie der Psychologie und sozialen Messungen“ (1904). Der erste standardisierte pädagogische Test, veröffentlicht unter der Leitung von E. Thorndike, ausgestattet mit Standards – ein Test zur Lösung arithmetischer Probleme.

1915 - Erstellung einer Versuchsreihe mit einem modifizierten System zur Berechnung der Versuchsergebnisse (Yerkes).

Zu Beginn des 20. Jahrhunderts. Die Entwicklung und Erprobung von Tests erfolgt durch spezielle staatliche Stellen.

1900 – Gründung des Board of Entrance Examinations in den Vereinigten Staaten.

1926 – Das College Board verabschiedet den SAT-Test, der für die Qualifikation und berufliche Beurteilung eines Lehrers entwickelt wurde.

1947 – Gründung eines Prüfdienstes, der als repräsentativstes Forschungszentrum gilt.

Es kann festgestellt werden, dass amerikanische Autoren normalerweise die sogenannte empirische Strategie verwenden, bei der eine große Menge von Testproblemen ohne System oder interne Logik erstellt und nach der Anwendung auf eine große Anzahl von Probanden die Ergebnisse einer Korrelation unterzogen werden Faktorenanalyse.

Bis 1917 wurde den Testfragen in Russland nicht genügend Aufmerksamkeit geschenkt. Praktische Anwendung fanden die Tests nach 1925, als in der pädagogischen Abteilung des Instituts für Schularbeitsmethoden eine Prüfungskommission eingerichtet wurde (zu deren Aufgaben unter anderem die Entwicklung standardisierter Tests für Schulen gehörte). Im Frühjahr 1926 wurden Tests auf Basis amerikanischer Tests veröffentlicht.

Prominente russische Psychologen und Lehrer beschäftigten sich mit dem Problem der Testentwicklung: P.P. Blonsky, M.S. Bernstein, S.M. Vasileisky, A.M. Schubert et al.

Es wurden Tests entwickelt, um Lese-, Rechen- und Schreibfähigkeiten zu messen. eine Skala zur Messung der geistigen Entwicklung von Kindern; Tests zur kollektiven Prüfung der geistigen Begabung; Schulerfolgstests für Massenuntersuchungen von Kindern in Regelschulen.

1936 wurden die Tests als „bürgerlich und schädlich“ verboten. Positive Anwendungsbeispiele wurden nicht berücksichtigt. Seit über vierzig Jahren herrscht in der Testentwicklung und -nutzung eine Phase der Stagnation. Die Entwicklung der Testologie ist mit den Werken von N.F. verbunden. Talyzina über programmiertes Training, V.P. Bespalko zu Problemen der pädagogischen Technologie, D.B. Elkonina und andere.

Derzeit ist die Frage nach der Notwendigkeit von Prüfungen in der Pädagogik durch die Praxis positiv gelöst. Allerdings sind dadurch eine Reihe von Problemen entstanden, für deren Lösung das gesamte Bildungssystem als Ganzes nicht bereit ist.

Das moderne Verständnis von Tests und dem Testprozess lässt sich in Ebenen einteilen. Im Werk von A.N. Mayorov identifizierte drei solcher Ebenen:

Drittes Level

(„wissenschaftlich“)

Dieses Niveau ist das genaueste, weil berücksichtigt die Merkmale von Tests und spiegelt die Anforderungen an diese wider, die im Prozess der Entwicklung und wissenschaftlichen Begründung von Tests auftreten.

Zweites Level

("Wortschatz")

In diesem Verständnis werden die Hauptkomponenten des Testkonzepts hervorgehoben, die für einen bestimmten Anwendungsbereich spezifischen Besonderheiten des Verfahrens zur Erstellung, Verwendung und Analyse jedoch nicht berücksichtigt.

Erste Ebene

("inländisch")

Unter dem Test versteht man eine Reihe von Fragen mit möglichen Antworten, die mit Rätseln und Kreuzworträtseln vergleichbar sind.

Der aktuelle Stand der Tests liegt auf der zweiten Ebene der Verständnistests, es besteht jedoch der Wunsch nach der dritten Ebene durch die Schaffung spezieller Testzentren: des Zentrums zur Bewertung der Bildungsqualität des Instituts für Allgemeinbildung der Russischen Akademie Bildung, das Prüfungszentrum für Absolventen allgemeinbildender Einrichtungen der Russischen Föderation, das Zentrum für psychologische und berufliche Prüfungen der Moskauer Staatlichen Universität usw. Diese Zentren lösen einen Komplex didaktischer Aufgaben:

    entwickeln Sie die Testologie unter Berücksichtigung der gesammelten weltweiten pädagogischen und psychologischen Erfahrungen mit einem Fokus auf Neues Informationstechnologie;

    Entwicklung hochwertiger Diagnosetools für die operative, objektive Überwachung;

    ein mathematisch-statistisches Gerät zur Verarbeitung quantitativer Informationen auf der Grundlage von Testergebnissen entwickeln;

    sorgen für einen Übergang von theoretisches Niveau Forschung zum Empirischen;

    ein System zur Beobachtung des Zustands und der Veränderungen, Bewertung und Prognose in Bezug auf die Qualität der Bildung schaffen.

Die Entwicklung und Etablierung von Prüftechnologien ermöglicht es, den Prozess des Erwerbs einer Ausbildung statistisch genau zu analysieren und weitere Entwicklungsperspektiven zu erkennen.

2.2 Klassifizierung pädagogischer Prüfungen

Eine Analyse der ausländischen und inländischen Literatur zeigt, dass es mehrere Ansätze für dieses Problem gibt.

Kurzbeschreibung verschiedene Arten Pädagogische Tests sind in Tabelle 2.1 dargestellt.

Tabelle 2.1 – Klassifizierung pädagogischer Tests

pädagogische Prüfung

Beschreibung

zur Interpretationsmethodik (V.S. Avanesov):

    normativ orientiert

Ein normativ orientierter pädagogischer Test ermöglicht es, die Bildungsleistungen (Ausbildungsstand, Stand der beruflichen Kenntnisse und Fähigkeiten) einzelner Testteilnehmer miteinander zu vergleichen.

Mithilfe normativ orientierter pädagogischer Tests werden verlässliche und normalverteilte Ergebnisse für den Vergleich zwischen Testteilnehmern ermittelt.

    kriterienbasiert

Kriterienbasierte pädagogische Tests werden verwendet, um Testergebnisse entsprechend dem Kompetenzniveau der Testteilnehmer in einem genau definierten Inhaltsbereich zu interpretieren. Der Einsatz kriterienbasierter Tests für die aktuelle, mittlere und abschließende Zertifizierung von Studierenden wird immer wichtiger. Lehrer können die Ergebnisse kriterienbezogener Tests nutzen, um den Vorbereitungsstand der Schüler genau einzuschätzen. Tests dieser Art ermöglichen es, den Fortschritt der Studierenden zu überwachen und Mängel in der Vorbereitung rechtzeitig zu erkennen.

je nach Homogenitätsgrad der Aufgaben:

    homogen

Eine homogene pädagogische Prüfung basiert auf den Inhalten eines einzelnen Fachs. Bei der Entwicklung müssen die Autoren klar darauf achten, dass jede Aufgabe inhaltlich nicht über den Rahmen des jeweiligen Faches hinausgeht. Ein homogener Test kann je nach Zweck seiner Erstellung entweder normativ oder kriterienorientiert sein. Diese Art von pädagogischem Test kommt im Bildungsprozess am häufigsten vor.

    heterogen

Ein heterogener pädagogischer Test basiert auf den Inhalten mehrerer akademischer Fächer. Ein heterogener pädagogischer Test ist im Wesentlichen interdisziplinär. In den meisten Fällen umfasst jede Aufgabe eines heterogenen Tests inhaltliche Elemente mehrerer Fächer. Bei der Entwicklung müssen Autoren die Ziele ihrer Entstehung verstehen und in vielen Disziplinen kompetent sein. Naturgemäß ist ein heterogener Test für Autoren deutlich schwieriger als ein homogener. Eine Art heterogener Tests ist eine Reihe homogener Tests, d. h. Ein heterogener Test kann aus mehreren homogenen Teilen (Untertests) bestehen.

je nach Präsentationsform:

    Papier

Pädagogische Papiertests , Die auf Papier in Form eines Ausdrucks präsentierten Themen sind sowohl im Inland als auch im Ausland am weitesten verbreitet und traditionell. Das Speichern, Bearbeiten und variable Drucken eines pädagogischen Tests unter modernen Bedingungen sollte jedoch mit spezieller Software erfolgen. Besonderes Augenmerk von Entwicklern und Anwendern papierbasierter pädagogischer Tests sollte auf die Qualität des Drucks, die Fehlerfreiheit und die korrekte Anordnung der Aufgaben gelegt werden. Aus wirtschaftlicher Sicht sind Papiertests weiterhin die zugänglichsten und günstigsten.

    Computer

Computerpädagogische Tests haben ihre eigenen Besonderheiten, die bei der Entwicklung berücksichtigt werden müssen. Die Analyse von Informationen auf einem Computerbildschirm ist aufgrund der falschen Darstellung des Materials oft schwierig. Obwohl es computergestützte Tests sind, die ihre Vorteile und Aussichten für die Anwendung in der Bildung haben. Eine besondere Rolle kommt dabei dem computeradaptiven Testen zu, bei dem jedem Probanden ein einzigartiger Aufgabensatz gestellt wird. In entwickelten Ländern gewinnen computeradaptive Tests, insbesondere die Nutzung lokaler und globaler (Internet-)Netzwerke, zunehmend an Bedeutung. Leider lässt unser Rückstand in der Testtheorie und -technologie den Einsatz computeradaptiver Tests im Bildungsprozess noch nicht zu. Dabei ist zu beachten, dass der Einsatz von Computern für Massentests aus wirtschaftlicher Sicht um ein Vielfaches teurer ist.

    Thema

Die Leistung von Probandentests hängt von der Geschwindigkeit und Korrektheit der Aufgabe ab.

    Hardware

Tests mit Geräten zur Untersuchung der Eigenschaften von Aufmerksamkeit, Wahrnehmung, Gedächtnis und Denken.

nach Richtung:

    Intelligenztests

Intelligenztests offenbaren Merkmale intellektueller Fähigkeiten.

    Persönlichkeitstests

Persönlichkeitstests sollen den Motivations-Bedürfnis-Bereich des Einzelnen diagnostizieren.

nach Verwendungszweck:

    vorläufige Determinante

Der vorläufige Einstufungstest dient der Beurteilung anfänglicher Fähigkeiten und deckt einen sehr kleinen Wissensbereich ab.

    prägend

Der formative Test deckt einen begrenzten Ausbildungsabschnitt (Kapitel, Abschnitt) ab.

    diagnostisch

Der Diagnosetest konzentriert sich mehr auf häufige Fehler

    summieren

Ein summativer Test enthält in der Regel Fragen mit einem höheren Schwierigkeitsgrad.

nach Verwendungszweck:

Mit Basistests können Sie die Beherrschung grundlegender Konzepte auf reproduktiver und algorithmischer Ebene überprüfen.

    diagnostisch

Ein diagnostischer Test ermöglicht es, nicht nur Wissenslücken zu einem Thema, sondern auch den Grad der Assimilation und Lernfähigkeit des Studierenden zu erkennen.

    thematisch

Am Ende des Studiums eines Themas wird ein thematischer Test durchgeführt, der es Ihnen ermöglicht, den Umfang und den Grad der Assimilation zu erfassen.

    Finale

Der Abschlusstest wird am Ende des sechsmonatigen Kurses pro Jahr durchgeführt, um den Umfang und den Grad der Beherrschung des Materials zu ermitteln.

3.3 Anforderungen an pädagogische Tests, ihre Vor- und Nachteile

Die moderne Theorie der Modellierung pädagogischer Tests betrachtet das Testverfahren und die Bewertung des Wissens der Testpersonen als einen Prozess der objektiven Messung, und die Ergebnisse solcher Messungen, die mit standardmäßigen mathematischen Methoden erzielt werden, werden von standardmäßigen Genauigkeitsmerkmalen begleitet. In der Testliteratur wird den Anforderungen an pädagogische Tests viel Aufmerksamkeit geschenkt. Darunter sind Anforderungen wie die Übereinstimmung der Prüfungsinhalte mit den Prüfungszielen, die Feststellung der Bedeutung des zu prüfenden Wissens, der Zusammenhang zwischen Inhalt und Darstellungsform der Prüfungsaufgaben sowie die Übereinstimmung der Prüfungsinhalte mit den zu nennen Niveau von aktuellen Zustand Wissenschaft, Komplexität, Konsistenz der Testinhalte. Nach der klassischen Testtheorie sind Zuverlässigkeit, Validität und Wirksamkeit die wichtigsten Konzepte, die ein professionell gestalteter pädagogischer Test erfüllen muss.

Die Testzuverlässigkeit wird durch die Stabilität und Stabilität der Indikatoren bei wiederholten Messungen mit demselben Test oder einem gleichwertigen Ersatz charakterisiert. Es wird festgestellt, dass die Zuverlässigkeit des Tests umso geringer ist, je höher die thematische und inhaltliche Vielfalt der Testaufgaben ist. Ein Test, der darauf abzielt, die Beherrschung eines bestimmten Themas zu testen, ist immer zuverlässiger als ein Test, der darauf abzielt, den gesamten Abschnitt (Kurs) zu testen, der eine erhebliche Menge an Material abdeckt – Muster, Konzepte, Fakten.

Die Zuverlässigkeit von Tests hängt maßgeblich von der Schwierigkeit ihrer Durchführung ab, die durch das Verhältnis richtiger und falscher Antworten auf Testaufgaben bestimmt wird. Die Einbeziehung von Aufgaben in Tests, die alle Studierenden richtig oder umgekehrt falsch beantworten, verringert die Zuverlässigkeit des Tests insgesamt stark. Den größten praktischen Wert haben die Aufgaben, die von 45-80 % der Studierenden richtig beantwortet werden.

Die Testzuverlässigkeit ist ein Merkmal, das die Genauigkeit der Messung und die Stabilität der Ergebnisse gegenüber dem Einfluss fremder Zufallsfaktoren widerspiegelt. Dies bedeutet, dass eine kleine Änderung der Testbedingungen und des Zustands der Probanden zu einer unbedeutenden Änderung der Endergebnisse führen sollte.

Es ist zu beachten, dass eine Erhöhung der Anzahl der Testelemente zur Erhöhung der Zuverlässigkeit beiträgt. Allerdings z echte Prüfung Es ist problematisch, einen Test mit einer ausreichend großen Anzahl an Aufgaben zu erstellen. Dies ist auf zeitliche Einschränkungen, Hygienestandards, Materialkosten, menschliche Fähigkeiten usw. zurückzuführen.

Die inhaltliche Gültigkeit des Tests kommt den Anforderungen an Vollständigkeit, Umfang der Prüfung und proportionale Darstellung aller Elemente der zu untersuchenden Kenntnisse und Fähigkeiten nahe. Der Begriff „validity“ stammt aus dem Englischen. gültig – bedeutsam, wertvoll. Es ist immer zu bedenken, dass der Testschreiber alle Abschnitte des Lehrplans und der Lehrbücher sorgfältig studieren und über gute Kenntnisse des Zwecks und der spezifischen Lernziele verfügen muss. Nur dann kann er Tests erstellen, die für eine bestimmte Kategorie von Studenten effektiv sind.

Eine klare und eindeutige Formulierung der Fragestellung im Rahmen des erworbenen Wissens ist eine wesentliche Voraussetzung für die Validität des Tests. Wenn der Test über die Grenzen der erlernten Inhalte hinausgeht oder diese Grenzen nicht erreicht, das vorgesehene Ausbildungsniveau überschreitet, ist er für die Studierenden, an die er sich richtet, nicht wirksam.

Zusätzlich zu den berücksichtigten Anforderungen wird auch der Testeffektivitätsindikator verwendet. Als effektiver gilt ein Test, der unter sonst gleichen Bedingungen eine größere Anzahl an Antworten pro Zeiteinheit liefert. Beispielsweise können Sie in 10 Testminuten 5, 8 oder 10 Antworten von Schülern erhalten, die verschiedene Methoden zum Verfassen von Testaufgaben verwenden.

Der Vorteil der Testkontrolle besteht darin, dass es sich um eine wissenschaftlich fundierte Methode handelt empirische Forschung und ermöglicht in einem bestimmten Bereich, spekulative Wissenseinschätzungen zu überwinden. Es sei darauf hingewiesen, dass die von vielen Lehrern verwendeten und von ihnen als Tests bezeichneten Aufgaben in Wirklichkeit überhaupt keine solchen sind. Im Gegensatz zu gewöhnlichen Aufgaben haben Testaufgaben eine klare, eindeutige Antwort und werden standardisiert anhand eines Preisschilds bewertet. Im einfachsten Fall ist die Note eines Schülers die Summe der Punkte für richtig erledigte Aufgaben. Testaufgaben müssen kurz, klar und korrekt sein und dürfen keine Unklarheiten zulassen. Der Test selbst ist ein System von Aufgaben mit zunehmendem Schwierigkeitsgrad. Die Testkontrolle kann als Mittel zur aktuellen, thematischen und Meilensteinkontrolle sowie in einigen Fällen als Endkontrolle eingesetzt werden.

Natürlich dort, wo Wissen und Lehrmaterial leichter strukturiert und formalisiert werden können, wie zum Beispiel in Naturwissenschaften, ist das Schreiben von Testaufgaben einfacher. Gleichzeitig basieren alle wissenschaftlichen Disziplinen, darunter auch die Geschichte, auf Grundlagenwissen. In der Geschichte umfasst dies das Wissen über Ereignisse, Daten, Namen, Definitionen grundlegender Konzepte und vieles mehr. Die Prüfung des Grundwissens mittels Testkontrolle ermöglicht es dem Lehrer, in der verbleibenden Zeit mehr Aufmerksamkeit auf die Kommunikation mit den Schülern auf der Ebene von Konzepten und Schlussfolgerungen zu richten und nicht so viel Wissen wie traditionelle Formen, sondern das Verständnis für die Probleme eines bestimmten Lehrers zu testen Disziplin. Es ist hervorzuheben, dass es sich bei der Prüfungskontrolle um die Überprüfung des Grundwissens handelt.

Die Prüfungskontrolle ohne großen Zeitaufwand ermöglicht Ihnen die Befragung aller Studierenden in allen Abschnitten des Studienfaches. Die Summe der Noten kann eine Wissensbewertung bilden, die nach Ermessen des Lehrers als Grundlage für die Befreiung des Schülers von der Abschlussarbeit dienen kann. Tests locken Studierende durch ihre Ungewöhnlichkeit im Vergleich zu herkömmlichen Kontrollformen, regen sie zum systematischen Studium des Faches an und schaffen zusätzliche Lernmotivation.

Zu den Vorteilen der Teststeuerung gehören:

    Der individuelle Charakter der Kontrolle, die Fähigkeit, die Arbeit jedes Schülers und seine persönlichen Bildungsaktivitäten zu kontrollieren.

    Die Möglichkeit einer regelmäßigen, systematischen Prüfung in allen Phasen des Lernprozesses.

    Die Möglichkeit der Kombination mit anderen traditionellen Formen der pädagogischen Kontrolle.

    Die Vollständigkeit, die darin besteht, dass die pädagogische Prüfung alle Abschnitte des Lehrplans abdecken kann, bietet eine vollständige Prüfung des theoretischen Wissens sowie der intellektuellen und praktischen Fähigkeiten.

    Objektivität der Prüfungskontrolle, Ausschluss subjektiver (oft fehlerhafter) Werturteile und Schlussfolgerungen des Lehrers, die auf einer unzureichenden Untersuchung des Vorbereitungsniveaus der Schüler oder einer voreingenommenen Einstellung gegenüber einigen von ihnen beruhen.

    Buchhaltung Spezielle Features jedes Studienfach und seine einzelnen Teilbereiche durch den Einsatz moderner Entwicklungsmethoden und vielfältiger Prüfungsaufgabenformen.

    Möglichkeit der traditionellen („Papier“) und computergestützten Durchführung (in lokales Netzwerk) testen.

    Möglichkeit des Einsatzes moderner Computerprüftechnik.

    Möglichkeit groß angelegter, standardisierter Massentests durch Drucken und Replizieren paralleler Formen (Varianten) des Tests.

    Unter Berücksichtigung der individuellen Merkmale einer bestimmten Stichprobe von Probanden ist der Einsatz verschiedener Methoden zur Entwicklung eines Tests und von Testaufgaben entsprechend diesen Merkmalen erforderlich.

    Einheitliche Anforderungen für alle Testteilnehmer, unabhängig von ihren bisherigen Bildungsleistungen.

    Standardisierung der Teststeuerung.

    Differenzierung der Testergebnisskala, die eine Einstufung des Bildungsniveaus in einem weiten Bereich ermöglicht.

    Hohe Zuverlässigkeit der Testkontrolle, sodass wir von einer vollwertigen pädagogischen Messung des Ausbildungsniveaus sprechen können.

    Hohe prädiktive Validität der Aufnahmetests, die es ermöglicht, den Erfolg der Studierenden in der Zukunft vorherzusagen.

    Hohe (aktuelle) Kriteriumsvalidität der abschließenden Zertifizierungstests.

    Die Wirksamkeit des pädagogischen Tests, der die Überwachung einer beliebigen Stichprobe von Probanden in kurzer Zeit und mit minimalen Kosten ermöglicht.

    Durch die richtige Organisation der Prüfungen und den Einsatz von Informationssicherheitsmethoden ist es möglich, die unehrliche Einstellung einiger Studierender gegenüber der Durchführung schriftlicher Prüfungen (Betrug, Hinweise, Spickzettel usw.) zu beseitigen.

    Die Prüfungskontrolle regt die ständige Arbeit aller Studierenden an, und dies wird bis zu einem gewissen Grad durch die Durchführung groß angelegter Tests erreicht, die für die Probanden unerwartet sind.

    Möglichkeit der Berücksichtigung regionaler Besonderheiten bei der Prüfung.

Zu den Nachteilen des Testens gehören:

    In Testaufgaben wird Wissen dogmatisiert, es gibt keine Kreativität oder gemeinsame Suche nach der Wahrheit.

    Die Lösung jeder Testaufgabe enthält ein Element des Zufalls.

    Die Testkontrolle trägt zur Fragmentierung des Wissens bei.

    Tests standardisieren Wissen und entwickeln die Denkfähigkeiten der Schüler nicht vollständig.

    Tests überprüfen das Bewusstsein des Schülers für bestimmte Fakten und geben keinen Aufschluss über die Fähigkeiten und Fertigkeiten des Schülers [2].

Der derzeit größte Nachteil der Wissensprüfung in unserem Land ist die Fülle an unsystematisiertem Testmaterial unterschiedlicher Qualität.

In jüngster Zeit sind neue originelle Methoden zur Entwicklung und Verwendung von Tests entstanden. Moderne Tests ermöglichen es, Kenntnisse und Fähigkeiten von Probanden offenzulegen, die dem oberflächlichen Blick verborgen bleiben.

Die Verwirklichung der Vorteile pädagogischer Tests kann daher nur unter Berücksichtigung der Anforderungen der klassischen Testtheorie erreicht werden, auf deren Grundlage die Zuverlässigkeit, Validität und Wirksamkeit der Testüberwachung des Wissens der Studierenden sichergestellt werden kann. Natürlich können nicht alle notwendigen Merkmale der Assimilation durch Tests ermittelt werden. Beispielsweise können Indikatoren wie die Fähigkeit, die eigene Antwort anhand von Beispielen zu präzisieren, die Kenntnis von Fakten, die Fähigkeit, seine Gedanken kohärent, logisch und nachweisbar auszudrücken, und einige andere Merkmale von Wissen, Fähigkeiten und Fertigkeiten nicht durch Tests diagnostiziert werden. Dies bedeutet, dass die Prüfung zwingend mit anderen (traditionellen) Formen und Methoden der Verifizierung kombiniert werden muss.

Abschluss

Als Ergebnis der theoretischen Betrachtung des Materials wurden die folgenden Schlussfolgerungen gezogen.

Ein Test ist eine standardisierte Aufgabe, anhand deren Ergebnisse die psychophysiologischen und persönlichen Eigenschaften sowie die Kenntnisse, Fähigkeiten und Fertigkeiten der Testperson beurteilt werden.

Ein pädagogischer Test kann im Gegensatz zu einem Test als eine Art Messgerät mit einer bestimmten Auflösung und Genauigkeit betrachtet werden. Der Messgegenstand ist hier äußerst spezifisch und daher hängen die Ergebnisse maßgeblich von der Fähigkeit ab, diesen Gegenstand rational zu formalisieren.

Ein Test ist ein Werkzeug bestehend aus einem qualimetrisch verifizierten System von Testaufgaben, einem standardisierten Verfahren und einer vorgefertigten Technologie zur Verarbeitung und Analyse von Ergebnissen zur Messung von Persönlichkeitsqualitäten und -eigenschaften, deren Veränderung im Rahmen einer systematischen Ausbildung möglich ist .

Ein Test ist ein kurzer standardisierter Test, der eine quantitative Bewertung der Ergebnisse anhand ihrer statistischen Verarbeitung ermöglicht.

Die Auswahl der Struktur der Testaufgaben hängt davon ab, welche Indikatoren und Faktoren für den Forscher für einen bestimmten Personenkreis von Interesse sind. Jede Testaufgabe stellt für den Testteilnehmer grundsätzlich eine Frage oder ein Problem dar. Die Antwort auf eine Frage besteht immer darin, einige Zweifel, Bedenken und Unsicherheiten in der betrachteten Situation zu beseitigen, um neue, genauere Erkenntnisse zu gewinnen.

Jedes der Testitems enthält eine Beschreibung einer „Situation“ aus Natur, Produktion, praktische Tätigkeiten Person usw. Es kann in verschiedenen „Sprachen“ dargestellt werden: verbal, in der Sprache von Symbolen, Grafiken, Bildern usw. Da jede Beschreibung immer nur annähernd und unvollständig ist, steht die Testperson vor der „Anforderung“, die Aufgabensituationen genauer und vollständiger zu gestalten und zu diesem Zweck „Informationen für die Entscheidung“ zu nutzen, die in der Beschreibung der Situation, dem Text, enthalten sind der Aufgabe, und auch durch die Einbeziehung „externer“ Informationen, die dem Subjekt bekannt sind wissenschaftliche Fakten, Muster usw. Bei der Lösung einer Aufgabe ist es notwendig, die Situation neu zu modellieren, indem eine Reihe von Annahmen und Abstraktionen eingeführt werden, die die Lösung vereinfachen, indem die Beschreibung von einer Sprache in eine andere verschoben wird.

Unter den Testaufgaben ist zu unterscheiden:

    Informationsaufgaben;

    Aufgabe, deren Lösung algorithmisch und formalisiert erfolgen kann;

    Probleme, deren Lösung eine heuristische und nicht standardisierte Suche erfordert.

Die im Text einer Aufgabe enthaltenen Informationen können explizit oder in versteckter Form dargestellt werden, sodass mehr oder weniger komplexe Operationen ausgeführt werden müssen, was die Komplexität der Aufgaben erhöht. Das ist das Erste.

Zweitens handelt es sich bei dem Test um einen „standardisierten Test“, d. h. ein Test, bei dem alle Aufgaben ausführenden Personen unter denselben, genau festgelegten Bedingungen arbeiten. Nur so können Sie Testergebnisse vergleichen und die Messergebnisse auf eine Zahl bringen. Das in den Tests verwendete standardisierte Bewertungsformular ermöglicht es, den Leistungsstand des Schülers im gesamten Studienfach und in seinen einzelnen Abschnitten mit dem durchschnittlichen Leistungsstand der Schüler in der Klasse und dem Leistungsstand jedes Einzelnen in Beziehung zu setzen.

Drittens ermöglicht der Test eine „quantitative Bewertung“ der Testergebnisse. Da ständig wechselnde, nichtdiskrete Größen gemessen werden sollen, werden spezielle Skalen verwendet, um die Messergebnisse auf Zahlen zu reduzieren. Eine Skala ist eine bestimmte Folge numerischer Werte der Ergebnisse von Messoperationen, die auf ein empirisches System angewendet werden.

Der Leitgedanke eines traditionellen Tests besteht darin, das Wissen möglichst vieler Testpersonen in kurzer Zeit, schnell, effizient und zu geringsten Kosten zu vergleichen.

Die Ergebnisse der von den Probanden durchgeführten Aufgaben enthalten vielfältige Informationen in versteckter Form. Es gibt nur eine Möglichkeit, es zu extrahieren: Vergleichen Sie die Ergebnisse der Erledigung einer ausreichend großen Anzahl von Aufgaben (Sammeln von Statistiken). Nur so können wir vertrauenswürdige Schlussfolgerungen ziehen.

Literaturverzeichnis

    Bespalko V.P. Komponenten der pädagogischen Technologie / V.P.

Fingerlos. – M.: Pädagogik, 2005. – 296 S.

2. Avanesov V.S. Grundlagen der wissenschaftlichen Organisation der Pädagogik

Kontrolle in der Hochschulbildung / V.S. Avanesov. – M., 1989. – 168 S.

3. Hochschulpädagogik: Lehrbuch. Zulage / Z.B. Skibitsky, V.V. Egorov, S.M. Udartseva, G.M. Smirnova, I.I. Erakhtina, V.V. Gotting – 2. Aufl. hinzufügen. und verarbeitet – Karaganda: KSTU, 2013. – 409 S.

    Efremova N.F.. Moderne Testtechnologien in der Bildung: wissenschaftliche Veröffentlichung / N. F. Efremova; Ross. Universität der Völkerfreundschaft. - M.: Logos, 2003. - 175 S.

    A. Anastasi, S. Urbina; [Übersetzung aus dem Englischen und allgemeine wissenschaftliche Bearbeitung von A. A. Alekseev] – 7. Auflage. - St. Petersburg [usw.]: Peter, 2009. - 687 S.

    Raven John Pädagogische Prüfung: Probleme, Missverständnisse, Perspektiven / Übers. aus dem Englischen: „Cogito-Center“; Moskau; 1999. – 144 S.

    http://www.edufacts.ru

    Mayorov A. N. Theorie und Praxis der Erstellung von Tests für das Bildungssystem (Wie man Tests für Bildungszwecke auswählt, erstellt und verwendet) M.: Intellect Center, 2005. - 296 S.

    Pädagogik: Lehrbuch für Bachelor / Ed. PI. Schwuchtel. – 3. Aufl. korr. hinzufügen. – M.: Yurayt, 2012. – 511 S.

    Zagvyazinsky V.I. Pädagogik / Hrsg. IN UND. Zagvyazinsky. – 2. Aufl., gelöscht. – M.: Aademia, 2012. - 351 S.

    Pädagogik: Lehrbuch für Bachelor / Ed. Hrsg. L.S. Podymova, V.A. Slastenina. – M.: Yurayt, 2012. – 332 S.

Prüfen Es handelt sich um eine objektive und standardisierte Messung, die quantifiziert, statistisch verarbeitet und verarbeitet werden kann vergleichende Analyse. Der Test dient der Feststellung der Kenntnisse des Probanden und muss eine Reihe von Grundsätzen erfüllen:

1. Anwendung einer Reihe identischer Tests auf eine große Anzahl von Probanden.

2. Statistische Verarbeitung der Ergebnisse.

3. Identifizierung von Bewertungsstandards.

IN dieser Moment Testaufgaben werden in Bildungseinrichtungen unseres Landes häufig zum Lernen und Auswendiglernen von Lehrmaterialien verwendet. Eine der wichtigen Aufgaben des Testens ist die schnelle und zuverlässige Einschätzung des Wissens einer Person. Die Theorie pädagogischer Tests wird als Teil der pädagogischen Qualimetrie betrachtet. Der Stand der Wissenskontrolle von Schülern mithilfe von Testmessgeräten wurde untersucht und die Hauptprobleme bei der Verwendung von Tests wurden identifiziert: die Qualität und Gültigkeit des Inhalts von Testaufgaben, die Zuverlässigkeit von Testergebnissen, die Mängel bei der Verarbeitung von Ergebnissen gemäß der klassischen Testtheorie, mangelnde Nutzung der modernen Theorie der Verarbeitung von Testmaterialien mithilfe von Computertechnologie. Der hohe Messfehler der Testergebnisse lässt keine Aussage über die hohe Zuverlässigkeit der Messergebnisse zu.

Vor- und Nachteile des Testens.

Einer der Nachteile der Testmethode zur Wissenskontrolle von Studierenden besteht darin, dass die Erstellung von Tests, deren Vereinheitlichung und Analyse mit viel mühsamer Arbeit verbunden sind. Um den Test zur vollen Einsatzbereitschaft zu bringen, ist es notwendig, statistische Daten über mehrere Jahre zu sammeln, mindestens bei einem Zustrom von 100-120 Studierenden. Es können auch andere Schwierigkeiten auftreten. Bei der Gestaltung des Inhalts der Prüfungen selbst, bei der Auswahl und Formulierung der Prüfungsfragen besteht häufig eine erhebliche Subjektivität; vieles hängt auch vom konkreten Prüfungssystem, davon, wie viel Zeit für die Prüfung von Wissen aufgewendet wird, von der Struktur der Prüfungen ab in der Testaufgabe enthaltene Fragen usw.

Doch trotz der aufgezeigten Nachteile des Testens als Methode der pädagogischen Kontrolle weisen seine positiven Eigenschaften weitgehend darauf hin, dass der Einsatz dieser Technologie in Bildungseinrichtungen sinnvoll ist.

Zu den Vorteilen gehören:

wie gesagt, größere Objektivität und infolgedessen eine größere positive stimulierende Wirkung auf die kognitive Aktivität des Schülers; Einflussnahme ist ausgeschlossen negativer Einfluss auf den Ergebnissen der Prüfung von Faktoren wie Stimmung, Qualifikationsniveau und anderen Merkmalen eines bestimmten Lehrers;

Fokus auf moderne technische Mittel für den Einsatz im Umfeld computergestützter (automatisierter) Trainingssysteme; Universalität, Abdeckung aller Phasen des Lernprozesses. Beachten wir weitere Vorteile. Die getestete Umfrage ist multifunktional. Es ermöglicht Ihnen, schnell zu verstehen, wie Sie mit einem bestimmten Studenten weiterarbeiten können, und hilft dem Dozenten auch bei der Anpassung des Kurses.

Im Ergebnis ist festzuhalten, dass der Einsatz von Studierendentests ab dem 1. Studienjahr dazu beitragen wird, eine objektive Zertifizierung der Hochschule durchzuführen, die mit dem Ziel durchgeführt wird, die Übereinstimmung von Inhalt, Niveau und Qualität der Ausbildung der Absolventen festzustellen mit den Anforderungen der staatlichen Bildungsstandards.

Die systematische Umsetzung von Kontrollaktivitäten mithilfe von auf höchstem Niveau zusammengestellten Kontrollinstrumenten ermöglicht es den Universitäten, hochqualifizierte Spezialisten in verschiedenen Wissensgebieten auszubilden, die jederzeit bereit sind, das gesammelte Wissen anzuwenden.

Genau solche Fachkräfte braucht unser Land jetzt und in Zukunft, um mit ihrer Hilfe die Wirtschaft schnell wieder anzukurbeln.

Einführung................................................. ....................................................... ............. ............ 2

1. Pädagogische Prüfung als Kontrollmethode................................................. .......... 4

2. Computertests in der Pädagogik................................................ ........ ......... 7

3. Intelligentes Testen................................................ ...... ...................... 12

Abschluss................................................. ................................................. ...... ...... 19

Liste der verwendeten Literatur................................................ ........... ................. 20


Einführung

IN letzten Jahren In Russland nimmt im Bildungsbereich das Interesse an der Automatisierung der Zwischen- und Abschlussüberwachung der Lernergebnisse von Schülern in den unterschiedlichsten Bildungseinrichtungen, von Schulen bis hin zu kommerziellen Studiengängen, rapide zu. Die beliebteste Art einer solchen Kontrolle ist das Testen, das auf einem Dialog zwischen dem Computersystem und dem Benutzer basiert. Der rasante Anstieg der Geschwindigkeit von Computersystemen, der Rückgang der Preise für Computerausrüstung und das Aufkommen hochwertiger und leistungsstarker Programmiersysteme haben den Bedarf an Systemen erhöht, die eine objektive, schnelle und zuverlässige Bewertung des Wissens der Studierenden ermöglichen und interessante Angebote bieten Formen der Interaktion mit ihnen.

Die Frage der Schaffung solcher Systeme ist jedoch nicht einfach, und die Autoren bestehender Entwicklungen weichen manchmal von der pädagogischen und psychologischen Seite des Problems ab und versuchen, die Attraktivität ihrer Systeme zu maximieren Softwareprodukte durch Multimedia. Manchmal ignorieren Programmierer einfach den Prozess der Interaktion mit direkten Wissensträgern (Lehrern), was sich auf bestehende Anwendungen auswirkt. Sehr oft beherrschen die Lehrkräfte selbst die Methoden zur Beurteilung der Qualität der von ihnen erstellten Tests (wir werden über Tests sprechen) nicht ausreichend.

Es sei darauf hingewiesen, dass die ersten Konzepte der Computerisierung des Bildungswesens vor mehr als 30 Jahren unter dem Motto „technische Umrüstung des Lehrers, Mechanisierung seiner Arbeit“, „Lehrmaschine“ entstanden sind und den Prozess der individuellen Arbeit zwischen einem Lehrer simulieren und ein Student. Mit der Zeit wuchs das Verständnis für ihre Grenzen.

Tatsache ist, dass der Einsatz traditioneller Methoden des Computertrainings und der Computerkontrolle (direktes Testen, Punktesystem usw.) inakzeptabel ist: Um das Wissen des Schülers zu beurteilen, muss der Lehrer eine große Menge an Informationen verarbeiten, und der Prozess von Die Interaktion zwischen dem Bewerter und dem Bewerteten kann nicht strikt formalisiert werden, daher können die drei wichtigsten algorithmischen Strukturen (sequentiell, verzweigt, Schleife) bei der Implementierung maschineller Systeme diesen Themenbereich nicht vollständig beschreiben. Diese. Die Umsetzung einer automatisierten Kontrolle der Kenntnisse und Fähigkeiten der Auszubildenden beinhaltet zunächst die Lösung des Problems der Bestimmung der Menge der erforderlichen Wissensqualitäten, ohne die die Kriterien zur Wissensbewertung und Methoden zur Bestimmung des Niveaus ihrer Assimilation nicht identifiziert werden können.

Der Zweck des Aufsatzes besteht darin, einige bestehende Methoden und Modelle pädagogischer Tests aufzuzeigen, die Qualität bestehender Test- und Kontrollsysteme zu beschreiben und zu bewerten und eigene Ideen einzubringen.

1. Pädagogische Prüfung als Kontrollmethode.

Das Hauptziel des Wissens- und Kompetenzmonitorings besteht darin, die Leistungen und Erfolge der Studierenden zu ermitteln, Möglichkeiten zur Verbesserung und Vertiefung von Kenntnissen und Fähigkeiten aufzuzeigen, damit Voraussetzungen für die spätere Einbindung der Studierenden in aktive kreative Aktivitäten geschaffen werden. Dieses Ziel bezieht sich in erster Linie auf die Bestimmung der Qualität der Aufnahme von Lehrmaterial durch die Schüler – den Grad der Beherrschung der im Programm vorgesehenen Kenntnisse, Fertigkeiten und Fertigkeiten. Zweitens ist die Festlegung des Hauptziels der Kontrolle mit der Vermittlung von Methoden der gegenseitigen Kontrolle und Selbstkontrolle, der Bildung des Bedürfnisses nach Selbstkontrolle und gegenseitiger Kontrolle verbunden.

Drittens geht es bei diesem Ziel darum, bei den Schülern Persönlichkeitsmerkmale wie Verantwortung für die geleistete Arbeit und Eigeninitiative zu fördern.

Wenn die aufgeführten Ziele der Überwachung des Wissens und der Fähigkeiten von Studierenden verwirklicht werden, können wir sagen, dass Tests die folgenden Funktionen erfüllen: Kontrollieren, Lehren (pädagogisch), diagnostisch, prognostisch, entwicklungsorientiert, leitend, erziehend. Schauen wir uns diese Funktionen genauer an.

Die Kontrollfunktion besteht darin, den Wissens- und Fähigkeitsstand der Studierenden, den Stand ihrer geistigen Entwicklung zu ermitteln, den Grad der Beherrschung von Methoden der kognitiven Aktivität und die Fähigkeiten rationaler Bildungsarbeit zu untersuchen.

Mit Hilfe von Tests wird das Ausgangsniveau für die weitere Beherrschung von Kenntnissen, Fähigkeiten und Fertigkeiten ermittelt, die Tiefe und der Umfang ihrer Aneignung untersucht. Die geplanten Ergebnisse werden mit den tatsächlichen Ergebnissen verglichen und die Wirksamkeit der von der Lehrkraft eingesetzten Methoden, Formen und Mittel des Unterrichts festgestellt.

Die pädagogische Funktion des Testens besteht darin, Wissen und Fähigkeiten zu verbessern und zu systematisieren. Während des Prüfungsprozesses wiederholen und vertiefen die Studierenden das Gelernte. Sie reproduzieren nicht nur das zuvor Gelernte, sondern wenden Wissen und Fähigkeiten auch in einer neuen Situation an. Tests helfen dabei, das Wesentliche, das Wesentliche im Lernstoff hervorzuheben, um die zu prüfenden Kenntnisse und Fähigkeiten klarer und genauer zu machen. Das Testen trägt auch zur Verallgemeinerung und Systematisierung von Wissen bei.

Der Kern der diagnostischen Funktion von Tests besteht darin, Informationen über Fehler, Mängel und Lücken in den Kenntnissen und Fähigkeiten der Schüler und die zugrunde liegenden Ursachen für die Schwierigkeiten der Schüler bei der Beherrschung des Unterrichtsmaterials sowie über die Anzahl und Art der Fehler zu erhalten. Die Ergebnisse der diagnostischen Untersuchungen helfen bei der Auswahl der intensivsten Lehrmethode und klären die Richtung für eine weitere inhaltliche Verbesserung der Lehrmethoden und -instrumente.

Die prädiktive Funktion von Tests dient dazu, erweiterte Informationen über den Bildungsprozess zu erhalten. Als Ergebnis der Prüfung werden Anhaltspunkte für eine Prognose über den Verlauf eines bestimmten Abschnitts des Bildungsprozesses gewonnen: Sind die Studierenden ausreichend ausgebildet? spezifisches Wissen, Fähigkeiten und Fertigkeiten zur Beherrschung des nächsten Teils des Lehrmaterials (Abschnitt, Thema).

Aus den Ergebnissen der Prognose wird ein Modell des zukünftigen Verhaltens eines Schülers erstellt, der heute Fehler dieser Art macht oder bestimmte Lücken im System der Methoden der kognitiven Aktivität aufweist.

Die Prognose hilft, die richtigen Schlussfolgerungen für die weitere Planung und Umsetzung des Bildungsprozesses zu ziehen.

Die entwicklungspolitische Funktion von Tests besteht darin, die kognitive Aktivität der Schüler anzuregen und ihre kreativen Fähigkeiten zu entwickeln. Tests haben ein außerordentliches Potenzial für die Entwicklung von Schülern. Während des Testprozesses entwickeln sich Sprache, Gedächtnis, Aufmerksamkeit, Vorstellungskraft, Wille und Denken von Schulkindern. Tests haben einen großen Einfluss auf die Entwicklung und Manifestation von Persönlichkeitseigenschaften wie Fähigkeiten, Neigungen, Interessen und Bedürfnissen.

Der Kern der Orientierungsfunktion des Testens besteht darin, Informationen darüber zu erhalten, inwieweit das Lernziel von einem einzelnen Studierenden und der Gruppe insgesamt erreicht wird – wie viel beherrscht und wie intensiv der Lehrstoff studiert wurde. Tests geben den Schülern Orientierung bei ihren Schwierigkeiten und Erfolgen.

Indem sie die Lücken, Fehler und Unzulänglichkeiten der Studierenden aufdecken, zeigen Tests ihnen die Richtung auf, in die sie ihre Bemühungen zur Verbesserung von Wissen und Fähigkeiten anwenden können, und helfen dem Studierenden, sich selbst besser kennenzulernen und seine Kenntnisse und Fähigkeiten einzuschätzen.

Die pädagogische Funktion des Testens besteht darin, den Schülern eine verantwortungsvolle Einstellung zum Lernen, Disziplin, Genauigkeit und Ehrlichkeit zu vermitteln. Durch das Überprüfen werden Sie dazu ermutigt, sich selbst bei der Ausführung von Aufgaben ernsthafter und regelmäßiger zu überwachen. Es ist eine Voraussetzung für die Entwicklung eines starken Willens, Ausdauer und der Gewohnheit, regelmäßig zu arbeiten.

Die Hervorhebung der Funktion pädagogischer Tests als Kontrollform unterstreicht ihre Rolle und Bedeutung im Lernprozess. Im Bildungsprozess manifestieren sich die Funktionen selbst in unterschiedliche Grade und verschiedene Kombinationen. Durch die praktische Umsetzung der ausgewählten Funktionen wird die Kontrolle effektiver und der Bildungsprozess selbst effektiver.

Pädagogische Tests als Form der Wissenskontrolle sind daher ein integraler Bestandteil des Bildungsprozesses.

Computertests in der Pädagogik

Die Idee des Computertests geht direkt auf die Idee der programmierten Wissenskontrolle zurück. Die programmierte Wissenskontrolle wiederum war in erster Linie eine unvermeidliche Reaktion auf einige Probleme höhere Bildung in Russland. Eigentlich gelten für die Schulbildung ungefähr die gleichen Probleme, allerdings ist diese aufgrund der traditionellen Trägheit sehr wenig empfänglich für neue Technologien.

Das Hauptproblem jeder Ausbildung (nicht nur der russischen) ist das Fehlen einer klaren Kontrolle über die Qualität des Lernstoffs. Hat der Lehrer zudem in der Schulpraxis mehr oder weniger die Möglichkeit, den aktuellen Wissensstand des Studierenden in einer gewissen Periodizität zu überprüfen, so gibt der Lehrer an der Universität den Stoff für ein ganzes Semester und erst am Ende des Semesters aus ist vom Grad seiner Assimilation überzeugt. Natürlich wird im Hochschulsystem davon ausgegangen, dass die Studierenden sich ausreichend mit der eigenständigen Bildung beschäftigen sollten, dieser vermeintlich eigenständige Wissenserwerb liegt jedoch ausschließlich im Gewissen des Studierenden, und der Lehrer kann absolut nicht wissen, welcher der Studierenden dabei ist Zumindest macht es irgendetwas von alleine. Da eine große Zahl von Studierenden Zugang zum Internet erhielt, wurde die Situation noch dadurch verschärft, dass nun selbst das Einreichen von Aufsätzen nicht bedeutet, dass man überhaupt nicht mit Informationen arbeiten muss; Oft halten Studierende es nicht einmal für notwendig, das, was sie aus dem Internet ausdrucken, vollständig zu lesen.

Die Notwendigkeit einer systematischen Überwachung der Materialaufnahme steht außer Zweifel. Erstens würde dies dem Lehrer Zeit sparen, der mangels Feedback gezwungen ist, entweder Lehrinhalte zu wiederholen, die die Schüler schon vor langer Zeit gelernt haben, oder Lehrinhalte zu präsentieren, die auf Fakten basieren, die von den Schülern kaum verstanden werden. Zweitens stimuliert die systematische Überwachung des Wissensstands der Studierenden eine Verbesserung der Bildungsqualität, indem der Schwerpunkt auf schwer zu erlernenden Inhalten gelegt und die Verantwortung der Studierenden für die Ergebnisse erhöht wird unabhängige Arbeit(natürlich für den Fall, dass der Lehrer daran interessiert ist).

Ein wichtiger Punkt der systematischen programmierten Wissenskontrolle ist ihre Objektivität, die auf eine Akzentverschiebung von der Straffunktion zur Informationsfunktion zurückzuführen ist. Nur in diesem Fall wird der Schüler keine Angst vor Kontrolle haben und Wege finden, um eine bessere Note zu bekommen, und nur in diesem Fall wird der Lehrer ein wirkliches Bild vom Wissen des Schülers bekommen.

Technisch gesehen ist die programmierte Wissenskontrolle einfach: Den Schülern wird ein bestimmtes Papiermedium gegeben (der Aufstieg der programmierten Kontrolle führte zu „elektronischen“ Monstern mit Relaisröhren, die immer noch in Führerscheinprüfungen zu sehen sind), auf denen Fragen und Antwortmöglichkeiten stehen geschrieben, von denen eine (oder mehrere) richtig sind. Der Schüler kann nur die richtigen Antworten ankreuzen.

Diese Technologie hat es ermöglicht, einen qualitativen Sprung bei der Bereitstellung von Feedback zwischen Lehrer und Schüler zu machen. Die programmierte Steuerung, bestehend aus 8-10 Fragen, erfolgt in sehr kurzer Zeit kurzfristig- von 5 bis 10 Minuten, und gleichzeitig kann der Lehrer gleichzeitig vollständige Informationen über die Beherrschung des behandelten Stoffes durch die gesamte Bildungsgruppe erhalten. Darüber hinaus konnte durch die technische Umsetzung der programmierten Steuerung Betrug vollständig vermieden werden, sodass jedem Schüler seine eigene Version der programmierten Karte angeboten werden konnte.

Der Nachteil der programmierten Steuerung in ihrer Vorcomputerform war der hohe Arbeitsaufwand bei der Erstellung programmierter Karten, die (idealerweise) für jede Unterrichtsstunde benötigt wurden, und die Komplexität ihrer anschließenden Bearbeitung. Mit dem Aufkommen der Computertechnologie haben Lehrer die Möglichkeit, den Arbeitsaufwand sowohl bei der Vorbereitung von Tests als auch bei der Verarbeitung von Ergebnissen drastisch zu reduzieren.

Es gibt fünf allgemeine Anforderungen für Tests:

· Gültigkeit;

· Gewissheit (allgemein verständlich);

· Einfachheit;

· Eindeutigkeit;

· Zuverlässigkeit.

Testvalidität ist Angemessenheit. Es wird zwischen inhaltlicher und funktionaler Validität unterschieden: Zum einen geht es um die Übereinstimmung des Tests mit dem Inhalt des kontrollierten Lehrmaterials, zum anderen um die Übereinstimmung des Tests mit dem beurteilten Aktivitätsniveau.

Die Erfüllung der Anforderung an die Sicherheit (öffentliche Verfügbarkeit) des Tests ist nicht nur notwendig, damit jeder Schüler versteht, was er absolvieren muss, sondern auch, um vom Standard abweichende richtige Antworten auszuschließen.

Die Anforderung an die Einfachheit des Tests bedeutet, dass der Test eine Aufgabe auf demselben Niveau haben muss, d. h. sollte nicht komplex sein und aus mehreren Aufgaben bestehen verschiedene Level. Es ist notwendig, den Begriff „komplexer Test“ vom Begriff „schwieriger Test“ zu unterscheiden. Die Schwierigkeit eines Tests wird üblicherweise durch die Anzahl der Operationen P charakterisiert, die im Test ausgeführt werden müssen: P< 3 – первая группа трудности; P = 3-10 – вторая группа трудности. Не следует также смешивать понятия простоты-комплексности и легкости-трудности с понятием сложности.

Unter Eindeutigkeit versteht man die gleiche Beurteilung der Qualität der Testdurchführung durch verschiedene Experten. Um diese Anforderung zu erfüllen, muss der Test über einen Standard verfügen. Um den Grad der Korrektheit zu messen, verwenden Sie den Koeffizienten K a = P 1 / P 2 , wobei P 1 die Anzahl der korrekt ausgeführten signifikanten Operationen in einem Test oder einer Testreihe ist; P 1 – die Gesamtzahl der signifikanten Vorgänge in einem Test oder einer Testreihe. Als wesentlich gelten diejenigen Vorgänge im Test, die auf dem Niveau der geprüften Beherrschung ausgeführt werden. Operationen, die einer niedrigeren Ebene angehören, werden nicht in die Anzahl der signifikanten Operationen einbezogen. Wenn K a ³ 0,7 ist, wird davon ausgegangen, dass die Aktivität auf diesem Niveau gemeistert wurde.

Das Konzept der Testzuverlässigkeit ist definiert als die Wahrscheinlichkeit, den Wert von K a korrekt zu messen. Quantitativer Indikator der Zuverlässigkeit r О . Die Zuverlässigkeitsanforderung besteht darin, die Stabilität der Ergebnisse wiederholter Tests desselben Probanden sicherzustellen. Die Zuverlässigkeit eines Tests oder einer Testbatterie steigt mit der Anzahl der signifikanten Operationen P.

Daher ist es meiner Meinung nach bei der Implementierung von Computertestsystemen notwendig, diese fünf Anforderungen an die zu erstellenden Tests einzuhalten. Aber das Problem des Computertests ist viel akuter. Die Umsetzung der oben beschriebenen fünf Testanforderungen in Testsystemen bedeutet nicht, dass der erstellte Komplex allen Anforderungen des Lehrers und Schülers gerecht wird.

Die meisten Softwareprodukte erlauben es Lehrern und Schülern nicht, im realen Bildungsprozess von traditionellen Methoden abzuweichen: Vorlesung, Notizen, persönliche Wissenskontrolle, Tests, Tests, Prüfungen. Dieser Nachteil kann wie folgt definiert werden: Ein Computerkurs ist per Definition proprietär und bietet daher nur dann eine qualitativ hochwertige Ausbildung, wenn der Autor angemessen unterstützt wird (der in den meisten Fällen nicht über ausreichende Kenntnisse auf dem Gebiet der Informationstechnologie verfügt). Obwohl einzelne Bestandteile eines Computertrainings-, Monitoring- oder Lehrkontrollkurses als eigenständige Trainingsmodule von anderen Lehrkräften (sowie bei der eigenständigen Beherrschung des Themas) genutzt werden können, kann die maximale Wirkung höchstwahrscheinlich nur im Zusammenspiel mit dem Autor erzielt werden. Entwickler des Kurses.

Wird auf der Grundlage eines multimedialen Kurses eines Autors ein weiterer Lehrer in den Bildungsprozess einbezogen, besteht die Gefahr eines Persönlichkeitskonflikts, da nicht nur unterschiedliche Methoden der methodischen Gestaltung des Bildungsprozesses, sondern auch unterschiedliche persönliche Ansätze auf einem einzigen Bildungsfeld aufeinanderprallen .

Was die Prüfung der Qualität des Wissens betrifft, erfordert der informelle Charakter des Wissensbewertungsprozesses den Einsatz von Computertests, die für den Lehrer schwer zu verarbeiten sind. Aktives Feedback ist erforderlich, um die Richtigkeit der Beherrschung des Materials, Sicherheit und Wirksamkeit zu beurteilen klar ausgedrückt werden .

Es ist die Informalität des Wissens als solches und der Prozess des Wissenstests im Besonderen, der zu vielen Problemen im Bereich des Computertests geführt hat, wie z. B. voreingenommene Bewertungen, Schwierigkeiten für Schüler, vorbereitete Fragen zu verstehen, und langsamer Betrieb von Computersystemen , usw.

Knowledge Engineering und Methoden der Theorie der künstlichen Intelligenz werden dazu beitragen, ein Wissenskontrollsystem zu schaffen, das es Ihnen ermöglicht, Wissensmodelle des Lehrers und des Testteilnehmers zu erstellen und deren Wissen und Fähigkeiten objektiv zu bewerten.

3. Intelligentes Testen

Der Begriff „künstliche Intelligenz“ hat unterschiedliche Bedeutungen – von der Anerkennung der Intelligenz von Computern, die logische oder sogar beliebige Rechenprobleme lösen, bis hin zur Einstufung als intelligent nur solcher Systeme, die den gesamten Komplex von Aufgaben lösen, die von Menschen ausgeführt werden, oder einen noch breiteren Satz davon ihnen. Es gibt zwei Hauptarbeitsrichtungen zur künstlichen Intelligenz (KI). Die erste ist mit der Verbesserung der Maschinen selbst verbunden, mit der Steigerung der „Intelligenz“ künstlicher Systeme. Die zweite betrifft die Aufgabe, das Zusammenspiel von „künstlicher Intelligenz“ und den tatsächlichen intellektuellen Fähigkeiten des Menschen zu optimieren.

Die Idee, „menschliche“ Denkmaschinen zu schaffen, die wie lebende Menschen zu denken, sich zu bewegen, zu hören, zu sprechen und sich im Allgemeinen zu verhalten scheinen, hat eine lange Geschichte. Schon die alten Ägypter und Römer erlebten Ehrfurcht vor Kultstatuen, die gestikulierten und Prophezeiungen aussprachen (natürlich nicht ohne die Hilfe von Priestern). Im Mittelalter und sogar später gab es Gerüchte, dass einige der Weisen Homunkuli (kleine künstliche Männer) hatten – echte Lebewesen, die fähig waren, Gefühle zu empfinden. Derzeit sind Roboter, Mustererkennungssysteme, Expertensysteme usw. rufen beim Uneingeweihten die gleiche Ehrfurcht und Bewunderung für eine „denkende“ Maschine hervor.

Doch nicht umsonst wurden einige Forschungsarbeiten im Bereich KI zeitweise eingefroren. Versuche, maschinelle Intelligenz zu schaffen, scheiterten und die Begeisterung der Wissenschaftler ließ immer wieder nach, da es mit den damals vorhandenen Rechenmitteln nicht möglich war, das Zusammenspiel von Neuronen im Gehirn zumindest annähernd nachzubilden. Das Aufkommen von Multiprozessorsystemen und die Zunahme der Anzahl der Mikroprozessorbefehle und ihrer Taktfrequenz ermöglichen es meiner Meinung nach nun, mithilfe paralleler Prozesse und neuronaler Netze ein annäherndes menschliches Denken aufzubauen.

Wenn wir uns dem Problem der Rolle der KI beim Lernen und in der Bildung zuwenden, werden wir diesen Prozess als eine der Arten der Interaktion zwischen einer Person und einem Computer betrachten und unter den vielversprechenden Möglichkeiten diejenigen aufzeigen, die auf die Schaffung des sogenannten adaptiven Lernens abzielen Systeme, die den operativen Dialog zwischen einem Schüler und einem menschlichen Lehrer nachahmen.

Intellektuelles Testen setzt das Vorhandensein eines Wissensmodells voraus, eines Modells des Test- und Bewertungsprozesses selbst. So lassen sich allgemein alle Entwicklungen in diesem Bereich charakterisieren. Schauen wir uns einige davon genauer an.

Das traditionelle russische System zur Bewertung der Kenntnisse von Studierenden basiert auf sprachlichen Beurteilungen, nach denen ein Stipendium festgelegt, Fortschritte aufgezeichnet, Eintragungen in Notenbücher für die Studienzeit vorgenommen werden usw.

Gleichzeitig geht es bei einem solchen neuen Bildungsverfahren wie dem Bildungstest auf alternativer Basis um die Beurteilung des Wissensstandes im Bereich von null bis einhundert, wodurch sich das Problem ergibt, anhand der Ergebnisse das sprachliche Wissensbild zu erkennen solche pädagogischen Tests.

Unter dem Bild des Wissensstandes werden Studierende verstanden, die zu einer Menge (Gruppe) gehören, deren Wissen gemäß dem „Standard des Wissensstandes“ sprachlichen Bewertungen von ungenügend (D), befriedigend (C), gut (B) zugeordnet wird. , ausgezeichnet (A).

Unter der Erkennung eines Bildes eines Wissensstandes versteht man das Verfahren zur Entscheidung darüber, ob ein bestimmter Schüler zu einem der angegebenen Bilder gehört, basierend auf einem Vergleich seiner Bildungsleistungen bei der Prüfung mit den Merkmalen des Bildes.

Jeder Kurs hat Schwerpunkte, insbesondere wichtige Themen, ohne deren Kenntnis die Beherrschung komplexerer Inhalte während des Studiums nicht möglich ist oder die für die Arbeit im Fachgebiet erforderlich sind. Während der mündlichen Prüfung muss der Lehrer im persönlichen Kontakt mit dem Schüler das Verständnis des Schülers für diese Themen bewerten. Beim automatisierten Testen können Sie die Bedeutung bestimmter Abschnitte des Kurses berücksichtigen, indem Sie den Anteil der Fragen in diesen Abschnitten an der Gesamtzahl der Fragen erhöhen. Dies ist für den Testschreiber jedoch nicht immer praktisch, da die wichtigsten Abschnitte nicht immer den meisten Stoff enthalten.

Die Theorie des pädagogischen Testens sollte auf den besonderen Gesetzen und Mustern wissenschaftlicher Bereiche wie Informationswissenschaft, allgemeine Statistik, statistische Akzeptanzkontrolle, Qualimetrie, Pädagogik, Psychologie, Operations Research, Entscheidungstheorie usw. basieren. Direkte Anwendung theoretischer Entwicklungen daraus naturwissenschaftlichen Fachgebieten macht sich nicht bemerkbar praktische Ergebnisse zur Bewertung von Wissen aufgrund der Ungreifbarkeit von Wissen als Forschungsgegenstand. Die Aufgabe, eine Theorie des pädagogischen Testens zu formulieren, lässt sich als die Aufgabe formulieren, die optimale Struktur spezifischer Gesetze und Muster der Testologie zu finden, die es ermöglicht, Wissen mit einem gegebenen Fehler zu bewerten.

Um Probleme dieser Klasse zu lösen, werden genetische Methoden am erfolgreichsten eingesetzt, die auf der Implementierung genetischer Algorithmen basieren und es ermöglichen, gezielt nach bestimmten Gesetzen und Mustern in den akzeptablen Richtungen für die Bildung der inländischen Theorie zu suchen pädagogische Tests.

Im Gegensatz zur traditionellen Zufallssuche nach akzeptablen Lösungen nutzen genetische Suchalgorithmen in vielen Wissensbereichen Analogien oder Nähe bestehender Lösungen, um nach einem optimalen Satz spezifischer Gesetze zu suchen, die Objektivität, Zuverlässigkeit und Genauigkeit bei der Beurteilung des von den Studierenden reproduzierten Wissensniveaus gewährleisten Prüfverfahren. Eine solche gezielte Suche nach bestimmten Gesetzen ist evolutionär und weist viele Ähnlichkeiten mit den Operatoren auf, die in genetischen Algorithmen und Verfahren verwendet werden, die bei lebenden Organismen in der Natur vorkommen.

Es wird vorgeschlagen, dass die Haupteigenschaften von Bildungstests auf Populationen privater Rechtswissenschaften in solchen wissenschaftlichen Bereichen wie: Informationswissenschaft; Psychologie, Pädagogik und Psychodiagnostik; Logik; Wahrscheinlichkeitstheorie; Suchtheorie; Fuzzy-Mengen-Theorie; Spieltheorie; statistische Entscheidungstheorie; Abnahmeprüfung.

Diese Studien untersuchen die Möglichkeiten der sogenannten „absoluten Zeitskala der Wissensbewertung“. Seine Grundsätze werden formuliert. Es werden die Phasen eines sequentiellen Übergangs von der traditionellen Prüfungsform zur Testform dieses Ansatzes und auf ihrer Grundlage die Anforderungen an die Erstellung von Testmaterialien dieses Ansatzes formuliert.

Die Erfahrungen mit der Anwendung dieses Ansatzes bei Aufnahmeprüfungen an der Staatlichen Universität Twer über einen Zeitraum von vier Jahren werden analysiert.

Das diagnostische Potenzial dieses Ansatzes wird untersucht. Das Prinzip der „dreistufigen Abstraktion“ für diagnostische Tests wird formuliert.

Die Methodik basiert auf der Tatsache, dass der Bildungsprozess ein Sonderfall des technologischen Prozesses ist und durch die gleichen Analysemethoden charakterisiert werden sollte, wie sie für verwendet werden Herstellungsprozesse. Allerdings sind solche Methoden nicht blind übertragbar, insbesondere wenn es um eine sinnvolle Analyse des Prozesses geht.

Um den Bildungsprozess zu analysieren, ist es notwendig, erstens ein Kriterium für die Qualität des Unterrichts zu haben und zweitens seine Veränderungen im Laufe der Zeit zu verfolgen. Das aussagekräftigste Kriterium für die Qualität der Ausbildung sollte der Lerngrad der Studierenden – SLA – sein. Dieses Kriterium basiert auf Statistiken über die Noten, die Studierende für die Erledigung einzelner Aufgaben oder Tests erhalten. Bewertungen werden in die SOU mit einem „Gewicht“ aufgenommen, das dem Integral der Wahrscheinlichkeit entspricht, eine bestimmte Bewertung für eine bestimmte „typische“ Verteilung von Bewertungen zu erhalten.

Das Testverfahren beinhaltet die Analyse von Antworten auf eine Abfolge von Testaufgaben einer bestimmten Komplexität. Wenn die Antwort richtig ist, wird davon ausgegangen, dass der Vorbereitungsgrad des Schülers höher ist als die Komplexität der gestellten Aufgabe und er in der Lage ist, Probleme einer bestimmten Komplexität zu lösen, andernfalls ist er unfähig. Dies ähnelt der Schätzung des Gradienten einer hypothetischen Regressionsfunktion, bei der der Gradient selbst eine Zufallsvariable ist.

Es wird vorgeschlagen, den folgenden Ansatz zu verwenden. Wir glauben, dass der Testteilnehmer, wenn er die Aufgabe gelöst hat, den Wunsch verspürt, eine komplexere Aufgabe zu lösen. Wenn nicht, werden sie einen weiteren Versuch unternehmen, eine Aufgabe mit der gleichen Komplexität zu lösen. Wird sie ebenfalls nicht gelöst, liegt eine Aufgabe mit reduzierter Komplexität vor. Wird eine weniger komplexe Aufgabe nicht sofort gelöst, so wird eine Aufgabe mit geringerer Komplexität zur Lösung vorgeschlagen. Der Prozess der Erhöhung der Komplexität von Aufgaben erfolgt auf ähnliche Weise. Wenn wir also die Lernphase bei der Lösung von Problemen ausschließen, wählt der Schüler für sich selbst einen bestimmten Komplexitätsgrad, um den herum die Komplexität der Aufgaben verschwimmt.

Somit ist die Funktion „Wissensstand“ eine Transformation der Funktion „Komplexität“ einer Aufgabe durch die „Fähigkeit, Probleme zu lösen“ einer bestimmten „Komplexität“. In dieser Aussage sind die Begriffe „Wissensstand“, „Fähigkeit zur Problemlösung“ und „Schwierigkeit“ vage. Um diese Konzepte zu formalisieren, empfiehlt es sich daher, den Apparat der Fuzzy-Sets zu verwenden. Darüber hinaus macht sich in dieser Formulierung der Unterschied zwischen „Komplexität“ und „Problemlösungsfähigkeit“ bemerkbar.

Die Konzepte „Komplexität“ und „Wissensstand“ sind einige Fuzzy-Variablen (nur Variablen, obwohl sie durch eine Funktion gegeben sind), während „Problemlösungsfähigkeit“ eine Fuzzy-Beziehung der Fuzzy-Variablen „Komplexität“ und „Wissensstand“ ist. . Die Anzahl der Punkte ist ebenfalls eine Variable, aber diese Variable darf nicht analysiert werden, da es sich um eine Transformation des „Wissensstandes“ handelt.

Als direktes Testen bezeichnen wir eine Methode zur Überwachung des Wissens eines Schülers, bei der die Struktur des Tests (d. h. die Menge und Reihenfolge der Präsentation der Testaufgaben) nicht von den tatsächlichen Antworten des Schülers abhängt. Fast alle derzeit existierenden Tests arbeiten im direkten Testmodus, meist implementieren sie jedoch nur die einfachsten und bei weitem nicht die effektivsten Methoden zur Wissensbewertung.

Eine detaillierte Analyse pädagogischer Techniken und Methoden des „Live“-Dialogs zwischen Lehrer und Testteilnehmer zeigte, dass mindestens fünf Parameter identifiziert werden können, deren Werte die Organisation des Prozesses der Wissensüberwachung und -bewertung beeinflussen.

Der Zweck der Prüfung wird durch die Hauptfrage bestimmt, deren Antwort als Ergebnis der Prüfung erhalten werden soll: a) Verfügt der Student über einen einheitlichen Wissensstand im gesamten Stoff (Prüfung der Wissensbreite) oder b) ist dies der Fall? Der Studierende verfügt über systematische Kenntnisse zu den Themen der ihm gestellten Prüfungsaufgaben (Prüfung der Wissenstiefe).

Die Art der Prüfung hat zwei Bedeutungen: Prüfung oder Prüfung. Die Ergebnisse des bestandenen Tests werden im Binärformat dargestellt: „bestanden“ oder „nicht bestanden“. Bei der Feststellungsprüfung wird die Note „bestanden“ vergeben, wenn der Studierende Kenntnisse nachweist, die einen bestimmten, a priori festgelegten Schwellenwert überschreiten.

Während der Prüfungsprüfung Basierend auf der Summe der Punkte, die der Student bei Abschluss des Tests erreicht, wird die endgültige Bewertung des Wissens des Studenten (die in der Regel mehr als zwei akzeptable Werte aufweist) berechnet, wobei die Punktesumme auf die verwendete Bewertungsskala projiziert wird.

Die Komplexität der Prüfung wird durch den Kenntnisstand charakterisiert, den der Studierende bei der Absolvierung nachweisen muss. Sie wird durch den Grad der Komplexität der Prüfungsaufgaben bestimmt, die dem Studierenden vorgelegt werden können. Untersuchungen deuten auf mindestens drei Stufen der Testkomplexität hin: Standard, erhöht und reduziert.

Der Grad der Kontrolle bestimmt den Grad der Genauigkeit der Überprüfung der Wissenstiefe. Eine Untersuchung der Methoden zur Durchführung von Test- und Prüfungsumfragen zeigt, dass wir von vier verschiedenen Genauigkeitsstufen bei der Bewertung der Antworten auf Testaufgaben sprechen können (strenge Kontrolle; Identifizierung des wichtigsten Wissens; Identifizierung des einfachsten Wissens; Identifizierung eventuell vorhandenen Wissens). .

Und schließlich die Zustandsverfolgung vorzeitige Beendigung Das Testen beinhaltet den vorzeitigen Abschluss des Tests in einer Situation, in der ein weiteres Testen nicht mehr praktikabel ist. Als erste dieser Bedingungen gilt die Überschreitung der maximalen Prüfdauer. Die zweite Bedingung besteht darin, die Prüfung abzubrechen und eine ungenügende Note zu vergeben, wenn eine a priori festgelegte Anzahl falscher Antworten eingeht.

Die Vielfalt der möglichen Wertekombinationen der fünf vorgeschlagenen Merkmale lässt uns von der Existenz einer sehr umfangreichen Familie von Algorithmen zur direkten Wissensprüfung sprechen (z. B. Prüfungsbewertung der Wissenstiefe mit erhöhter Komplexität und strenger Kontrolle, oder Testbewertung der Wissensbreite mit Standardkomplexität und Kontrolle der maximalen Testdauer usw. ).

Abschluss

Die Einführung neuer Informationstechnologien in Bildungseinrichtungen, die in unserem Land Anfang der 80er Jahre begann – der Unterricht mit Hilfe pädagogischer Software sowie der Einsatz von Testprogrammen – hat mehr als bescheidene Ergebnisse gebracht. Unter den vielen bekannten Gründen dafür (finanzielle, technische, organisatorische, methodische Schwierigkeiten) stellen wir einen fest: die psychologische Ablehnung von „Computer“-Methoden der Wissensvermittlung und -überwachung durch Lehrer, insbesondere von hochqualifizierten, kreativen. Dafür gibt es Gründe: Es gibt eine Vielzahl schlechter Programme, die nicht den grundlegenden psychologischen und pädagogischen Grundsätzen der Ausbildung entsprechen und die Hauptphasen des Wissenserwerbs erfolglos umsetzen; Eine methodische Unterstützung gibt es in der Regel nicht; Der Zeit- und Arbeitsaufwand für die Beherrschung von Computern, das Studium des Programms und die Unterstützung der entsprechenden Infrastruktur erweist sich als unerschwinglich hoch. selbst bei guten Systemen wird die Rolle des Lehrers im Bildungsprozess nivelliert, der kreative Charakter seiner Arbeit verschwindet; Es gibt kein System zur Förderung innovativer Lehrer, die neue Informationstechnologien beherrschen.

Diese Situation kann und sollte geändert werden. Technischer Fortschritt Moderne Computertechnologie und Telekommunikationssysteme haben in den letzten Jahren trotz der rasanten Fortschritte enorme Fortschritte hinsichtlich der Geschwindigkeit sowie der Menge der verarbeiteten und gespeicherten Informationen erzielt. Die Entwicklung von Programmdesignsystemen (objektorientierte visuelle Programmiersysteme, DBMS, neuronale Netzwerkmodellierungssysteme usw.) hat Ingenieuren und Systemanalytikern die leistungsstärksten Werkzeuge für die Entwicklung und Umsetzung der fantastischsten Projekte an die Hand gegeben.

Liste der verwendeten Literatur

1. Avanesov B.S. Zusammensetzung der Testaufgaben. Lehrbuch für Hochschullehrer, Schullehrer, Doktoranden und Studierende pädagogischer Hochschulen. 2. Aufl., Überarbeitung.. und Ergänzungen. M.: Adept. – 2002.

2. Vankov E.A. „Computertesttechnologien“ // Computer, 2002. - Nr. 3.

3. Granitskaya A.S. Denken und Handeln lehren: Adaptives Bildungssystem in der Schule: Buch. für den Lehrer. M.: Aufklärung. – 2001.

4. Kazarinov A.S., Kultysheva A.Yu., Miroshnichenko A.A. Technologie der adaptiven Validität von Testaufgaben: Lernprogramm. Glazov: GGPI, 1999.

5. Kalney V.A., Shishov S.E. Technologie zur Überwachung der Unterrichtsqualität im „Lehrer-Schüler“-System: Ein Handbuch für Lehrer. M.: Pädagogische Gesellschaft Russlands, 1999.

6. Kasyanova N.V. „Schaffung eines Computersteuerungssystems als Ergebnis neuer Informationstechnologien in der Lehre“, Ostukrainische Nationaluniversität (VNU), Ukraine, Lugansk // Materialien der ITO-2001-Konferenz.

7. Mayorov A.N. Tests: Design, Implementierung, Nutzung. Zweite Auflage – St. Petersburg: Bildung und Kultur, 1997.

8. Moiseev V.B., Usmanov V.V., Tarantseva K.R., Pyatirublevyy L.G. „Auswertung der Testergebnisse auf Basis fachmännischer Analysemethoden.“ Zeitschrift „Open Education“, Nr. 3, 2001, S. 32-36.

9. Rudinsky I.D. „Methode der adaptiven automatisierten Wissenskontrolle.“ Sammlung von Konferenzmaterialien, 2001.

10. Chelyshkova M.B. Entwicklung pädagogischer Tests auf Basis moderner mathematischer Modelle: Lehrbuch. M.: Forschungszentrum für Probleme der Qualität der Ausbildung von Fachkräften, 1995.

Vankov E.A. „Computertesttechnologien“ // Computer, 2002. - Nr. 3

Avanesov B.S. Zusammensetzung der Testaufgaben. Lehrbuch für Hochschullehrer, Schullehrer, Doktoranden und Studierende pädagogischer Hochschulen. 2. Aufl., Überarbeitung.. und Ergänzungen. M.: Adept. – 2002

3 Granitskaya A.S. Denken und Handeln lehren: Adaptives Bildungssystem in der Schule: Buch. für den Lehrer. M.: Aufklärung. – 2001

Kasyanova N.V. „Schaffung eines Computersteuerungssystems als Ergebnis neuer Informationstechnologien in der Ausbildung“, Ostukrainische Nationaluniversität (VNU), Ukraine, Lugansk // Konferenzmaterialien ITO-2001

Kazarinov A.S., Kultysheva A.Yu., Miroshnichenko A.A. Technologie der adaptiven Validität von Testaufgaben: Lehrbuch. Glazov: GGPI, 1999

Chelyshkova M.B. Entwicklung pädagogischer Tests auf Basis moderner mathematischer Modelle: Lehrbuch. M.: Forschungszentrum für Probleme der Qualität der Ausbildung von Fachkräften, 1995

Moiseev V.B., Usmanov V.V., Tarantseva K.R., Pyatirublevyy L.G. „Auswertung der Testergebnisse auf Basis fachmännischer Analysemethoden.“ Zeitschrift „Open Education“, Nr. 3, 2001, S. 32-36

Mayorov A.N. Tests: Design, Implementierung, Nutzung. Zweite Auflage – St. Petersburg: Bildung und Kultur, 1997

Rudinsky I.D. „Methode der adaptiven automatisierten Wissenskontrolle.“ Sammlung von Konferenzmaterialien, 2001

Kalney V.A., Shishov S.E. Technologie zur Überwachung der Unterrichtsqualität im „Lehrer-Schüler“-System: Ein Handbuch für Lehrer. M.: Pädagogische Gesellschaft Russlands, 1999

GKOU RO Lyzeum-Internat „Pädagogisch“ Taganrog

Methodische Materialien

Russischlehrer der höchsten Kategorie

Desyateryk Yu.E.

Mathematiklehrer der Kategorie 1

Marchenko M.V.

Taganrog 2015

UDC 001.8

Veröffentlicht durch Beschluss des Wissenschaftlichen und Methodischen Rates

GKOU RO Lyceum-Internat „Pädagogisch“ Taganrog

Redaktion:

Direktor der staatlichen Bildungseinrichtung der Russischen Föderation, Internat „Pädagogisch“ in Taganrog,

Kandidat der Pädagogischen Wissenschaften

Kochetkova O.A.

Stellvertretender Direktor für akademische Angelegenheiten,

Physiklehrer der höchsten Qualifikationskategorie

GKOU RO Lyceum-Internat „Pädagogisch“ Taganrog

Karapetyan A.V.

Stellvertretender Direktor für pädagogische Arbeit,

GKOU RO Lyceum-Internat „Pädagogisch“ Taganrog

Menyailenko Yu.V.

Stellvertretender Direktor für wissenschaftliche und methodische Arbeit,

Russischlehrer der höchsten Qualifikationskategorie

GKOU RO Lyceum-Internat „Pädagogisch“ Taganrog

Desyateryk Yu.E.

Stellvertretender Direktor für wissenschaftliche und methodische Arbeit,

Mathematiklehrer der 1. Qualifikationskategorie

GKOU RO Lyceum-Internat „Pädagogisch“ Taganrog

Marchenko M.V.

Sammlung methodischer Materialien / Desyaterik Yu.E., Marchenko M.V. – T., 2015. –28 S.

Die Sammlung umfasst Lehrmaterialien zum Thema „Tests in Bildungsprozess„Es wird die Entstehungsgeschichte von Tests beschrieben, die Etymologie des Konzepts „Test“ erläutert, die Testtypen beschrieben, die Vor- und Nachteile von Tests erläutert und die Methodik zur Zusammenstellung von Tests beschrieben.

Nicht zu verkaufen.

UDC 001.8

Gedruckt vom fertigen Originallayout.

p/p

Abteilungsname

Seite

Einführung.

Was ist ein Test?

Aus der Geschichte der Tests.

Arten von Tests.

Testentwicklung.

Testanforderungen.

Schwierigkeitsgrad des Tests.

Kriterien zur Bewertung.

Liste der verwendeten Literatur und Internetressourcen.

Notiz.

Einführung.

Eine der wichtigsten Komponenten Bildungsaktivitäten ist Kontrolle. Die pädagogische Kontrolle erfüllt eine Reihe von Funktionen pädagogischer Prozess: bewertend, anregend, entwicklungsfördernd, pädagogisch, diagnostisch, pädagogisch usw.

Die Kontrolle soll externes Feedback (Lehrerkontrolle) und internes Feedback (Selbstkontrolle des Schülers) liefern; die Kontrolle zielt auch darauf ab, Informationen zu erhalten und zu analysieren, welche der Lehrer während des Bildungsprozesses die notwendigen Anpassungen vornimmt.

Eine seiner vielfältigen Formen ist das Testen, das in dieser Sammlung besprochen wird.

Tests in der Pädagogik erfüllen drei miteinander verbundene Hauptfunktionen: Diagnose, Lehre und Bildung:

  • Diagnosefunktion besteht darin, den Wissensstand, die Fähigkeiten und Fertigkeiten des Schülers zu ermitteln. Dies ist die wichtigste und offensichtlichste Testfunktion. In puncto Objektivität, Umfang und Schnelligkeit der Diagnose übertrifft das Testen alle anderen Formen der pädagogischen Kontrolle.

    Bildungsfunktion Tests sollen den Schüler motivieren, die Arbeit an der Beherrschung des Lehrstoffs zu intensivieren. Um die pädagogische Funktion des Tests zu verbessern, können zusätzliche Anreizmaßnahmen eingesetzt werden, wie z. B. die Verteilung eines ungefähren Fragenkatalogs durch den Lehrer zur Selbstvorbereitung, das Vorhandensein von Leitfragen und Tipps im Test selbst und die gemeinsame Analyse der Testergebnisse.

    Bildungsfunktionäußert sich in der Häufigkeit und Unvermeidlichkeit der Testkontrolle. Dies diszipliniert, organisiert und lenkt die Aktivitäten der Studierenden, trägt dazu bei, Wissenslücken zu erkennen und zu schließen und weckt den Wunsch, ihre Fähigkeiten weiterzuentwickeln.

Es gibt viele unterschiedliche Meinungen, sowohl für als auch gegen den Einsatz von Tests im Bildungsprozess. Einige betrachten Tests als ein Mittel, den Bildungsprozess in Richtung seiner Technologisierung umzuwandeln, die Arbeitsintensität zu reduzieren und werden zu Enthusiasten dieser Methode. Andere sehen in Tests eine Herabwürdigung der Rolle des Lehrers und die Testergebnisse seien nicht zuverlässig genug. Es ist jedoch zu beachten, dass Tests nach und nach zur Hauptform des Bestehens von Abschlussprüfungen (und nicht nur) werden. Seit 2009 ist für alle Schulabgänger die wichtigste Form des staatlichen Schulabschlusses Russische Föderation ist das Einheitliche Staatsexamen. Daher ist es zwingend erforderlich, Testtechnologien in das Bildungssystem einzuführen. Mit ihrer Hilfe können Sie das ganze Jahr über den Grad der Beherrschung des Stoffes durch die Schüler beurteilen und ihre Fähigkeiten im Umgang mit Testaufgaben entwickeln. Eine solche Ausbildung ermöglicht es den Studierenden, ihre Punktzahl beim Bestehen des Einheitlichen Staatsexamens tatsächlich zu steigern. Während einer solchen Ausbildung werden entsprechende psychotechnische Fähigkeiten zur Selbstregulation und Selbstkontrolle entwickelt. In dieser Hinsicht werden Tests als Mittel zur Messung und Überwachung des Wissens der Schüler zur Grundlage des Bildungsprozesses an jeder russischen Schule.

Jeder Lehrer entscheidet selbst, in welchem ​​Umfang er die eine oder andere Kontrollmethode einsetzt.

Was ist ein Test?

Gegenstand unserer Forschung ist der Test. Was ist es?

Heutzutage findet man diesen Begriff nicht nur im Bildungswesen, sondern auch in weit davon entfernten Bereichen recht häufig.

Testen kommt vom Wort prüfen- testen, prüfen. Mithilfe von Tests wird die Übereinstimmung des Prüfgegenstands mit festgelegten Spezifikationen und Kriterien festgestellt. Der Zweck der Prüfung besteht nicht darin, die Gründe für die Nichteinhaltung spezifizierter Anforderungen zu ermitteln. Das Testen gehört zu den Teilgebieten der Diagnostik und wird in Technik, Medizin, Psychiatrie und Bildung eingesetzt, um die Eignung eines Testobjekts zur Erfüllung bestimmter Funktionen festzustellen. Die Qualität des Tests und die Zuverlässigkeit seiner Ergebnisse hängen weitgehend vom Tester ab.

Auf diese Weise , bestimmt werden kann prüfen , als standardisierte, kurze, zeitlich begrenzte Tests zur Feststellung quantitativer und qualitativer individueller Unterschiede.

In diesem Handbuch sprechen wir jedoch von pädagogischen Tests. Und um es zu definieren, ist Folgendes besser geeignet:

Pädagogische Prüfung ist eine Form der Wissensmessung von Schülern auf der Grundlage pädagogischer Tests. Es umfasst die Vorbereitung hochwertiger Tests, die eigentliche Prüfung und die anschließende Verarbeitung der Ergebnisse, die eine Beurteilung der Ausbildung der Prüfungsteilnehmer ermöglichen.

Dann pädagogische Prüfung kann als Instrument zur Beurteilung des Lernerfolgs von Studierenden definiert werden, bestehend aus einem System von Testaufgaben, einem standardisierten Verfahren zur Durchführung, Verarbeitung und Analyse der Ergebnisse.

Mit anderen Worten: Wir können definieren pädagogische Prüfung als ein System von Aufgaben mit zunehmendem Schwierigkeitsgrad und einer bestimmten Form, das es ermöglicht, das Niveau qualitativ und effektiv zu messen und die Struktur der Vorbereitung der Schüler zu bewerten.

Um diese Definition besser zu verstehen, geben wir eine kurze Interpretation ihrer wichtigsten Begriffe.

System bedeutet, dass der Test Aufgaben enthält, die systembildende Eigenschaften haben. Hierbei ist zunächst die generelle Zugehörigkeit von Aufgaben zum gleichen Wissenssystem hervorzuheben, d.h. zu einer akademischen Disziplin, einem Abschnitt, einem Thema usw., deren Verbindung und Reihenfolge. Für die staatliche Abschlusszertifizierung (GCA) von Schulabsolventen ist es notwendig, integrierte Aufgaben zu entwickeln, deren Inhalt das Wissenssystem abdeckt. Bei der pädagogischen Prüfung werden die Aufgaben nach steigendem Schwierigkeitsgrad geordnet – vom einfachsten zum schwierigsten. Mit anderen Worten: Das wesentliche formalsystembildende Merkmal des Tests ist der Unterschied der Aufgaben hinsichtlich ihres Schwierigkeitsgrades.

Spezifisches Formular Testaufgaben unterscheiden sich dadurch, dass es sich bei den Testaufgaben nicht um Fragen oder Aufgaben handelt, sondern um Aufgaben, die in Form von Aussagen formuliert sind, die je nach Antwort wahr oder falsch sind. Herkömmliche Fragen hingegen sind weder wahr noch falsch, und die Antworten darauf sind oft so vage und ausführlich, dass die Feststellung ihrer Richtigkeit insgesamt einen erheblichen Aufwand an intellektueller Energie der Lehrer erfordert. In diesem Sinne sind traditionelle Fragen und Antworten Low-Tech und sollten daher nicht in den Test einbezogen werden.

Spezifischer Inhalt bedeutet, dass in der Prüfung nur solches Kontrollmaterial verwendet wird, das dem Inhalt der akademischen Disziplin entspricht; der Rest wird unter keinem Vorwand in die pädagogische Prüfung einbezogen.

Zunehmende Schwierigkeit der Aufgaben kann im übertragenen Sinne mit Barrieren auf einem Stadionlaufband verglichen werden, bei denen jede weitere höher ist als die vorherige. Da in einer pädagogischen Prüfung die Aufgaben nach dem Prinzip steigender Schwierigkeit geordnet werden, „scheitern“ manche Prüfungsteilnehmer bereits bei der einfachsten, ersten Aufgabe, während andere bei den Folgeaufgaben durchfallen. Ein Schüler mit durchschnittlicher Vorbereitung kann nur die Hälfte der Testaufgaben richtig beantworten, und schließlich sind nur die sachkundigsten Schüler in der Lage, die Aufgaben mit dem höchsten Schwierigkeitsgrad am Ende des Tests richtig zu beantworten.

Beantwortung der pädagogischen Testaufgabe ist ein kurzes Urteil, das in Inhalt und Form auf den Inhalt der Aufgabe bezogen ist. Jeder Aufgabe sind richtige und falsche Antworten zugeordnet. Die Genauigkeitskriterien werden vorab von den Testautoren festgelegt. Die Wahrscheinlichkeit einer richtigen Antwort auf eine Aufgabe hängt vom Verhältnis des Wissensstands der Testperson zum Schwierigkeitsgrad der Aufgabe ab.

Durch Tests werden Wissen, Fähigkeiten, Fertigkeiten und Ideen häufiger getestet als andere Zeichen. Aus pädagogischer Sicht ist eine Einführung sinnvoll zwei Hauptindikatoren für die Wissensqualität- Niveau und Struktur des Wissens. Zur Bewertung werden Punkte sowohl für das Wissen als auch für das Unwissen über alle erforderlichen Bestandteile des zu prüfenden Materials erfasst. Um diesen Prozess zu objektivieren, müssen alle Komponenten identisch sein. Auch die Regeln für die Benotung der Fächer sind die gleichen. Diese Bedingungen eröffnen den Weg für einen objektiven Vergleich individueller Wissens- und Nichtwissensstrukturen.

Wissensstand wird durch die Analyse der Antworten jedes Schülers auf alle Testaufgaben ermittelt. Je mehr richtige Antworten vorhanden sind, desto höher ist die individuelle Testpunktzahl des Probanden. Typischerweise wird dieses Testergebnis mit dem Konzept des „Wissensstandes“ in Verbindung gebracht und einem Klärungsverfahren unterzogen, das auf dem einen oder anderen Modell der pädagogischen Messung basiert. Der gleiche Wissensstand kann durch die Beantwortung unterschiedlicher Aufgaben erreicht werden.

Mit Beginn der aktiven Entwicklung der Computertechnologie ist der Einsatz eines Computers als Werkzeug zur Aufgabenanalyse sehr effektiv. Computertests gehören heute zu den elektronischen Lernwerkzeugen (ELT).

Also, die wichtigsten Phasen der Beurteilung der Wirksamkeit der Ausbildung Studierende, die ESE nutzen, sollten:

1. Klare Formulierung der Anforderungen an Kenntnisse, Fähigkeiten und Fertigkeiten der Studierenden. Die Anforderungen werden vor Beginn der Ausbildung und der Gründung des ESB formuliert und müssen den Inhalten und Methoden der Ausbildung entsprechen;

2. Entwicklung von Kontroll- und Messsubsystemen der ESE zur Prüfung von Studierenden. Die Materialien werden in strikter Übereinstimmung mit den Anforderungen an Kenntnisse, Fähigkeiten und Fertigkeiten der Studierenden entwickelt. Für jede Aufgabe wird angegeben, welche Anforderung(en) sie erfüllt;
3. Entwicklung von Technologien zum Testen von Studierenden, Bestimmung der Rolle der ESO bei der Messung der Effektivität des Lernens von Studierenden;

4. Fachliche Beurteilung der Qualität von Kontroll- und Messmaterialien. Überprüfung der Übereinstimmung der Prüfungsmaterialien mit den Ausbildungsinhalten und den Anforderungen an Kenntnisse, Fertigkeiten und Fähigkeiten der Studierenden. Beurteilung der Vollständigkeit der Anforderungsabdeckung mit Messmitteln;
5. Durchführung von Messungen mit dem entwickelten ESD. Die Beurteilung der Bildungsqualität kann sowohl im Rahmen des aktuellen Bildungsprozesses als auch nach dessen Abschluss am Ende des Studienjahres erfolgen. Die Messung erfolgt durch den Lehrer mittels elektronischer Lernmittel;
6. Ermittlung der Messergebnisse, Skalierung der Ergebnisse, Zusammenführung in ein Bewertungssystem, Vergleich der Ergebnisse, Formulierung von Schlussfolgerungen zur Qualität der Ausbildung von Studierenden, die ESE nutzen.

Aus der Geschichte der Tests.

Heutzutage werden Tests sehr aktiv im Bildungsprozess eingesetzt. Haben Sie jemals darüber nachgedacht, wann der erste Test erschien?

Auch in Antikes Ägypten, Griechenland, China, verschiedene Fähigkeiten, Kenntnisse, Fertigkeiten und Fertigkeiten wurden getestet. Diese Tests waren mit bestimmten Messungen bestimmter qualitativer Ergebnisse menschlicher Aktivitäten verbunden. Sie können mit Fug und Recht als Vorgeschichte der Tests betrachtet werden. Mit der Weiterentwicklung der sozialen Beziehungen verbesserten sich auch die quantitativen Messmethoden und es wurden neue Anforderungen an Prüfungen und Benotungen gestellt. Alle oben genannten Punkte können jedoch nicht als Tests bezeichnet werden modernes Verständnis diese Bezeichnung.

P erste Stufe Der Einsatz von Tests in der weltweiten Praxis kann als Zeitraum ab den 80er Jahren betrachtet werden. 19. Jahrhundert bis in die 20er Jahre 20. Jahrhundert Dies ist die Zeit der Geburt und Entwicklung des Testens. Die theoretischen Grundlagen des Testens wurden Mitte der 80er Jahre gelegt. 19. Jahrhundert Der englische Psychologe und Naturforscher F. Galton schlug vor, dass es mit Hilfe von Tests möglich sei, die Faktoren Vererbung und Umwelteinflüsse in der menschlichen Psyche zu trennen.

F. Galtons wichtiger Beitrag zur Entwicklung der Testtheorie war die Identifizierung von drei Grundprinzipien, die noch heute verwendet werden:

1) Anwendung einer Reihe identischer Tests auf eine große Anzahl von Probanden;

2) statistische Verarbeitung der Ergebnisse;

3) Identifizierung von Bewertungsstandards.

Der französische Psychologe Alfred Binet leistete einen großen Beitrag zur Entwicklung der Testologie. Er gilt als Begründer moderner Tests zur Diagnose des Intelligenzentwicklungsstandes. Anschließend führten er und der Pariser Arzt T. Simon das Konzept des „geistigen Alters“ und die entsprechende metrische Skala ein (1908). Also im ersten Jahrzehnt des 20. Jahrhunderts. In der Praxis wurde der bekannte Binet-Simon-Test eingeführt, dessen Hauptaufgabe darin bestand, geistig behinderte Kinder zu identifizieren und sie anschließend auf Sonderschulen zu schicken.

Zweite Etage Die Entwicklung des Testens kann als die 20-60er Jahre betrachtet werden. letztes Jahrhundert. Amerikanische V.A. McCall unterteilte die Tests in pädagogische (Bildungstest) und psychologische (Intelligenztest). McCall begründete den Zweck der Verwendung pädagogischer Tests – die Gruppierung von Schülern, die die gleiche Menge an Material mit der gleichen Geschwindigkeit lernen. Das Hauptziel pädagogischer Tests bestand darin, den Erfolg von Schülern in bestimmten Schulfächern über einen bestimmten Studienzeitraum sowie den Erfolg bei der Anwendung bestimmter Lehr- und Organisationsmethoden zu messen.

Die Entwicklung des ersten pädagogischen Tests gehört dem amerikanischen Psychologen Edward Lee Thorndike. Er gilt als Begründer der pädagogischen Messung. Der erste unter seiner Leitung veröffentlichte pädagogische Test war der Stone-Test zur Lösung arithmetischer Probleme. Vor allem in den USA sind Erfolgstests zur Überprüfung der Kenntnisse, Fähigkeiten und Fertigkeiten von Studierenden in einzelnen Fächern weit verbreitet.

Der erste Fremdsprachentest wurde 1925 von B. Wood zusammengestellt. Seine Tests wurden für Abschlussprüfungen an New Yorker Schulen verwendet und umfassten Multiple-Choice-Aufgaben zu Wortschatz, Grammatik und Lesen in Französisch und Spanisch. Im Jahr 1929 untersuchte der amerikanische Psychologe V. Henmon einige Fragen der Technologie zur Zusammenstellung von Testaufgaben für Erfolgstests. Er entwickelte Tests, um Kenntnisse in Wortschatz, Grammatik und Phonetik zu testen; Fähigkeiten, das Gelesene auf der Ebene von Sätzen und Absätzen zu verstehen, Übersetzung, Zuhören, Sprechfähigkeiten und die Fähigkeit, Aufsätze zu schreiben.

In Russland praktische Bedeutung Tests gingen nach 1925 ein, als eine spezielle Testkommission eingerichtet wurde. Es existierte in der pädagogischen Abteilung des Instituts für Schularbeitsmethoden. Zu ihren Aufgaben gehörte die Entwicklung von Tests für die sowjetische Schule. Und bereits im Frühjahr 1926 wurden solche Tests veröffentlicht, die auf der Grundlage amerikanischer Tests erstellt wurden. Tests wurden in den Bereichen Naturgeschichte, Sozialkunde, Rechnen, Problemlösung, Leseverständnis und Rechtschreibung entwickelt. Zu diesen Tests gehörten Anweisungen und eine Punktekarte zur Aufzeichnung der Fortschritte des Schülers.

Bereits in diesen Jahren wurde nachgewiesen, dass die Testmethode nicht nur die Erfassung einzelner elementarer mentaler Prozesse ermöglicht, sondern auch deren Gesamtheit analysieren kann. Darüber hinaus wurde festgestellt, dass die Prüfungsabrechnung Zufälligkeit, Subjektivität und ungefähre Beurteilung der Arbeit mit Studierenden eliminiert.

In den 30-50er Jahren. Besonderes Augenmerk wurde auf die sogenannten prädiktiven Tests, den Zweck von Tests im Bildungssystem, die Arten von Tests und deren Einsatz in der Praxis gelegt. Fragen im Zusammenhang mit der Entwicklung von Tests durch praktizierende Lehrer sind derzeit von besonderer Relevanz.

Der nächste Schritt Die Entwicklung des Testens in Russland reicht bis in die frühen 60er Jahre zurück. bis Ende der 70er Jahre. Reformen im Unterricht verschiedener Fächer und die Entwicklung des programmierten Unterrichts haben wesentliche Impulse für die weitere Verbesserung der Tests gegeben.

Gleichzeitig beginnt sich das Testen mit Computern in großem Umfang durchzusetzen, was dank der Fortschritte auf dem Gebiet der Automatisierung und Kybernetik möglich wurde.

In den 60er Jahren Nach einer langen Pause beginnt zunächst die Forschung einheimischer Wissenschaftler zum Einsatz psychologischer und pädagogischer Tests. Grundsätzlich basieren diese Entwicklungen auf der Analyse langjähriger, im Ausland gesammelter Testerfahrungen.

Seit Anfang der 80er Jahre. hat begonnen neue Bühne bei der Entwicklung von Tests in Russland. Diese Zeit ist durch eine Reihe von Merkmalen gekennzeichnet. Ein wichtiger Bereich ist zunächst der intensive Einsatz von Computern sowohl im Testprozess als auch bei der Verarbeitung der gewonnenen Ergebnisse.

In den letzten Jahren wurden Tests aktiv in den Bildungsprozess eingeführt. Und trotz der Defizite, die bei dieser Form der Wissenskontrolle und -bewertung auftreten, nimmt das Testen eine recht starke Stellung ein.

Arten von Tests.

Tests können nach verschiedenen Kriterien klassifiziert werden:

    nach Zweck - Information, Diagnose, Schulung, Motivation, Zertifizierung;

    je nach Erstellungsverfahren - standardisiert, nicht standardisiert;

    nach der Methode der Aufgabengenerierung - deterministisch, stochastisch, dynamisch;

    nach Technologie - Papier, einschließlich Papier mit optischer Erkennung, in Originalgröße, unter Verwendung spezieller Geräte, Computer;

    je nach Aufgabenform - geschlossener Typ, offener Typ, Matching, Sequenzreihenfolge;

    je nach Vorhandensein von Feedback - traditionell und adaptiv.

Da sich das Handbuch dem Einsatz von Tests im Bildungsbereich widmet, werden wir über Wissenstests sprechen.

Traditionelle Tests

Ein traditioneller Test hat Zusammensetzung, Integrität und Struktur; ein solcher Test enthält eine Liste von Fragen und Verschiedene Optionen Antworten. Jede Frage ist eine bestimmte Anzahl von Punkten wert. Das Ergebnis eines herkömmlichen Tests hängt von der Anzahl der richtig beantworteten Fragen ab. Laut V. S. Avanesov ist ein traditioneller Test ein System von Aufgaben, die in der Reihenfolge zunehmender Komplexität gleichzeitig präsentiert werden, mit dem gleichen Bewertungssystem für alle Testteilnehmer.

Nicht-traditionelle Tests

Zu den nicht-traditionellen Tests zählen integrative, adaptive, mehrstufige und sogenannte kriterienorientierte Tests.

1. Integrative Tests

Als integrativer Test kann ein Test bezeichnet werden, der aus einem Aufgabensystem besteht, das auf eine verallgemeinerte Enddiagnose der Vorbereitung eines Absolventen einer Bildungseinrichtung abzielt. Die Diagnostik erfolgt durch die Darstellung solcher Aufgaben, deren richtige Beantwortung integrierte (verallgemeinerte, klar zusammenhängende) Kenntnisse zweier oder mehrerer wissenschaftlicher Disziplinen erfordert.

2. Adaptive Tests

Der adaptive Test ist eine Variante automatisiertes System Testen, bei dem die Parameter Schwierigkeit und Differenzierungsfähigkeit jeder Aufgabe im Voraus bekannt sind. Hierbei handelt es sich um eine spezielle Art von Test, bei dem jede weitere Aufgabe in Abhängigkeit von den Antworten auf vorherige Aufgaben ausgewählt wird. Die Reihenfolge der Aufgaben und deren Anzahl wird bei diesem Testtyp dynamisch bestimmt. Dieses System wird in Form einer Computerdatenbank mit Aufgaben erstellt, die nach den Merkmalen der interessierenden Aufgaben geordnet sind. Das wichtigste Merkmal adaptiver Testaufgaben ist ihr empirisch ermittelter Schwierigkeitsgrad, das heißt: Bevor jede Aufgabe an die Bank gelangt, wird sie einer empirischen Prüfung unterzogen, um sicherzustellen, dass sie ausreichend ist große Zahl typische Studierende der interessierenden Bevölkerung.

Die wichtigsten Vorteile computeradaptiver Tests gegenüber herkömmlichen Tests sind:

    die Fähigkeit, sich an den Wissensstand des Testteilnehmers anzupassen (Sie müssen keine zu komplexen oder zu einfachen Fragen beantworten);

    Zeit- und Arbeitsersparnis durch Reduzierung der Aufgabenanzahl (Testlänge kann um bis zu 60 % reduziert werden), ohne dass die Zuverlässigkeit verloren geht.

Arten von Testaufgaben

Betrachten wir die beliebteste Klassifizierung von Testaufgaben. Innerhalb dieser Klassifizierung lassen sich Testaufgaben in zwei Gruppen einteilen:

    geschlossene Testaufgaben (jede Frage wird begleitet von vorgefertigte Optionen Antworten, aus denen Sie eine oder mehrere richtige auswählen müssen);

    offene Testaufgaben (für jede Frage muss der Testteilnehmer seine eigene Antwort anbieten: ein Wort, eine Phrase, einen Satz, ein Zeichen, eine Formel usw. hinzufügen).

Die Wahl der Art und Art der Prüfaufgabe richtet sich in erster Linie nach den Zielen, nach denen geprüft wird, der Beschaffenheit des Stoffes, dessen Beherrschung ermittelt werden soll, und den Altersmerkmalen des Prüflings Fächer. Von nicht geringer Bedeutung sind die finanzielle, personelle und ressourcenbezogene Unterstützung sowie die Zeit, die dem Entwickler zur Verfügung steht.

Geschlossene Aufgaben

Offene Aufgaben

Mehrfachauswahl

Kostenlose Präsentation

Alternative Wahl

Zusatz

Compliance herstellen

Sequenzierung

    Multiple Choice – Der Testteilnehmer muss eine oder mehrere richtige Antworten aus der vorgegebenen Liste auswählen.

    Alternative Wahl – der Proband muss mit „Ja“ oder „Nein“ antworten.

    Herstellen einer Korrespondenz – Der Proband wird gebeten, eine Korrespondenz zwischen den Elementen zweier Listen herzustellen.

    Festlegung einer Reihenfolge – der Proband muss die Elemente der Liste in einer bestimmten Reihenfolge anordnen.

    Freie Präsentation – der Proband muss die Antwort selbstständig formulieren; In der Aufgabe werden ihnen keine Einschränkungen auferlegt.

    Ergänzung – Der Testteilnehmer muss Antworten unter Berücksichtigung der in der Aufgabe vorgesehenen Einschränkungen formulieren (z. B. Ergänzung zum Satz).

Vor- und Nachteile des Testens.

Im Vergleich zu anderen Formen der Wissenskontrolle hat das Testen seine Vor- und Nachteile.

Vorteile:

    Tests sind eine qualitativ hochwertigere und objektivere Bewertungsmethode. Ihre Objektivität wird durch die Standardisierung des Verfahrens und die Überprüfung der Qualitätsindikatoren von Aufgaben und Tests insgesamt erreicht.

    Tests sind eine gerechtere Methode; sie stellt alle Schüler sowohl im Kontrollprozess als auch im Bewertungsprozess gleich und eliminiert praktisch die Subjektivität des Lehrers. Nach Angaben des englischen Verbandes NEAB, der sich mit der Abschlusszertifizierung von Studierenden im Vereinigten Königreich befasst, kann die Zahl der Einsprüche durch Tests um mehr als das Dreifache reduziert werden, sodass das Bewertungsverfahren für alle Studierenden gleich ist, unabhängig von Wohnort, Art und Weise Art der Bildungseinrichtung, in der Studierende studieren.

    Tests sind ein umfangreicheres Instrument, da die Tests Aufgaben zu allen Themen des Kurses umfassen können, während die mündliche Prüfung normalerweise 2-4 Themen umfasst und die schriftliche Prüfung 3-5. Auf diese Weise können Sie das Wissen des Studenten während des gesamten Kurses nachvollziehen und so den Zufall beim Ziehen eines Tickets vermeiden. Mit Hilfe von Tests ist es möglich, den Kenntnisstand des Studierenden im gesamten Fach und in seinen einzelnen Abschnitten zu ermitteln.

    Ein Test ist ein genaueres Werkzeug. Beispielsweise besteht eine Testbewertungsskala mit 20 Fragen aus 20 Unterteilungen, während eine normale Wissensbewertungsskala nur vier Unterteilungen hat.

    Tests sind kostengünstiger. Die Hauptkosten beim Testen hängen mit der Entwicklung hochwertiger Werkzeuge zusammen, sind also einmaliger Natur. Die Kosten für die Durchführung der Prüfung sind deutlich geringer als bei einer schriftlichen oder mündlichen Prüfung. Die Durchführung der Prüfung und Ergebniskontrolle in einer Gruppe von 30 Personen dauert eineinhalb zwei Stunden, eine mündliche oder schriftliche Prüfung dauert mindestens vier Stunden.

    Prüfungen sind ein sanfteres Instrument; sie stellen alle Schüler auf die gleiche Stufe, verwenden ein einziges Verfahren und einheitliche Bewertungskriterien, was zu einer Verringerung der nervösen Anspannung vor der Prüfung führt.

Mängel:

    Die Entwicklung hochwertiger Testwerkzeuge ist ein langer, arbeitsintensiver und teurer Prozess.

    Die vom Lehrer als Ergebnis der Tests erhaltenen Daten enthalten zwar Informationen über Wissenslücken in bestimmten Abschnitten, ermöglichen jedoch keine Beurteilung der Gründe für diese Lücken.

    Der Test testet und bewertet nicht hohe, produktive Wissensniveaus, die mit Kreativität verbunden sind, also probabilistisches, abstraktes und methodisches Wissen.

    Die Breite der Themenabdeckung beim Testen hat auch eine Kehrseite. Während einer Prüfung bleibt dem Studierenden im Gegensatz zu einer mündlichen oder schriftlichen Prüfung nicht genügend Zeit für eine vertiefte Auseinandersetzung mit dem Thema.

    Um die Objektivität und Fairness des Tests zu gewährleisten, müssen besondere Maßnahmen ergriffen werden, um die Vertraulichkeit der Testaufgaben sicherzustellen. Bei einer Wiederverwendung des Tests empfiehlt es sich, Änderungen an den Aufgaben vorzunehmen.

    Beim Testen gibt es ein Element der Zufälligkeit. Beispielsweise kann ein Schüler, der eine einfache Frage nicht beantwortet, auf eine komplexere Frage die richtige Antwort geben. Der Grund hierfür könnte entweder ein zufälliger Fehler bei der ersten Frage oder eine Vermutung der Antwort bei der zweiten sein. Dies verzerrt die Testergebnisse und führt dazu, dass bei der Analyse die probabilistische Komponente berücksichtigt werden muss.

Die oben genannten Nachteile weisen darauf hin, dass die Fähigkeiten der Testform zur Wissensmessung und -überwachung nicht absolut sein sollten. Nicht alle notwendigen Merkmale zur Beherrschung von Kenntnissen und Fähigkeiten können durch Tests erworben werden. Beispielsweise können Indikatoren wie die Fähigkeit, die eigene Antwort anhand von Beispielen zu präzisieren, die Kenntnis von Fakten, die Fähigkeit, seine Gedanken kohärent, logisch und nachweisbar auszudrücken, und einige andere Merkmale von Wissen, Fähigkeiten und Fertigkeiten nicht durch Tests diagnostiziert werden. Dies bedeutet, dass die Prüfung unbedingt mit anderen Formen und Methoden der Prüfung und Überwachung des Wissens der Studierenden kombiniert werden muss.

Doch trotz der aufgezeigten Nachteile des Testens als Methode der pädagogischen Kontrolle weisen seine positiven Eigenschaften weitgehend darauf hin, dass der Einsatz dieser Technologie im Bildungsprozess sinnvoll ist.

Testentwicklung.

Testaufgaben können mit einer Vielzahl von Computertools erstellt werden, die von verschiedenen Editoren und Programmen zur Entwicklung von Präsentationen bis hin zum Einsatz von Programmiersprachen und dem Internet reichen.

Markieren fünf Phasen der Testentwicklung :

Die erste Stufe besteht darin, den Zweck und die Ziele der Testentwicklung zu bestimmen.

Zweite Etage ist die Entwicklung von Aufgaben in Testform. Die zweite Stufe erfordert eine Ausbildung auf dem Gebiet des Unterrichtsfachs, Kenntnisse über Testformen, die Beherrschung der Logik und die Fähigkeit, Fragmente von Inhalten der akademischen Disziplin in Aufgabeninhalte umzuwandeln.

An dritter Abschnitt Testaufgaben werden entwickelt. Für erfolgreiche Aktivitäten in der dritten Stufe benötigen Entwickler zusätzlich eine Schulung in der Anwendung statistischer Methoden, der Datenverarbeitung und -interpretation.

An vierte Stufe Aufgaben werden ausgewählt und Tests erstellt, wodurch die Qualität und Effizienz des Tests erhöht wird. Das Vorhandensein einer ausreichenden Anzahl von Testaufgaben ermöglicht es uns, den Test als System mit Integrität, Zusammensetzung und Struktur zu entwickeln.

An fünfte Stufe Der Inhalt der interessierenden Variablen wird geklärt, die Messskala festgelegt und mithilfe eines Computerprogramms die Schwierigkeitswerte von Testaufgaben und der Vorbereitungsgrad der Testteilnehmer ermittelt und geklärt.

Die Entwicklung hochwertiger Testwerkzeuge ist, wie oben erwähnt, ein langer, arbeitsintensiver und teurer Prozess. Bei diesem Prozess müssen einige Punkte berücksichtigt werden:

Inhalte des Tests.

Beim Erstellen eines Tests besteht der erste Schritt darin, seinen Zweck zu bestimmen. Wenn Sie sich entscheiden, eine eigene Methode zu entwickeln, müssen Sie genau wissen, wozu der Test dient und warum Sie mit den vorhandenen Analoga nicht zufrieden sind.

Bei der Entwicklung von Aufgaben sollten Sie sich an einigen orientieren

    Formulieren Sie jede Aufgabe oder Frage in einer gemeinsamen und klaren (eindeutigen) Sprache, die für die Probanden verständlich ist.

    Beim Schreiben von Fragen sollten Sie besonders sorgfältig auf die Wörter „manchmal“, „oft“, „immer“, „alle“, „nie“ achten.

    Die Frage sollte klar formuliert sein und die Wörter groß, klein, klein, viele, wenig, weniger, mehr usw. vermeiden.

    Vermeiden Sie einleitende Phrasen und Sätze, die wenig mit der Hauptidee zu tun haben; Sie sollten nicht auf lange Aussagen zurückgreifen, da diese zur richtigen Antwort führen, auch wenn der Schüler diese nicht weiß.

    Denken Sie daran, dass eine Erhöhung der Anzahl der in einem Test enthaltenen Elemente seine Zuverlässigkeit erhöht.

    Der Test sollte nach Möglichkeit Aufgaben unterschiedlicher Art und Art umfassen, da dies seine Zuverlässigkeit erhöht.

    Die Konstruktion von Antworten auf der Grundlage von „Ja“ und „Nein“ verringert die Zuverlässigkeit von Tests.

    Fügen Sie im Testtext keine direkten Zitate aus Büchern ein.

    Verwenden Sie im Test keine Fallenaufgaben oder provokativen Fragen.

    Der Test sollte keine Probleme enthalten, die Antworten auf andere Fragen liefern.

    Vermeiden Sie Fragen, die auf der Grundlage allgemeiner Gelehrsamkeit ohne besondere Kenntnisse aus dem Studium dieser Disziplin beantwortet werden können.

    Verwenden Sie Diagramme, Tabellen, Bilder, Diagramme, Flussdiagramme und andere erklärende Aufgaben.

    Falsche Antworten müssen vernünftig und geschickt ausgewählt sein und dürfen keine offensichtlichen Ungenauigkeiten oder Hinweise enthalten.

    Alle Antwortmöglichkeiten müssen grammatikalisch mit dem Hauptteil der Aufgabe übereinstimmen; verwenden Sie kurze, einfache Sätze, ohne abhängige oder unabhängige Sätze.

    Verneinungen im Hauptteil seltener verwenden, doppelte Verneinungen vermeiden, wie zum Beispiel: „Warum geht das nicht ...?“

    Die Beantwortung der gestellten Frage sollte nicht von früheren Antworten abhängen.

    Richtige und falsche Antworten müssen in Inhalt, Struktur und Gesamtzahl der Wörter klar sein. Verwenden Sie plausible Irrtümer aus Erfahrung.

    Wenn die Frage quantitativer Natur ist, ordnen Sie die Antworten in aufsteigender Reihenfolge; wenn die Antworten in Form von Textwörtern dargestellt werden, ordnen Sie sie in alphabetischer Reihenfolge.

    Auf die Antwortmöglichkeiten „keine der oben genannten“ und „alle der oben genannten“ sollten Sie besser verzichten.

    Vermeide Wiederholung.

    Verwenden Sie Einschränkungen in der Frage selbst.

    Vereinfachen Sie die Probleme nicht.

    Der Ort der richtigen Antwort muss so bestimmt werden, dass sie sich nicht von Frage zu Frage wiederholt, keine Muster aufweist, sondern in zufälliger Reihenfolge angegeben wird.

    Es ist besser, eine lange Frage und eine kurze Antwort zu verwenden.

    Analysieren Sie die Aufgaben unter dem Gesichtspunkt der falschen Antwort der am besten vorbereiteten Schüler.

    Die nationalen Systeme einer Reihe von Ländern stellen spezifische Anforderungen an Testaufgaben, denen wir noch nicht genügend Aufmerksamkeit geschenkt haben. Betrachten Sie als Beispiel die Anforderungen der Richtlinien zum Verfassen von Tests, die vom Northen Examinations and Assessment Board (NEAB) bereitgestellt werden: „Fragen, die in irgendeiner Weise eine Überlegenheit gegenüber dem Testteilnehmer eines bestimmten Geschlechts suggerieren, sollten vermieden werden.“

Der Inhalt des Tests kann als optimale Widerspiegelung der Bildungsinhalte im System der Testaufgaben definiert werden. Inhalt schulische Ausbildung wird als ein Wissens- und Erfahrungssystem der Menschheit definiert, dessen Aneignung für den späteren Erwerb einer beruflichen Bildung und zur Verbesserung der Lebensqualität notwendig ist. Die Inhalte der Ausbildung werden durch verschiedene Bildungsprogramme bestimmt, deren Wahl die Studierenden auf freiwilliger Basis treffen. In einem gut funktionierenden Bildungssystem sollte ein System von Testaufgaben grundsätzlich das gesamte Wissen prüfen, das den Studierenden im Lernprozess vermittelt wird. Aus vielen Gründen ist der Umfang des geprüften Wissens jedoch immer geringer als der Umfang des im Unterricht angebotenen Wissens. Überprüfbares Wissen ist der Teil des Inhalts einer wissenschaftlichen Disziplin, dessen Erwerb durch Studierende in einer bestimmten Bildungseinrichtung einer obligatorischen Kontrolle unterliegt.

Einige Elemente des zu prüfenden Wissens (hauptsächlich zu bestimmten Themen) werden nur in der aktuellen Kontrolle verwendet. Weitere Elemente, die Kenntnisse zu mehreren Themen abdecken, werden in der Zwischenkontrolle, beispielsweise am Ende des akademischen Quartals, eingesetzt. Und schließlich kommen in der Endkontrolle Aufgaben zum Einsatz, deren richtige Beantwortung Kenntnisse über viele, teilweise sogar alle im Laufe des Schuljahres erlernten Themen erfordert.

In den Testschreibanweisungen des NEAB (Northen Examinations and Assessment Board) heißt es: „Bei einem Testthema muss der Entwickler sicherstellen, dass das gesamte Thema durch die vorgeschlagenen Fragen abgedeckt wird. Der Inhalt des Faches muss durch die Matrix zu allen Themen vollständig abgedeckt sein. Wenn in einzelnen Fächern geprüft wird, ist es in diesem Fall erforderlich, dass das gesamte Thema durch die Prüfungsfragen abgedeckt wird. Wenn eine Frage oder ein Teil einer Frage nicht zum Thema passt oder im Rahmen dieses Themas nicht ganz klar ist, sollte man davon absehen, die Frage zu stellen.“

Testanforderungen .

Ein gut konzipierter Test muss bestimmte Anforderungen erfüllen.

Gültigkeit - Dies ist die Übereinstimmung der Testinhalte mit den Lernergebnissen, die im Programm erfasst werden. Es spiegelt wider, was der Test messen soll und wie gut er dies tut; gibt an, inwieweit ein Test die Qualität misst, die er bewerten soll. Der Validitätsindikator beantwortet die Frage: „Wird mit seiner Hilfe gemessen, was im Zweck der Kontrollaufgabe formuliert ist?“ Die Überprüfung der Validität des entwickelten Tests erfolgt durch Vergleich der Ergebnisse seiner Anwendung mit den Ergebnissen der Überprüfung des Ausbildungsstandes der getesteten Studierenden mit anderen Methoden (mündliche Befragung, Selbst- oder Testarbeit) und Vergleich dieser Ergebnisse mit der aktuellen Leistung von Studenten.

Sicherheit prüfen bedeutet, dass der Proband beim Lesen gut versteht, welche Aufgaben und in welchem ​​Umfang er erledigen muss, damit das erzielte Ergebnis der Aufgabe entspricht.

Standardisierung – ein einheitliches Verfahren zur Prüfung und Zusammenfassung der Ergebnisse.

Zuverlässigkeit prüfen - Dies ist seine Fähigkeit, den in didaktischen Experimenten untersuchten Indikator, sowohl die Aufgabe als Ganzes als auch ihre Teile, ausreichend einheitlich zu charakterisieren, d. h. inwieweit ihre Wiederholung zu den gleichen Ergebnissen führt. Die Erhöhung der Zuverlässigkeit des Tests wird durch seine Einfachheit, die strikte Einhaltung der Testbedingungen und den Ausschluss der Möglichkeit des Einflusses fremder Faktoren (Hinweise, Betrug usw.) erleichtert.

Prognostisch Der Wert des Tests bedeutet, dass der Test so beschaffen sein sollte, dass die Umfrageergebnisse in nachfolgenden Aktivitäten verwendet werden können, beispielsweise bei der Wiederholung von schlecht erlerntem Material.

Einfachheit Die Formulierung von Aufgaben und Antworten sollte klar und prägnant sein. Ein Indikator für Einfachheit ist die Geschwindigkeit der Aufgabenerledigung.

Einer der schwierigen und wichtigen Aspekte bei der Vorbereitung von Testaufgaben ist ihre korrekte Formulierung:

    Die Aufgabe sollte nach Möglichkeit keine Frage enthalten und die Antwort sollte eine Fortsetzung der Aufgabe sein.

    Die Formulierung der Aufgabe muss die dem Prüfling gestellte Aufgabe umfassend erläutern und die Sprache und Begriffe, Bezeichnungen, grafischen Darstellungen und Illustrationen der Aufgabe und Antworten darauf müssen für Studierende unbedingt und eindeutig verständlich sein.

    Der Wortlaut aller Antworten muss mit dem Wortlaut der Frage übereinstimmen. Es sollte keine Antworten geben, die sofort als unglaubwürdig auffallen.

    Es ist wünschenswert, dass alle Testaufgaben vom gleichen Typ sind, beispielsweise die Auswahl einer von fünf Antworten. Wenn Sie dennoch Aufgaben unterschiedlicher Art verwenden, müssen diese im Testprogramm sehr deutlich getrennt, beispielsweise farblich hervorgehoben, werden.

    Der Umfang der Testaufgabe sollte möglichst zehn Wörter nicht überschreiten. Es wird schwieriger sein, einen langen Aufgabentext als Ganzes wahrzunehmen.

    Gleiches gilt für die Länge der Antworten auf Aufgaben.

    Die Anzahl der Antwortmöglichkeiten sollte optimal sein.

Die elektronische Präsentation des Tests spart Zeit bei der Verwaltung und Zusammenfassung der Testergebnisse.

Schwierigkeitsgrad des Tests.

Wenn ein pädagogischer Test kurz als ein System von Aufgaben mit steigendem Schwierigkeitsgrad definiert wird, wird deutlich, dass die Schwierigkeit der Aufgaben der wichtigste, sagen wir mal, testbildende Indikator ist. Aus dieser Anforderung wird deutlich, dass vor Beginn der Tests eine vorläufige empirische Prüfung jeder Aufgabe obligatorisch ist. Während des Testprozesses erfüllen viele Aufgaben (in der Regel mehr als die Hälfte) nicht die dafür gestellten Anforderungen und werden daher nicht in den Test einbezogen. Die erste Voraussetzung für Testaufgaben: Im Test sollten die Aufgaben einen unterschiedlichen Schwierigkeitsgrad aufweisen, der sich aus der zuvor gegebenen Definition des Tests und dem betrachteten Prinzip ergibt.

Der Indikator für die Schwierigkeit des Tests und der Testaufgaben ist aussagekräftig und formal zugleich. Ein aussagekräftiger Indikator, denn in Guter Test Der Schwierigkeitsgrad kann nur vom Inhalt und vom Grad der Vorbereitung der Testteilnehmer selbst abhängen, während bei einem schlechten Test die Ergebnisse merklich durch die Form der Aufgaben beeinflusst werden (insbesondere wenn diese nicht dem Inhalt angemessen sind), dürftig Organisation von Tests, ob Möglichkeiten für Betrug oder Informationslecks bestehen.

Die formale Komponente des Schwierigkeitsindikators entsteht, wenn das Testen als ein Prozess der Konfrontation zwischen jeder Testperson und jeder ihr gestellten Aufgabe betrachtet wird. Es ist sinnvoll, das Ergebnis als Ergebnis einer solchen Konfrontation zu betrachten. Bei einer vereinfachten Interpretation jedes Falles der Konfrontation eines Probanden mit der nächsten Aufgabe werden in der Regel nur zwei Ergebnisse berücksichtigt: Sieg des Probanden mit der richtigen Lösung der Aufgabe, bei dem er einen Punkt erhält, oder Niederlage, für die ihm null Punkte gegeben werden Punkte. Die Bewertung des Ergebnisses der Konfrontation hängt vom Verhältnis des Wissensstandes des Testteilnehmers zum Schwierigkeitsgrad der Aufgabe, von der gewählten Maßeinheit des Wissens und von der vorab festgelegten Regel (Konvention) ab – was gilt als „Sieg“ für den Testteilnehmer und ob ein Unentschieden akzeptabel ist, wenn wir in der Sprache des Sports sprechen.

Das Prinzip der Schwierigkeitssteigerung wird bei der Darstellung der Inhalte vieler Lehrbücher und Handbücher verwendet, insbesondere in jenen akademischen Disziplinen, die auf einem kumulativen Prinzip aufbauen, was bedeutet: Das Wissen über nachfolgende Elemente des Kurses hängt explizit von dem Wissen über vorherige Bildungselemente ab. Diese Struktur ist Lehrbüchern zu Mathematik, Logik, Fremdsprachen, Statistik, Technik und vielen anderen Wissenschaften inhärent. In ihnen werden zuvor erlernte Konzepte aktiv in Folgethemen eingesetzt. Daher müssen Sie solche Disziplinen nur von Anfang an und lückenlos studieren.

Oftmals stimmt der Schwierigkeitsgrad einer Lernaufgabe nicht mit ihrer Komplexität überein. Der Grad der Komplexität von Lehrmaterialien wird durch den realen (objektiven) Reichtum der Bildungsaufgabe und der Form ihrer Darstellung charakterisiert, und der Schwierigkeitsgrad setzt immer eine Korrelation der zu beherrschenden Lehrmaterialien mit zuvor erworbenen Lehrmaterialien und dem voraus intellektuelle Fähigkeiten der Studierenden.

Schwierigkeit pädagogische Aufgabe Dies wird häufig dadurch erklärt, dass die Studierenden oft nicht wissen, welche Operationen durchgeführt werden müssen, um eine Lösung zu finden. Wenn ein System von Operationen zur Lösung einer bestimmten Klasse von Problemen als Lösungsmethode bezeichnet wird, dann ist die Schwierigkeit seiner Meinung nach mit der Unkenntnis der Methode verbunden, mit der Unkenntnis darüber, wie im Lösungsprozess zu denken ist, wie und in welcher Reihenfolge man sollte mit den Bedingungen des Problems handeln. Die auftretenden Schwierigkeiten erklären sich aus der Tatsache, dass der Lehrer oft versucht, Wissen über den Inhalt des Gelernten zu vermitteln, und sich viel weniger darum kümmert, wie man denkt und argumentiert. Diese Interpretation überschneidet sich mit der Vorstellung, dass die Komplexität einer Aufgabe mit der Anzahl der Operationen zusammenhängt, die abgeschlossen werden müssen, um erfolgreich zu sein. Diese Definitionen von Schwierigkeit und Komplexität sind größtenteils psychologischer Natur; Sie sind nützlich bei der psychologischen Analyse des Inhalts von Testaufgaben.

Der Inhalt des Tests kann nicht nur leicht, mittel oder schwer sein. Hier kommt die bekannte Vorstellung über die Abhängigkeit der Ergebnisse von der verwendeten Methode voll zur Geltung. Einfache Testaufgaben erwecken bei Studierenden nur den Anschein von Wissen, da sie minimales Wissen testen. In diesem Zusammenhang ist festzuhalten, dass die Fokussierung des Bundesbildungsmanagements auf die Prüfung des Mindestwissens auch per Definition keinen Aufschluss über den tatsächlichen Wissensstand, d.h. Bereitstellung der Informationen, die Gesellschaft und Regierungsbehörden seit langem benötigen. Es verzerrt die Testergebnisse und die Auswahl offensichtlich schwieriger Aufgaben, was dazu führt, dass die Mehrheit der Studierenden schlechte Ergebnisse erzielt. Die Konzentration auf schwierige Aufgaben wird oft als Mittel zur Steigerung der Lernmotivation angesehen. Dieses Mittel hat jedoch gemischte Wirkungen. Schwierige Aufgaben können manche Menschen dazu bringen, zu lernen, während andere sie davon abhalten können. Eine solche Ausrichtung verzerrt die Ergebnisse und mindert letztlich die Qualität der pädagogischen Messung.

Bei der Definition des Tests wurde bereits darauf hingewiesen, dass alle Testaufgaben, das möchte ich betonen, unabhängig von den Inhalten der Themen, Abschnitte und Fachdisziplinen nach steigendem Schwierigkeitsgrad geordnet sind. Die bis vor Kurzem verbreitete Empfehlung, mehr Aufgaben mit mittlerem Schwierigkeitsgrad in die Prüfung einzubeziehen, ist unter dem Gesichtspunkt der Bestimmung der Messsicherheit anhand sogenannter Formeln gerechtfertigt. klassische Testtheorie. Die in dieser Theorie vorhandenen Methoden zur Bewertung der Testzuverlässigkeit führen zu einer Abnahme der Zuverlässigkeit, wenn einfache und schwierige Aufgaben in den Test einbezogen werden. Gleichzeitig führt die Hingabe an Aufgaben mit nur mittlerem Schwierigkeitsgrad zu einer gravierenden Verformung des Prüfungsinhalts: Dieser verliert die Fähigkeit, den Inhalt der Studiendisziplin, in der es immer leichte und schwierige gibt, normal wiederzugeben Material. Also in der Verfolgung theoretisch hohe Zuverlässigkeit die inhaltliche Gültigkeit der Testergebnisse geht verloren. Der Wunsch, die Validität von Testergebnissen zu erhöhen, geht häufig mit einer Verringerung ihrer Genauigkeit einher.

Eine optimale Abbildung der Inhalte von Lehrmaterialien in Prüfungsaufgaben des geforderten Schwierigkeitsgrades erfordert die Möglichkeit, eine geeignete Form zu wählen.

3. Aufträge zur Feststellung der Compliance;

4. Aufgaben zur Festlegung der richtigen Handlungsfolge.

Kriterien zur Bewertung.

Die Methode zur Umrechnung eines Testergebnisses in ein traditionelles Fünf-Punkte-System kann unterschiedlich sein. Hier sind einige Beispiele:

    Nehmen wir an, der Test besteht aus 20 Aufgaben mit jeweils 4 möglichen Antworten, von denen nur eine richtig ist. Berechnen wir die Wahrscheinlichkeit des Erratens: Sie ist gleich ¼, d.h. Von 20 vorgeschlagenen Aufgaben kann ein Schüler zufällig 5 erraten. Wenn die verbleibenden Aufgaben in drei gleiche Teile aufgeteilt werden, entsprechend den positiven Noten „3“, „4“ und „5“, erhalten wir die Verteilungstabelle:

2 Punkte – 5 bis 8 richtige Antworten

(wobei 5 nur eine Vermutung sein könnte!)

3 Punkte – 9 bis 10 richtige Antworten;

4 Punkte – 11 bis 15 richtige Antworten;

5 Punkte – 16 bis 20 richtige Antworten.

    Bewertungskriterien in Prozent:

„5“: 80 – 100 % der Gesamtpunktzahl

„4“: 70 – 75 %

„3“: 50 – 65 %

„2“: weniger als 50 %

    Kriterien zur Bewertung von Testaufgaben anhand des Lernkoeffizienten K:

K = A/P, wobei A die Anzahl der richtigen Antworten im Test und P die Gesamtzahl der Antworten ist

Faktor K

Grad

0,9 – 1,0

„5“

0,8 – 0,89

„4“

0,7 – 0,79

"3"

Weniger als 0,7

„2“

Methoden zur Erstellung eines elektronischen Tests.

Wenn Fragen für einen Test zusammengestellt werden, benötigen Sie ein Programm, mit dem Sie Computertests durchführen können. Folgende Optionen sind beispielsweise möglich:

    Programm Mein Test.

Alle Rechte am MyTest-Programm liegen bei seinem Autor – Alexander Sergeevich Bashlakov (Unecha, Region Brjansk). Das Programm wird kostenlos verteilt, die kostenlose Nutzung des Programms ist allen Bildungseinrichtungen, Lehrern und Schülern gestattet. In diesem Programm erstellte Tests können unter beliebigen Bedingungen verteilt werden. MyTest wird „wie besehen“ verteilt. Es gibt keine Garantien, weder ausdrücklich noch stillschweigend. Die Nutzung des Programms erfolgt auf eigene Gefahr. Der Autor übernimmt keine Garantie für die Fehlerfreiheit und übernimmt auch keine Verantwortung für direkte oder indirekte Verluste aus der Nutzung oder Nichtnutzung des Programms, einschließlich solcher, die dadurch entstehen mögliche Fehler oder Tippfehler im Satz. Es ist untersagt, Änderungen am Programmcode vorzunehmen.

    Testgenerator.

Der Test wird im HTML-Format erstellt. Sie können die Anzahl der Fragen und Antwortmöglichkeiten unabhängig voneinander festlegen. Dabei wird auch die Komplexität der Fragen berücksichtigt. Eine sehr bequeme und einfache Möglichkeit, einen Test zu erstellen. Mit den vorgeschlagenen Optionen können Sie jedoch nur Tests von Standardtypen erstellen. Manchmal müssen oder möchten Sie jedoch Tests in einer anderen, nicht standardmäßigen Form durchführen.

    Erstellen von Tests mit FPSprojekt.

FPSproject ist eine Reihe von Programmen (Module: Creator, Server, Client, Journal), die entwickelt wurden, um den Testprozess zu vereinfachen und zu verbessern.

Das Funktionsprinzip des Komplexes ist wie folgt: Aufgaben werden mit dem Creator-Modul erstellt, dann werden Tests basierend auf diesen Aufgaben zusammengestellt, dann wird der Test mit dem Server-Modul gestartet und die Testteilnehmer bestehen diesen Test mit dem Client-Modul.

Unterscheidungsmerkmale (zu anderen Programmen zur Erstellung und Durchführung von Tests):

    Aufgaben können sowohl in Form von Standardaufgaben (Multiple Choice, Matching etc.) als auch in der in der jeweiligen Situation notwendigen Form gestellt werden. Da das Creator-Modul über einen recht flexiblen Aufgabeneditor verfügt.

    Die Anzahl der Aufgabenoptionen ist praktisch unbegrenzt.

    Ein Test kann Aufgaben mit einer unterschiedlichen Anzahl von Optionen enthalten.

    Ein Testplan vereinfacht den Testprozess.

    Fähigkeit, Tests sowohl manuell als auch nach Zeitplan durchzuführen.

    Für einen Kurs können mehrere Tests am selben Tag geplant werden.

    Erstellen von Computertests mit Excel. Mit Excel können Sie Tests mit einer freien Antwort (wenn dem Schüler keine Antwortmöglichkeit gegeben wird) und mit einer selektiven Antwort (wenn dem Schüler Antwortmöglichkeiten angeboten werden, aus denen er die richtige auswählt) erstellen.

    Avanesov V. S. Zusammensetzung der Testaufgaben. - M., Testzentrum, 2002.

    Avanesov, V. Definition eines pädagogischen Tests. // Schulverwaltung. – 1999. Nr. 29

    Bateshov E. A. „Grundlagen der Technologisierung von Computertests“: Lehrbuch. - Astana: Polygraph-Mir LLP, 2011. - 241 S.

    Bespalko, V.P. Komponenten der pädagogischen Technologie. – M.: Pädagogik, 1989. – 190 S.

    Zorin S. F. Entwicklung eines automatisierten Systems zur Überwachung des Wissens der Studierenden in der Disziplin „Unternehmensökonomie“. MGVMI, 2007.

    Kabanova T. A., Novikov V. A. Tests in der modernen Bildung. Uch. Nutzen. - M.: Höhere Schule, 2010.

    Kaziev V. M. Einführung in die praktische Prüfung. - M.: Intuit.ru, Binom. Labor des Wissens, 2008.

    Mayorov A. N. Theorie und Praxis der Erstellung von Tests für das Bildungssystem: Auswahl, Erstellung und Verwendung von Tests für Bildungszwecke. M: Intellect-Center, 2002.

    Mikhailychev E.A. Technologie zur Standardisierung didaktischer Tests. // Schultechnologien. – 2001. Nr. 5. – S. 36 – 54

    Morev I. A. Bildungsinformationstechnologien. Teil 2. Pädagogische Dimensionen: Lehrbuch. - Wladiwostok: Far Eastern University Publishing House, 2004.

    Neiman Yu. M., Khlebnikov V. A. Pädagogische Prüfung als Messung. Teil 1. - M.: Testzentrum des Verteidigungsministeriums der Russischen Föderation, 2002.

    Rapoport I. A., Selg R., Sotter I. Tests im Fremdsprachenunterricht: Ergebnisse eines zwanzigjährigen Experiments // Fremdsprachen in der Schule. - 1989. - Nr. 6.

    Chelyshkova M. B. Theorie und Praxis der Erstellung pädagogischer Tests. Uch. Nutzen. - M.: Logos, 2002.

Notiz.

Methodische Materialien

„Tests im Bildungsprozess“

Methodische Materialien „Tests im Bildungsprozess“: Sammlung methodischer Materialien / Desyaterik Yu.E., Marchenko M.V. – T., 2015. – 28 S.

Sammlung von Lehrmaterialien

Stilistische Bearbeitung – Desyaterik Yu.E.

Computerlayout – Marchenko M.V.

Website der staatlichen Bildungseinrichtung der Russischen Föderation des Internats „Pädagogisch“ in Taganrog

Gedruckt in der staatlichen Bildungseinrichtung der Russischen Föderation, dem Lyzeum-Internat „Pädagogisch“ in Taganrog