Diagnostic pédagogique dans le processus éducatif. Le test comme méthode de contrôle pédagogique

Diagnostic pédagogique dans le processus éducatif.  Le test comme méthode de contrôle pédagogique
Diagnostic pédagogique dans le processus éducatif. Le test comme méthode de contrôle pédagogique

Conférence 8. Tests pédagogiques, leurs types et leur objectif.

1. Approches normatives et critériées dans les dimensions pédagogiques.

2. Tâches de test et types de tests.

3. Classification des types d'épreuves pédagogiques.

4. Appareil conceptuel : tâche de pré-test, tâche de test, test pédagogique.

1. Approches normatives et critérielles dans les dimensions pédagogiques

Approches générales de l'interprétation des résultats des mesures pédagogiques. Dans les mesures pédagogiques, l'interprétation des scores des élèves peut varier en fonction de la manière dont les scores des élèves sont comparés. Une approche compare les scores de chaque étudiant avec les résultats d'un groupe spécifique - un échantillon d'étudiants qui passent le même test - pour déterminer la place de chaque score par rapport au résultat moyen dans le groupe (approche normative). Selon une autre approche, les résultats des sujets sont interprétés par rapport au domaine de contenu inclus dans le test et assortis de certains critères de performance (approche critériée).

Les deux approches fournissent des informations sur l'état de préparation des élèves, mais elles ont un caractère différent. Conformément à ces approches de l'interprétation des résultats des tests, les tests orientés normatifs et orientés critères sont distingués.

Approche normative et normes. Standardisation des tests . L'objectif principal des tests axés sur les normes est de différencier les sujets de test en fonction des résultats du test. Lors de l'interprétation des résultats, la position relative du sujet peut être évaluée différemment, car il aura meilleure apparence dans le contexte d'un groupe plus faible que d'un groupe plus fort. Pour une interprétation correcte des résultats du test, le score de chaque élève doit être comparé avec normes d'essai.

Les normes sont un ensemble d'indicateurs qui reflètent les résultats d'un test par un échantillon bien défini de sujets - un groupe normatif pertinent qui est représentatif de la population générale des élèves testés. Les normes comprennent généralement la moyenne des scores aux tests et la dispersion (variance) autour de la moyenne de tous les autres scores obtenus par un échantillon représentatif d'étudiants testés (les méthodes de calcul de la moyenne et les indicateurs de variance sont donnés au chapitre 9). Ayant des normes, vous pouvez définir la position de chaque résultat par rapport au score moyen du test, voir comment le résultat de l'étudiant est supérieur ou inférieur à la moyenne.

Le processus d'établissement des normes s'appelle standardisation des tests. La standardisation est toujours effectuée sur un échantillon représentatif de sujets, dont la formation est un moment obligatoire pour déterminer les normes de test.

Relativité des normes et échantillonnage de la normalisation . Normes de test adaptées à l'interprétation des résultats de tous les élèves à tous les tests ; n'existe pas. La portée de toute norme est limitée à un test donné et à un ensemble spécifique de sujets, de sorte que les normes ne sont ni absolues ni constantes. Ils reflètent les résultats de l'échantillon de standardisation au moment de la création du test et font l'objet d'une mise à jour et d'une revalidation systématiques.

Les exigences suivantes s'appliquent aux normes :

Les règles doivent être différenciées. Par exemple, les tests pour l'enseignement général et les écoles spécialisées doivent être standardisés sur différents échantillons, ce qui se traduira très probablement par des normes sensiblement différentes ;

Les normes doivent refléter les exigences réelles et actuelles en matière de qualité des résultats scolaires découlant de la situation actuelle de l'éducation ;

Les normes doivent être représentatives, elles sont donc toujours établies de manière empirique en fonction des résultats des tests d'un échantillon de normalisation (fédéral pour l'USE, municipal pour la certification des écoles, intra-scolaire pour la certification des élèves à l'école).

"Normal" est un concept relatif, étroitement lié à la qualité de l'échantillon utilisé pour la standardisation. L'échantillon doit refléter avec précision la catégorie (ou les catégories) de personnes auxquelles le test est destiné, et également être suffisamment grand et équilibré pour garantir que l'erreur type est si petite qu'elle peut être négligée dans le processus de normalisation du test. Ainsi, lors de la formation d'un échantillon de normalisation, il est nécessaire de prendre en compte deux variables - le volume et la représentativité, qui ensemble fournissent une grande précision dans l'évaluation des normes du test.

Stratification de l'échantillon. Pour représenter uniformément différents groupes d'étudiants dans une population de matières, un processus spécial est utilisé - la stratification. Stratification - stratification de l'échantillon en strates dont la taille doit être proportionnelle à la taille des populations correspondantes dans la population générale des étudiants. Généralement, les facteurs les plus liés à la variable de mesure sont identifiés comme base de la stratification. Dans l'examen d'État unifié, ces facteurs incluent le statut social des parents du diplômé, la région où se trouve l'école, si elle appartient à des écoles rurales ou urbaines, etc.

La présence de nombreux facteurs de stratification, la nécessité d'analyser les proportions de la population générale des sujets et les tests d'approbation pour déterminer les normes font du travail de standardisation des tests une procédure assez coûteuse et chronophage. Le niveau actuel de développement des technologies de test permet de simuler des tests avec des normes prévisibles en utilisant IRT , une banque d'éléments de test calibrés et des programmes spéciaux pour la génération informatique d'options de test.

Informations incluses avec les tests standardisés . Le test standardisé doit être accompagné de :

Normes de performance des tests, qui sont déterminées sur un échantillon de normalisation ;

La taille de l'échantillon de normalisation, les motifs de sa stratification et la période de son utilisation ;

Résultats bruts des tests pour l'échantillon de normalisation.

La comparaison des normes pour divers tests n'est possible que s'il existe des raisons d'affirmer l'adéquation des échantillons de normalisation.

Approche critériée dans les dimensions pédagogiques . Avec une approche basée sur des critères dans les mesures pédagogiques, les résultats des élèves sont interprétés en relation avec le domaine de contenu ou les exigences établies pour les résultats scolaires. À évaluation dichotomique("1" ou "0") des résultats des tâches individuelles, le score de chaque élève est calculé en convertissant en pourcentage la proportion de tâches correctement réalisées par rapport au nombre total d'items du test. Lorsque bilans polytomiques Le rapport entre le score brut de l'étudiant accumulé sur les devoirs et le score maximum possible sur le test est converti en pourcentages. Le pourcentage obtenu pour chaque élève est comparé à des normes de performance - critères établis par des experts et validés empiriquement lors de la conception du test.

Avec une approche critériée, basée sur les résultats des tests, vous pouvez :

- identifier les connaissances, compétences et capacités maîtrisées et non maîtrisées et construire un parcours scolaire individuel pour chaque élève ;

Classer les candidats par pourcentage d'achèvement et construire des échelles d'évaluation ;

Divisez les matières en deux groupes à l'aide d'un score de critère ou en plusieurs groupes à l'aide de plusieurs scores de critère, en mettant, par exemple, les notes scolaires - «deux», «trois», «quatre», «cinq».

Inconvénients de l'approche critériée. L'approche basée sur des critères présente des inconvénients liés à la nécessité d'une couverture complète du contenu, pris à 100 %, en un seul test. Les tests de certification axés sur des critères s'avèrent souvent très longs - de 150 à 300 tâches, qui sont tout simplement impossibles à réaliser même au lycée avec une seule présentation. Ainsi, lors de la certification, les tests adaptatifs sont souvent utilisés, ce qui permet de réduire significativement la durée du test en optimisant la difficulté des tâches. Ils utilisent également une réduction du contenu du test en minimisant les objectifs de l'évaluation. Pour ce faire, les tests critériés sont souvent utilisés pour tester une ou deux compétences ou aptitudes, et lorsqu'ils couvrent un contenu plus hétérogène, les tests normatifs sont choisis.

Les tests axés sur des critères ont également une portée plutôt limitée. Ils conviennent dans les cas où il est possible de définir clairement les connaissances, les compétences et les capacités dans un domaine de contenu particulier et de fixer leurs limites supérieure et inférieure pour la détermination correcte des critères d'exécution des tests. Dans les domaines de connaissances plus complexes et moins structurés liés à la résolution de problèmes de niveau créatif, il est souvent impossible de déterminer la limite supérieure.

Parfois, lors de l'exécution de telles tâches, l'étudiant est guidé par la connaissance, mais le plus souvent, l'ingéniosité et la conjecture décident de tout. Par conséquent, lors de la création de tests conçus pour contrôler la performance de tâches de niveau créatif, il convient de privilégier une approche orientée vers la normalisation ou d'essayer de combiner les deux approches dans un seul test.

Différences dans les approches axées sur les normes et sur les critères. Les tests normatifs et critériés diffèrent par les objectifs de création, la méthodologie de sélection du contenu, la nature de la distribution des résultats empiriques, les tests, les méthodes de traitement, les critères de qualité des tests et des items de test, et surtout, dans l'interprétation des résultats des sujets de test qui ont terminé le test.

Dans les tests critériés utilisés pour l'évaluation, les tâches sont assez simples, puisque les enseignants essaient toujours de prévoir le pourcentage de "deux" et de limiter le nombre d'élèves non évalués. Par exemple, si « deux » ne doit pas dépasser 10 % et qu'il est prévu que le critère d'abandon pour les sous-performants soit fixé à 70 % (tous ceux qui ont terminé moins de 70 % des items du test obtiennent « deux »), alors au moins 70 % des des tâches faciles doivent être incluses dans le test, qui peut être réalisé par 90% des élèves testés (Fig. 9). Les tests normatifs sont généralement beaucoup plus difficiles. Ils comprennent de 50 à 70 % de tâches de difficulté moyenne, c'est-à-dire celles que seulement la moitié des élèves testés ont pu compléter correctement (Fig. 10).

Riz. 9. Répartition des tâches par difficulté, dans une épreuve à orientation normative

Riz. 10. Répartition des tâches par difficulté dans une épreuve critériée

Étant donné que les distributions des scores bruts d'un échantillon représentatif de sujets aux tests normatifs et critériés ont généralement une forme différente (Fig. 11), il est nécessaire d'utiliser différentes méthodes pour évaluer la fiabilité et validité des résultats des mesures pédagogiques, des techniques de mise à l'échelle et de nivellement.

Riz. 11. Répartition typique des résultats des tests pour un représentant

échantillon d'étudiants

Les différences les plus significatives entre les tests axés sur les normes et les tests axés sur les critères sont présentées dans le tableau. une.

Tableau 1

Différences entre les tests normatifs et les tests basés sur des critères

Les caractéristiques

Essais normatifs

Tests basés sur des critères

Nombre moyen typique d'étudiants qui ont complété correctement presque tous les items du test

Zone de comparaison des résultats des élèves

Résultats des autres étudiants

Portée des objectifs d'audit

Large, couvrant de nombreux objectifs et types d'activités d'apprentissage

Étroit, couvrant généralement plusieurs cibles de contrôle

Représentativité de la couverture du contenu du sujet

Modéré, fragmenté - n'inclut généralement pas toutes les sections

grand, généralement inclure tout ce qui peut être opérationnalisé et accepté comme 100 %

Dispersion des résultats des élèves (écart de notation)

Élevé, puisque le but principal des tests est la différenciation des sujets selon niveau de formation

Faible, dans les résultats du groupe d'étudiants ayant dépassé par leurs résultats score du critère, presque pas de variabilité

Sélection des tâches par difficulté

La distribution des cotes de difficulté est proche de la normale. Principal certaines tâches ont une difficulté de 40 à 60 %

La distribution est faussée. La partie principale des tâches a une difficulté de 80-90%

Pour l'enseignant, la situation la plus instructive est celle où les deux approches se complètent. Par conséquent, certains Les tests sont conçus avec l'espoir que les résultats des élèves peuvent être corrélés à la fois avec les normes et le contenu du test. Un exemple est le matériel de contrôle et de mesure (KIM) de l'examen d'État unifié.

2. Tâches de test et types de tests

Classification générale des problèmes résolus à l'aide de tests . Selon les types de contrôle lors des essais, on peut distinguer :

Tâches à l'entrée de la formation (contrôle d'entrée);

Tâches courantes (contrôle courant);

Tâches correspondant à la fin d'une certaine période du processus éducatif (contrôle final).

Test dans le contrôle d'entrée . Le début de la formation correspond au test d'entrée, qui permet d'identifier le degré de possession des connaissances, compétences et capacités de base nécessaires pour commencer la formation, et de déterminer le niveau de connaissance du nouveau matériel avant son étude en classe. Cette dernière situation ne semble pas typique pour une école, cependant, il suffit de rappeler l'exemple classique où des enfants qui lisent bien entrent en première année et commencent à s'ennuyer en classe.

Tests de contrôle d'entrée, communément appelés prétests(tests préliminaires), sont divisés en deux types. Prétests du premier type vous permettent d'identifier la préparation à l'assimilation de nouvelles connaissances en classe. Ils sont élaborés dans le cadre d'une approche critériée et contiennent des tâches permettant de tester les connaissances, compétences et capacités de base nécessaires à la maîtrise d'une nouvelle matière. Fondamentalement, ces prétests sont destinés aux élèves les plus faibles, qui se situent à la frontière entre ceux qui sont clairement préparés et clairement pas préparés à commencer à apprendre de nouvelles matières. Selon les résultats du prétest, les personnes testées sont divisées en deux groupes, dont l'un comprend ceux qui peuvent passer à autre chose et l'autre - ceux qui ont besoin d'un travail supplémentaire et des conseils de l'enseignant.

Pré-tests du deuxième type sont élaborés dans le cadre d'une approche normative. Ils couvrent les résultats prévus de la formation à venir et sont entièrement construits sur du nouveau matériel. Sur la base des résultats du prétest, l'enseignant prend une décision qui permet d'introduire des éléments d'individualisation dans le processus éducatif de masse. Si l'étudiant a montré quelques connaissances préliminaires sur le nouveau matériel, alors son plan de formation doit être reconstruit et repartir d'un niveau supérieur afin que le matériel de formation ait un vrai caractère de nouveauté pour lui. Parfois, le rôle du prétest d'entrée est joué par le test final, qui est destiné à l'évaluation future des résultats de la maîtrise du nouveau matériel après l'achèvement de son étude.

Sur la fig. 12 montre les fonctions possibles des tests d'entrée dans le processus éducatif.

Riz. 12. Un modèle simplifié des fonctions de test des intrants dans le

processus, en corrélation avec les tâches de l'enseignant.

Essais en contrôle de courant . Pour le contrôle du courant, des tests correctifs et diagnostiques sont développés. Les tests correctifs, en règle générale, sont axés sur des critères: si le pourcentage d'erreurs de l'élève dépasse le score du critère, ses connaissances doivent être corrigées. À l'aide de tests correctifs, vous pouvez trouver des faiblesses dans la préparation des étudiants et identifier les domaines d'assistance individuelle dans la maîtrise du nouveau matériel.

Les épreuves correctives ne doivent pas être confondues avec les moyens de contrôle courant des connaissances des élèves, elles sont cependant quelque peu proches, du moins quant aux finalités d'application. Cependant, il existe des différences technologiques et substantielles importantes entre le premier et le deuxième moyen. Les outils de suivi traditionnels sont moins efficaces et se concentrent principalement sur le test et l'évaluation systématique des connaissances des élèves sur de petites unités de matériel pédagogique. Les tests correctifs sont conçus pour identifier les lacunes dans les connaissances d'un groupe d'unités d'apprentissage, y compris le contenu de plusieurs thèmes ou même de sections. Habituellement, ils contiennent des tâches classées par ordre croissant de difficulté afin d'identifier les tout premiers problèmes de maîtrise du matériel pédagogique.

Si les difficultés de l'élève à accomplir les tâches sont systématiques, l'enseignant peut recourir à l'aide tests diagnostiques. L'objectif principal du diagnostic - établir les causes des lacunes dans les connaissances des étudiants - est atteint par une sélection spéciale du contenu des tâches dans les tests. En règle générale, ils présentent des tâches dont le contenu varie légèrement, calculé selon la forme de présentation pour suivre les étapes individuelles de la mise en œuvre de chaque tâche du test correctif. Le détail détaillé permet d'identifier les causes des erreurs persistantes des élèves, de préciser la nature des difficultés qui surviennent et de tirer des conclusions sur le manque de formation de certaines compétences d'apprentissage.

Par exemple, un item à choix unique d'un test de correction mathématique d'école élémentaire pourrait ressembler à ceci :

2+6:3 8:4=

A.2

B.3

B.1

D 4

Nombre maximal de tâches de diagnostictest est déterminé par le nombre d'actions lors de l'exécution d'un travail de test correctif. Par exemple, pour l'expression numérique considérée, quatre tâches peuvent être proposées si l'enseignant ne souhaite pas vérifier les connaissances des élèves sur la procédure :

1) 6:3= A. 3 B. 2 C. 4

2) 8:4= A. 2 B. 4 C. 1

3) 2+6:3= A. 5 B. 6 C. 4

4) 2+6:3-8:4 = A. 3 B. 2 C. 0

La sélection des tâches pour le test de diagnostic s'effectue de manière individualisée, en fonction des tâches que chaque élève a mal fait au test de correction. Les processus de correction et de diagnostic sont particulièrement efficaces lors de la génération informatique et de la présentation de tests en combinaison avec des modules de formation pour chaque unité de matériel pédagogique non appris. Dans ce cas, la correction est effectuée immédiatement, car après avoir identifié l'écart suivant et établi sa cause, l'ordinateur sélectionne lui-même le module de formation et le donne immédiatement à l'étudiant.

Un modèle simplifié des fonctions de test actuelles est illustré à la fig. 13.

Riz. 1Z. Modèle de fonctions de test en commande de courant

Essais finaux. L'objectif principal des tests finaux est de fournir une évaluation objective des résultats d'apprentissage, qui se concentre sur les caractéristiques de maîtrise du contenu du cours (tests critériés) ou sur la différenciation des étudiants (tests normatifs). Sur la fig. 14 montre un modèle des fonctions du test final.

Riz. 14. Modèle de fonctions de test final

Les tests finaux sont généralement standardisés, car ils sont le plus souvent utilisés pour prendre des décisions de gestion administrative dans l'éducation. Si la conduite des tests d'entrée et de courant est la fonction d'un enseignant, alors les tests finaux sont souvent effectués par des structures externes et sont de la nature d'un organisme indépendant. chèques. Un exemple de test final indépendant en Russie est l'examen d'État unifié, le test lors de l'attestation des écoles, etc. à l'intérieur de l'école, les tests finaux peuvent être utilisés lors du transfert d'élèves d'une classe à l'autre, lors de la sélection d'élèves en retard pour les placer dans des classes correctionnelles, etc.

3. Classification des types de tests pédagogiques

Approches de base de la classification des tests. Dans la littérature nationale et étrangère, il existe différentes approches de la classification des tests pédagogiques, qui diffèrent par les caractéristiques qui sous-tendent la démarcation des types. Conformément à l'approche de l'interprétation des données, il y a normatif et tests axés sur des critères.

Selon la dimension du construit, les tests pédagogiques sont divisés en homogène(mesurant une seule variable et donc homogène en contenu) et hétérogène (mesurant plus d'une variable - cas d'un construit multidimensionnel) essais. Les tests hétérogènes sont multidisciplinaires et interdisciplinaires. Les tests multidisciplinaires consistent en des sous-tests homogènes dans des disciplines individuelles. Les notes des étudiants aux sous-tests sont combinées pour calculer les notes finales de l'ensemble du test multidisciplinaire. Pour effectuer des tâches de tests interdisciplinaires, l'utilisation de connaissances et de compétences généralisées, interdisciplinaires et intégratives est requise. Les tests interdisciplinaires sont toujours multidimensionnels, leur élaboration nécessite l'utilisation de méthodes factorielles d'analyse de données, de méthodes mathématiques et statistiques de mise à l'échelle multidimensionnelle, etc.

Selon la nature des variables mesurées, il existe des tests pour tester les connaissances, les compétences pédagogiques et pratiques, et aussi épreuves de compétence. Parfois, un groupe distinct est attribué essais de vitesse, exigeant un délai strict pour l'exécution de chaque tâche et contenant toujours un nombre excessif de tâches ne permettant pas de réaliser l'ensemble du test. Selon la forme de présentation, il existe Vide et ordinateur, oral et épreuves écrites.

Plus classification générale tests dans le processus éducatif nous permet de les diviser en deux groupes inégaux : tests standardisés, avec des normes de performance, et tests non standardisés, qui sont beaucoup plus, puisque chaque enseignant les prépare pour les utiliser dans le processus éducatif quotidien. Les tests non standardisés sont souvent appelés tests de l'enseignant ou de l'auteur.

Classification par types de contrôle, leurs fonctions et la nature des tâches à résoudre. Si nous choisissons les types de contrôle et la nature des tâches résolues par l'enseignant à l'aide de tests comme signe de démarcation, nous obtenons alors une classification des types de tests pédagogiques présentés à la Fig. quinze.

Riz. 15. Classement des épreuves pédagogiques

L'analyse du tableau de classement permet de distinguer quatre types d'épreuves pédagogiques comme fondamentales, parmi lesquelles les épreuves finales à orientation normative sont de la plus haute importance en termes d'utilisation.

L'augmentation de l'impact des tests sur la prise de décision managériale basée sur les données de suivi et l'analyse de la qualité de l'éducation dans de nombreux pays a conduit à 21e siècle . à l'émergence d'un nouveau type de tests à visée administrative et managériale (dans la littérature anglo-saxonne -Épreuves à enjeux élevés ). Les données des tests administratifs et de gestion sont une source d'informations importante pour analyser les conséquences des réformes et des innovations éducatives dans le domaine de l'éducation, mener des études comparatives sur la qualité de la préparation des diplômés de diverses régions de Russie, attester les établissements d'enseignement et évaluer l'efficacité de leurs activités. .

4. Définitions de base de l'appareil conceptuel

Appareil conceptuel dans le développement et l'utilisation des tests. La nécessité de créer un appareil conceptuel clair pour développer des tests n'est pas toujours claire pour les praticiens. Cela est dû en partie à l'apparente simplicité des concepts eux-mêmes, puisque souvent, du point de vue de l'enseignant, tout ensemble de tâches du formulaire de test est associé à un test. De tels pseudo-tests sont souvent publiés dans des collections spéciales. Ils peuvent être utilisés dans le contrôle actuel, mais pas dans le travail des centres de certification.

La non-conformité des pseudo-tests aux critères de qualité fondés sur des données probantes peut entraîner une composante erronée importante dans les évaluations de la préparation des élèves, ce qui entraînera des conclusions erronées sur la performance des enseignants ou des équipes pédagogiques. Ainsi, l'appareil conceptuel est nécessaire parce qu'il sert à séparer les tests de ce qui est souvent confondu avec eux.

Tâche de prétest . La définition d'un item de prétest est basique, contenant des exigences spécifiques afin de le distinguer d'un item de contrôle traditionnel. Une tâche de pré-test est une unité de matériel de contrôle dont le contenu, la structure logique et la forme de présentation satisfont à un certain nombre d'exigences et assurent la non-ambiguïté des évaluations des résultats de performance grâce à des règles de vérification normalisées.

Dans les tâches de pré-test, les éléments de base les plus essentiels du contenu de la discipline sont vérifiés. Dans chaque tâche de pré-test, il est déterminé ce qui est sans équivoque considéré comme la bonne réponse avec le degré prévu d'exhaustivité.

Exigences relatives à la forme des tâches de pré-test , peut être conditionnellement divisé en spécial, reflétant les spécificités de la forme, et général, invariant par rapport à la forme choisie. Selon les exigences générales, la tâche doit avoir un certain numéro de série, des instructions standard d'exécution, adaptées à la forme, une norme pour la réponse correcte, des règles standardisées pour évaluer les résultats de sa mise en œuvre et etc. d . (voir leçon 10). Les exigences particulières pour le formulaire sont assez nombreuses, elles sont partiellement présentées dans la leçon 10, consacrée aux formulaires des tâches de pré-test.

Les avantages des tâches de pré-test par rapport aux tâches de contrôle traditionnelles sont fournis par l'extrême standardisation dans la présentation et l'évaluation des résultats de leur performance, ce qui augmente généralement l'objectivité des évaluations des étudiants sur le test.

Test . Les éléments de pré-test doivent subir des tests empiriques obligatoires, selon les résultats desquels certains d'entre eux se transforment en éléments de test, et la partie restante est supprimée de l'ensemble initial d'éléments de test. Une tâche de pré-test se transforme en tâche de test si les évaluations quantitatives de ses caractéristiques répondent à certains critères visant à vérifier empiriquement la qualité du contenu, de la forme et des propriétés systémiques des tâches de pré-test.

Habituellement, au moins deux ou trois approbations sont requises, selon les résultats desquelles le contenu, la forme, la difficulté de l'item, sa validité et les propriétés statistiques qui caractérisent la qualité de son travail ainsi que le reste des items du test sont corrigés. L'étude des caractéristiques de formation du système de la tâche de test est réalisée sur la base de l'analyse de statistiques descriptives (descriptives), ainsi que de méthodes d'analyse de corrélation, factorielle et structurelle latente. L'interprétation des résultats d'analyse est toujours un travail analytique complexe, dont les résultats dépendent de nombreuses conditions, y compris le type de test créé. Les caractéristiques statistiques des éléments de test et les exigences pour leur qualité sont discutées dans la leçon 12 .

L'approbation et la correction à long terme sont principalement nécessaires pour les tests finaux utilisés pour prendre des décisions managériales dans l'éducation. Par exemple, lors de l'élaboration de tests d'enseignants pour le contrôle actuel, la corrélation et l'analyse factorielle ne sont pas nécessaires, mais des statistiques descriptives qui vous permettent de sélectionner des tâches valides de difficulté acceptable sans trop d'effort seront également très utiles.

Essai pédagogique. Contrairement aux deux premières définitions, qui sont invariantes quant aux objectifs du test et aux tâches à résoudre, la définition d'un test pédagogique doit être centrée sur un type de test spécifique. En particulier, le test final orienté vers les normes est un système d'items de test ordonnés dans le cadre d'une certaine stratégie de présentation et présentant des caractéristiques qui permettent une différenciation, une précision et une validité élevées des évaluations de la qualité des résultats scolaires.

Deux implications importantes découlent de cette définition. Premièrement : il n'y a pas et il ne peut y avoir de tests qualitatifs en général, puisque l'appréciation de l'effet différenciateur du test, la précision des mesures (fiabilité) et leur adéquation aux objectifs fixés (validité) ne dépendent pas seulement des caractéristiques de items du test, mais aussi sur les caractéristiques de la population étudiante testée. Deuxièmement, pour évaluer la qualité d'un test, des données de test empiriques obtenues à partir d'un échantillon représentatif d'étudiants sont nécessaires. Les travaux sur la correction des tests consolident le système de tâches de test - la connexion interne et l'intégrité, l'intégrativité du système augmentent progressivement, une transition est effectuée d'un ensemble de tâches de pré-test à un test conçu par des professionnels.

Le test final axé sur des critères est un système de tâches de test commandées dans le cadre d'une certaine stratégie de présentation et présentant des caractéristiques telles qu'elles fournissent une interprétation valable et significative des résultats scolaires par rapport à des critères de performance établis et statistiquement valables. La définition ne précise pas le domaine de contenu de base utilisé dans l'interprétation, ce qui permet de l'utiliser pour divers types de tests fondés sur des critères.

THÈME : Le test comme forme de contrôle pédagogique

Introduction

Chapitre 1 Fondements théoriques des tests pédagogiques comme moyen de contrôle des connaissances des élèves

1.1 Le contrôle pédagogique et ses fonctions

1.2 Tests en contrôle pédagogique

1.3 Aspects psychologiques et pédagogiques des tests

Chapitre 2 Les épreuves pédagogiques, leur contenu, leur structure, leurs formes et leurs types

2.1 Fondements historiques des tests pédagogiques

2.2 Classification des épreuves pédagogiques

2.3 Exigences pour les tests pédagogiques, leurs avantages et inconvénients

Conclusion

Bibliographie

Introduction

Actuellement, dans tous les pays du monde, il y a un problème d'augmentation de la fiabilité et de l'efficacité du contrôle de la qualité dans l'éducation. Pour le résoudre, divers systèmes de suivi pédagogique sont développés et testés, construits principalement sur le test normatif de contrôle des connaissances des étudiants. Des études internationales comparatives sur les résultats scolaires des étudiants dans divers domaines de la connaissance sont en cours. Les technologies de test se sont solidement établies dans la pratique éducative internationale en tant qu'outil d'évaluation objective des connaissances. Au cours de la dernière décennie, le système éducatif national a suivi cette voie, maîtrisant activement les technologies de test.

Le développement des normes éducatives de l'État, l'introduction de nouvelles technologies d'enseignement et le contrôle des connaissances des élèves ont suscité l'intérêt de la communauté pédagogique générale pour les tests. Dans le cadre de nombreuses innovations pédagogiques, les tests permettent d'obtenir des évaluations objectives du niveau de connaissances, de vérifier la conformité des exigences pour la préparation des diplômés avec les normes spécifiées et d'identifier les lacunes dans la préparation des étudiants.

Les tests constituent une étape importante vers le développement d'une méthodologie de contrôle de l'assimilation du matériel pédagogique par les étudiants. L'introduction des tests permet une transition en douceur des évaluations subjectives et largement intuitives aux évaluations objectives. Cependant, comme toute autre innovation pédagogique, cette étape doit être réalisée strictement base scientifique sur la base des résultats d'expériences pédagogiques et de recherches scientifiques. Les tests ne doivent pas remplacer les méthodes traditionnelles de contrôle pédagogique, mais doivent seulement les compléter dans une certaine mesure.

Le but du résumé est d'étudier les caractéristiques des tests pédagogiques comme moyen de contrôle des connaissances des élèves.

Conformément à l'objectif, les tâches suivantes du résumé sont formulées.

Premièrement, étudier les fondements théoriques des tests pédagogiques comme moyen de contrôle des connaissances des élèves ;

Deuxièmement, analyser les aspects psychologiques et pédagogiques des tests ;

Troisièmement, considérez les tests pédagogiques, leur contenu, leur structure, leurs formes et leurs types ;

Quatrièmement, tirez les conclusions appropriées.

Les travaux scientifiques de scientifiques nationaux et étrangers ont servi de base méthodologique pour la rédaction du résumé.

Chapitre 1 Fondements théoriques des tests pédagogiques comme moyen de contrôle des connaissances des élèves

1.1 Le contrôle pédagogique et ses fonctions

Dans la didactique domestique traditionnelle, les termes suivants sont utilisés : contrôle, vérification, évaluation et comptabilisation des connaissances. Examinons brièvement le contenu de ces définitions.

Contrôle - vérification, ainsi que surveillance constante à des fins de vérification ou de surveillance. Dans la pédagogie domestique, le contrôle de l'apprentissage est compris comme : une procédure administrative-formelle de contrôle du travail d'un enseignant et des institutions ; fonction de gestion, dont les résultats servent à prendre des décisions de gestion ; une partie intégrante, une composante du processus d'apprentissage, organiquement associée à l'étude du matériel du programme par sa compréhension, sa consolidation et son application ; formation de compétences et de capacités. L'essence de la vérification des résultats d'apprentissage est d'identifier le niveau d'assimilation des connaissances par les étudiants, qui doit être conforme à la norme éducative de l'État pour un domaine de connaissances donné (programme, matière). L'objet du contrôle à l'université est l'évaluation des résultats du processus pédagogique qui y est organisé.

Dans la vision cybernétique, le contrôle est considéré comme un principe de rétroaction caractéristique du contrôle d'un système autorégulé. Le contrôle des activités d'apprentissage des élèves fournit une rétroaction externe (contrôle effectué par l'enseignant) et une rétroaction interne (contrôle de soi des élèves). Elle intervient à toutes les étapes (étapes, maillons, cycles) de la formation, mais acquiert une signification particulière après l'étude de n'importe quelle section du programme et la fin de l'étape de formation.

Le contrôle est interprété en didactique comme un diagnostic pédagogique. Dans ce cas, la fixation d'objectifs d'apprentissage joue un rôle important. V.P. Bespalko estime que l'objectif du processus pédagogique est défini de manière diagnostique si les conditions suivantes sont remplies :

1. une description si précise et définie de la qualité personnelle formée est donnée qu'elle peut être différenciée sans équivoque et sans ambiguïté de toute autre qualité de la personnalité ;

2. il existe une méthode, un «outil» pour l'identification sans ambiguïté d'une qualité diagnosticable d'une personnalité dans le processus de contrôle objectif de sa formation;

3. il est possible de mesurer quantitativement l'intensité de la qualité diagnostiquée à partir des données de contrôle ;

4. il existe une échelle d'évaluation de la qualité basée sur les résultats de mesure.

Le contrôle des apprentissages dans le cadre du processus didactique et de la procédure didactique pose des problèmes sur les fonctions de vérification, son contenu, les types, les méthodes et les formes de contrôle, sur les mesures, sur la réussite des apprentissages et l'échec des élèves.

Il est bien connu que les tâches principales du contrôle sont : identifier les lacunes dans la formation ; sa correction; planifier la formation ultérieure; recommandations pour la prévention des pannes.

Exigences pédagogiques pour le contrôle dans la formation, fournissant des résultats élevés :

1. caractère individuel du contrôle ;

2. un contrôle systématique et régulier à tous les stades de l'enseignement, sa combinaison avec d'autres aspects des activités éducatives des élèves ;

3. une variété de formes de contrôle, assurant la mise en œuvre des fonctions d'éducation, de formation et de développement;

4. Contrôle complet. Il devrait couvrir toutes les sections du programme, fournir un test de connaissances théoriques et de compétences pratiques;

5. une approche différenciée qui prend en compte les spécificités de chaque matière académique et les caractéristiques typologiques individuelles et les capacités intellectuelles de l'étudiant ;

6. l'unité des exigences des enseignants qui contrôlent le travail pédagogique des élèves d'un groupe (classe) donné ;

7. économique en termes de temps passé par l'enseignant et l'étudiant, permettant l'analyse des épreuves et leur évaluation dans un délai relativement court ;

8. objectif et raisonnable.

D'après V.S. Avanesov, les principes du contrôle pédagogique comprennent : le principe du lien du contrôle avec l'éducation, l'éducation et la formation ; le principe d'objectivité; le principe de justice et de publicité ; principe de caractère scientifique et d'efficacité; le principe de systématicité et d'exhaustivité.

Dans la pratique pédagogique, lors de l'exercice du contrôle, la question se pose généralement de savoir exactement ce qui est vérifié dans la formation à l'aide du contrôle. En pédagogie domestique, il est généralement admis que les connaissances, les compétences et les capacités des élèves sont sujettes à vérification. Ils sont décrits à la fois au niveau didactique général, supra-matière, et au niveau de la matière, généralement sous la forme de matériel pour le programme sur le sujet.

Dans la pédagogie occidentale, les résultats d'apprentissage vérifiables sont décrits comme des objectifs d'apprentissage cognitifs, sociaux et émotionnels. Selon P. I. Pidkasistogo, les efforts de la didactique domestique moderne sont dirigés vers cela.

L'un de ses problèmes est que les objectifs d'apprentissage, qui sont les résultats à vérifier, sont formés en termes de comportement, d'activités d'apprentissage observées des élèves. Dans ce cas, leur présence, manifestation sous une forme ou une autre peut être enregistrée. Ils peuvent être mesurés, c'est-à-dire le niveau de formation des connaissances, des aptitudes et des capacités (compétences) peut être établi.

A partir des années 50. Au siècle dernier, une taxonomie des objectifs des études à l'étranger (B. Blum) a été élaborée précisément sur la base de cette approche : les objectifs fixés par diagnostic permettent de détecter et d'évaluer objectivement le stade de leur réalisation.

Dans le domaine cognitif : la mémorisation et la reproduction du matériel pédagogique sont vérifiées, la capacité à effectuer diverses activités avec lui. Outre les connaissances, le contenu de l'épreuve de réussite est :

1) développement psychologique social et général des étudiants;

2) la formation de motifs d'enseignement et d'activité, des qualités sociales telles que le sens des responsabilités, les normes morales et le comportement.

Les fonctions de contrôle consistent à établir le niveau d'assimilation des connaissances à toutes les étapes de l'enseignement, à mesurer l'efficacité du processus pédagogique. En pédagogie, on distingue les fonctions de contrôle suivantes :

1. Diagnostic. Il vise à identifier le phénomène d'intérêt, son évaluation et l'adoption d'une décision de gestion basée sur les résultats du contrôle. Le diagnostic pédagogique est la partie la plus importante du système scientifique de contrôle pédagogique.

2. Organisation. Manifeste dans son identification sur l'organisation de la formation. En fonction des résultats du contrôle, une décision est prise sur la nécessité de cours supplémentaires et de consultations, sur la fourniture d'une aide méthodologique aux élèves en difficulté, sur l'encouragement des élèves et des enseignants qui travaillent dur.

3. Fonction de vérification (inspecteur). Les indicateurs de contrôle servent de base principale à l'analyse des résultats de l'exercice. Les données de contrôle indiquent non seulement les résultats et l'évaluation des activités des élèves et des enseignants, mais également l'état du travail éducatif de l'ensemble du contrôle pédagogique.

4. Éducatif. Lors de l'exécution des tâches de contrôle, les connaissances acquises sont répétées et consolidées par leur clarification, addition et/ou repensée. Le contrôle enseigne également comment organiser rationnellement les activités d'apprentissage.

5. Développer. Cela réside dans le fait que le contrôle offre plus de possibilités pour le développement de la personnalité de l'élève, de ses capacités cognitives. Toute forme de contrôle exige de la part d'une personne un travail aiguisé d'attention, de mémoire, de réflexion, d'imagination, la capacité de comparer et de systématiser les connaissances existantes.

6. Éducatif. L'épreuve des connaissances affecte toujours la sphère émotionnelle de l'individu, puisque les efforts individuels pour maîtriser le matériel pédagogique deviennent l'objet d'un jugement public. Souvent la réputation de l'élève et son statut dans l'équipe (groupe, classe) dépendent des notes. Disciplines de contrôle, favorise un sens des responsabilités pour leur travail, stimule une attitude consciencieuse envers elle. Un contrôle compétent encourage les élèves à améliorer leurs connaissances et leurs compétences, développe des jugements d'auto-évaluation.

7. Méthodique. Cela réside dans le fait que le test enseigne non seulement à l'élève, mais aussi à l'enseignant, lui permettant de voir ses propres erreurs, de choisir les meilleures options d'apprentissage.

Dans la littérature pédagogique, les types de contrôle suivants sont généralement distingués selon le temps : préliminaire, courant, jalon (périodique) et final.

1. Le contrôle préalable (diagnostic) est nécessaire pour la bonne gestion du processus éducatif. Il permet de déterminer le niveau initial de préparation des élèves afin de se concentrer sur la complexité admissible du matériel pédagogique. L'analyse des données de contrôle préliminaires permet également à l'enseignant d'apporter des modifications au matériel didactique, aux méthodes d'enseignement, etc.

2. Le contrôle actuel fournit des informations continues sur les progrès et la qualité de la maîtrise du matériel pédagogique, apporte rapidement des modifications à la formation. Le contrôle actuel n'est pas tant une inspection qu'une formation, car il est associé à la consolidation, la répétition et l'analyse du matériel pédagogique. Le contrôle du courant répond à deux exigences : a) il ne doit pas être réduit à une mémorisation formelle et mécanique du matériel pédagogique ; b) elle doit être effectuée systématiquement, régulièrement. Le contrôle actuel est opérationnel, souple, diversifié dans ses méthodes, ses formes et ses moyens.

3. Le contrôle des jalons (périodiques) vous permet de déterminer la qualité de l'étude par les étudiants du matériel pédagogique dans une discipline donnée (section, sujet, module, etc.). Habituellement, il a lieu 3 à 4 fois par semestre (trimestre).

Les colloques, les tâches de contrôle, les résumés sur le sujet, les travaux graphiques, les tests, etc. peuvent servir d'exemple de contrôle des limites. Il prend également en compte les données du contrôle en cours.

4. Le contrôle final sert à identifier les résultats finaux de la formation dans une discipline académique particulière ou un cycle de disciplines. Sa tâche est de fixer le minimum de formation que dispense la formation continue. Le contrôle final est l'intégration. Il est utilisé pour juger les résultats globaux des élèves. En règle générale, il est effectué lors des examens de transfert et de semestre, des tests de qualification, des examens d'État et finaux, de la soutenance d'un projet de fin d'études, etc.

Les méthodes de contrôle sont les méthodes par lesquelles l'efficacité des activités éducatives des élèves et le travail pédagogique de l'enseignant sont déterminés. Les méthodes de contrôle sont également définies comme des méthodes d'activité de diagnostic qui permettent une rétroaction dans le processus d'apprentissage, afin d'obtenir des données sur le succès de la formation, l'efficacité du processus pédagogique. Ils doivent fournir des informations systématiques, complètes, exactes et rapides sur l'avancement du processus d'apprentissage.

PAR EXEMPLE. Skibitsky, V.V. Egorov, S.M. Udartseva, G.M. Smirnova, I.I. Erakhtina, V.V. Gotting propose les méthodes de contrôle suivantes :

1. Contrôle oral - une réponse monologique des étudiants ou un formulaire de questions-réponses - une conversation. Le contrôle oral, comme courant, est réalisé horaire (par classe) sous forme individuelle, frontale ou combinée.

2. Une enquête individuelle auprès des élèves permet à l'enseignant d'obtenir des données plus complètes et précises sur le niveau d'assimilation. Cependant, il laisse les autres élèves passifs dans la classe.

3. Le test et l'examen oral sont les tests de connaissances les plus actifs et approfondis pour une certaine période d'études (inconvénients : loterie, subjectivité).

5. Contrôle actuel des connaissances - l'observation est largement utilisée, une étude systématique des étudiants en formation, la détection de nombreux indicateurs, des manifestations de comportement qui indiquent la formation de connaissances, de compétences et d'autres résultats d'apprentissage. Les résultats des observations ne sont pas consignés dans des documents officiels, mais sont pris en compte par l'enseignant pour corriger les apprentissages.

Les tests didactiques constituent une méthode (moyen) relativement nouvelle pour vérifier les résultats d'apprentissage. Ils représentent un ensemble de tâches standardisées pour un matériel pédagogique spécifique, qui établit le degré d'assimilation de celui-ci par les élèves.

1.2 Testsdanspédagogiquemcontrôlere

À l'heure actuelle, les formes non traditionnelles de formation et de contrôle sont largement utilisées dans le système éducatif. Ces formulaires comportent des tests pédagogiques. Cependant, lors de l'application des tests, les enseignants sont confrontés à de nombreux problèmes de nature objective et subjective. Les problèmes de nature subjective sont principalement liés à la personnalité de l'enseignant lui-même, à son attitude face à l'utilisation des tests. Les problèmes de nature objective sont associés à une quantité insuffisante de littérature méthodologique qui permettrait à l'enseignant d'apprendre à rédiger des tests répondant à certaines exigences.

Le mot "tester" Origine anglaise et dans la langue d'origine signifie "test", "test".

CONTRE. Avanesov donne une définition claire d'un test pédagogique: «Un test pédagogique est un ensemble de tâches interdépendantes de complexité croissante, permettant une évaluation fiable et valide des connaissances et d'autres caractéristiques de personnalité intéressant un enseignant.

À cette définition l'accent est mis sur un système de tâches interdépendantes de complexité croissante.

CONTRE. Avanesov note les caractéristiques lexicales du test pédagogique : « dans les définitions scientifiques, le concept de « test pédagogique » est considéré dans deux sens existants :

En tant que méthode de mesure pédagogique;

À la suite de l'application du test comme méthode de mesure, consistant en un ensemble limité de tâches ».

CONTRE. Avanesov met en avant les tests dits traditionnels, qui représentent l'unité de trois systèmes :

Système de tâches formelles de difficulté croissante ;

Caractéristiques statistiques tâches et sujets.

Il existe différentes définitions du concept de «test», qui diffèrent les unes des autres, mais elles contiennent toutes les caractéristiques essentielles suivantes de ce concept: un ensemble de tâches spécialement préparées et testées d'une forme spécifique et d'une complexité croissante; le système de tâches vous permet d'évaluer qualitativement la structure des connaissances des étudiants; mesurer efficacement l'apprentissage des élèves. Il est significatif que de nombreux scientifiques-enseignants, lorsqu'ils examinent l'essence du concept désigné, élargissent considérablement le contenu de ce concept, y compris la structure du test et la technologie de sa mise en œuvre sous forme de signes (V.V. Zinoviev, V.P. Levin, A.N. Mayorov, etc..). De nombreux auteurs se sont appuyés sur le concept de V.S. Avanesov sur l'essence du concept de «test pédagogique» en tant que système de tâches interdépendantes de complexité croissante, permettant une évaluation fiable et valide des connaissances et des compétences dans un domaine de contenu particulier .

L'épreuve pédagogique est considérée précisément comme un système, comme un ensemble ordonné de tâches d'épreuve. Les tâches sont ces éléments, les « briques » dont un test pédagogique est compilé.

L'attitude envers les tests dans l'enseignement n'est pas univoque. En lien avec la richesse informationnelle du processus éducatif, la forme de test de contrôle des connaissances permet d'économiser de manière significative et permet dans de nombreux cas de surmonter la subjectivité de la notation, d'augmenter le côté motivationnel de l'apprentissage. L'utilisation du test contrôle contribue à la prise en compte des acquis des élèves dans le processus de passage d'un niveau de maîtrise de la matière à un autre.

1.3 Aspects psychologiques et pédagogiques des tests

L'introduction d'une nouvelle forme de test-contrôle dans le contexte de l'apprentissage entraîne un changement, principalement dans la perception et les attitudes de contrôle, toute la situation change, y compris la situation psychologique associée à la formation d'une attitude positive à leur égard parmi les tests participants, avec acceptation, approbation ou rejet, tests de rejet comme forme de contrôle.

N.F. Efremova a mené une étude diagnostique visant à identifier l'évaluation des méthodes de contrôle traditionnelles et de test (environ 500 personnes y ont participé). Ce qui suit a été trouvé :

    Dans le même temps, l'objectivité de la procédure de test et l'indépendance de l'évaluation par rapport à l'opinion de l'enseignant, ainsi que le postulat de non-divulgation des notes, ont reçu le score le plus élevé ;

    Parmi les avantages du contrôle traditionnel ont été évalués : la possibilité d'assistance, le faible niveau de difficulté de la tâche.

De nombreuses études ont souligné l'importance de la préparation psychologique aux tests :

    Le degré d'amélioration des résultats aux tests dépend des capacités et des connaissances des élèves, du nombre et du type de classes préliminaires et des caractéristiques des tests.

    La préparation aux tests est plus utile pour les élèves faibles ; elle n'affecte pas de manière significative les résultats des élèves forts.

    Le degré d'influence positive de la formation préalable sur l'évolution des résultats des tests dépend directement de l'étroitesse de la relation entre le contenu des tâches de formation et le contenu du test.

    La préparation préliminaire réduit l'anxiété dans le comportement des sujets pendant le test et les motive à terminer le test.

    La formation pré-test aide les mécanismes de la mémoire à fonctionner dans un événement de contrôle strictement limité dans le temps.

Tout aussi importante est la motivation en tant que système unique d'objectifs, de besoins (le processus dynamique de gestion du comportement humain), qui encourage l'individu à la fois à se rapporter consciemment à l'apprentissage et au contrôle, en tant que partie intégrante, et à être actif dans le travail éducatif et cognitif. La motivation remplit les fonctions suivantes dans l'éducation : motiver, guider, organiser et sémantique. Lors des tests, la motivation est l'un des principaux facteurs psychologiques de la réussite du contrôle.

Le niveau de motivation pour l'activité éducative et cognitive est toujours influencé par des complexes de facteurs objectifs (tels que l'histoire de la matière étudiée, l'autorité de l'enseignant) et subjectifs (projets de vie d'une personne, désir de réalisation de soi, le désir d'avoir de bonnes notes). Le processus d'induction d'une personne au dépistage s'avère souvent être un acte socio-psychologique, intellectuel, émotionnel et volontaire très complexe. Une personne qui a de l'expérience dans la réalisation de tests a un avantage significatif sur ceux qui participent à des tests pour la première fois: après tout, il a surmonté le sentiment d'inconnu, développé une confiance en lui-même et en ses capacités. La psychologue américaine Anna Anastasi estime qu'une personne expérimentée dans le travail avec des tâches de format de test a des performances de onze pour cent supérieures à celles des sujets de test inexpérimentés.

Dans le même temps, on distingue deux composants importants de l'anxiété liée aux tests - l'anxiété émotionnelle et l'anxiété préoccupée. La composante émotionnelle de l'anxiété de test couvre les sentiments, les réponses physiologiques telles que la tension. La préoccupation est associée à des pensées négatives, à l'attente d'un échec à un test et à une inquiétude quant aux conséquences d'un échec. À cet égard, les psychologues développent la technologie de la « thérapie comportementale ».

Des études menées par la psychologue Anna Anastasi et un certain nombre d'autres psychologues montrent que l'anxiété liée aux tests peut s'atténuer sans "intervention thérapeutique". L'anxiété liée aux tests est un phénomène complexe causé par de nombreuses raisons différentes, de fait et de contenu, propres à chaque individu. Parmi les moyens de surmonter ce type d'anxiété figurent l'amélioration des compétences et des capacités de communication et d'élocution, le développement correct d'instructions et de manuels pour les tests.

La méthodologie de réalisation des tests doit être basée sur la personnalité des enseignants, non seulement ceux qui participent en tant qu'experts à la création du test, mais également ceux qui sont associés au processus de réalisation de cette forme de contrôle. C'est pourquoi il est nécessaire de parler des normes et principes éthiques des tests dans l'éducation. Il convient de noter qu'ils doivent avant tout être dictés par le code d'éthique professionnelle de l'enseignant. Faisant partie d'un ensemble de normes humaines universelles qui régissent le comportement d'un enseignant lors d'un test conformément aux exigences du devoir, de l'honnêteté professionnelle et des principes d'humanisme, elles deviennent les principes fondamentaux, fondamentaux et fondamentaux pour standardiser le test.

Ce groupe assez large de principes comprend :

    Le principe de confidentialité - définit les règles de non-divulgation d'informations sur les résultats des tests sans le consentement du sujet du test.

    Le principe d'accessibilité est associé au droit des sujets d'avoir accès à une description significative et à une interprétation complète des résultats du test, de recevoir des informations identifiées à la suite de l'analyse des problèmes et des échecs identifiés dans l'exécution des tâches individuelles du test.

    Le principe de validité et de réflexion dynamique du développement - provoque une mise à jour systématique des données sur l'état de préparation des stagiaires obtenus à l'aide de tests (suivi).

    Le principe du consentement éclairé - implique le consentement des sujets à effectuer des tests et des interrogatoires.

    Le principe de la sélection du contenu est que le contenu du test est défini comme un affichage complètement optimal du contenu du matériel de la discipline académique dans le système de tâches de test créées.

    Le principe de fiabilité scientifique - le test ne comprend que le contenu du matériel vérifié, qui est objectivement scientifiquement vrai et fait l'objet d'une sorte d'argumentation rationnelle.

Les tests psychologiques et pédagogiques en éducation présentent de profondes différences entre eux. Anna Anastasi écrit que les tests pédagogiques évaluent les résultats de la maîtrise d'un cours de programme commun à tous les étudiants, et les tests psychologiques sont conçus pour refléter la perception individuelle expérience de la vie, différant par les conditions sociales et économiques de son acquisition.

Les résultats des tests en psychologie sont principalement utilisés pour prédire le succès de toute activité, en fonction des évaluations qualitatives et quantitatives reçues des caractéristiques et des inclinations personnelles, ou sont consultatifs pour identifier les problèmes personnels, afin de déterminer les moyens de les surmonter.

Les tests pédagogiques, en particulier, dans le contrôle final, donnent à l'enseignant des informations sur l'évaluation quantitative du niveau de préparation actuel de l'élève, qui est principalement destinée à la prise de décisions administratives et managériales.

Il existe un certain nombre de différences externes entre les tests psychologiques et pédagogiques dans l'éducation :

    Formulation des tâches (dans les tests psychologiques, c'est généralement indirect, dans les tests pédagogiques, c'est direct)

    Diagnostics (dans les tests psychologiques, il n'y a pas de réponses "correctes", les caractéristiques de la personnalité sont déterminées, tandis que les tests pédagogiques testent les connaissances, ce qui signifie qu'ils nécessitent une correspondance stricte de la réponse du sujet à la bonne réponse).

    Les objectifs de l'interprétation (dans les tests psychologiques, les caractéristiques de la personnalité sont déterminées, dans les tests pédagogiques, le niveau d'assimilation des connaissances par le sujet est révélé).

Parfois, les frontières entre les types de tests à l'étude peuvent être floues, en particulier dans les cas où les tests visent à tester la pensée logique et les capacités créatives des élèves.

Ainsi, puisque le test est une méthode unique de suivi et d'évaluation des connaissances, qui permet une mesure qualitative et quantitative du niveau de connaissances, des caractéristiques psychologiques et des préférences du sujet, il est nécessaire de créer une atmosphère psychologique pour le participant au test. qui lui permettra de s'ouvrir complètement. C'est pourquoi, aujourd'hui, le développement de méthodes, d'exigences et de règles pour les tests est une tâche importante pour améliorer la qualité du processus éducatif.

Dans le même temps, la forme de test de contrôle des connaissances a des opposants, parmi lesquels J. Raven.

Raven critique les tests de manière très sévère, tout en notant à la fois les aspects scientifiques et éthiques de l'expansion de la testologie dans le domaine de l'éducation. Selon lui, le refus des professionnels de prendre en compte les dommages que la pratique des tests cause au sort des enfants et aux intérêts de la société "est extrêmement immoral". Il ne s'agit pas seulement du manque de validité et de fiabilité prédictive des tests critériés en tant que tels, mais de la création d'un nouveau type de psychodiagnostic. Les nouvelles méthodes de diagnostic, parmi lesquelles J. Raven, incluent la technique des conclusions descriptives, les entretiens comportementaux événementiels, la procédure d'identification des attentes de valeur - doivent répondre à un certain nombre d'exigences fondamentalement différentes par rapport aux mesures de test généralement acceptées : être sensible aux caractéristiques de l'expérience acquise (ensemble de compétences) , que chaque enfant aura la sienne; s'appliquer uniquement si un environnement éducatif adéquat est créé pour cet enfant ; tenir compte de ses capacités individuelles, de ses intérêts et de ses valeurs ; fixer la dynamique du développement des capacités individuelles; assurer l'identification des différents types de douance des enfants.

Une place distincte dans les travaux de J. Raven est occupée par ses arguments sur le changement de l'idéologie du système éducatif, qui, à son avis, devrait viser à la formation d'une personnalité compétente.

Pour J. Raven, le concept de compétence agit comme un fondement substantiel de premier plan qui permet de formuler les quatre conséquences les plus importantes sur le besoin : premièrement, reconsidérer les points de vue sur les capacités de chaque enfant, car tous les élèves peuvent devenir compétents en faisant leur choix dans le plus large éventail d'activités; en conséquence, l'enseignant doit apprendre à voir chaque enfant en termes d'un ensemble unique de qualités qui sont importantes pour réussir dans l'un ou l'autre domaine particulier ; deuxièmement, la reformulation des objectifs de l'éducation ; la tâche du développement de la personnalité sur la base de l'individualisation de l'éducation vient au premier plan; troisièmement, des changements dans les méthodes d'enseignement, qui devraient aider à identifier et à former les compétences des étudiants, en fonction de leurs inclinations et intérêts personnels ; l'utilisation de la méthode de projet est proposée comme principal outil didactique ; quatrièmement, un rejet radical des procédures traditionnelles de test des étudiants et d'évaluation des programmes d'enseignement.

Chapitre 2 Les épreuves pédagogiques, leur contenu, leur structure, leurs formes et leurs types

2.1 Fondements historiques des tests pédagogiques

Les tests pédagogiques modernes ont leur propre histoire.

F. Galton (1882-1911), explorant les différences individuelles, a utilisé un certain ensemble de techniques (pour déterminer la sensibilité auditive, visuelle, le temps de réaction, etc.). F. Galton a identifié trois principes de base de la théorie des tests qui sont actuellement utilisés :

    Application d'une série de tests identiques à un grand nombre de sujets.

    Traitement statistique des résultats.

    Sélection des normes d'évaluation.

F. Galton a qualifié les tests effectués dans son laboratoire de tests mentaux.

James McKean Cattell (1860-1944) popularisa le terme en publiant son article Mental Tests and Measurements en 1890. Il a développé et utilisé des ensembles de tâches pour déterminer la « physionomie intellectuelle ». J. Cattell était un ardent partisan et propagandiste de la méthode de test, estimant que ce n'est qu'alors que le test est un moyen de mener une expérience scientifique, lorsque les exigences pertinentes sont remplies:

    Les mêmes conditions pour tous les sujets - le principe est à la base de la normalisation de la procédure de test;

    Délai de test ;

    Les mêmes instructions et une compréhension claire par les sujets de ce qu'il faut faire - le principe est à la base de la normalisation de la procédure de test;

    L'absence de spectateurs dans le laboratoire où se déroule l'expérience ;

    Équipement de test ;

    Effectuer une analyse statistique des résultats des tests - le principe est mis en œuvre dans les méthodes d'analyse statistique et de modélisation.

Les exigences identifiées par J. Cattell constituent la base de la testologie moderne.

L'activité du psychologue français Alfred Binet (1857-1911), associée au diagnostic du niveau de développement de l'intelligence, a donné une impulsion significative au développement de la testologie. En 1904, Binet rejoint la commission de la création à Paris écoles spéciales pour les enfants handicapés mentaux. Il était nécessaire de séparer les enfants capables d'apprendre, mais paresseux et peu désireux d'apprendre, de ceux souffrant de malformations congénitales. En fait, l'application de ce test était la première tentative de déterminer les différences individuelles entre les enfants en mesurant leur développement mental.

Depuis longtemps, les tests ont été développés comme un outil de mesures individuelles. Il fallait passer des tests individuels aux tests collectifs. En 1917-1919. aux États-Unis, les premiers tests de groupe pour l'armée sont apparus. Les tests développés par Arthur Sintos Otis (1866-1963) sont devenus les plus populaires. Les principes de base utilisés dans la préparation de ces tests ont constitué la base de toute la méthodologie des tests de groupe :

    Le principe de limitation dans le temps.

    Le principe de l'instruction détaillée, tant en ce qui concerne la conduite des tests qu'en ce qui concerne le calcul des résultats.

    Des tests avec une méthode sélective de formation d'une réponse ont été introduits.

    Sélection des tests après un traitement statistique minutieux et une vérification expérimentale.

Parallèlement, des méthodes de traitement des résultats de test et de création de systèmes de test sont en cours de développement :

    La méthode de comparaison statistique de deux séries de variables et l'introduction de l'indice de rapport conjoint - le coefficient de corrélation (F. Galton);

    Construction de droites de régression d'une variable à l'autre (F. Galton) ;

    Théorie de la corrélation (K. Pearson, Ch. Spearman);

    Analyse factorielle (L. Thurstone).

W. McCall a divisé les tests en tests pédagogiques, dont la tâche principale était de mesurer le succès des élèves dans les disciplines scolaires pendant une certaine période d'études, ainsi que le succès de l'application de certaines méthodes d'enseignement et de tests psychologiques - pour déterminer un certain niveau de développement.

Le développement du premier test pédagogique appartient au psychologue américain E. Tondike. Le résultat de celui-ci travail de recherche dans le domaine de la mesure et de l'utilisation de la méthode de test en pédagogie était le livre Introduction à la théorie de la psychologie et des mesures sociales (1904). Le premier test pédagogique standardisé, publié sous la direction d'E. Thorndike, équipé de normes - un test de résolution de problèmes arithmétiques.

1915 - création d'une série de tests avec un système modifié de calcul des résultats des tests (Yerks).

Au début du XXe siècle. des services spéciaux de l'État sont engagés dans le développement et la vérification des tests.

1900 - Création du Conseil des examens d'entrée aux États-Unis.

1926 - Adoption par le conseil du collège du test SAT, qui a été développé pour la qualification et l'évaluation professionnelle de la performance de l'enseignant.

1947 - Création du service d'essais, considéré comme le centre de recherche le plus représentatif.

On peut noter que les auteurs américains utilisent généralement la stratégie dite empirique, qui implique la création d'un large ensemble de problèmes de test sans système ni logique interne, et après application sur un grand nombre de sujets, les résultats sont soumis à une corrélation et analyse factorielle.

Jusqu'en 1917, une attention insuffisante a été accordée aux problèmes de test en Russie. Les tests ont été mis en pratique après 1925, lorsqu'une commission de test a été créée au département pédagogique de l'Institut des méthodes scolaires (ses tâches comprenaient l'élaboration de tests standardisés pour l'école). Au printemps 1926, des tests basés sur les tests américains sont sortis.

Le problème du développement de tests a été traité par d'éminents psychologues et enseignants russes: P.P. Blonsky, MS Bernstein, SM. Vasileisky, A.M. Schubert etc...

Des tests ont été développés pour mesurer les compétences en lecture, en calcul et en écriture ; une échelle pour mesurer le développement mental des enfants; tests du test collectif de dotation mentale; tests de réussite scolaire pour des enquêtes de masse auprès des enfants des écoles normales.

En 1936, les tests sont interdits car « bourgeois et nocifs ». Les exemples positifs de leur application n'ont pas été pris en compte. Pendant plus de quarante ans, il y a eu une période de stagnation dans le développement et l'application des tests. Le développement de la testologie est associé aux travaux de N.F. Talyzina sur l'apprentissage programmé, V.P. Bespalko sur les problèmes de la technologie pédagogique, D.B. Elkonina et autres.

À l'heure actuelle, la pratique a résolu positivement la question de la nécessité des tests en pédagogie. Cependant, cela a engendré un certain nombre de problèmes que le système éducatif dans son ensemble n'est pas prêt à résoudre.

La compréhension moderne des tests et du processus de test peut être divisée en niveaux. Dans l'ouvrage d'A.N. Mayorov a identifié trois niveaux de ce type :

Troisième niveau

("scientifique")

Ce niveau est le plus précis, car prend en compte les caractéristiques des tests et reflète leurs exigences qui apparaissent dans le processus de développement et de justification scientifique des tests.

Deuxième niveau

("vocabulaire")

Cette compréhension met en évidence les principales composantes du concept de test, mais ne prend pas en compte les caractéristiques de la procédure de création, d'utilisation, d'analyse, spécifiques à un domaine d'application particulier.

Premier niveau

("domestique")

Le test est compris comme un ensemble de questions à réponses multiples, qui s'apparente à des énigmes, des mots croisés.

L'état actuel de la testologie est au deuxième niveau de compréhension des tests, mais il y a un désir pour le troisième niveau grâce à la création de centres de test spéciaux: le Centre d'évaluation de la qualité de l'éducation de l'Institut d'enseignement général de l'Académie russe de l'éducation, le centre de test pour les diplômés des établissements d'enseignement général de la Fédération de Russie, le Centre de tests psychologiques et professionnels de l'Université d'État de Moscou, etc. Ces centres résolvent un ensemble de tâches didactiques :

    développer la testologie en tenant compte de l'expérience pédagogique et psychologique mondiale accumulée en mettant l'accent sur les nouvelles technologies de l'information;

    développer des outils de diagnostic de qualité pour un contrôle opérationnel et objectif ;

    développer l'appareil de mathématiques et de statistiques pour le traitement des informations quantitatives basées sur les résultats des tests;

    assurer une transition du niveau théorique de la recherche à l'empirique ;

    créer un système d'observation de l'état et des changements, d'évaluation et de prévision par rapport à la qualité de l'éducation.

Le développement et la formation de la technologie des tests permettent d'analyser statistiquement avec précision le processus d'obtention de l'éducation et de voir de nouvelles perspectives pour son développement.

2.2 Classification des épreuves pédagogiques

L'analyse de la littérature étrangère et nationale montre qu'il existe plusieurs approches à ce problème.

Brève description différents types de tests pédagogiques sont présentés dans le tableau 2.1.

Tableau 2.1 - Classement des épreuves pédagogiques

test pédagogique

La description

selon la méthodologie d'interprétation (V.S. Avanesov):

    orienté vers la norme

Une épreuve pédagogique à orientation normative permet de comparer les acquis scolaires (niveau de formation, niveau de connaissances et compétences professionnelles) des différentes matières entre elles.

Les tests pédagogiques normatifs permettent d'obtenir des scores fiables et normalement distribués pour comparer les candidats.

    axé sur les critères

Des tests pédagogiques basés sur des critères sont utilisés pour interpréter les résultats des tests en fonction du niveau de connaissance des candidats dans un domaine de contenu bien défini. L'utilisation de tests axés sur des critères pour l'évaluation actuelle, intermédiaire et finale des étudiants est d'une grande importance. Les éducateurs peuvent utiliser les résultats des tests basés sur des critères pour évaluer correctement le niveau de préparation des élèves. Les tests de ce type vous permettent de suivre les progrès des étudiants, d'identifier les lacunes de la formation dans le temps.

selon le degré d'homogénéité des tâches :

    homogène

Une épreuve pédagogique homogène est basée sur le contenu de n'importe quelle matière. Lors de son élaboration, les auteurs doivent clairement veiller à ce que chaque tâche ne dépasse pas le cadre d'un sujet donné dans son contenu.Un test homogène peut être à la fois orienté vers la norme et orienté vers des critères, selon le but de sa création. Ce type de test pédagogique est le plus courant dans le processus éducatif.

    hétérogène

L'épreuve pédagogique hétérogène est basée sur le contenu de plusieurs matières académiques. L'épreuve pédagogique hétérogène est intrinsèquement interdisciplinaire. Dans la plupart des cas, chaque tâche d'un test hétérogène comprend des éléments du contenu de plusieurs matières. Lors de son développement, les auteurs doivent comprendre les objectifs de sa création et être compétents dans de nombreuses disciplines. Naturellement, un test hétérogène est beaucoup plus difficile pour les auteurs qu'un test homogène. L'une des variétés d'un test hétérogène est un ensemble de tests homogènes, c'est-à-dire un test hétérogène peut consister en plusieurs parties homogènes (sous-tests).

sous forme de soumission :

    papier

Tests pédagogiques papier , présentés à un échantillon de sujets, sur papier sous forme d'impression, sont les plus courants et traditionnels, tant dans notre pays qu'à l'étranger. Cependant, le stockage, l'édition et l'impression variable d'un test pédagogique dans des conditions modernes doivent être effectués à l'aide d'outils logiciels spécialisés. Une attention particulière des développeurs et des utilisateurs d'un test pédagogique sur papier doit être attirée par la qualité de l'impression, l'absence de défauts et la disposition compétente des tâches. D'un point de vue économique, les tests papier restent les plus accessibles et les moins chers.

    l'ordinateur

Les tests pédagogiques informatiques ont leurs propres caractéristiques qui doivent être prises en compte lors de leur élaboration. L'analyse des informations sur un écran d'ordinateur est souvent difficile en raison d'une présentation incorrecte du matériel. Bien que ce soit le test informatisé qui a ses avantages et ses perspectives d'application dans l'éducation. Un rôle particulier appartient ici aux tests adaptatifs par ordinateur, lorsque chaque sujet de test est présenté avec un ensemble unique de tâches. Dans les pays développés, ce sont les tests adaptatifs par ordinateur, en particulier l'utilisation des réseaux locaux et mondiaux (Internet), qui deviennent extrêmement importants. Malheureusement, notre retard dans la théorie et la technologie des tests ne permet pas encore l'utilisation de tests adaptatifs par ordinateur dans le processus éducatif. Il convient de noter que d'un point de vue économique, l'utilisation d'ordinateurs pour les tests de masse est plusieurs fois plus coûteuse.

    matière

La performance des tests soumis dépend de la vitesse et de l'exactitude de la tâche.

    Matériel

Tests utilisant des appareils pour étudier les caractéristiques de l'attention, de la perception, de la mémoire et de la pensée.

par direction :

    tests d'intelligence

Les tests d'intelligence révèlent les caractéristiques des capacités intellectuelles.

    tests de personnalité

Les tests de personnalité sont conçus pour diagnostiquer la sphère des besoins motivationnels d'une personne.

par finalité d'utilisation :

    définition préliminaire

Le test de définition préliminaire est conçu pour évaluer les capacités initiales, couvre un très petit éventail de connaissances.

    formatif

L'épreuve formative touche un segment limité de l'apprentissage (chapitre, section).

    diagnostique

Le test de diagnostic se concentre davantage sur les erreurs courantes

    sommation

Le test de sommation contient généralement des questions qui présentent un niveau de difficulté plus élevé.

sur rendez-vous:

Les tests de base permettent de vérifier la maîtrise des concepts de base aux niveaux reproductif et algorithmique.

    diagnostique

Le test de diagnostic permet d'identifier non seulement les lacunes dans les connaissances sur le sujet, mais aussi le niveau d'assimilation, les capacités d'apprentissage de l'élève.

    thématique

Un test thématique est réalisé à la fin de l'étude du sujet, il permet de fixer le volume et le niveau d'assimilation.

    final

Le test final a lieu à la fin du semestre, année, pour le cours afin d'identifier le volume et le niveau d'assimilation de la matière.

3.3 Exigences pour les tests pédagogiques, leurs avantages et inconvénients

La théorie moderne de la modélisation des tests pédagogiques considère la procédure de test et l'évaluation des connaissances des candidats comme un processus de mesure objective, et les résultats de ces mesures, obtenus par des méthodes mathématiques standard, sont accompagnés de caractéristiques de précision standard. Dans la littérature sur les tests, les exigences des tests pédagogiques ont reçu beaucoup d'attention. Parmi elles, il convient de noter des exigences telles que la conformité du contenu du test avec les objectifs du test, la détermination de l'importance des connaissances testées, la relation entre le contenu et la forme de présentation des tâches de test, la conformité des le contenu du test avec le niveau de l'état actuel de la science, la complexité, la cohérence du contenu du test. Selon la théorie classique des tests, les concepts les plus importants qu'un test pédagogique conçu par des professionnels doit respecter sont la fiabilité, la validité et l'efficacité.

La fiabilité d'un test se caractérise par la stabilité, la stabilité des indicateurs lors de mesures répétées utilisant le même test ou son substitut équivalent. Il est à noter que plus la variété thématique et significative des tâches de test est élevée, plus la fiabilité du test est faible. Un test visant à vérifier la maîtrise d'un sujet particulier sera toujours plus fiable qu'un test visant à vérifier l'ensemble de la section (cours), couvrant une quantité importante de matériel - modèles, concepts, faits.

La fiabilité des tests dépend de manière significative de la difficulté de leur mise en œuvre, qui est déterminée par le rapport des réponses correctes et incorrectes aux éléments de test. L'inclusion dans les tests de telles tâches, auxquelles tous les élèves répondent correctement ou, au contraire, incorrectement, réduit fortement la fiabilité du test dans son ensemble. Les tâches auxquelles 45 à 80 % des élèves répondent correctement ont la plus grande valeur pratique.

La fiabilité d'un test est une caractéristique qui reflète la précision de la mesure et la résistance des résultats à l'influence de facteurs aléatoires externes. Cela signifie qu'un petit changement dans les conditions de test et l'état des sujets devrait entraîner un changement insignifiant dans les résultats finaux.

Il convient de noter qu'une augmentation du nombre d'items de test contribue à une augmentation de la fiabilité. Cependant, pour de vrais tests il est problématique de composer un test avec un nombre suffisamment grand de tâches. Cela est dû aux contraintes de temps, aux normes sanitaires, aux coûts matériels, aux capacités humaines, etc.

La validité du test dans son contenu est proche de l'exigence d'exhaustivité, d'exhaustivité de la vérification, de représentation proportionnelle de tous les éléments des connaissances et compétences étudiées. Le terme "validité" vient de l'anglais. valide - significatif, précieux. Cela signifie toujours que le compilateur du test est obligé d'étudier attentivement toutes les sections du programme, d'étudier les livres, de bien connaître le but et les objectifs spécifiques de la formation. Ce n'est qu'alors qu'il pourra faire des tests qui seront efficaces pour une certaine catégorie d'étudiants.

Un énoncé clair et précis de la question dans les limites des connaissances acquises est une condition essentielle de la validité du test. Si le test dépasse les limites du contenu maîtrisé ou n'atteint pas ces limites, dépasse le niveau d'apprentissage prévu, alors il ne sera pas efficace pour les étudiants auxquels il s'adresse.

En plus des exigences considérées, l'indicateur d'efficacité du test est également utilisé. Un test qui, ceteris paribus, fournit un plus grand nombre de réponses par unité de temps est considéré comme plus efficace. Par exemple, en 10 minutes de test, les élèves peuvent obtenir 5, 8 et 10 réponses en utilisant diverses méthodes pour compiler les éléments de test.

L'avantage du contrôle des tests est qu'il s'agit d'une méthode de recherche empirique scientifiquement fondée et, dans un certain domaine, vous permet de surmonter les évaluations spéculatives des connaissances. Il convient de noter que les tâches utilisées par de nombreux enseignants et appelées par eux tests, en fait, ne le sont pas du tout. Contrairement aux tâches normales, les tâches de test ont une réponse claire et sans ambiguïté et sont évaluées de manière standard en fonction du prix. Dans le cas le plus simple, la note d'un élève est la somme des points pour les tâches correctement réalisées. Les tâches de test doivent être courtes, claires et correctes, sans ambiguïté. Le test lui-même est un système de tâches de difficulté croissante. Le contrôle des tests peut être utilisé comme moyen de contrôle actuel, thématique et frontalier, et dans certains cas, définitif.

Bien sûr, là où les connaissances et le matériel pédagogique sont plus facilement structurés et formalisés, comme par exemple dans les sciences naturelles, il est plus facile de composer des tâches de test. Dans le même temps, toutes les disciplines académiques, y compris les disciplines historiques, reposent sur des connaissances de base. En histoire, cela inclut la connaissance des événements, des dates, des noms, des définitions des concepts de base, et bien plus encore. La vérification des connaissances de base au moyen de tests de contrôle permet à l'enseignant, dans le temps restant, d'accorder plus d'attention à la communication avec les étudiants au niveau des concepts et des conclusions, de vérifier avec des formes traditionnelles non pas tant les connaissances que la compréhension des problèmes d'une discipline académique particulière . Il convient de souligner que c'est la vérification des connaissances de base qui fait l'objet du contrôle des tests.

Le contrôle des tests sans passer beaucoup de temps vous permet d'interroger tous les étudiants dans toutes les sections du sujet. La somme des notes peut constituer une note de connaissances qui, à la discrétion de l'enseignant, peut servir de base pour dispenser l'étudiant du travail final. Les tests attirent les étudiants par leur caractère inhabituel par rapport aux formes traditionnelles de contrôle, les encouragent à étudier systématiquement le sujet et créent une motivation supplémentaire pour l'apprentissage.

Les avantages du contrôle des tests incluent :

    Le caractère individuel du contrôle, la possibilité d'exercer un contrôle sur le travail de chaque élève, sur ses activités pédagogiques personnelles.

    La possibilité d'un contrôle régulier et systématique des tests à toutes les étapes du processus d'apprentissage.

    La possibilité de le combiner avec d'autres formes traditionnelles de contrôle pédagogique.

    Exhaustivité, ce qui signifie que le test pédagogique peut couvrir toutes les sections du programme, fournir un test complet des connaissances théoriques, des compétences intellectuelles et pratiques.

    L'objectivité du test contrôle, excluant les jugements de valeur subjectifs (souvent erronés) et les conclusions de l'enseignant, fondés sur une étude insuffisante du niveau de préparation des élèves ou sur une attitude biaisée envers certains d'entre eux.

    Comptabilité caractéristiques spécifiques chaque sujet académique et ses sections individuelles grâce à l'utilisation de méthodes de développement modernes et une variété de formes de tâches de test.

    Possibilité de réaliser des tests traditionnels ("papier") et informatisés (en réseau local).

    Possibilité d'utiliser la technologie moderne de test informatique.

    La possibilité de tests standardisés de masse à grande échelle en imprimant et en reproduisant des formulaires parallèles (variantes) du test.

    Prise en compte des caractéristiques individuelles d'un échantillon spécifique de sujets, nécessitant l'utilisation de diverses méthodes pour développer un test et des tâches de test conformément à ces caractéristiques.

    L'unité des exigences pour toutes les matières, quels que soient leurs acquis scolaires antérieurs.

    Normalisation du contrôle des tests.

    Différenciation de l'échelle des résultats aux tests, qui permet de classer le niveau de réussite scolaire dans une large gamme.

    Haute fiabilité du contrôle des tests, ce qui nous permet de parler d'une mesure pédagogique à part entière du niveau d'apprentissage.

    Validité prédictive élevée des tests d'entrée, permettant de prédire la réussite future des étudiants.

    Critère élevé de validité (actuelle) des tests finaux de certification.

    L'efficacité du test pédagogique, qui permet de contrôler n'importe quel échantillon de sujets en peu de temps et à moindre coût.

    Avec la bonne organisation des tests et l'utilisation de méthodes de sécurité de l'information, il est possible d'éliminer l'attitude malhonnête de certains étudiants face à la mise en œuvre des tests de contrôle écrits (triche, utilisation d'indices, aide-mémoire, etc.).

    Le contrôle des tests stimule le travail constant de tous les élèves, et cela est réalisé dans une certaine mesure en effectuant des tests à grande échelle qui sont inattendus pour les sujets.

    Capacité à prendre en compte lors du test des fonctionnalités régionales.

Les inconvénients des tests incluent les suivants :

    Dans les tâches de test, les connaissances sont dogmatisées, il n'y a pas de créativité, une recherche conjointe de la vérité.

    La solution de toute tâche de test contient un élément de hasard.

    La maîtrise des tests contribue à la fragmentation des connaissances.

    Les tests normalisent les connaissances et ne développent pas complètement les capacités de réflexion des élèves.

    Les tests vérifient la conscience de l'élève de certains faits et ne donnent pas une idée des capacités et des compétences de l'élève [2].

La lacune la plus importante du test de contrôle des connaissances dans notre pays au stade actuel est l'abondance de matériel de test non systématisé et de qualité différente.

Récemment, de nouvelles méthodes originales de développement et d'application de tests sont apparues. Les tests modernes permettent de révéler les connaissances et les capacités des sujets cachés à un regard superficiel.

Ainsi, la mise en œuvre des avantages des tests pédagogiques ne peut être réalisée que si les exigences de la théorie classique des tests sont prises en compte, sur la base desquelles il est possible d'assurer la fiabilité, la validité et l'efficacité du contrôle des tests des élèves. connaissances. Naturellement, toutes les caractéristiques nécessaires à l'assimilation ne peuvent pas être obtenues au moyen de tests. Par exemple, des indicateurs tels que la capacité à concrétiser sa réponse avec des exemples, la connaissance des faits, la capacité à exprimer ses pensées de manière cohérente, logique et convaincante, certaines autres caractéristiques des connaissances, des compétences et des capacités ne peuvent pas être diagnostiqués par des tests. Cela signifie que les tests doivent nécessairement être combinés avec d'autres formes et méthodes (traditionnelles) de tests.

Conclusion

À la suite de l'examen théorique du matériau, les conclusions suivantes ont été tirées.

Test - tâches standardisées, dont les résultats sont utilisés pour juger des caractéristiques psychophysiologiques et personnelles, ainsi que des connaissances, des compétences et des capacités du sujet.

L'épreuve pédagogique, contrairement au travail de contrôle, peut être considérée comme une sorte d'outil de mesure d'une certaine résolution et précision. L'objet de mesure est ici extrêmement spécifique, et donc les résultats dépendent fortement de la capacité à formaliser raisonnablement cet objet.

Un test est un outil composé d'un système de tâches de test vérifié qualimétriquement, d'une procédure standardisée de réalisation et d'une technologie préconçue pour le traitement et l'analyse des résultats, conçue pour mesurer les qualités et les propriétés d'une personne, qui peuvent être modifiées dans le processus d'apprentissage systématique.

Le test est un test court et standardisé qui permet l'évaluation quantitative des résultats en fonction de leur traitement statistique.

La sélection de la structure des éléments de test dépend des indicateurs et des facteurs qui intéressent le chercheur de ce groupe de personnes. Chacune des tâches du test, dans son essence, représente une question, un problème pour le sujet. La réponse à la question est toujours l'élimination de certains doutes, hésitations, incertitudes dans la situation considérée afin d'obtenir de nouvelles connaissances plus précises.

Chacune des tâches de test contient une description d'une "situation" tirée de la nature, de la production, activités pratiques personne, etc... Il peut être présenté dans différents « langages » : verbal, symbolique, graphique, dessin, etc. Toute description est toujours approximative, incomplète, et par conséquent, le sujet reçoit une "exigence" pour rendre les situations de tâche plus précises, complètes, en utilisant à cette fin les "informations pour la solution" contenues dans la description de la situation, le texte de la tâche, et impliquant également des informations "externes par rapport à la tâche" - faits scientifiques connus du sujet, modèles, etc. Dans le processus de réalisation de la tâche, il est nécessaire de remodeler la situation en introduisant un certain nombre d'hypothèses et d'abstractions qui simplifient la solution, en passant d'une langue à l'autre dans la description.

Parmi les tâches du test, il convient de distinguer:

    tâches à caractère informatif;

    tâche dont la solution peut être réalisée de manière algorithmique et formalisée ;

    problèmes nécessitant une recherche heuristique et non standardisée.

L'information contenue dans le texte de la tâche peut être présentée explicitement ou sous une forme masquée, nécessitant des opérations plus ou moins complexes pour l'extraire, ce qui augmente la complexité des tâches. C'est le premier.

Deuxièmement, le test est un "test standardisé", c'est-à-dire un test dans lequel tous les exécutants sont dans les mêmes conditions strictement spécifiées. Seul cela vous permet de comparer les résultats des tests, de ramener les résultats de mesure à un nombre. La forme d'évaluation standardisée utilisée dans les tests permet de corréler le niveau de réussite de l'élève dans la matière académique dans son ensemble et dans ses sections individuelles avec le niveau de réussite moyen des élèves de la classe et les niveaux de réussite de chacun des leur.

Troisièmement, le test vous permet d'obtenir une "évaluation quantitative" des résultats du test. Etant donné qu'il faut mesurer des quantités non discrètes en constante évolution, des échelles spéciales sont utilisées pour amener les résultats de mesure à un nombre. Une échelle est une certaine séquence de valeurs numériques des résultats d'opérations de mesure appliquées à un système empirique.

L'idée maîtresse du test traditionnel est de comparer les connaissances du plus grand nombre possible de sujets en peu de temps, rapidement, efficacement et au moindre coût avec un nombre minimum de tâches.

Les résultats des tâches effectuées par les sujets contiennent une grande variété d'informations sous une forme cachée. Il n'y a qu'une seule façon d'extraire - de comparer les résultats d'un nombre suffisamment grand de tâches (rassembler des statistiques). C'est le seul moyen d'obtenir des conclusions fiables.

Bibliographie

    V.P. Bespalko Composantes de la technologie pédagogique / V.P.

Bespalko. - M. : Pédagogie, 2005. - 296 p.

2. Avanesov V.S. Fondamentaux de l'organisation scientifique de la pédagogie

contrôle dans l'enseignement supérieur / V.S. Avanesov. - M., 1989. - 168 p.

3. Pédagogie de l'enseignement supérieur : manuel. allocation / par ex. Skibitsky, V.V. Egorov, S.M. Udartseva, G.M. Smirnova, I.I. Erakhtina, V.V. Gotting - 2e éd. ajouter. et retravaillé. - Karaganda : KSTU, 2013. - 409 p.

    Efremova N.F. Technologies de test modernes dans l'éducation: publication scientifique / N.F. Efremova; Ros. Université de l'Amitié des Peuples. - M. : Logos, 2003. - 175 p.

    A. Anastasi, S. Urbina; [traduction de l'anglais et édition scientifique générale par A. A. Alekseev] - 7e édition. - Saint-Pétersbourg [et autres] : Peter, 2009. - 687 p.

    Test pédagogique de Raven John : Problèmes, idées fausses, perspectives / Per. de l'anglais : "Cogito-Center" ; Moscou; 1999. - 144 p.

    http://www.edufacts.ru

    Maiorov A. N. Théorie et pratique de la création de tests pour le système éducatif (Comment choisir, créer et utiliser des tests à des fins éducatives) M.: Intellect-center, 2005. - 296 p.

    Pédagogie : manuel pour les bacheliers / Ed. PI. piètrement. - 3e éd. corriger ajouter. – M. : Yurayt, 2012. – 511 p.

    Zagvyazinsky V.I. Pédagogie / éd. DANS ET. Zagvyazinsky. - 2e éd., effacé. - M. : Académie, 2012. - 351 p.

    Pédagogie : manuel pour les bacheliers / Ed. éd. L.S. Podymova, V.A. Slasténine. – M. : Yurayt, 2012. – 332 p.

Test il s'agit d'une mesure objective et standardisée qui peut être quantifiée, traitée statistiquement et étalonnée. Le test sert à évaluer les connaissances du sujet et doit répondre à un certain nombre de principes :

1. Application d'une série de tests identiques à un grand nombre de sujets.

2. Traitement statistique des résultats.

3. sélection des normes d'évaluation.

À ce moment Les tâches de test sont largement utilisées pour étudier et mémoriser du matériel pédagogique dans les établissements d'enseignement de notre pays. L'une des tâches importantes des tests est l'évaluation rapide et fiable des connaissances humaines. La théorie des tests pédagogiques est considérée comme faisant partie de la qualimétrie pédagogique. L'état du contrôle des connaissances des élèves à l'aide de compteurs de test a été étudié et les principaux problèmes ont été identifiés lors de l'utilisation de tests: la qualité et la validité du contenu des éléments de test, la fiabilité des résultats des tests, les lacunes du traitement des résultats selon la théorie classique des tests, le manque d'utilisation de la théorie moderne du traitement des matériaux de test à l'aide de la technologie informatique. L'erreur de mesure élevée des résultats des tests ne nous permet pas de parler de la grande fiabilité des résultats de mesure.

Avantages et inconvénients des tests.

L'un des inconvénients de la méthode des tests de contrôle des connaissances des étudiants est que la création des tests, leur unification et leur analyse est un travail de longue haleine. Pour que le test soit pleinement prêt à être utilisé, il est nécessaire de collecter des données statistiques pendant plusieurs années, au moins avec un flux d'étudiants de 100 à 120 personnes. D'autres difficultés peuvent également survenir. Très souvent, il existe une subjectivité importante dans la formation du contenu des tests eux-mêmes, dans la sélection et la formulation des questions de test, beaucoup dépend également du système de test spécifique, du temps alloué au contrôle des connaissances, de la structure de les questions incluses dans la tâche de test, etc.

Mais malgré ces lacunes du test comme méthode de contrôle pédagogique, ses qualités positives témoignent largement de l'opportunité d'utiliser cette technologie dans les établissements d'enseignement.

Les avantages devraient inclure :

comme on l'a dit, une plus grande objectivité et, par conséquent, un plus grand effet stimulant positif sur l'activité cognitive d'un élève; l'influence est exclue impact négatif sur les résultats des tests de facteurs tels que l'humeur, le niveau de compétence et d'autres caractéristiques d'un enseignant particulier;

se concentrer sur les moyens techniques modernes à utiliser dans l'environnement des systèmes d'apprentissage informatisés (automatisés); universalité, couverture de toutes les étapes du processus d'apprentissage. Nous notons d'autres avantages. L'enquête testée est multifonctionnelle. Cela vous permet de comprendre rapidement comment travailler davantage avec cet étudiant et aide également le professeur à corriger le cours.

En conséquence, il convient de noter que l'utilisation des tests des étudiants à partir de la 1ère année aidera à mener de manière objective la certification universitaire, qui est réalisée dans le but d'établir la conformité du contenu, du niveau et de la qualité de la formation supérieure avec les exigences de normes éducatives de l'État.

La mise en œuvre systématique de mesures de contrôle à l'aide d'outils de contrôle compilés au plus haut niveau permet aux universités de former des spécialistes hautement qualifiés dans divers domaines de connaissances, prêts à appliquer à tout moment la base de connaissances accumulée.

Ce sont précisément de tels spécialistes dont notre pays a besoin maintenant et à l'avenir afin de procéder à une reprise rapide de l'économie avec leur aide.

Présentation .................................................. . ................................................ .. .......... 2

1. Les tests pédagogiques comme méthode de contrôle .................................................. ..... 4

2. Les tests informatiques en pédagogie .................................................. .. ......... 7

3. Tests intelligents .................................................. .................................................. 12

Conclusion................................................. .................................................. . ..... 19

Liste de références ............................................... ............................... .................. vingt


Introduction

Ces dernières années, en Russie, dans le domaine de l'éducation, il y a eu une augmentation rapide de l'intérêt pour l'automatisation du contrôle intermédiaire et final des résultats d'apprentissage des étudiants de divers établissements d'enseignement, des écoles aux cours commerciaux. Le type le plus populaire de ce contrôle est le test basé sur le dialogue entre le système informatique et l'utilisateur. La croissance rapide de la vitesse des systèmes informatiques, la réduction des prix du matériel informatique, l'émergence de systèmes de programmation puissants et de haute qualité ont accru le besoin de systèmes permettant d'évaluer de manière objective, rapide et fiable les connaissances des étudiants, offrant des formes d'interaction avec eux.

Mais la question de la création de tels systèmes n'est pas sans ambiguïté, et les auteurs des développements existants s'écartent parfois du côté pédagogique et psychologique de la question, essayant de maximiser l'attractivité de leur produits logiciels grâce au multimédia. Parfois, les programmeurs ignorent simplement le processus d'interaction directe avec les détenteurs de connaissances (enseignants), ce qui affecte les applications existantes. Très souvent, les enseignants eux-mêmes ne connaissent pas bien les méthodes d'évaluation de la qualité des tests créés (on parlera de testing).

Il est à noter que les premiers concepts d'informatisation de l'enseignement sont apparus il y a plus de 30 ans sous le slogan « rééquipement technique de l'enseignant, mécanisation de son travail », « machine à enseigner », imitant le processus de travail individuel d'un enseignant avec un étudiant. Au fil du temps, la prise de conscience de leurs limites s'est accrue.

Le fait est que l'utilisation des méthodes traditionnelles de formation et de contrôle par ordinateur (tests directs, système de notation, etc.) est inacceptable : pour évaluer les connaissances de l'élève, l'enseignant doit traiter une énorme quantité d'informations, et le Le processus d'interaction entre l'évaluateur et l'évalué ne peut être une formalisation stricte, par conséquent, les trois principales structures algorithmiques (séquentielle, arborescente, cycle) dans la mise en œuvre des systèmes de machines ne pourront pas décrire complètement ce domaine. Ceux. la mise en œuvre d'un contrôle automatisé des connaissances, des compétences des stagiaires comprend tout d'abord la résolution du problème de la détermination de la totalité des qualités de connaissances requises, sans lesquelles les critères d'évaluation des connaissances et les méthodes de détermination du niveau de leur assimilation ne peuvent être identifiés .

Le but du résumé : montrer quelques-unes des méthodes et modèles de tests pédagogiques existants, décrire et évaluer la qualité des systèmes de test et de contrôle existants, proposer leurs propres idées.

1. Tests pédagogiques comme méthode de contrôle.

L'objectif principal du suivi des connaissances et des compétences est de détecter les réalisations, les réussites des étudiants, d'indiquer les moyens d'améliorer, d'approfondir les connaissances, les compétences, afin que les conditions soient créées pour l'inclusion ultérieure des étudiants dans une activité créative active. Cet objectif est principalement lié à la détermination de la qualité de l'apprentissage par les étudiants du matériel pédagogique - le niveau de maîtrise des connaissances, des compétences et des capacités prévues par le programme. Deuxièmement, la spécification de l'objectif principal du contrôle est associée à l'enseignement des méthodes de contrôle mutuel et de maîtrise de soi, à la formation du besoin de maîtrise de soi et de contrôle mutuel.

Troisièmement, cet objectif implique l'éducation chez les étudiants de traits de personnalité tels que la responsabilité du travail effectué, la manifestation de l'initiative.

Si les objectifs énumérés de contrôle des connaissances et des compétences des élèves sont atteints, nous pouvons dire que les tests remplissent les fonctions suivantes : contrôle, enseignement (éducatif), diagnostic, pronostic, développement, orientation, éducation. Examinons ces fonctions plus en détail.

La fonction de contrôle consiste à identifier l'état des connaissances et des compétences des étudiants, leur niveau de développement mental, à étudier le degré de maîtrise des méthodes d'activité cognitive, les compétences du travail éducatif rationnel.

À l'aide de tests, le niveau initial de maîtrise des connaissances, des compétences et des capacités est déterminé, la profondeur et le volume de leur assimilation sont étudiés. Le projeté est comparé aux résultats réels, l'efficacité des méthodes, formes et moyens d'enseignement utilisés par l'enseignant est établie.

La fonction éducative des tests est d'améliorer les connaissances et les compétences, leur systématisation. Au cours du processus de vérification, les étudiants répètent et consolident le matériel étudié. Non seulement ils reproduisent les acquis antérieurs, mais ils appliquent également des connaissances et des compétences dans une nouvelle situation. La vérification aide à mettre en évidence l'essentiel, l'essentiel dans le matériel étudié, à rendre les connaissances et les compétences testées plus claires et précises. Les tests contribuent également à la généralisation et à la systématisation des connaissances.

L'essence de la fonction de diagnostic des tests est d'obtenir des informations sur les erreurs, les lacunes et les lacunes dans les connaissances et les compétences des élèves et les causes de leurs difficultés à maîtriser le matériel pédagogique, le nombre et la nature des erreurs. Les résultats des contrôles de diagnostic aident à choisir la méthodologie d'enseignement la plus intensive, ainsi qu'à clarifier la direction pour une amélioration ultérieure du contenu des méthodes et outils d'enseignement.

La fonction prédictive des tests sert à obtenir des informations avancées sur le processus éducatif. À la suite de la vérification, des motifs sont obtenus pour prédire le déroulement d'un certain segment du processus éducatif: les connaissances spécifiques, compétences et capacités pour maîtriser la partie suivante du matériel pédagogique (section, sujet).

Les résultats de la prévision sont utilisés pour créer un modèle pour le comportement ultérieur d'un élève qui commet aujourd'hui des erreurs de ce type ou qui présente certaines lacunes dans le système de techniques d'activité cognitive.

Les prévisions aident à tirer les bonnes conclusions pour la planification et la mise en œuvre ultérieures du processus éducatif.

La fonction valorisante des tests est de stimuler l'activité cognitive des élèves, dans le développement de leurs capacités créatives. Les tests offrent des opportunités exceptionnelles dans le développement des étudiants. Au cours du test, la parole, la mémoire, l'attention, l'imagination, la volonté et la pensée des écoliers se développent. Les tests ont une grande influence sur le développement et la manifestation de traits de personnalité tels que les capacités, les inclinations, les intérêts, les besoins.

L'essence de la fonction d'orientation des tests est d'obtenir des informations sur le degré de réalisation de l'objectif d'apprentissage par un élève individuel et le groupe dans son ensemble - combien est appris et à quel point le matériel pédagogique est étudié. Les tests orientent les élèves dans leurs difficultés et leurs réalisations.

Révélant les lacunes, les erreurs et les lacunes des étudiants, les tests leur indiquent les directions d'application des forces pour améliorer les connaissances et les compétences, aident l'étudiant à mieux se connaître, à évaluer ses connaissances et ses capacités.

La fonction éducative des tests est d'éduquer les élèves à une attitude responsable face à l'apprentissage, à la discipline, à l'exactitude, à l'honnêteté. La vérification vous encourage à vous contrôler plus sérieusement et régulièrement lorsque vous effectuez des tâches. C'est une condition pour cultiver une forte volonté, la persévérance et l'habitude d'un travail régulier.

La mise en évidence de la fonction des tests pédagogiques en tant que forme de contrôle souligne son rôle et son importance dans le processus d'apprentissage. Dans le processus éducatif, les fonctions elles-mêmes se manifestent à des degrés divers et dans diverses combinaisons. La mise en œuvre des fonctions sélectionnées dans la pratique rend le contrôle plus efficace et le processus d'apprentissage lui-même devient plus efficace.

Ainsi, les tests pédagogiques en tant que forme de contrôle des connaissances font partie intégrante du processus éducatif.

Tests informatiques en pédagogie

L'idée de tests informatiques découle directement de l'idée de contrôle programmé des connaissances. Le contrôle programmé des connaissances, à son tour, était une réponse inévitable à certains problèmes, principalement l'enseignement supérieur en Russie. En fait, à peu près les mêmes problèmes s'appliquent à l'enseignement scolaire, mais celui-ci, en raison de la rigidité traditionnelle, est très peu réceptif aux nouvelles technologies.

Le principal problème de toute éducation (pas seulement le russe) est le manque de contrôle clair sur la qualité de l'assimilation du matériel. De plus, si dans la pratique scolaire, l'enseignant a encore plus ou moins la possibilité de vérifier le niveau des connaissances actuelles de l'étudiant avec une certaine fréquence, alors à l'université, l'enseignant distribue le matériel pour tout le semestre et seulement à la fin du semestre est convaincu du niveau de son assimilation. Bien sûr, dans le système d'enseignement supérieur, il est entendu que les étudiants doivent être suffisamment engagés dans une éducation indépendante, cependant, cette acquisition de connaissances supposée indépendante reste entièrement sur la conscience de l'étudiant, et l'enseignant ne peut absolument pas savoir lequel des étudiants est au moins quelque chose le fait tout seul. Avec la réception d'un grand nombre d'étudiants ayant accès à Internet, la situation a été encore aggravée par le fait que même la remise d'essais n'implique absolument aucun travail avec l'information; souvent, les étudiants ne jugent même pas nécessaire de lire intégralement ce qu'ils impriment à partir du Web.

La nécessité d'un contrôle systématique de l'assimilation du matériel ne fait aucun doute. Tout d'abord, cela ferait gagner du temps à l'enseignant qui, en l'absence de retour d'expérience, est contraint soit de répéter des dispositions que les élèves maîtrisent depuis longtemps, soit d'énoncer des dispositions basées sur des faits mal compris par les élèves. Deuxièmement, le contrôle systématique du niveau de connaissances des étudiants stimule une augmentation de la qualité de l'enseignement en mettant davantage l'accent sur les dispositions difficiles à apprendre et en augmentant la responsabilité des étudiants pour les résultats du travail indépendant (dans le cas, bien sûr, quand l'enseignant s'y intéresse).

Un point important du contrôle programmé systématique des connaissances est son objectivité, qui est due au déplacement de l'accent de la fonction punitive vers la fonction informative. Seulement dans ce cas, l'élève n'aura pas peur du contrôle et inventera des moyens d'obtenir une note plus élevée, et seulement dans ce cas, l'enseignant recevra une image réelle des connaissances de l'élève.

Le contrôle des connaissances techniquement programmé est simple - les étudiants reçoivent un support papier (l'âge d'or du contrôle programmé a donné naissance à des monstres "électroniques" à tube relais, que l'on peut encore voir dans les examens du permis de conduire à ce jour), sur lequel questions et réponses options sont enregistrées, dont une (ou plusieurs) sont correctes. L'élève n'a qu'à placer des croix contre les bonnes réponses.

Cette technologie a permis de faire un saut qualitatif dans la mise en place d'un retour d'expérience entre l'enseignant et l'élève. Le contrôle programmé, composé de 8 à 10 questions, est effectué pendant une durée très court terme- de 5 à 10 minutes, et en même temps l'enseignant peut obtenir des informations complètes sur l'assimilation de la matière couverte par l'ensemble du groupe de formation en même temps. De plus, la mise en œuvre technique du contrôle programmé a permis d'éviter totalement la tricherie, permettant de proposer à chaque élève sa propre version de la carte programmée.

L'inconvénient du contrôle programmé sous sa forme pré-informatique était la grande pénibilité de la création de cartes programmées, qui (idéalement) étaient nécessaires pour chaque leçon, et la complexité de leur traitement ultérieur. Avec l'avènement de l'informatique, les enseignants ont la possibilité de réduire drastiquement la complexité tant de la préparation du contrôle que du traitement des résultats.

Il existe cinq exigences générales de test :

Validité

certitude (compréhensibilité);

simplicité;

sans ambiguïté ;

Fiabilité.

La validité d'un test est son adéquation. Il existe une validité de contenu et une validité fonctionnelle : la première est la conformité du test avec le contenu du matériel pédagogique contrôlé, la seconde est la conformité du test avec le niveau d'activité évalué.

Le respect de l'exigence de certitude (publicité) du test est nécessaire non seulement pour que chaque étudiant comprenne ce qu'il doit faire, mais également pour exclure les réponses correctes qui diffèrent de la norme.

L'exigence de simplicité du test signifie que le test doit avoir une tâche du même niveau, c'est-à-dire ne doit pas être complexe et consister en plusieurs tâches différents niveaux. Il faut distinguer la notion de « test complexe » de la notion de « test difficile ». La difficulté du test est généralement caractérisée par le nombre d'opérations P qui doivent être effectuées dans le test : P< 3 – первая группа трудности; P = 3-10 – вторая группа трудности. Не следует также смешивать понятия простоты-комплексности и легкости-трудности с понятием сложности.

L'absence d'ambiguïté est définie comme la similitude de l'évaluation de la qualité du test par différents experts. Pour répondre à cette exigence, le test doit avoir un repère. Pour mesurer le degré d'exactitude, le coefficient K a \u003d P 1 / P 2 est utilisé, où P 1 est le nombre d'opérations essentielles correctement effectuées dans le test ou la batterie de tests; P 1 est le nombre total d'opérations significatives dans le test ou la batterie de tests. Les opérations du test effectuées au niveau d'assimilation contrôlé sont considérées comme significatives. Les opérations appartenant à un niveau inférieur ne font pas partie des opérations essentielles. Lorsque K a ³ 0,7, on considère que l'activité à ce niveau est maîtrisée.

Le concept de fiabilité des tests est défini comme la probabilité d'une mesure correcte de la valeur de K a . Indicateur quantitatif de fiabilité r í . L'exigence de fiabilité est d'assurer la stabilité des résultats des tests multiples du même sujet. La fiabilité d'un test ou d'une batterie de tests augmente avec l'augmentation du nombre d'opérations significatives P .

Ainsi, lors de la mise en œuvre de systèmes de tests informatiques, il est nécessaire, à mon avis, de respecter ces cinq exigences pour les tests créés. Mais le problème des tests informatiques est beaucoup plus aigu. La mise en œuvre des cinq exigences de test décrites ci-dessus dans les systèmes de test ne signifie pas que le complexe créé répondra à toutes les exigences de l'enseignant et de l'élève.

La plupart des produits logiciels ne permettent pas à l'enseignant et à l'élève, à l'enseignant et à l'élève de s'éloigner des méthodes traditionnelles dans le véritable processus éducatif: un cours magistral, des notes, un contrôle des connaissances à temps plein, des tests, des tests, des examens. Cet inconvénient peut être défini comme suit : un cours d'informatique est protégé par droit d'auteur par définition, et n'offre donc un enseignement de grande qualité qu'avec un accompagnement approprié de l'auteur (qui, dans la plupart des cas, n'a pas les connaissances suffisantes dans le domaine des technologies de l'information) . Bien que les composants individuels d'un cours d'apprentissage, de supervision ou d'enseignement-supervision assisté par ordinateur puissent être utilisés comme modules d'apprentissage indépendants par d'autres enseignants (ainsi que lorsqu'ils maîtrisent le sujet par eux-mêmes), l'effet maximal ne peut très probablement être atteint que dans coopération avec l'auteur-développeur du cours.

Si un autre enseignant est inclus dans le processus éducatif basé sur le cours multimédia de l'auteur, il existe un risque de conflit de personnalités, car non seulement différentes méthodes d'organisation méthodologique du processus éducatif, mais également différentes approches personnelles se heurtent dans un même domaine éducatif. .

En ce qui concerne le test de la qualité des connaissances, la nature informelle du processus d'évaluation des connaissances nécessite l'utilisation de tests informatiques difficiles à traiter pour l'enseignant, une rétroaction active est nécessaire pour aider à évaluer l'exactitude de la maîtrise de la matière, la certitude et l'efficacité doivent être clairement exprimée. .

C'est le caractère informel des connaissances en tant que telles, et du processus de test des connaissances en particulier, qui a donné lieu à de nombreux problèmes dans le domaine des tests informatiques, tels que biais d'évaluation, difficulté à comprendre les questions préparées par les étudiants, fonctionnement lent des systèmes informatiques. , etc.

L'ingénierie des connaissances et les méthodes de la théorie de l'intelligence artificielle aideront à créer un système de contrôle des connaissances qui vous permettra de construire des modèles de connaissances de l'enseignant et du candidat et d'évaluer objectivement les connaissances et les compétences de ce dernier.

3. Tests intelligents

Différentes significations sont données au concept d '«intelligence artificielle» - de la reconnaissance de l'intelligence dans les ordinateurs qui résolvent des problèmes logiques ou même de calcul, à la classification comme intelligents uniquement les systèmes qui résolvent l'ensemble des tâches effectuées par une personne, ou un ensemble encore plus large d'entre eux. Il existe deux grands axes de travail sur l'intelligence artificielle (IA). Le premier est lié à l'amélioration des machines elles-mêmes, avec une augmentation de "l'intelligence" des systèmes artificiels. La seconde est liée à la tâche d'optimiser le travail conjoint de "l'intelligence artificielle" et les capacités intellectuelles réelles d'une personne.

L'idée de créer des machines pensantes "de type humain" qui semblent penser, bouger, entendre, parler et se comporter généralement comme des personnes vivantes est enracinée dans un passé lointain. Même les anciens Égyptiens et Romains ont éprouvé une horreur respectueuse devant les statues de culte, qui gesticulaient et prononçaient des prophéties (bien sûr, pas sans l'aide des prêtres). Au Moyen Âge et même plus tard, il y avait des rumeurs selon lesquelles l'un des sages avait des homoncules (petits hommes artificiels) - de vrais vivants, capables de sentir les êtres. Actuellement, les robots, les systèmes de reconnaissance de formes, les systèmes experts, etc. évoquent chez les non-initiés la même admiration et le même plaisir devant la machine « pensante ».

Mais ce n'est pas pour rien que certaines recherches dans le domaine de l'IA ont été gelées à un moment donné. Les tentatives de création d'un esprit machine ont échoué et l'enthousiasme des scientifiques s'est estompé à maintes reprises, car les outils informatiques existants à l'époque ne permettaient pas de recréer au moins approximativement l'interaction des neurones du cerveau. L'émergence des systèmes multiprocesseurs et l'augmentation du nombre d'instructions du microprocesseur et de sa fréquence d'horloge permettent, selon moi, de « construire » une pensée humaine approximative à l'aide de processus parallèles et de réseaux de neurones.

Passant à la problématique du rôle de l'IA dans la formation et l'éducation, nous considérerons ce processus comme l'une des variétés d'interaction homme-machine, et révélerons parmi les opportunités prometteuses celles qui visent à créer des systèmes d'apprentissage dits adaptatifs qui simulent le dialogue opérationnel entre un élève et un enseignant humain.

L'épreuve intellectuelle présuppose l'existence d'un modèle de connaissance, un modèle du processus d'épreuve et d'évaluation lui-même. Ainsi, il est possible de caractériser en général tous les développements dans ce domaine. Considérons certains d'entre eux plus en détail.

Le système russe traditionnel d'évaluation des connaissances des étudiants est basé sur des évaluations linguistiques, selon lesquelles une bourse est établie, les progrès sont enregistrés, des enregistrements sont effectués dans les registres pour la période d'étude, etc.

En même temps, une telle nouvelle procédure pédagogique que les tests pédagogiques sur une base alternative implique d'évaluer le niveau de connaissance dans la fourchette de zéro à cent, ce qui pose le problème de la reconnaissance de l'image linguistique de la connaissance basée sur les résultats de ces tests pédagogiques.

L'image du niveau de connaissances est comprise comme des élèves appartenant à un ensemble (groupe), dont les connaissances, selon la «norme du niveau de connaissances», sont référencées aux évaluations linguistiques comme insatisfaisant (D), satisfaisant (C), bon (B), excellent (A).

La reconnaissance d'images au niveau des connaissances est comprise comme la procédure permettant de décider si un étudiant particulier appartient à l'une des images indiquées sur la base d'une comparaison de ses résultats scolaires lors des tests avec les caractéristiques de l'image.

Chaque cours comporte des points clés, en particulier des sujets importants, sans la connaissance desquels il est impossible de maîtriser une matière plus complexe en cours d'étude ou qui sera nécessaire au travail dans la spécialité. Lors de l'examen oral, en contact personnel avec l'étudiant, l'enseignant évalue nécessairement la compréhension de l'étudiant sur ces sujets. Avec les tests automatisés, vous pouvez prendre en compte l'importance de n'importe quelle section du cours en augmentant la proportion de questions sur ces sections dans le nombre total de questions. Mais ce n'est pas toujours pratique pour le compilateur du test, car les sections les plus importantes ne contiennent pas toujours le plus de matière.

La théorie des tests pédagogiques devrait être formée sur la base de lois et de modèles particuliers de domaines scientifiques tels que l'information, les statistiques générales, le contrôle d'acceptation statistique, la qualimétrie, la pédagogie, la psychologie, la recherche opérationnelle, la théorie de la décision, etc. Application directe des développements théoriques de ces domaines scientifiques ne fournit pas de résultats pratiques notables dans l'évaluation des connaissances en raison de l'intangibilité des connaissances en tant qu'objet de recherche. La tâche de former la théorie des tests pédagogiques peut être formulée comme la tâche de trouver la structure optimale de lois et de modèles spécifiques de testologie, qui permet d'évaluer les connaissances avec une erreur donnée.

Pour résoudre des problèmes de cette classe, les méthodes génétiques basées sur la mise en œuvre d'algorithmes génétiques sont utilisées avec le plus de succès, ce qui permet d'effectuer une énumération dirigée de lois et de modèles particuliers dans les directions les plus appropriées pour la formation d'une théorie nationale de l'éducation. essai.

Contrairement à la recherche aléatoire traditionnelle de solutions acceptables, les algorithmes de recherche génétique utilisent des analogues ou la proximité de solutions existantes dans de nombreux domaines de connaissances pour rechercher un ensemble optimal de lois spécifiques qui garantissent l'objectivité, la fiabilité et l'exactitude de l'estimation du niveau de connaissances reproduit par les étudiants. dans les procédures de test. Une telle énumération dirigée de lois particulières est évolutive et présente de nombreuses similitudes avec les opérateurs utilisés dans les algorithmes génétiques et les procédures qui se produisent avec des organismes vivants dans la nature.

Les principales propriétés des tests pédagogiques sont proposées pour être formées sur des populations de lois particulières de branches scientifiques telles que: sciences de l'information; psychologie, pédagogie et psychodiagnostic; logiques ; théorie des probabilités; théorie de la recherche ; théorie des ensembles flous; la théorie des jeux; théorie des décisions statistiques; contrôle par échantillonnage pour acceptation.

Dans ces études, les possibilités de la soi-disant "échelle de temps absolue d'évaluation des connaissances" sont explorées. Ses principes sont formulés. Les étapes d'une transition séquentielle de la forme traditionnelle des examens à la forme de test de cette approche sont formulées, sur leur base - les exigences pour la création de matériel de test pour cette approche.

L'expérience de l'utilisation de cette approche aux examens d'entrée à l'Université d'État de Tver pendant 4 ans est analysée.

Le potentiel diagnostique de cette approche est en cours d'étude. Le principe de "l'abstraction à trois niveaux" pour les tests de diagnostic est formulé.

La méthodologie est basée sur le fait que le processus éducatif est un cas particulier du processus technologique et qu'il doit être caractérisé par les mêmes méthodes d'analyse que celles adoptées pour les processus de production. Cependant, on ne peut pas transférer aveuglément de telles méthodes, surtout lorsqu'il s'agit d'une analyse significative du processus.

Pour analyser le processus éducatif, il est nécessaire de disposer, d'une part, d'un critère de qualité de l'éducation et, d'autre part, de suivre son évolution dans le temps. En tant que critère le plus informatif pour la qualité de l'éducation, il convient d'utiliser le degré d'apprentissage des élèves - SDA. Ce critère est basé sur les statistiques des notes reçues par les étudiants pour l'exécution de tâches ou de tests individuels. Les estimations sont incluses dans l'ADS avec un « poids » égal à l'intégrale de la probabilité d'obtenir une estimation donnée pour une distribution « type » d'estimations.

La procédure de test implique l'analyse des réponses à une séquence de tâches de test d'une certaine complexité. Si la réponse est correcte, alors on suppose que le niveau de préparation de l'élève est supérieur à la complexité de la tâche présentée et qu'il est capable de résoudre des problèmes d'une complexité donnée, sinon il en est incapable. Ceci est similaire à l'estimation du gradient d'une fonction de régression hypothétique, dans laquelle le gradient est lui-même une variable aléatoire.

Il est proposé d'utiliser l'approche suivante. Nous croyons que si la personne testée a résolu la tâche, alors elle a le désir de résoudre une tâche plus difficile. Sinon, ils feront une autre tentative pour résoudre une tâche de la même complexité. S'il n'est pas non plus résolu, alors un problème de complexité réduite se présente. Si une tâche moins complexe n'est pas immédiatement résolue, alors une tâche moins complexe est proposée pour solution. De même, il existe un processus d'augmentation de la complexité des tâches. Par conséquent, si l'on exclut le stade de l'apprentissage lors de la résolution de problèmes, l'élève choisira lui-même un certain niveau de complexité, autour duquel la complexité des tâches s'estompera.

Ainsi, la fonction du "niveau de connaissance" est la transformation de la fonction de la "complexité" de la tâche par la "capacité à résoudre des problèmes" d'une certaine "complexité". Dans cet énoncé, les termes « niveau de connaissances », « capacité à résoudre des problèmes » et « complexité » sont vagues. Donc, pour formaliser ces concepts, il convient d'utiliser l'appareil des ensembles flous. De plus, dans cette formulation, il y a une différence notable entre « complexité » et « capacité à résoudre des problèmes ».

Les concepts « complexité » et « niveau de connaissances » sont des variables floues (uniquement des variables, bien qu'elles soient définies par une fonction), tandis que la « capacité à résoudre des problèmes » est un rapport flou de variables floues « complexité » et « niveau de connaissances ». ". Le score est aussi une variable, cependant cette variable peut ne pas être analysée car il s'agit d'une transformation du "niveau de connaissance".

Nous appellerons tests directs un moyen de contrôler les connaissances de l'étudiant, dans lequel la structure du test (c'est-à-dire l'ensemble et l'ordre de présentation des éléments de test) ne dépend pas des réponses réelles de l'étudiant. Presque tous les tests existants actuellement fonctionnent en mode de test direct, cependant, le plus souvent, ils ne mettent en œuvre que les méthodes les plus simples et loin d'être les plus efficaces pour évaluer les connaissances.

Une analyse détaillée des techniques pédagogiques et des méthodes de communication dialoguée « en direct » entre l'enseignant et le candidat a montré qu'au moins cinq paramètres peuvent être distingués, dont les valeurs affectent l'organisation du processus de contrôle et d'évaluation des connaissances.

Le but du test est déterminé par la question principale, dont la réponse doit être obtenue à la suite du test - a) l'étudiant a-t-il un niveau de connaissances uniforme dans tout le matériel (tester l'étendue des connaissances) ou b) est-ce que le l'étudiant a des connaissances systématiques sur les sujets des tâches de test qui lui sont présentées (test de la profondeur des connaissances).

Le type de test a deux significations - crédit ou examen. Les résultats du test de maîtrise sont présentés sous forme binaire : « réussite » ou « échec ». Au cours des tests de maîtrise, la note de « réussite » est fixée si l'étudiant démontre des connaissances qui dépassent une certaine valeur seuil prédéterminée a priori.

Pendant les tests d'examen en fonction de la somme des points obtenus par le stagiaire lors de l'épreuve, l'évaluation finale des connaissances du stagiaire (qui dans le cas général comporte plus de deux valeurs acceptables) est calculée, dont la somme des points est projetée sur le barème d'évaluation appliqué .

La complexité du test est caractérisée par le niveau de connaissances que l'étudiant doit démontrer lors de son exécution. Il est déterminé par le degré de complexité des tâches de test qui peuvent être présentées à l'étudiant. Les études nous permettent de parler d'au moins trois niveaux de complexité des tests - standard, augmenté et réduit.

Le niveau de contrôle détermine le degré de rigueur de la vérification de la profondeur des connaissances. L'étude des méthodes de réalisation des enquêtes de test et d'examen montre que l'on peut parler de quatre niveaux de sévérité différents dans l'évaluation des réponses aux tâches de test (contrôle strict ; identification des connaissances les plus importantes ; identification des connaissances les plus simples ; identification des connaissances existantes).

Et enfin, le suivi des conditions résiliation anticipée le test implique l'achèvement précoce du test dans une situation où la poursuite du test devient impossible. La première de ces conditions est considérée comme le dépassement de la durée limite de l'essai. La deuxième condition est la fin des tests et la présentation d'une note insatisfaisante lorsqu'un nombre a priori donné de réponses incorrectes est reçu.

La variété des combinaisons possibles des valeurs des cinq caractéristiques proposées nous permet de parler de l'existence d'une famille très étendue d'algorithmes de test direct des connaissances (par exemple, examen d'évaluation de la profondeur des connaissances avec une complexité accrue et un contrôle strict, ou test d'évaluation de l'étendue des connaissances avec une complexité standard et contrôle de la durée maximale des tests, etc.).

Conclusion

L'introduction des nouvelles technologies de l'information dans les établissements d'enseignement qui a commencé dans notre pays au début des années 1980 - enseignement à l'aide de logiciels pédagogiques, ainsi que l'utilisation de programmes de test - a donné des résultats plus que modestes. Parmi les nombreuses raisons bien connues à cela (difficultés financières, techniques, organisationnelles, méthodologiques), on en note une : le rejet psychologique par les enseignants des méthodes "informatiques" d'enseignement et de contrôle des connaissances, surtout hautement qualifiées, travaillant de manière créative. Ils ont des raisons à cela: il existe un grand nombre de mauvais programmes qui ne répondent pas aux grands principes psychologiques et pédagogiques de l'éducation, réalisant sans succès les principales étapes du processus de maîtrise des connaissances; en règle générale, il n'y a pas de support méthodologique ; le temps et les efforts consacrés à la maîtrise des ordinateurs, à l'étude du programme et à la prise en charge de l'infrastructure appropriée s'avèrent prohibitifs ; lors de l'utilisation même de bons systèmes, le rôle de l'enseignant dans le processus éducatif est nivelé, la nature créative de son travail disparaît; il n'existe pas de système d'incitation pour les enseignants innovants maîtrisant les nouvelles technologies de l'information.

Cette situation peut et doit être changée. Le progrès technique a progressé rapidement, les systèmes informatiques et de télécommunications modernes ont obtenu des résultats considérables au cours des dernières années en termes de vitesse, de volume d'informations traitées et stockées. Le développement de systèmes de conception de logiciels (systèmes de programmation visuelle orientés objet, SGBD, systèmes de modélisation de réseaux de neurones, etc.) a donné aux ingénieurs et aux analystes de systèmes les outils les plus puissants pour développer et mettre en œuvre les projets les plus fantastiques.

Liste de la littérature utilisée

1. Avanesov B.C. Composition des tâches de test. Livre éducatif pour les professeurs d'université, les enseignants des écoles, les étudiants diplômés et les étudiants des universités pédagogiques. 2e éd., Rev. et add. M. : Adepte. - 2002.

2. Vankov E.A. "Technologies de test informatique" // Ordinateur, 2002. - N°3.

3. Granitskaya A.S. Apprendre à penser et à agir : Système adaptatif d'enseignement à l'école : Livre. pour le professeur. M. : Lumières. - 2001 .

4. Kazarinov A.S., Kultysheva A.Yu., Miroshnichenko A.A. Technologie de validité adaptative des items de test : Didacticiel. Glazov : GSPI, 1999.

5. Kalney V.A., Shishov S.E. Technologie de contrôle de la qualité de l'enseignement dans le système "enseignant-élève": un guide pour l'enseignant. Moscou : Société pédagogique de Russie, 1999.

6. Kasyanova N. V. "Création d'un système de contrôle informatique à la suite des nouvelles technologies de l'information dans l'éducation", Université nationale d'Ukraine orientale (VNU), Ukraine, Lugansk // documents de la conférence ITO-2001.

7. Mayorov A.N. Essais : conception, réalisation, utilisation. Deuxième édition - Saint-Pétersbourg : Education et culture, 1997.

8. Moiseev V.B., Usmanov V.V., Tarantseva K.R., Pyatirublevy L.G. "Estimation des résultats des tests basée sur des méthodes analytiques expertes". Open Education Journal, n° 3, 2001, p. 32-36.

9. Rudinsky I.D. "Méthode de contrôle automatisé adaptatif des connaissances". Collection de documents de conférence, 2001.

10. Chelyshkova M.B. Développement de tests pédagogiques basés sur des modèles mathématiques modernes : Uch.posobie. M. : Centre de recherche sur les problèmes de qualité dans la formation des spécialistes, 1995.

Vankov E.A. "Technologies de test informatique" // Informatique, 2002. - N°3

Avanesov B.C. Composition des tâches de test. Livre éducatif pour les professeurs d'université, les enseignants des écoles, les étudiants diplômés et les étudiants des universités pédagogiques. 2e éd., Rev. et add. M. : Adepte. – 2002

3 Granitskaya A.S. Apprendre à penser et à agir : Système adaptatif d'enseignement à l'école : Livre. pour le professeur. M. : Lumières. – 2001

Kasyanova N. V. "Création d'un système de contrôle informatique grâce aux nouvelles technologies de l'information dans l'éducation", Université nationale d'Ukraine orientale (VNU), Ukraine, Lugansk // documents de la conférence ITO-2001

Kazarinov A.S., Kultysheva A.Yu., Miroshnichenko A.A. Technologie de validité adaptative des éléments de test : manuel. Glazov : GSPI, 1999

Chelyshkova M.B. Développement de tests pédagogiques basés sur des modèles mathématiques modernes : Uch.posobie. M. : Centre de recherche sur les problèmes de qualité chez les spécialistes de la formation, 1995

Moiseev V.B., Usmanov V.V., Tarantseva K.R., Pyatirublevy L.G. "Estimation des résultats des tests basée sur des méthodes analytiques expertes". Open Education Journal, n° 3, 2001, p. 32-36

Mayorov A.N. Essais : conception, réalisation, utilisation. Deuxième édition - Saint-Pétersbourg : Education et culture, 1997

ID Rudinsky "Méthode de contrôle automatisé adaptatif des connaissances". Collection de documents de conférence, 2001

Kalney V.A., Shishov S.E. Technologie de contrôle de la qualité de l'enseignement dans le système "enseignant-élève": un guide pour l'enseignant. M. : Société pédagogique de Russie, 1999

Internat GKOU RO "Pédagogique" Taganrog

Matériaux méthodiques

Professeur de russe de la catégorie la plus élevée

Dix Yu.E.

professeur de mathématiques de 1ère catégorie

Marchenko M.V.

Taganrog 2015

UDC 001.8

Publié par décision du Conseil Scientifique et Méthodologique

Internat GKOU RO "Pédagogique" Taganrog

Équipe éditoriale:

directeur de l'internat SCEI RO "Pédagogique" à Taganrog,

candidat en sciences pédagogiques

Kochetkova O.A.

Sous-directeur des affaires académiques,

professeur de physique de la catégorie de qualification la plus élevée

Internat GKOU RO "Pédagogique" Taganrog

Karapetyan A.V.

directeur adjoint pour travail éducatif,

Internat GKOU RO "Pédagogique" Taganrog

Menyailenko Yu.V.

Sous-directeur des travaux scientifiques et méthodologiques,

Professeur de russe de la catégorie de qualification la plus élevée

Internat GKOU RO "Pédagogique" Taganrog

Dix Yu.E.

Sous-directeur des travaux scientifiques et méthodologiques,

professeur de mathématiques de la 1ère catégorie de qualification

Internat GKOU RO "Pédagogique" Taganrog

Marchenko M.V.

Collection de matériaux méthodologiques / Desyaterik Yu.E., Marchenko M.V. - T., 2015. -28 p.

La collection comprend des matériaux méthodologiques sur le thème "Tests en processus éducatif», décrit l'historique de l'apparition des tests, explique l'étymologie du concept de « test », décrit les types de tests, explique les avantages et les inconvénients des tests, décrit la méthodologie de compilation des tests.

Pas à vendre.

UDC 001.8

Imprimé à partir de la mise en page originale finie.

p/p

Nom de la section

Page

Introduction.

Qu'est-ce qu'un essai.

De l'histoire des tests.

Types d'épreuves.

Développement d'essais.

Exigences d'essai.

Le niveau de difficulté du test.

Critères d'évaluation.

Liste de la littérature utilisée et des ressources Internet.

Noter.

Introduction.

L'un des composants les plus importants Activités éducatives est le contrôle. Le contrôle pédagogique remplit plusieurs fonctions dans processus pédagogique: évaluative, stimulante, valorisante, pédagogique, diagnostique, éducative, etc.

Le contrôle est conçu pour fournir une rétroaction externe (contrôle de l'enseignant) et interne (contrôle de soi de l'élève), également le contrôle vise à obtenir des informations, en analysant que l'enseignant fait les ajustements nécessaires au cours du processus éducatif.

L'une de ses formes nombreuses et variées est le test, qui sera abordé dans cette collection.

Les tests en pédagogie remplissent trois fonctions principales interdépendantes : diagnostique, pédagogique et éducative :

  • Fonction diagnostique est d'identifier le niveau de connaissances, de compétences, d'aptitudes de l'élève. C'est la fonction de test principale et la plus évidente. En termes d'objectivité, d'étendue et de rapidité de diagnostic, les tests surpassent toutes les autres formes de contrôle pédagogique.

    Fonction d'enseignement l'épreuve consiste à motiver l'élève à intensifier le travail d'assimilation du matériel pédagogique. Pour améliorer la fonction d'apprentissage des tests, des incitations supplémentaires peuvent être utilisées, telles que la distribution par l'enseignant d'une liste approximative de questions pour l'auto-préparation, la présence de questions et de conseils orientés dans le test lui-même et l'analyse conjointe du test. résultats.

    fonction éducative se manifeste dans la fréquence et l'inévitabilité du contrôle des tests. Cette discipline, organise et dirige les activités des étudiants, aide à identifier et éliminer les lacunes dans les connaissances, forme le désir de développer leurs capacités.

Il existe de nombreuses opinions différentes à la fois "pour" et "contre" l'utilisation des tests dans le processus éducatif. Certains considèrent les tests comme un moyen de transformer le processus éducatif dans le sens de sa technicisation, de réduire l'intensité du travail et deviennent adeptes de cette méthode. D'autres voient dans les tests un moyen de déprécier le rôle de l'enseignant et les résultats des tests ne sont pas suffisamment fiables. Cependant, il convient de noter que ce sont les tests qui deviennent progressivement la principale forme de réussite aux examens finaux (et pas seulement). Depuis 2009, pour tous les diplômés de l'école, la principale forme de certification d'État finale à l'école Fédération Russe est l'examen d'État unifié. Ainsi, il est nécessaire d'introduire des technologies de test dans le système de formation. Avec leur aide, au cours de l'année, il est possible d'évaluer le niveau d'assimilation de la matière par les étudiants et de former leurs compétences en travaillant avec des tâches de test. Une telle formation permettra aux étudiants d'augmenter réellement leur score lors de la réussite de l'examen. Au cours de ces formations, les compétences psychotechniques correspondantes d'autorégulation et de maîtrise de soi sont développées. À cet égard, les tests, en tant que moyen de mesurer et de contrôler les connaissances des élèves, deviennent la base du processus éducatif dans toute école russe.

Chaque enseignant décide lui-même dans quelle mesure utiliser telle ou telle méthode de contrôle.

Qu'est-ce qu'un essai.

L'objet de notre étude est le test. Qu'est-ce que c'est?

Aujourd'hui, ce terme se retrouve assez souvent, et pas seulement dans l'éducation, mais aussi dans des domaines éloignés.

Le test vient du mot test- tester, tester. Les tests sont utilisés pour déterminer la conformité de l'élément de test avec les spécifications et critères spécifiés. Il n'appartient pas aux essais de déterminer les causes de non-conformité aux exigences spécifiées. Le test est l'une des sections du diagnostic et est utilisé dans la technologie, la médecine, la psychiatrie et l'éducation pour déterminer l'adéquation d'un objet de test à l'exécution de certaines fonctions. La qualité du test et la fiabilité de ses résultats dépendent largement du testeur.

De cette façon , peut être défini test sous forme de tests standardisés, courts et limités dans le temps, conçus pour établir des différences individuelles quantitatives et qualitatives.

Cependant, dans ce manuel, nous parlons de tests pédagogiques. Et ce qui suit convient mieux à sa définition :

Tests pédagogiques - il s'agit d'une forme de mesure des connaissances des élèves, basée sur l'utilisation de tests pédagogiques. Il comprend la préparation de tests de haute qualité, les tests proprement dits et le traitement ultérieur des résultats, qui évalue la formation des candidats.

Alors test pédagogique peut être défini comme un outil d'évaluation des apprentissages des élèves, constitué d'un système de tâches de test, d'une procédure normalisée de réalisation, de traitement et d'analyse des résultats.

Autrement dit, on peut définir test pédagogique en tant que système de tâches de difficulté croissante, une forme spécifique qui vous permet de mesurer qualitativement et efficacement le niveau et d'évaluer la structure de préparation des élèves.

Pour une meilleure compréhension de cette définition, nous donnerons une brève interprétation de ses principaux termes.

Système signifie que le test contient des tâches qui ont des propriétés formant le système. Ici, tout d'abord, il faut mettre en évidence l'appartenance commune des tâches à un même système de connaissances, c'est-à-dire à une discipline académique, une section, un sujet, etc., leur connexion et leur ordre. Pour la certification finale d'État (GIA) des diplômés des écoles, il est nécessaire de développer des tâches intégrées dont le contenu couvre le système de connaissances. Dans le test pédagogique, les tâches sont organisées au fur et à mesure que la difficulté augmente - du plus facile au plus difficile. En d'autres termes, la principale caractéristique formatrice du système formel du test est la différence des tâches en fonction de leur degré de difficulté.

formulaire spécifique Les tâches de test diffèrent en ce que les tâches de test ne sont pas des questions ou des tâches, mais des tâches formulées sous forme d'énoncés, vrais ou faux, selon les réponses. Les questions traditionnelles, au contraire, ne sont ni vraies ni fausses, et leurs réponses sont souvent si vagues et verbeuses que pour révéler leur exactitude, une dépense notable, en termes totaux, d'énergie intellectuelle des enseignants est nécessaire. En ce sens, les questions et réponses traditionnelles sont non technologiques, et il est donc préférable de ne pas les inclure dans le test.

Contenu spécifique signifie l'utilisation dans le test uniquement d'un tel matériel de contrôle qui correspond au contenu de la discipline académique ; le reste n'est inclus dans l'épreuve pédagogique sous aucun prétexte.

Difficulté croissante des tâches peut être comparée au sens figuré aux barrières sur la piste d'athlétisme du stade, où chacune suivante est plus haute que la précédente. Étant donné que dans le test pédagogique, les tâches sont ordonnées selon le principe de la difficulté croissante, certains sujets "échouent" déjà sur la plus facile, la première tâche, d'autres - sur les tâches suivantes. Un élève d'un niveau de préparation moyen ne peut répondre correctement qu'à la moitié des items du test et, enfin, seuls les plus avertis sont capables de donner la bonne réponse aux tâches du plus haut niveau de difficulté situées à la fin du test.

La réponse à la tâche du test pédagogique est un court jugement lié dans le contenu et la forme au contenu de la tâche. Chaque tâche se voit attribuer des réponses correctes et incorrectes. Les critères d'exactitude sont prédéterminés par les auteurs du test. La probabilité d'une réponse correcte à n'importe quelle tâche dépend du rapport entre le niveau de connaissance du sujet et le niveau de difficulté de la tâche.

Grâce à des tests, plus souvent que d'autres signes, les connaissances, les compétences, les capacités et les idées sont vérifiées. Du point de vue des mesures pédagogiques, il est utile d'introduire deux indicateurs principaux de la qualité des connaissances- niveau et structure des connaissances. Ils sont évalués en enregistrant des scores pour la connaissance et l'ignorance de tous les composants requis du matériel testé. Pour objectiver ce processus, tous les composants doivent être identiques. Les règles de notation des sujets sont les mêmes. Ces conditions ouvrent la voie à une comparaison objective des structures individuelles du savoir et du non-savoir.

Niveau de connaissance se révèle lors de l'analyse des réponses de chaque élève à toutes les tâches du test. Plus il y a de réponses correctes, plus le score individuel du sujet est élevé. Typiquement, cette note de test est associée à la notion de « niveau de connaissance » et subit une procédure d'affinement basée sur l'un ou l'autre modèle de mesure pédagogique. Le même niveau de connaissance peut être obtenu en répondant à des tâches différentes.

Avec le début du développement actif de la technologie informatique, l'utilisation d'un ordinateur comme outil d'analyse des tâches est très efficace. Aujourd'hui, les tests informatiques font partie des outils d'apprentissage électronique (ESL).

Alors, les grandes étapes de l'évaluation de l'efficacité de la formation les étudiants utilisant l'ESE doivent être :

1. Une formulation claire des exigences en matière de connaissances, de compétences et d'aptitudes des étudiants. Les exigences sont formulées avant le début de la formation et la création de l'ESE, doivent respecter le contenu et les modalités de la formation ;

2. Développement de sous-systèmes de contrôle et de mesure de l'ESP pour tester les élèves. Les matériaux sont développés en stricte conformité avec les exigences en matière de connaissances, de compétences et de capacités des étudiants. Pour chaque tâche, il est indiqué à quelle(s) exigence(s) elle répond ;
3. Développement de technologies pour tester les étudiants, déterminant le rôle de l'ESE dans la mesure de l'efficacité de l'apprentissage des étudiants;

4. Expertise de la qualité des matériels de contrôle et de mesure. Vérifier la conformité des matériels de contrôle et de mesure avec le contenu de la formation et les exigences relatives aux connaissances, compétences et capacités des étudiants. Évaluation de l'exhaustivité de la couverture des exigences en mesurant les matériaux ;
5. Réalisation de mesures à l'aide du POE développé. L'évaluation de la qualité de l'enseignement peut être effectuée aussi bien dans le cadre du processus éducatif en cours qu'à son terme à la fin de l'année scolaire. La mesure est effectuée par l'enseignant à l'aide d'outils d'apprentissage électroniques;
6. Déterminer les résultats des mesures, mettre à l'échelle les résultats, les amener à un système d'évaluation, comparer les résultats, formuler des conclusions sur la qualité de la formation des étudiants utilisant l'ESE.

De l'histoire des tests.

Aujourd'hui, les tests sont très activement utilisés dans le processus éducatif. Avez-vous déjà pensé à la date d'apparition du premier test?

Aussi dans L'Egypte ancienne, Grèce, Chine, diverses capacités, connaissances, compétences et capacités ont été testées. Ces tests étaient associés à certaines mesures de certains résultats qualitatifs de l'activité humaine. Ils peuvent à juste titre être considérés comme la préhistoire des épreuves. Au fur et à mesure que les relations sociales se développaient, les méthodes quantitatives de mesure ont également été améliorées, de nouvelles exigences ont été imposées pour les examens et la notation. Cependant, tout ce qui précède ne peut pas être qualifié de test dans compréhension moderne ce terme.

P première étape l'utilisation des tests dans la pratique mondiale peut être considérée comme la période des années 80. 19ème siècle jusqu'aux années 20 20ième siècle C'est la période d'origine et de développement des tests. Les bases théoriques des tests ont été posées au milieu des années 80. 19ème siècle Le psychologue et naturaliste anglais F. Galton, qui a suggéré qu'à l'aide de tests, il serait possible de séparer les facteurs de l'hérédité et l'influence de l'environnement sur la psyché humaine.

La contribution importante de F. Galton au développement de la théorie des tests a été la définition de trois principes de base qui sont encore utilisés aujourd'hui :

1) application d'une série de tests identiques à un grand nombre de sujets ;

2) traitement statistique des résultats ;

3) sélection des normes d'évaluation.

Une énorme contribution au développement de la testologie a été apportée par le psychologue français Alfred Binet. Il peut être considéré comme l'ancêtre des tests modernes conçus pour diagnostiquer le niveau de développement de l'intelligence. Par la suite, lui et le médecin parisien T. Simon ont introduit le concept d '«âge mental» et l'échelle métrique correspondante (1908). Donc, dans la première décennie du 20ème siècle. Le célèbre test Binet-Simon est en cours d'introduction dans la pratique, dont la tâche principale était d'identifier les enfants arriérés mentaux avec leur orientation ultérieure vers des écoles spéciales.

Deuxième étape dans le développement des tests peut être considéré comme 20-60s. le siècle dernier. American V.A. McCall a divisé les tests en tests pédagogiques (test éducatif) et psychologiques (test d'intelligence). McCall a justifié le but de l'utilisation de tests pédagogiques - pour unir les étudiants en groupes qui apprennent un matériau égal à la même vitesse. La tâche principale des tests pédagogiques était de mesurer le succès des élèves dans certaines disciplines scolaires pendant une certaine période d'études, ainsi que le succès de l'application de certaines méthodes et organisation d'enseignement.

Le développement du premier test pédagogique appartient au psychologue américain Edward Lee Thorndike. Il est considéré comme le fondateur des mesures pédagogiques. Le premier test pédagogique qui est sorti sous sa direction était le test de Stone pour résoudre des problèmes arithmétiques. C'est aux États-Unis que les tests de réussite visant à tester les connaissances, les compétences et les capacités des élèves dans des matières individuelles sont particulièrement répandus.

Le premier test dans une langue étrangère a été compilé par B. Wood en 1925. Ses tests ont été utilisés pour les examens finaux dans les écoles de New York et avaient dans leur structure des tâches pour choisir une réponse en vocabulaire, grammaire et lecture en français et en espagnol. En 1929, le psychologue américain W. Henmon a étudié certains aspects de la technologie de compilation des tâches de test pour les tests de réussite. Il a développé des tests pour tester la connaissance du vocabulaire, de la grammaire, de la phonétique ; capacité à comprendre ce qui est lu au niveau des phrases et des paragraphes, compétences en traduction, écoute, expression orale, rédaction d'essais.

En Russie, les tests ont acquis une importance pratique après 1925, lorsqu'une commission de test spéciale a été créée. Il existait au service pédagogique de l'Institut des méthodes de travail scolaire. Sa tâche était de développer des tests pour l'école soviétique. Et déjà au printemps 1926, de tels tests, créés sur la base des tests américains, sont sortis. Des tests ont été développés pour l'histoire naturelle, les études sociales, l'arithmétique, la résolution de problèmes, la compréhension de la lecture et l'orthographe. Ces tests étaient accompagnés d'instructions et d'une carte personnelle permettant de suivre les progrès de l'élève.

Déjà dans ces années, il a été prouvé que la méthode des tests permet non seulement de couvrir les processus mentaux élémentaires individuels, mais peut analyser leur totalité. De plus, il a été observé que la comptabilité des tests élimine le caractère aléatoire, la subjectivité et l'évaluation approximative du travail avec les étudiants.

Dans les années 30-50. Une attention considérable a été accordée aux tests dits prédictifs, à la finalité des tests dans le système éducatif, aux types de tests et à leur utilisation dans la pratique. À l'heure actuelle, les questions liées à l'élaboration de tests par les enseignants en exercice revêtent une importance particulière.

L'étape suivante dans le développement des tests en Russie est la période du début des années 60. jusqu'à la fin des années 70. Les réformes de l'enseignement d'un certain nombre de matières, le développement de l'apprentissage programmé ont donné une impulsion significative à l'amélioration des tests.

Parallèlement, les tests à l'aide d'ordinateurs commencent à être largement introduits, ce qui est devenu possible grâce aux progrès de l'automatisation et de la cybernétique.

Dans les années 60. le premier, après une longue pause, des études de scientifiques nationaux sur l'utilisation de tests d'orientation psychologique et pédagogique commencent. Fondamentalement, ces développements analysent de nombreuses années d'expérience en matière de tests accumulées dans des pays étrangers.

Dès le début des années 80. a commencé nouvelle étape dans le développement des tests en Russie. Cette période est caractérisée par un certain nombre de caractéristiques. Tout d'abord, une direction importante est l'utilisation intensive des ordinateurs à la fois dans le processus de test et dans le traitement des résultats.

Ces dernières années, il y a eu une introduction active des tests dans le processus éducatif. Et malgré les lacunes qui surviennent lors de l'utilisation de cette forme de contrôle et d'évaluation des connaissances, les tests occupent une position assez forte.

Types d'épreuves.

Les tests peuvent être classés selon différents critères :

    par objectifs - informationnel, diagnostique, éducatif, motivationnel, attestation ;

    selon la procédure de création - standardisée, non standardisée ;

    selon la méthode de formation des tâches - déterministe, stochastique, dynamique ;

    selon la technologie de la conduite - papier, y compris papier utilisant la reconnaissance optique, à grande échelle, utilisant un équipement spécial, un ordinateur;

    sous forme de tâches - type fermé, type ouvert, appariement, séquençage ;

    par la présence de rétroaction - traditionnelle et adaptative.

Étant donné que le manuel est consacré à l'utilisation des tests dans l'enseignement, nous parlerons alors des tests de connaissances.

Essais traditionnels

Un test traditionnel a une composition, une intégrité et une structure, un tel test contient une liste de questions et diverses options réponses. Chaque question vaut un certain nombre de points. Le résultat du test traditionnel dépend du nombre de questions auxquelles on a répondu correctement. Selon V. S. Avanesov, un test traditionnel est un système de tâches présentées par ordre de complexité croissante en même temps, avec le même système de notation pour tous les candidats.

Essais non conventionnels

Les tests non traditionnels comprennent les tests intégratifs, adaptatifs, en plusieurs étapes et dits critériels.

1. Tests intégratifs

Un test intégratif peut être appelé un test consistant en un système de tâches visant à un diagnostic final généralisé de l'état de préparation d'un diplômé d'un établissement d'enseignement. Le diagnostic est effectué en présentant de telles tâches, dont les réponses correctes nécessitent une connaissance intégrée (généralisée, clairement interconnectée) de deux ou plusieurs disciplines académiques.

2. Tests adaptatifs

Un test adaptatif est une variante d'un système de test automatisé dans lequel les paramètres de difficulté et de capacité de différenciation de chaque tâche sont connus à l'avance. Il s'agit d'un type spécial de test dans lequel chaque tâche suivante est sélectionnée en fonction des réponses aux tâches précédentes. La séquence des tâches et leur nombre dans ce type de test sont déterminés dynamiquement. Ce système est créé sous la forme d'une banque informatique de tâches, ordonnées en fonction des caractéristiques des tâches d'intérêt. La caractéristique la plus importante des items de test adaptatif est leur niveau de difficulté, obtenu empiriquement, ce qui signifie qu'avant d'entrer dans la banque, chaque item est testé empiriquement pendant une durée suffisante. grands nombresétudiants typiques de la population d'intérêt.

Les avantages les plus significatifs des tests adaptatifs informatiques par rapport aux tests traditionnels sont :

    la capacité à s'adapter au niveau de connaissance de la personne testée (vous n'aurez pas à répondre à des questions trop complexes ou trop simples) ;

    gain de temps et d'efforts en réduisant le nombre de tâches (la durée du test peut être réduite jusqu'à 60%) sans perdre le niveau de fiabilité.

Types d'éléments de test

Considérez la classification la plus populaire des éléments de test. Dans cette classification, les tâches de test peuvent être divisées en deux groupes :

    tâches de test de type fermé (chaque question est accompagnée options prêtes à l'emploi réponses, parmi lesquelles il faut en choisir une ou plusieurs correctes) ;

    tâches de test de type ouvert (pour chaque question, le sujet doit proposer sa propre réponse : ajouter un mot, une phrase, une phrase, un signe, une formule, etc.).

Le choix du type et du type de tâche de test est déterminé, tout d'abord, par les objectifs conformément auxquels les tests sont effectués, la nature du matériel, dont l'assimilation doit être identifiée, et les caractéristiques d'âge des sujets . Tout aussi important est le soutien financier, personnel et des ressources, ainsi que la réserve de temps dont dispose le développeur.

Tâches de type fermé

Tâches de type ouvert

Choix multiple

présentation gratuite

Choix alternatif

Ajout

Correspondant à

Séquençage

    Choix multiple - le sujet doit choisir une ou plusieurs bonnes réponses dans la liste fournie.

    Choix alternatif - le sujet doit répondre "oui" ou "non".

    Correspondance - le sujet est invité à faire correspondre les éléments des deux listes.

    Séquençage - le sujet doit organiser les éléments de la liste dans un certain ordre.

    Présentation libre - le sujet doit formuler indépendamment la réponse; aucune restriction ne leur est imposée dans la tâche.

    Supplément - le sujet doit formuler des réponses en tenant compte des restrictions prévues dans la tâche (par exemple, compléter la phrase).

Avantages et inconvénients des tests.

Par rapport à d'autres formes de contrôle des connaissances, les tests ont leurs avantages et leurs inconvénients.

Avantages :

    Le test est une méthode d'évaluation plus qualitative et objective, son objectivité est obtenue en normalisant la procédure de conduite, en vérifiant les indicateurs de qualité des tâches et des tests dans leur ensemble.

    Le test est une méthode plus équitable, il met tous les élèves sur un pied d'égalité, tant dans le processus de contrôle que dans le processus d'évaluation, éliminant pratiquement la subjectivité de l'enseignant. Selon l'association anglaise NEAB, qui s'occupe de l'évaluation finale des étudiants au Royaume-Uni, les tests peuvent réduire de plus de trois fois le nombre de recours, rendre la procédure d'évaluation la même pour tous les étudiants, quels que soient leur lieu de résidence, leur type et type d'établissement d'enseignement dans lequel les étudiants étudient.

    Les tests sont un outil plus volumineux, car les tests peuvent inclure des tâches sur tous les sujets du cours, tandis que l'examen oral comporte généralement 2 à 4 sujets et l'écrit - 3 à 5. Cela vous permet de révéler les connaissances de l'étudiant tout au long du cours, en éliminant l'élément de hasard lors du retrait d'un ticket. À l'aide de tests, il est possible d'établir le niveau de connaissance de l'étudiant dans la matière dans son ensemble et dans ses sections individuelles.

    Le test est un outil plus précis, ainsi, par exemple, une échelle d'évaluation de test de 20 questions se compose de 20 divisions, alors que l'échelle d'évaluation des connaissances habituelle n'en compte que quatre.

    Les tests sont plus efficaces d'un point de vue économique. Les principaux coûts lors des tests concernent le développement d'outils de haute qualité, c'est-à-dire qu'ils sont de nature ponctuelle. Le coût de réalisation du test est bien inférieur à celui d'un contrôle écrit ou oral. Tester et contrôler les résultats dans un groupe de 30 personnes prend une heure et demie à deux heures, un examen oral ou écrit - au moins quatre heures.

    Les tests sont un outil plus doux, ils mettent tous les élèves sur un pied d'égalité, en utilisant une procédure unique et des critères d'évaluation communs, ce qui entraîne une diminution de la tension nerveuse pré-examen.

Défauts:

    Le développement d'outils de test de haute qualité est un processus long, laborieux et coûteux.

    Les données obtenues par l'enseignant à la suite des tests, bien qu'elles incluent des informations sur les lacunes de connaissances dans des sections spécifiques, ne permettent pas de juger des raisons de ces lacunes.

    Le test ne permet pas de tester et d'évaluer des niveaux élevés et productifs de connaissances liées à la créativité, c'est-à-dire des connaissances probabilistes, abstraites et méthodologiques.

    L'étendue de la couverture des sujets dans les tests a un inconvénient. L'étudiant lors des tests, contrairement à l'examen oral ou écrit, n'a pas assez de temps pour une analyse approfondie du sujet.

    Garantir l'objectivité et l'équité du test nécessite l'adoption de mesures spéciales pour assurer la confidentialité des items du test. Lors de la réapplication du test, il est souhaitable d'apporter des modifications aux tâches.

    Il y a un élément de hasard dans les tests. Par exemple, un élève qui n'a pas répondu à une question simple peut donner la bonne réponse à une question plus complexe. La raison peut être à la fois une erreur accidentelle dans la première question et une devinette de la réponse dans la seconde. Cela fausse les résultats des tests et conduit à la nécessité de prendre en compte la composante probabiliste dans leur analyse.

Les lacunes ci-dessus indiquent qu'il n'est pas nécessaire d'absolutiser les possibilités de la forme de test de mesure et de contrôle des connaissances. Toutes les caractéristiques nécessaires à l'assimilation des connaissances et des compétences ne peuvent pas être obtenues au moyen de tests. Par exemple, des indicateurs tels que la capacité de concrétiser sa réponse avec des exemples, la connaissance des faits, la capacité d'exprimer ses pensées de manière cohérente, logique et convaincante, certaines autres caractéristiques des connaissances, des compétences et des capacités ne peuvent pas être diagnostiquées par des tests. Cela signifie que les tests doivent nécessairement être combinés avec d'autres formes et méthodes de test et de contrôle des connaissances des étudiants.

Mais malgré les inconvénients indiqués des tests en tant que méthode de contrôle pédagogique, ses qualités positives indiquent largement l'opportunité d'utiliser une telle technologie dans le processus éducatif.

Développement d'essais.

Les tâches de test peuvent être compilées à l'aide de divers outils informatiques, allant de divers éditeurs et programmes de présentation à l'utilisation de langages de programmation et de capacités Internet.

Allouer cinq étapes de développement de test :

Premier pas est de déterminer le but et les objectifs du développement des tests.

Deuxième étape est le développement de tâches sous forme de test. Au deuxième stade, une préparation dans le domaine de la matière enseignée, la connaissance des formulaires de test, la connaissance de la logique et la capacité de transformer des fragments du contenu de la discipline académique en contenu de tâches sont requises.

Sur le troisième étape des tests sont en cours d'élaboration. Pour une activité réussie dans la troisième étape, les développeurs auront en outre besoin d'une formation dans l'application des méthodes statistiques, le traitement et l'interprétation des données.

Sur le quatrième étape des tâches sont sélectionnées et des tests sont créés, améliorant ainsi la qualité et l'efficacité du test. La présence d'un nombre suffisant de tâches de test vous permet de procéder au développement d'un test en tant que système avec intégrité, composition et structure.

Sur le cinquième étape le contenu de la variable d'intérêt est précisé, l'échelle de mesure est déterminée, un programme informatique est utilisé pour déterminer et affiner les valeurs de la difficulté des tâches de test et le niveau de préparation des sujets.

Le développement d'outils de test de haute qualité, comme mentionné ci-dessus, est un processus long, laborieux et coûteux. Dans son parcours, il faut tenir compte de certains points :

Tester le contenu.

Lors de la création d'un test, la première étape consiste à déterminer son objectif. Si vous décidez de développer votre propre méthodologie, vous devez savoir clairement à quoi sert le test et pourquoi vous n'êtes pas satisfait des analogues existants.

Lors de l'élaboration des tâches, il faut être guidé par certains

    Formulez chaque tâche ou question dans un langage simple et clair (sans ambiguïté des termes) compréhensible pour les sujets.

    Lors de la compilation des questions, vous devez faire particulièrement attention à utiliser les mots « parfois », « souvent », « toujours », « tous », « jamais ».

    La question doit être formulée clairement, en évitant les mots grand, petit, petit, beaucoup, peu, moins, plus, etc.

    Évitez les phrases d'introduction et les phrases qui ont peu de rapport avec l'idée principale, ne recourez pas à de longues déclarations, car elles conduisent à la bonne réponse, même si l'étudiant ne le sait pas.

    N'oubliez pas que plus le nombre de tâches contenues dans le test augmente, plus sa fiabilité augmente.

    Le test doit inclure, si possible, des tâches de différents types et types, car cela augmente sa fiabilité.

    Construire des réponses sur la base de "oui" - "non" réduit la fiabilité des tests.

    N'incluez pas de citations directes de livres dans le texte du test.

    N'utilisez pas de tâches pièges, de questions provocantes dans le test.

    Le test ne doit pas contenir de tâches qui fournissent des réponses à d'autres questions.

    Évitez les questions auxquelles on peut répondre sur la base d'une érudition générale sans connaissances particulières acquises dans l'étude de cette discipline.

    Utilisez des diagrammes, des tableaux, des images, des diagrammes, des organigrammes et d'autres tâches explicatives.

    Les mauvaises réponses doivent être raisonnables, habilement sélectionnées, il ne doit pas y avoir d'inexactitudes évidentes, d'indices.

    Toutes les options de réponse doivent être grammaticalement cohérentes avec la partie principale de la tâche, utiliser des phrases courtes et simples, sans tours dépendants ou indépendants.

    Utilisez moins souvent les négatifs dans le corps principal, évitez les doubles négatifs tels que : "Pourquoi tu ne peux pas faire...?"

    La réponse à la question posée ne doit pas dépendre des réponses précédentes.

    Les réponses correctes et incorrectes doivent être sans ambiguïté dans le contenu, la structure et le nombre total de mots. Utilisez des erreurs plausibles tirées de l'expérience.

    Si la question est de nature quantitative, rangez les réponses par ordre croissant, si les réponses sont présentées sous forme de mots du texte, rangez-les par ordre alphabétique.

    Il est préférable de ne pas utiliser les options de réponse "aucune des réponses ci-dessus" et "toutes les réponses ci-dessus".

    Évite la répétition.

    Utilisez les restrictions dans la question elle-même.

    Ne simplifiez pas les questions.

    La place de la bonne réponse doit être déterminée de manière à ce qu'elle ne se répète pas d'une question à l'autre, qu'il n'y ait pas de modèles, mais qu'elle soit donnée dans un ordre aléatoire.

    Il est préférable d'utiliser une question longue et une réponse courte.

    Analysez les tâches du point de vue de la réponse incorrecte des élèves les plus préparés.

    Les systèmes nationaux d'un certain nombre de pays fixent des exigences spécifiques pour les éléments de test, auxquelles nous n'avons pas prêté suffisamment d'attention jusqu'à présent. À titre d'exemple, prenons l'exigence des instructions de conception des tests fournies par le NEAB (Northen Examinations and Assesment Board): "Il est nécessaire d'éviter les questions qui, de quelque manière que ce soit, donnent la supériorité au candidat d'un sexe particulier."

Le contenu du test peut être défini comme l'affichage optimal du contenu de l'éducation dans le système d'items du test. Contenu éducation scolaire est défini comme un système de connaissances et d'expériences de l'humanité, dont l'assimilation est nécessaire pour l'acquisition ultérieure d'une formation professionnelle et pour l'amélioration de la qualité de la vie. Le contenu de l'enseignement est défini par divers programmes éducatifs, dont le choix est effectué par les étudiants sur une base volontaire. Dans un système éducatif qui fonctionne bien, le système de tâches de test devrait, en principe, tester toutes les connaissances qui sont proposées aux étudiants dans le processus d'apprentissage. Mais pour de nombreuses raisons, la quantité de connaissances testées est toujours inférieure à la quantité de connaissances offertes en classe. Les connaissances testées sont la partie du contenu de la discipline académique dont l'assimilation par les étudiants est soumise à un contrôle obligatoire dans un seul établissement d'enseignement.

Certains éléments des connaissances testées (principalement sur certains thèmes) ne sont utilisés que dans le contrôle actuel. D'autres éléments couvrant la connaissance de plusieurs thèmes sont utilisés dans le contrôle à mi-parcours, par exemple, à la fin du trimestre académique. Et, enfin, dans le contrôle final, des tâches sont utilisées, dont les réponses correctes nécessitent la connaissance de plusieurs, et parfois de tous, des sujets étudiés au cours de l'année scolaire.

Les instructions de rédaction du test NEAB (Northen Examinations and Assesment Board) stipulent: «Avec un sujet de test existant, le développeur doit s'assurer que l'ensemble du sujet est couvert par les questions proposées. Le contenu du sujet doit être entièrement couvert par la matrice sur tous les sujets. Si les tests ont lieu sur des sujets individuels, dans ce cas, il est également nécessaire que l'ensemble du sujet soit couvert par les questions du test. Dans le cas où une question ou une partie de question ne correspond pas au sujet, ou n'est pas tout à fait claire dans le cadre de ce sujet, la question doit être abstenue.

Exigences d'essai .

Un test bien conçu doit répondre à certaines exigences.

Validité - c'est la correspondance du contenu de l'épreuve avec les acquis d'apprentissage fixés dans le programme. Il reflète exactement ce que le test doit mesurer et dans quelle mesure il le fait ; indique dans quelle mesure le test mesure la qualité à laquelle il est destiné. L'indicateur de validité répond à la question : « Est-ce que ce qui est formulé dans le but de la tâche de contrôle est mesuré avec son aide ? La validité du test développé est vérifiée sur la base de la comparaison des résultats de son utilisation avec les résultats du test du niveau de connaissance des étudiants testés par d'autres méthodes (enquête orale, travail indépendant ou de contrôle), en comparant ces résultats avec les résultats actuels progression des élèves.

Certitude test signifie qu'à sa lecture, le sujet comprend bien quelles tâches et dans quelle mesure il doit les accomplir pour que le résultat corresponde à la tâche.

Standardisation – une procédure unique pour tester et synthétiser ses résultats.

Fiabilité test - c'est sa capacité à caractériser avec une uniformité suffisante l'indicateur étudié dans les expériences didactiques, à la fois la tâche dans son ensemble et ses parties, c'est-à-dire dans quelle mesure sa répétition conduira aux mêmes résultats. La fiabilité du test est augmentée par sa simplicité, le strict respect des conditions de test, l'exclusion de la possibilité de l'influence de facteurs étrangers (indices, tricherie, etc.)

prédictif la valeur du test signifie que le test doit être tel que les résultats de l'examen puissent être utilisés dans des activités ultérieures, par exemple, lors de la répétition de matières mal apprises.

Simplicité la formulation des tâches et des réponses doit être claire et concise. L'indicateur de simplicité est la rapidité de la tâche.

L'un des points difficiles et importants dans la préparation des tâches de test est leur formulation correcte :

    Si possible, la tâche ne doit pas contenir de question et la réponse doit être, pour ainsi dire, une continuation de la tâche.

    Le libellé de la tâche doit expliquer pleinement la tâche assignée au sujet du test, et le langage et les termes, les désignations, les images graphiques et les illustrations de la tâche et les réponses à celle-ci doivent être inconditionnellement et sans ambiguïté compréhensibles pour les étudiants.

    Le libellé de toutes les réponses doit correspondre au libellé de la question. Il ne devrait pas y avoir de réponses immédiatement perceptibles comme incroyables.

    Il est souhaitable que tous les items du test soient du même type, par exemple en choisissant une réponse sur cinq. Si, néanmoins, des tâches de types différents sont utilisées, elles doivent être très clairement séparées dans le programme de test, par exemple en les mettant en évidence dans des couleurs différentes.

    La longueur de la tâche de test, si possible, ne doit pas dépasser dix mots. Un long texte de tâche sera plus difficile à percevoir dans son ensemble.

    Il en va de même pour la longueur des réponses aux tâches.

    Le nombre d'options de réponse doit être optimal.

La présentation électronique du test permettra de gagner du temps lors de la réalisation et de la synthèse du test.

Tester le niveau de difficulté.

Si le test pédagogique est brièvement défini comme un système de tâches de difficulté croissante, il devient clair que la difficulté des tâches est l'indicateur le plus important, disons, de la formation du test. À partir de cette exigence, il devient clair qu'une vérification empirique préliminaire de chaque tâche est obligatoire avant le début des tests. Au cours du processus de vérification, de nombreuses tâches (généralement plus de la moitié) ne répondent pas aux exigences et ne sont donc pas incluses dans le test. La première exigence pour les tâches de test : dans le test, les tâches doivent différer par le niveau de difficulté, qui découle de la définition du test donnée précédemment et du principe considéré.

L'indicateur de la difficulté du test et des tâches de test est à la fois significatif et formel. Un indicateur significatif, car dans Bon test la difficulté peut dépendre uniquement du contenu et du niveau de préparation des sujets eux-mêmes, tandis que dans un mauvais test, la forme des tâches (surtout si elle n'est pas adaptée au contenu), une mauvaise organisation des tests, s'il y a des opportunités pour la tricherie, les fuites d'informations commencent à affecter sensiblement les résultats.

La composante formelle de l'indicateur de difficulté apparaît lorsque le test est considéré comme un processus de confrontation entre chaque sujet testé et chaque tâche qui lui est proposée. Il est utile de considérer le résultat obtenu dans ce cas comme le résultat d'une telle confrontation. Avec une interprétation simplifiée de chaque cas de confrontation entre le sujet et la tâche suivante, seuls deux résultats sont généralement considérés : la victoire du sujet avec la bonne solution de la tâche, où il reçoit un point, ou la défaite, pour laquelle zéro point sont donnés. L'évaluation du résultat de la confrontation dépend du rapport entre le niveau de connaissance de la personne testée et le niveau de difficulté de la tâche, de l'unité de mesure de connaissance choisie et de la règle pré-adoptée (convention) - quelle est considéré comme une "victoire" du sujet de test et si un match nul est acceptable, parlant dans la langue du sport.

Le principe de difficulté croissante est utilisé dans la présentation du contenu de nombreux manuels et manuels, en particulier dans les disciplines académiques qui sont construites selon le principe cumulatif, ce qui signifie que la connaissance des éléments suivants du cours dépend explicitement de la connaissance des connaissances pédagogiques antérieures. éléments. Une telle construction est inhérente aux manuels de mathématiques, de logique, de langues étrangères, de statistiques, de techniques et de bien d'autres sciences. En eux, les concepts précédemment étudiés sont activement utilisés dans les sujets suivants. Par conséquent, il est nécessaire d'étudier ces disciplines uniquement dès le début et sans lacunes.

Souvent, le degré de difficulté d'une tâche d'apprentissage ne coïncide pas avec sa complexité. Le degré de complexité du matériel pédagogique se caractérise par la saturation réelle (objective) de la tâche pédagogique et de la forme de sa présentation, et le degré de difficulté implique toujours la corrélation du matériel pédagogique à maîtriser avec le matériel pédagogique préalablement maîtrisé et les capacités intellectuelles des élèves.

Difficulté tâche d'apprentissage s'explique souvent par le fait que les élèves ne connaissent souvent pas les opérations à effectuer pour trouver une solution. Si un système d'opérations pour résoudre une certaine classe de problèmes est appelé une méthode de résolution, alors, à son avis, la difficulté est associée à l'ignorance de la méthode, à l'ignorance de la façon dont il faut penser dans le processus de résolution, comment et dans quelle séquence on devrait agir avec les conditions du problème. Les difficultés qui surgissent s'expliquent par le fait que l'enseignant essaie souvent de donner des connaissances sur le contenu de ce qui est étudié et se soucie beaucoup moins de la façon dont il faut penser et raisonner. Cette interprétation recoupe l'idée que la complexité d'une tâche est liée au nombre d'opérations qui doivent être complétées pour réussir. Ces définitions de la difficulté et de la complexité sont, pour la plupart, psychologiques ; ils sont utiles dans l'analyse psychologique du contenu des items de test.

Le contenu du test ne peut pas être seulement facile, moyen ou difficile. Ici, l'idée bien connue de la dépendance des résultats de la méthode appliquée se manifeste pleinement. Les tâches de test faciles ne créent qu'une apparence de connaissances chez les étudiants, car elles testent des connaissances minimales. A cet égard, on peut noter que l'orientation de l'académie fédérale vers le contrôle du niveau minimum de connaissances ne donne pas, et ne peut, même par définition, donner une idée du niveau réel de connaissances, c'est-à-dire fournir les informations dont la société et les autorités gouvernementales ont besoin depuis longtemps. Cela déforme les résultats des tests et la sélection de tâches manifestement difficiles, à la suite desquelles la plupart des étudiants ont sous-estimé les scores. L'orientation vers des tâches difficiles est souvent considérée comme un moyen d'accroître la motivation à étudier. Cependant, cet outil fonctionne de manière ambiguë. Certaines tâches difficiles peuvent les pousser à étudier, d'autres peuvent les en éloigner. Une telle orientation fausse les résultats et, par conséquent, réduit la qualité de la mesure pédagogique.

Lors de la détermination du test, il a déjà été noté que tous les éléments du test, je tiens à le souligner, quel que soit le contenu des sujets, sections et disciplines académiques, sont classés par ordre de difficulté croissante. Jusqu'à récemment, la recommandation d'inclure plus d'éléments de difficulté moyenne dans le test est justifiée du point de vue de la détermination de la fiabilité de la mesure à l'aide des formules de la soi-disant. théorie classique des tests. Les méthodes d'évaluation de la fiabilité d'un test qui existent dans cette théorie donnent une diminution de la fiabilité lorsque des tâches faciles et difficiles sont incluses dans le test. Dans le même temps, l'engouement pour les tâches de difficulté moyenne entraîne une grave déformation du contenu de l'épreuve : celle-ci perd la capacité d'afficher normalement le contenu de la discipline étudiée, dans laquelle il y a toujours du matériel facile et difficile . Ainsi, dans la poursuite d'une fiabilité théoriquement élevée, la validité de contenu des résultats des tests est perdue. Le désir d'augmenter la validité des résultats des tests s'accompagne souvent d'une diminution de leur précision.

La cartographie optimale du contenu du matériel pédagogique en tâches de test du niveau de difficulté requis implique la possibilité de choisir la forme appropriée.

3. missions d'établissement de la conformité ;

4. tâches pour établir la bonne séquence d'actions.

Critères d'évaluation.

La méthodologie de transfert des résultats des tests vers le système traditionnel en cinq points peut être différente. Voici quelques exemples:

    Disons que le test se compose de 20 tâches, chacune a 4 réponses possibles, parmi lesquelles une seule est correcte. Calculons la probabilité de deviner : elle est égale à ¼, c'est-à-dire sur les 20 tâches proposées, l'élève peut en deviner 5 au hasard. Si les tâches restantes sont divisées en trois parties égales, correspondant aux notes positives "3", "4" et "5", alors on obtiendra un tableau de répartition :

2 points - de 5 à 8 bonnes réponses

(où 5 pourrait juste être deviné!)

3 points - de 9 à 10 bonnes réponses ;

4 points - de 11 à 15 bonnes réponses ;

5 points - de 16 à 20 bonnes réponses.

    Critères d'évaluation en termes de pourcentage :

"5": 80 - 100% du total des points

"4": 70 - 75%

"3": 50 - 65%

"2": moins de 50%

    Critères d'évaluation des items de test à l'aide du coefficient d'assimilation K :

K \u003d A / P, où A est le nombre de bonnes réponses au test, P est le nombre total de réponses

Facteur K

Noter

0,9 – 1,0

"5"

0,8 – 0,89

"quatre"

0,7 – 0,79

"3"

Moins de 0,7

"2"

Façons de créer un test électronique.

Lorsque les questions d'un certain test sont compilées, un programme est nécessaire pour permettre les tests informatiques. Par exemple, les options sont :

    Programme mon test.

Tous les droits sur le programme MyTest appartiennent à son auteur - Bashlakov Alexander Sergeevich (Unecha, région de Bryansk). Le programme est distribué gratuitement, l'utilisation gratuite du programme est autorisée pour tous les établissements d'enseignement, enseignants et étudiants. Les tests créés dans ce programme peuvent être distribués dans toutes les conditions. Le programme MyTest est distribué "tel quel". Aucune garantie, expresse ou implicite, n'est fournie. Le programme est utilisé à vos risques et périls. L'auteur ne garantit pas qu'il ne contienne pas d'erreurs et n'assume aucune responsabilité pour les pertes directes ou indirectes liées à l'utilisation ou à la non-utilisation du programme, y compris celles résultant d'éventuelles erreurs ou fautes de frappe dans son kit. Il est interdit d'apporter des modifications au code du programme.

    Générateur de tests.

Le test est créé au format HTML. Vous pouvez définir vos propres questions et options de réponse. La complexité des questions est également prise en compte. Un moyen très pratique et facile de créer un test. Cependant, les options proposées vous permettent de créer des tests de types standard uniquement, mais parfois cela est nécessaire ou simplement on souhaite effectuer des tests sous une forme différente et non standard.

    Création de tests à l'aide de Projet FPS.

FPSproject est un ensemble de programmes (modules : Creator, Server, Client, Journal) conçus pour simplifier et améliorer le processus de test.

Le principe de fonctionnement du complexe est le suivant : des tâches sont créées à l'aide du module Créateur, puis des tests sont compilés à partir de ces tâches, puis le test est lancé à l'aide du module Serveur et les candidats passent ce test à l'aide du module Client.

Caractéristiques distinctives (par rapport à d'autres programmes de création et de réalisation de tests) :

    Les tâches peuvent être présentées à la fois sous la forme de tâches standard (choix multiples, correspondance, etc.) et avoir la forme nécessaire dans une situation donnée. Depuis le module Creator dispose d'un éditeur de tâches assez souple.

    Le nombre d'options de tâches est pratiquement illimité.

    Dans un test, il peut y avoir des tâches avec un nombre différent d'options.

    Le calendrier des tests simplifie le processus de test.

    La possibilité d'effectuer des tests à la fois manuellement et selon un calendrier.

    Plusieurs tests peuvent être programmés pour la même classe le même jour.

    Compilation de tests informatiques au moyen exceller. Excel vous permet de créer des tests avec une réponse libre (lorsque l'étudiant n'a pas d'option de réponse) et avec une réponse sélective (lorsque l'étudiant se voit proposer des options de réponse, parmi lesquelles il choisit la bonne).

    Avanesov V.S. Composition des tâches de test. - M., Centre de test, 2002.

    Avanesov, V. Définition d'un test pédagogique. // Gestion scolaire. - 1999. N° 29

    Bateshov E. A. "Fondamentaux de la technicisation des tests informatiques": Manuel. - Astana : Polygraph-Mir LLP, 2011. - 241 p.

    Bespalko, vice-président Composantes de la technologie pédagogique. – M. : Pédagogie, 1989. – 190 p.

    Zorin S. F. Développement d'un système automatisé de suivi des connaissances des étudiants dans la discipline "Enterprise Economics". MGVMI, 2007.

    Kabanova T. A., Novikov V. A. Tests dans l'éducation moderne. Euh. Bénéficier à. - M. : Lycée supérieur, 2010.

    Kaziev V. M. Introduction aux tests pratiques. - M. : Intuit.ru, Binom. Laboratoire de connaissances, 2008.

    Maiorov A. N. Théorie et pratique de la création de tests pour le système éducatif : Comment choisir, créer et utiliser des tests à des fins éducatives. M : Intellect-Centre, 2002.

    Mikhailychev E.A. Technologie de normalisation des tests didactiques. // Technologies scolaires. - 2001. N° 5. - P. 36 - 54

    Morev I. A. Technologies de l'information éducative. Partie 2. Mesures pédagogiques : manuel. - Vladivostok : Maison d'édition de l'Université d'Extrême-Orient, 2004.

    Neiman Yu. M., Khlebnikov V. A. Test pédagogique comme mesure. Partie 1. - M.: Centre de test du ministère de la Défense de la Fédération de Russie, 2002.

    Rapoport I. A., Selg R., Sotter I. Tests d'enseignement des langues étrangères: résultats d'une expérience de vingt ans // Langues étrangèresà l'école. - 1989. - N° 6.

    Chelyshkova M. B. Théorie et pratique de la construction de tests pédagogiques. Euh. Bénéficier à. - M. : Logos, 2002.

Noter.

Matériaux méthodiques

"Les tests dans le processus éducatif"

Matériel méthodologique "Tests dans le processus éducatif": Collection de matériaux méthodologiques / Desyaterik Yu.E., Marchenko M.V. - T., 2015. - 28 p.

Collecte de matériel pédagogique

Édition stylistique - Desyaterik Yu.E.

Disposition informatique - Marchenko M.V.

Site de l'internat SCEI RO "Pédagogique" à Taganrog

Imprimé au pensionnat GKOU RO "Pédagogique" à Taganrog