ŠKOLA: O známkování
Snad je to způsobeno blížícím se pololetním vysvědčením, je však faktem, že v domácím mediálním rybníčku se poslední dobou objevilo poměrně hodně článků, jejichž společným jmenovatelem je známkování ve škole, a to skutečně z mnoha perspektiv. Mezi tyto perspektivy patří připomenutí již dříve oznámeného záměru nahradit známky na vysvědčení v prvních dvou ročnících slovním hodnocením či reakce na tento záměr. Podobným směrem však míří i článek o prvňácích s dvojkou z výtvarky. Ve skutečnosti by však jistě bylo možné nalézt známkování i v kauzálních řetězcích témat, jakými jsou užívání umělé inteligence při psaní domácích úkolů a písemek nebo nahrazování bakalářských prací ze stejných důvodů.
Někdy je zajímavé nahlédnout i do diskuzí a argumenty uváděné v článcích konfrontovat s argumenty v diskuzích. V obou skupinách převažují frikce - negativní důvody působící pro přijetí či prosazení změny, které je možné kategorizovat do jedné ze čtyř kategorií: setrvačnost, úsilí, přesvědčení a odpor vyplývající ze způsobu, jak je změna prosazována. Nelze si rovněž nevšimnout, že řada argumentů má spíše emoční než racionální pozadí, protože vycházejí ze „světonázoru“ svých předkladatelů. Což ani v nejmenším neznamená, že je proto možné je považovat za irelevantní. Ve skutečnosti to znamená spíše přesně pravý opak a jediné, v čem může tato kategorizace pomoci, je, že nemá nejmenšího smyslu se je pokoušet racionálně vyvracet.
Hezky je to možné demonstrovat na problému užívání umělé inteligence. V reakcích se objevují příspěvky oscilující kolem dvou pólů - první, který nekompromisně zastává názor, že pokud by mobily a jiná chytrá zařízení byla zakázána během vyučování, žádný problém by neexistoval; druhý, který naopak tvrdí, že takovýmto zákazem se vytvoří skleníkové, a značně anachronické, prostředí a má-li škola připravovat na budoucnost, popře tímto zákazem jeden ze svých základních účelů (problém mobilů má širší kontext než jen jejich zneužívání během písemek). Oba tyto pohledy jsou svým způsobem správné. Mám osobní zkušenost z certifikačními zkouškami provozovanými organizacemi, jako je například Pearson VUE. U těchto zkoušek nejsou dovoleny ani mobily, ani vlastní poznámky. Z místa zkoušky není možné se vzdálit, zkoušeného po celou dobu sleduje kamera a jakékoliv podezřelé chování automaticky znamená neúspěšný pokus. Na druhé straně by stála práce na domácích úkolech, která ze své podstaty nemůže být kontrolována a kde by používání alternativních podpůrných prostředků naopak mělo být povzbuzováno, a to dokonce do té míry, že sociálně slabší by měli mít možnost dosáhnout na podporu, aby se jejich podmínky vyrovnaly. Dostává-li žák téměř výhradně úkoly, které je možné zvládnout pouze umělou inteligencí, signalizuje to spíše problém z kategorií setrvačnost nebo úsilí na straně zadavatele.
A pak zbývají písemky, které se nachází někde uprostřed mezi certifikačními zkouškami a domácími úkoly. Čímž se obloukem vracíme ke známkám, protože známkování konkrétního výkonu je stále jednou z obvyklých a poměrně efektivních forem hodnocení. Certifikační zkoušky využívají spíše procentuální hodnocení, které se někdy dále dělí dle oblastí, jejichž znalost zkouška ověřuje. Je-li hodnocení konkrétního výkonu známkou víceméně v pořádku, problémy se začnou objevovat, pokud se se známkou, která představuje hodnocení na ordinální škále, začne pracovat jako s numerickou (kardinální) hodnotou. Řada škol využívá metody aritmetických či vážených průměrů ke stanovení souhrnné známky za období. To zatěžuje známky na vysvědčení chybou, jejíž nepřesnost je možné akceptovat při porovnávání výkonů v rámci jedné třídy a jednoho učitele (s výjimkou případů, kdy je hodnocení vychýleno předpojatostí hodnotitele vůči konkrétním osobám - viz např. D. Hamermesh, Beauty Pays: Why Attractive People Are More Successful), ale je zcela k ničemu, jak dokazuje řada studií (např. Budescu/Bruderman), při srovnání napříč různými hodnotiteli. Kromě různých kritérií hodnotitelů je dalším zdrojem chyb nestejná obtížnost úloh. Tento nedostatek by bylo možné minimalizovat, pokud by se namísto průměrů využívala metodika vycházející z Raschova modelu. Stále ovšem přetrvají chyby vyplývající z nekonzistentního hodnocení a nerovných podmínek, které asi na úrovni zkušeben certifikačních platforem ve školách ještě dlouho nepůjde zajistit, minimálně v rozsahu umožňujícím plošné testy v potřebném rozsahu.
Jediným racionálním závěrem z předešlého může být, že problém známkování není ani tak ve formě, tj. známka vs. slovní hodnocení, jako v interpretaci tohoto hodnocení. Poznámka na okraj, sumativní slovní hodnocení má ve skutečnosti problém úplně stejný.
Pokud by došlo k zákazu nikoliv známkování, ale zákazu užití známek jako objektivního srovnání hodnocených, kterým není ani v nejmenším, stala by se otázka známkování zcela marginální. Toto opatření by se týkalo výhradně úpravy kritérií pro přijímání na vyšší stupeň vzdělání, resp. absolvování a postoupení do dalšího ročníku a jeho zavedení by nevyžadovalo nic, než úpravu a schválení příslušných předpisů.
Přestanou-li známky mít předurčující roli, mohou mít o to více roli informativní a bude-li si je někdo chtít přikrášlovat užíváním umělé inteligence při testech, které mu mají poskytnout informaci o jeho skutečných znalostech, bude v první řadě především sám proti sobě. Na druhé straně, zůstane-li známkám, i při všech nepřesnostech, které jsme si popsali, předurčující role i nadále, nebude překvapující, budou-li existovat pokusy, kterým patrně nikdy nebude možné zcela předejít, jak tento jev zneužít ve svůj prospěch.
Zkusme se zamyslet na důvody, které by se mohly objevit proti návrhu zakázat používání známek na vysvědčení jako hodnotícího kritéria v rámci přijímacích řízení. Jedním z těch racionálních může být to, že v mixu možných kritérií zůstane u škol, které neprovádějí talentové či jiné zkoušky (např. manuální zručnosti), prakticky jen cermatovská jednotná zkouška, která je sice objektivní, ale svojí jednorázovostí i obsahem nemusí být vhodnou pro řadu oborů. Jelikož se i v této oblasti uvažuje o změnách (popsaných např. zde), možná by stálo za to posuzovat všechna zamýšlená opatření jako jeden celek. Jistě by pak nemělo být problém najít kombinaci, která může nabízet posun oproti současnému stavu a kterou je realistické zavést v horizontu měsíců bez nějakých příliš zvýšených nároků na systém.