Критерии оценки качества тестовых заданийСледующий этап — анализ результатов тестирования и, при необходимости, корректировка тестов.
Чтобы понять, требуется ли вносить изменения в тест, необходимо изучить его результаты.
В тестологии существует множество критериев, по которым оценивается качество тестов. Чаще всего оценивают валидность, надежность и дифференцирующую способность тестов.
Валидность (от англ. valid — действительный, пригодный, действенный) отражает обоснованность заданий в тесте, значимость результатов выполнения этих заданий, соответствие заданий учебным целям. Валидность является показателем меры соответствия конкретного теста как контрольно-измерительного инструмента цели контроля учебных достижений.
К причинам, негативно влияющим на валидность теста, можно отнести:
- несоответствие содержания тестовых заданий заявленной теме теста
- несоответствие форм представления контрольного материала его содержанию
- неудачно выбранные условия проведения тестирования
- наличие в тесте заданий неудовлетворительного качества
- неправильное определение объема теста и т. п.
Надежность теста считается одним из важнейших критериев качества, характеризующих его устойчивость к воздействию случайных факторов. Повысить надежность поможет стандартизация условий тестирования: одинаковые инструкции, формулировки заданий, время выполнения и правила оценивания.
На практике используются три основных метода оценки надежности теста:
- повторное тестирование
- параллельное тестирование
- расщепление теста на части
Дифференцирующая способность (дискриминативность) показывает, насколько задания теста могут отличить сильного обучающегося от слабого по уровню знаний. Если все или большинство обучающихся дают на тестовое задание один и тот же ответ, то это задание не обладает дифференцирующей способностью.
Выявить возможные причины, повлиявшие на результаты тестирования, помогут следующие вопросы к обучающимся (можно разместить в анкете обратной связи):
«Вы уже изучали то, что спрашивалось в тестовых заданиях?»«Количество заданий в тесте было достаточным / недостаточным / излишним?»«Задания в тесте были приемлемого уровня сложности / слишком простыми / слишком сложными»«Формулировки заданий понятны, не имеют двойного толкования / сложные для понимания, приходится перечитывать, уточнять»«Из заданий было понятно, что нужно делать / не было понимания, что и как нужно делать»«Верные ответы были очевидны / варианты ответов вызывали сомнения, отвлекали от верного ответа»С учетом специфики учебного материала, самих заданий или условий прохождения теста можно изменять или дополнять перечень вопросов к обучающимся. Главное — определить реальные проблемы, которые затрудняют процесс тестирования и негативно влияют на его качество, и те метрики, о которых мы писали выше.
Разрабатывая тестовые задания и тесты, помните об учебных задачах, которые вы с их помощью планируете решить, сопоставляйте с образовательными результатами и учитывайте особенности обучающихся: возраст, уровень подготовки, условия, в которых они будут выполнять задания.
Практика показывает, что тесты и тестовые задания, разработанные до или параллельно с проектированием учебной темы или её раздела, имеют более высокие показатели эффективности по сравнению с тестами и заданиями, разработанными по уже готовым учебным материалам. Измерительные материалы, созданные с опорой на образовательные результаты, помогают избежать пробелов или избыточности в учебном контенте.