Методы оценки критериев качества тестов
Классическая теория тестов опирается на теорию корреляции, главными параметрами которой являются надежность и валидность. Основы классических тестов составляет идея их параллельности. Параллельными называются тесты, в которых истинные и ошибочные компоненты равны на одной и той же выборке испытуемых. Они имеют одни и те же элементы содержания, одну и ту же трудность заданий.
Надежность - устойчивость результатов теста, получаемых при его применении. Существуют следующие методы оценивания надежности:
1. Параллельное тестирование в двух группах.
2. Ретестовая надежность (повторное тестирование).
3. Расщепление теста (тест расщепляют на две части по четным и нечетным номерам заданий). Чем выше корреляция между двумя частями, тем выше надежность. Существуют тесты на выявление знаний (dominitest) и на выявление навыков (masteritest).
Валндность - пригодность теста, т.е. способность качественно измерять то, для чего он создан по замыслу авторов. Оценка валидности производится по результатам тестирования и результатам экзамена и профессиональной деятельности, которые должны иметь высокий уровень корреляции.
Раньше данные тестирования подвергались статистической обработке, а сегодня конечный результат достигается с помощью математического структурного анализа. Теория математического структурного анализа основывается на том, что человеческие знания имеют некоторую латентную переменную. Идея этой переменной (параметра) и легла в основу тестирования. Основное предположение матструктурного анализа состоит в том, что между результатами теста и измеряемыми параметрами есть функциональная зависимость, позволяющая с помощью анализа и оценки этих параметров создавать представление о знании человека.
Недостатки традиционного тестирования:
• зависимость оценки знаний от уровня трудности заданий;
• зависимость оценки трудности задания от уровня подготовленности студентов;
• один инструмент оценки не может оценивать разное знание студентов.