Методы оценки критериев качества тестов

Классическая теория тестов опирается на теорию корреляции, главными параметрами которой являются надежность и валидность. Основы классических тестов составляет идея их параллельности. Параллельными называются тесты, в которых истинные и ошибочные компоненты равны на одной и той же выборке испытуемых. Они имеют одни и те же элементы содержания, одну и ту же трудность заданий.

Надежность - устойчивость результатов теста, получаемых при его применении. Существуют следующие методы оценивания надежности:

1. Параллельное тестирование в двух группах.

2. Ретестовая надежность (повторное тестирование).

3. Расщепление теста (тест расщепляют на две части по четным и нечетным номерам заданий). Чем выше корреляция между двумя частями, тем выше надежность. Существуют тесты на выявление знаний (dominitest) и на выявление навыков (masteritest).

Валндность - пригодность теста, т.е. способность качественно измерять то, для чего он создан по замыслу авторов. Оценка валидности производится по результатам тестирования и результатам экзамена и профессиональной деятельности, которые должны иметь высокий уровень корреляции.

Раньше данные тестирования подвергались статистической обработке, а сегодня конечный результат достигается с помощью математического структурного анализа. Теория математического структурного анализа основывается на том, что человеческие знания имеют некоторую латентную переменную. Идея этой переменной (параметра) и легла в основу тестирования. Основное предположение матструктурного анализа состоит в том, что между результатами теста и измеряемыми параметрами есть функциональная зависимость, позволяющая с помощью анализа и оценки этих параметров создавать представление о знании человека.

Недостатки традиционного тестирования:

• зависимость оценки знаний от уровня трудности заданий;

• зависимость оценки трудности задания от уровня подготовленности студентов;

• один инструмент оценки не может оценивать разное знание студентов.

Оглавление

Педагогика и психология

Методы оценки критериев качества тестов