Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Марксистская теория происхождения государства: По мнению Маркса и Энгельса, в основе развития общества, происходящих в нем изменений лежит...

Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...

Оснащения врачебно-сестринской бригады.

Интересное:

Аура как энергетическое поле: многослойную ауру человека можно представить себе подобным...

Принципы управления денежными потоками: одним из методов контроля за состоянием денежной наличности является...

Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Метод расщепления теста (однократное тестирование)

2017-10-16

467

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 48 из 61Следующая ⇒

Метод расщепления на две части (split-half method) наиболее распространен из-за своего удобства. Он позволяет вычислить коэффициент надежности при однократном выполнении учениками теста. Для оценки надежности результаты тестирования делят на две части: в одну включают данные испытуемых по четным, а в другую — по нечетным заданиям теста. Правда, деление на две части — не единственный способ, возможны и другие варианты, когда выделяют большее число частей при оценке надежности теста.

Результаты учеников заносят в табл. 5.31 и получают табл. 5.32.

Далее для таблицы данных используют формулу (5.74), в которой роль результатов в первом тестировании выполняют данные по четным заданиям, а во втором — по нечетным.

Таблица 5.31. Сводная таблица для оценки надежности (метод расщепления)

Номер ученика»	Балл при первом тестировании X,	Балл при втором тестировании Y,	X_iY_i	(X_i)²	(Y_i⁾²
	X₁	Y₁	X₁Y₁	(X₁)²	(Y₁)²
	X₂	Y₂	X₂Y₂	(X₂)²	(Y₂)²

N	X_n	Y_n	X_nYn	(X_n)²	(Y_n)²
	СУММА (X_i)	СУММА (Y_i)	СУММА(X_iY_i)	СУММА (X_i)²	СУММА (Y_i)²

Для матрицы табл. 5.28 результаты по четным и нечетным заданиям приводятся в табл. 5.32.

После подстановки чисел из табл. 5.32 в формулу (5.74) получается

По сравнению с прежним значением 0,78 надежность получилась намного меньше, что можно было предвидеть, поскольку подсчет методом расщепления велся не по 10 заданиям, а только по 5. Для оценки надежности исходного теста из 10 заданий используется формула Спирмена—Брауна

Таблица 5.32. Подсчет надежности (метод расщепления)

Номер ученика 1°	Балл при первом тестировании X,	Балл при втором тестировании Y,	Х,У,	(*У	(I?










Сумма

Тогда r_n теста из 10 заданий будет

После коррекции коэффициент надежности получился приблизительно такой же, как и в предыдущем случае подсчета ретестовым методом (г_н =0,78). Применение формулы Спирмена— Брауна подтверждает высказанное ранее предположение: увеличение длины повышает надежность теста.

Рассмотренный выше метод расщепления основан на допущении параллельности двух половин теста, что не всегда и не в полной мере может оказаться верным. Корреляция двух половин возрастает по мере роста гомогенности теста. В этой связи метод расщепления нередко называют методом оценки внутренней состоятельности (согласованности) теста (Internal-Consistency Method).

Следующий подход к оценке надежности основан на вполне реальных данных и не зависит от упомянутых выше искусственных допущений о полной параллельности частей теста.

Однако и он имеет свою ограниченную сферу применения, поскольку годится исключительно для гомогенных тестов.

метол кьюаера— ричардсона (аля дихотомических ouehok по заданиям теста)

Формула Кьюдера— Ричардсона (F. Kuder, M. Richardson 20, или KR-20) имеет вид [48]

где р_j — доля правильных ответов на j-е задание; q_j — доля неправильных ответов, qj= 1 –p_j, S_x² —дисперсия по распределению наблюдаемых баллов; п — число заданий теста.

Применительно к рассматриваемой матрице S_x² =6,89 (см.

разд. 5.2), a p_j(j= 1,2,..., 10) приводится в самой последней строчке табл. 5.27. Тогда

Результат подсчета коэффициента надежности по формуле (5.76) довольно близок к двум другим полученным ранее (0,76 и 0,78).

Из обсуждения должно быть понятно, что не может быть какого-либо единственного показателя, доказывающего по оценке своих значений приемлемую надежность теста. Для полной ее проверки следует учитывать несколько показателей надежности, подсчитанных по разным формулам, лишь небольшая часть которых приведена в данном тексте.

В качестве нижнего предела допустимых значений надежности обычно выбирают 0,7. При более низком значении использование теста вряд ли целесообразно в силу большой погрешности измерения. Если тест разрабатывают профессионалы, то к нему предъявляют более жесткие требования. Как правило, тесты с надежностью менее 0,8 считаются непригодными в профессионально организованных службах тестирования и центрах. Значения коэффициента надежности, превышающие 0,9, говорят о высоком качестве теста. Они крайне желательны, но редко встречаются. Как правило, в тестологической практике надежность тестов колеблется в интервале (0,8; 0,9).

Положение с выводами о качестве теста осложняется тем, что нет и не может быть раз и навсегда определенной надежности теста. Ситуация вполне объяснимая, поскольку коэффициент надежности, подсчитываемый по матрице тестовых результатов, всегда зависит от свойств выборки испытуемых. Поэтому при каждом очередном использовании теста приходится оценивать его надежность, а уж потом говорить о достоверной интерпретации результатов выполнения теста.

В целом надежность зависит от ряда характеристик теста, рассмотрение которых может способствовать повышению качества теста в процессе его создания.

Надежность и длина теста

При конструировании теста полезно уметь определить необходимую его длину, чтобы достичь планируемой надежности теста. С этой целью используется обобщенный вариант формулы Спирмена—Брауна

где k — число раз, в которое увеличивается длина теста; r_н — коэффициент надежности теста до увеличения его длины; (r_н)' —коэффициент надежности после увеличения длины теста [12].

Конечно, увеличение длины в обсуждаемой постановке проблемы предполагается вести путем добавления заданий, содержание которых основано на той же спецификации, что и исходные задания теста. Таким образом, увеличение длины предполагает не изменение содержательной области, подвергающейся проверке, а детализацию проверки каждого содержательного элемента в тесте. Помимо этого, добавляемые задания должны иметь статистические характеристики, близкие к характеристикам исходных заданий теста. Нарушение одного из этих условий приводит, как правило, к неоправданному завышению оценок надежности теста.

Использование формулы (5.27) легко пояснить с помощью численных данных. Например, если надежность теста была r_н=0,7идлину теста увеличили в 3 раза, то надежность нового теста возрастет до

что в отличие r_н= 0,7 является вполне приемлемой для профессионального уровня создания теста.

Возможно другое применение формулы (5.77), когда достигнутая надежность, скажем r_н=0,7, кажется разработчику явно недостаточной и он хочет узнать, во сколько раз следует увеличить длину для запланированного повышения качества теста. Если достигнутую надежность обозначить символом r_дост, а планируемую, т.е. желательную — символом r_план, то

Для рассматриваемого выше примера, где r_дост= 0,7, а r_план= 0,88,

Естественно, что надежность теста не является самоцелью, поскольку неоправданное увеличение длины теста, как уже было отмечено ранее, приведет к усталости и снижению мотивации у учеников, что в конечном счете отразится негативно на той же надежности теста. Поэтому при конструировании теста следует искать разумный компромисс, когда надежность теста находится в допустимых пределах, а длина теста выбрана сообразно возрастным особенностям учеников и специфике проверки. К тому же включение большого числа заданий, сходных по содержанию, нецелесообразно при итоговой проверке учеников.

⇐ Предыдущая 43 44 45 46 474849 50 51 52 Следующая ⇒

Поделиться с друзьями:

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...