Проблемы, связанные с конструированием тестов — КиберПедия 

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Проблемы, связанные с конструированием тестов

2017-08-23 277
Проблемы, связанные с конструированием тестов 0.00 из 5.00 0 оценок
Заказать работу

Конструирование психологических тестов включает в себя большое количество сложных и взаимосвязан­ных процессов. Двумя основными критериями, ко­торым должны соответствовать тесты, являются на­дежность и валидность (validity). Кроме того, в большинстве психологических тестов используют­ся нормы, с которыми следует сравнивать результа­ты тестирования конкретных индивидов.. А. теперь перейдем к поочередному краткому рассмотрению этих понятий.

Надежность. Под надежностью подразумевают­ся согласованность и точность получаемых резуль­татов. Различные части или разновидности одного и того же теста должны приводить к сходным оценкам, а повторение теста через небольшой промежуток времени должно дать результат, аналогичный перво­начальному. Поскольку при тестировании всегда присутствуют случайные факторы, например связан­ные с концентрацией внимания клиента, ни один из тестов невозможно признать абсолютно надежным; тем не менее, тесты высокого качества позволяют получить достаточно точные результаты, чтобы счи­тать тестовые показатели осмысленными. При оцен­ке отдельного индивида для признания теста в до­статочной степени точным коэффициент корреля­ции должен иметь значение около 0,8 и больше. (Говоря коротко, под корреляцией понимается тен­денция, при которой два взаимосвязанных показате­ля, относящиеся к двум различным множествам те­стовых показателей, изменяются совместно, так что, зная результат одного теста, можно с достаточной точностью предсказать средний результат другого). Коэффициенты корреляции варьируют от полного отсутствия связи, или 0,00, до идеальной связи; либо минус или плюс 1,00. Более подробное обсуждение вопросов надежности можно найти в книге Анаста-jn и Урбины (Anastasi & Urbina, 1997). (Мы исхо­дим из того, что читатели имеют некоторое представ­ление о статистических терминах, тогда как подробное объяснение этих терминов можно найти в работах, аналогичных книге Анастази.)

Валидность теста касается того, что именно из­меряется данным конкретным тестом и насколько хорошо измеряется этим тестом данный показатель. К примеру. в какой степени тест интеллекта действительности оценивает интеллект? Определение валидности теста — чрезвычайно сложная задача, для решения которой применяются различные техники, в частности связанные с сопоставлением результатов конкретного теста по определенному показателю с ре­зу штатами других тестов по этому показателю или с поведением испытуемого в условиях реальной жизни (конкурентная валидность), с сопоставлени­ем результатов тестирования с последующими достижениями испытуемого (прогностическая валидность), а также с определением того, насколько вза­имосвязаны между собой различные показатели одного теста, которые должны быть взаимосвязаны согласно лежащей в основе данного теста теории (конструктивная валидность). При проведении об­следований психолог должен понимать, что валид­ность является наиболее важным фактором в ин­терпретации результатов теста, особенно если ис­следуются сходные популяции с аналогичными предполагаемыми проблемами. Как правило, коэффициенты валидности значительно ниже коэффи­циентов надежности. Фактически можно считать показатель надежности теста верхней границей или пределом для любого показателя валидности, полу­ченного для данного теста (Anastasi & Urbina, 1997). Даже самые «валидные» тесты нередко не позволя­ют объяснить большую часть тех вариаций, которая наблюдается между тестовыми результатами. (Под­робное обсуждение этих вопросов и их связи с оцен­кой расстройств личности смотрите в книге Millon & Davis, 1996.)

Надежность и валидность в реальном мире. Стандарты, которым должны соответствовать основ­ные процедуры обследования — тестирование, ин­тервьюирование и наблюдение, — приобретают осо­бую важность, когда главной целью обследования становится принятие жизненно важного решения: к примеру, следует ли поместить человека в исправи­тельное учреждение, направить в интернат, оценить качество родительской опеки в ходе судебного раз­бирательства либо поставить диагноз умственной отсталости, депрессии или расстройства научения. Подобные решения нередко необратимо изменяют ход жизни клиента, подчиняя ее поставленному ди­агнозу. (Представьте себе, насколько изменилась бы ваша жизнь, если бы вам поставили диагноз умственной отсталости или депрессии.) Очень важно помнить о том, что последствия подобных решений зачастую необратимы. Иными словами, как гласит народная мудрость, «сделанного не воротишь», что полностью относится к тем случаям, когда на инди­вида уже навешен диагностический ярлык. Пробле­ма с определением валидности и надежности состо­ит в том. что соответствие релевантным критериям было тщательно изучено лишь для немногих техник. Техники, не удовлетворяющие высоким стандартам, могут иметь некоторую ценность лишь при наличии возможности сверить выводимые на их основании гипотезы с другими данными, как это имеет место в случае продолжительной терапии. Наконец, психо­лог, проводящий тестирование, должен быть уверен в том, что используемые им тестовые процедуры не слишком навязчивы и что их проведение действи­тельно является клинически показанным.

Нормы. Стандартизированные тесты, как прави­ло, применяются к большой выборке людей. Эта выборка должна быть репрезентативна по отноше­нию к обшей популяции, из которой она отобрана, а также в отношении популяций, которые будут оце­ниваться при тестировании. Данные, получаемые при стандартизации или нормированию выборки, позволяют вывести показатель среднего результата для данной популяции. Но пожалуй, самым важным показателем, обеспечиваемым нормами, являются частотные показатели отклонений от средней вели­чины. Иными словами, благодаря информации о ча­стоте результатов выше и ниже среднего для норма­тивной выборки можно установить, в какой степени результаты конкретного индивида являются типич­ными или нетипичными для его группы (Anastasi & Urbina, 1997). Такие психологические тесты, как те­сты интеллекта, зачастую характеризуются нормами, которые изменяются с возрастом, отражая типичные изменения человека по мере взросления. Например, результаты тестирования конкретного 6-летнего ре­бенка сравниваются с результатами других 6-летних детей. а результаты 10-и-летнего ребенка — с резуль­татами 10-летнпх В качественно сконструирован­ных тестах применяются нормативные выборки, отражающие основные демографические характерис­тики популяций, для которых предназначены дан­ные тесты; при этом, как правило, предпринимают­ся попытки добиться того, чтобы представители раз­личных этнических групп, социоэкономических уровней и обоих иолов были адекватным образом представлены в выборке.

Проведение тестов

Согласно этическому кодексу Американской психо­логической ассоциации (АРА, 1992а, 1992b), преж­де чем приступить к самостоятельному проведению тестирования или интерпретации его результатов, психолог должен продемонстрировать наличие соот­ветствующих знаний, профессиональной подготов­ки и опыта использования тестовых процедур. Как и при проведении интервью, задача тестирующего — побудить клиента к честному, свободному от тре­вожности и заинтересованному поведению. При ра­боте с клиническими пациентами, многие из которых изначально тревожны или склонны к психологичес­кой защите, тестирующему зачастую приходится по­тратить немало времени и сил для установления раппорта. Клиент, естественно, хочет знать, в чем именно состоит смысл тестирования и как будут ис­пользованы результаты. В начале предваряющего те­стирование интервью клиницист объясняет основ­ные цели тестирования и отвечает на вопросы. Этические нормы требуют, чтобы, как и в случае интервьюирования, клиент дал свое информирован­ное согласие и был поставлен в известность о том, что может прервать процедуру в любой момент. При тестировании детей или взрослых, не способных по­нять объяснения клинициста и свои права, к учас­тию в процедуре необходимо привлечь родителей или опекунов.

Если тесты были проведены с соблюдением всех правил и был установлен прочный раппорт, они представляют собой эффективный метод сравне­ния результатов тестируемого индивида с резуль­татами других людей или с релевантными крите­риями. В отличие от многих образовательных и производственных тестов, которые в течение последних нескольких десятилетий подвергались в США серь­езной критике, клинические тесты проще поддают­ся адаптации к потребностям пациента или клиента в более широких оценочных контекстах. Клиницис­ты обычно достаточно хорошо знают своих клиен­тов, а потому могут интерпретировать результаты, принимая во внимание личные проблемы клиентов и характерные для них стили прохождения тестов.


Поделиться с друзьями:

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.013 с.