Основные задачи общей метрологии. — КиберПедия 

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Основные задачи общей метрологии.

2017-07-25 577
Основные задачи общей метрологии. 0.00 из 5.00 0 оценок
Заказать работу

ЛЕКЦИЯ 1.

 

Тема: Спортивная метрология как учебная дисциплина. Основы теории спортивных измерений.

 

Вопросы для рассмотрения:

Основные задачи общей метрологии.

Предмет спортивной метрологии.

Управление спортивной тренировкой.

Шкалы измерений.

Единицы измерений.

Точность измерений.

 

1. Спортивную метрологию следует рассматривать как конкретное приложение к общей метрологии, основной задачей является обеспечения единства и точности измерений.

Метрология (греч. метрон – мера, логос – слово, наука) – наука об измерениях физических величин, методах и средствах обеспечения их единства и способах достижения требуемой точности. Предметом метрологии является извлечение количественной информации о свойствах объектов с заданной точностью и достоверностью. Средством метрологии является совокупность измерений и метрологических стандартов, обеспечивающих требуемую точность.

2. Спортивная метрология – это наука об измерениях в физическом воспитании и спорте. Как учебная дисциплина спортивная метрология выходит за рамки общей метрологии. Это связано с тем, что спортивная метрология наряду с измерением физических величин (время, масса, длина, сила) изучает и разрабатывает методы измерения величин нефизической природы. К ним относятся педагогические, психологические, социальные, биологические показатели. Кроме того, в учебный план спортивной метрологии включены разделы из других областей знаний, например, основы математической статистики, инструментальные методы, экспертные оценки.

Предметом спортивной метрологии является комплексный контроль в физическом воспитании и спорте и использование его результатов в планировании подготовки спортсменов.

3. Физическое воспитание и спортивная тренировка – не стихийный, а управляемый процесс. В каждый момент времени человек находится в определенном физическом состоянии, которое определяется, главным образом, здоровьем (соответствием показателей жизнедеятельности норме, степенью устойчивости организма к неблагоприятным внезапным воздействиям), телосложением и состоянием физических функций.

Физическим состоянием человека целесообразно управлять, изменяя его в нужном направлении. Это управление осуществляется средствами физического воспитания и спорта, к которым, в частности, относятся физические упражнения.

Это только кажется, что преподаватель (или тренер) управляет физическим состоянием, воздействуя на поведение спортсмена, т.е. предлагая определенные физические упражнения, а также контролируя правильность их выполнения и получаемые при этом результаты. В действительности же поведением спортсмена управляет не тренер, а сам спортсмен. В ходе спортивной тренировки оказывается воздействие на самоуправляемую систему (организм человека). Индивидуальные различия в состоянии спортсменов не дают уверенности в том, что одно и то же воздействие вызовет одинаковую ответную реакцию. Поэтому актуален вопрос об обратной связи: информации о состоянии спортсмена, поступающей тренеру в ходе контроля тренировочного процесса.

Контроль в физическом воспитании и спорте базируется на измерениях показателей, отборе наиболее существенных и их математической обработке.

Управление учебно-тренировочным процессом включает в себя три стадии:

1) сбор информации;

2) ее анализ;

3) принятие решений (планирование).

Сбор информации обычно осуществляется во время комплексного контроля, объектами которого являются:

1) соревновательная деятельность;

2) тренировочные нагрузки;

3) состояние спортсмена.

4. Измерением называют установление соответствия между изучаемыми явлениями, с одной стороны, и числами, с другой.

Одним из вопросов, составляющих основы теории измерений, является вопрос о шкалах измерений.

В физической культуре и спорте используются четыре шкалы.

Шкала наименований (номинальная шкала). Это самая простая из всех шкал. В ней числа играют роль ярлыков и служат для обнаружения и различения изучаемых объектов (например, нумерация игроков футбольной команды). Числа, составляющие шкалу наименований, можно менять местами. В этой шкале нет отношений типа “больше-меньше”, поэтому некоторые полагают, что применение шкалы наименований не стоит считать измерением. При использовании шкалы наименований могут проводиться только некоторые математические операции. Ее числа нельзя складывать или вычитать. Но можно подсчитывать, сколько раз (как часто) встречается то или иное число.

Шкала порядка. В такой шкале составляющие ее числа упорядочены по рангам (занимаемым местам), но интервалы между ними точно измерить нельзя. Есть виды спорта, где результат спортсмена определяется только местом, занятым на соревнованиях (например, единоборства). После таких соревнований ясно только, кто из спортсменов сильнее, а кто слабее, но насколько – сказать нельзя. Есть, например, три спортсмена, занявшие соответственно, первое, второе и третье места. При этом второй спортсмен может быть почти равен первому, а может быть существенно слабее его и быть почти одинаковым с третьим. Места, занимаемые в шкале порядка, называют рангами, а сама шкала называется ранговой или неметрической. К рангам шкалы можно применять большее число математических операций, чем к числам шкалы наименований. Можно определить характер неравенства в виде суждений: “больше-меньше”, “лучше-хуже” и т.п. С помощью шкал порядка можно измерять качественные, не имеющие строгой количественной меры, показатели. Особенно широко эти шкалы используются в гуманитарных науках: педагогике, психологии, социологии.

Шкала интервалов. Это такая шкала, в которой числа не только упорядочены по рангам, но и разделены определенными интервалами. Особенность ее состоит в том, что нулевая точка выбирается произвольно. Примерами могут быть календарное время (начало летоисчисления в различных календарях устанавливалось по разным причинам), суставной угол (угол в локтевом суставе при полном разгибании предплечья может приниматься равным либо нулю, либо 1800), температура, потенциальная энергия поля и др. По шкале интервалов можно определять не только отношения “больше-меньше”, но и отвечать на вопрос “на сколько больше?”, но нельзя утверждать, что одно значение измеряемой величины во столько-то раз больше другого.

Шкала отношений. Эта шкала отличается от шкалы интервалов только тем, что в ней строго определено положение нулевой точки. В спорте по шкале отношений измеряют и те величины, которые образуются как разности чисел, отсчитанных по шкале интервалов. Так, календарное время отсчитывается по шкале интервалов, а интервалы времени – по шкале отношений. Если ограничиться только применением шкал отношений, то можно дать более узкое определение измерению: измерить какую-либо величину – значит найти опытным путем ее отношение к соответствующей единице измерения. Шкала отношений не накладывает никаких ограничений на математический аппарат, используемый для обработки результатов наблюдений.

5. Чтобы результаты разных измерений можно было сравнить друг с другом, их выражают в одних и тех же единицах. В 1960 году на Международной генеральной конференции по мерам и весам была принята Международная система единиц, получившая сокращенное название СИ (от начальных букв слов System International). В настоящее время установлено предпочтительное применение этой системы во всех областях науки и техники, в народном хозяйстве, а также при преподавании.

СИ в настоящее время включает семь независимых друг от друга основных единиц (см. табл. 1).

Из указанных основных единиц в качестве производных выводят единицы остальных физических величин. Производные единицы определяются на основе формул, связывающих между собой физические величины. Например, единица длины (метр) и единица времени (секунда) – основные единицы, а единица скорости (метр в секунду) – производная.

Кроме основных, в СИ выделены две дополнительные единицы: радиан – единица плоского угла и стерадиан – единица телесного угла (угла в пространстве).

Таблица 1 – Основные единицы СИ

    Единицы  
Величина Размер- ность Название Обозначение  
      Русское Междунар.
Длина l Метр м m
Масса m Килограмм кг kg
Время t Секунда с s
Сила электричес-кого тока I Ампер А A
Температура Q Кельвин К K
Количество вещества N Моль моль mol
Сила света g Кандела кд cd

 

Кроме того, различают кратные единицы, образованные с помощью увеличивающих приставок кило-, мега- и др. и дольные с приставками мили-, микро- и др.

Поскольку система СИ носит рекомендательный характер, часто используются внесистемные единицы, такие как часы, минуты, миллиметры ртутного столба, калории и др.

6. Никакое измерение не может быть выполнено абсолютно точно. Результат измерения неизбежно содержит погрешность, величина которой тем меньше, чем точнее метод измерения и измерительный прибор. Например, с помощью обычной линейки с миллиметровыми делениями нельзя измерить длину с точностью до 0,01 мм.

По происхождению различают основную и дополнительную погрешности.

Основная погрешность – это погрешность метода измерения или измерительного прибора, которая имеет место в нормальных условиях их применения.

Дополнительная погрешность – это погрешность измерительного прибора, вызванная отклонением условий его работы от нормальных. Понятно, что прибор, предназначенный для работы при комнатной температуре будет давать неточные показания, если пользоваться им летом на стадионе под палящим солнцем или зимой на морозе. Погрешности измерения могут возникать в том случае, когда напряжение электрической сети или батарейного источника питания ниже нормы или непостоянно по величине.

По способу выражения погрешности бывают абсолютные и относительные.

Величина DA=A–A0, равная разности между показанием измерительного прибора (A) и истинным значением измеряемой величины (A0), называется абсолютной погрешностью измерения. Она измеряется в тех же единицах, что и сама измеряемая величина.

На практике часто удобно пользоваться не абсолютной, а относительной погрешностью. Относительная погрешность измерения бывает двух видов – действительной и приведенной. Действительной относительной погрешностью называется отношение абсолютной погрешности к истинному значению измеряемой величины:

.

Приведенная относительная погрешность – это отношение абсолютной погрешности к максимально возможному значению измеряемой величины:

.

По изменчивости различают систематическую и случайную погрешности.

Систематической называется погрешность, величина которой не меняется от измерения к измерению. В силу этой своей особенности систематическая погрешность часто может быть предсказана заранее или, в крайнем случае, обнаружена и устранена по окончании процесса измерения.

Способ устранения систематической погрешности зависит в первую очередь от ее природы. Систематические погрешности измерения можно разделить на три группы:

1) погрешности известного происхождения и известной величины;

2) погрешности известного происхождения, но неизвестной величины;

3) погрешности неизвестного происхождения и неизвестной величины.

Самые безобидные – погрешности первой группы. Они легко устраняются путем введения соответствующих поправок в результат измерения.

Ко второй группе относятся, прежде всего, погрешности, связанные с несовершенством метода измерения и измерительной аппаратуры. Например, погрешность измерения физической работоспособности с помощью маски для забора выдыхаемого воздуха: маска затрудняет дыхание, и спортсмен закономерно демонстрирует физическую работоспособность, заниженную по сравнению с истинной, измеряемой без маски. Величину этой погрешности нельзя предсказать заранее: она зависит от индивидуальных способностей спортсмена и его самочувствия в момент исследования.

Другой пример систематической погрешности этой группы – погрешность, связанная с несовершенством аппаратуры, когда измерительный прибор заведомо завышает или занижает истинное значение измеряемой величины, но величина погрешности неизвестна.

Погрешности третьей группы наиболее опасны, их появление бывает связано как с несовершенством метода измерения, так и с особенностями объекта измерения – спортсмена.

Случайные погрешности возникают под действием разнообразных факторов, которые ни предсказать заранее, ни точно учесть не удается. Случайные погрешности принципиально не устранимы. Однако, воспользовавшись методами математической статистики, можно оценить величину случайной погрешности и учесть ее при интерпретации результатов измерения. Без статистической обработки результаты измерений не могут считаться достоверными.

 

Контрольные вопросы для самопроверки:

1. Какие задачи решает метрология?

2. Что является предметом спортивной метрологии?

3. Стадии управления учебно-тренировочным процессом.

4. Объекты комплексного контроля.

5. Что называют измерением?

6. Какие шкалы измерений используются в физической культуре и спорте. Охарактеризуйте каждую из них.

7. Единицы измерений системы СИ. Основные, дополнительные, производные, кратные, дольные, внесистемные единицы.

8. Основная и дополнительная погрешности.

9. Абсолютная и относительная погрешности.

10. Систематическая и случайная погрешности.

 

Литература:

1. Годик М.А. Спортивная метрология. Учебник для ин-тов физической культуры. – М.: Физкультура и спорт, 1988. – С. 5 – 16.

2. Спортивная метрология. Учебник для ин-тов физической культуры (под общ. ред. В.М. Зациорского). – М.: Физкультура и спорт, 1982. – С. 5 – 18.

3. Смирнов Ю.И., Полевщиков М.М. Спортивная метрология: Учеб. для студ. пед. вузов. – М.: Издательский центр «Академия», 2000. – С. 8 – 10, 17 – 29, 67 – 72.

4. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 6 – 7, 9 – 14.

 

 

ЛЕКЦИЯ 2.

 

Тема: Основы теории вероятностей и математической статистики. Одинарные ряды результатов измерений и их статистические характеристики.

 

Вопросы для рассмотрения:

Характеристики центра ряда.

Характеристики вариации.

ЛЕКЦИЯ 3.

 

Тема: Нормальный закон распределения непрерывных случайных величин.

 

Вопросы для рассмотрения:

ЛЕКЦИЯ 4.

 

Тема: Взаимосвязь результатов измерения. Методы вычисления коэффициентов взаимосвязи.

 

Вопросы для рассмотрения:

Виды взаимосвязи.

ЛЕКЦИЯ 5.

 

Тема: Статистические гипотезы и достоверность статистических характеристик. Сравнение средних арифметических по данным малых выборок. Расчёт и построение доверительных интервалов.

 

Вопросы для рассмотрения:

Принцип проверки гипотез.

Пример сравнения средних арифметических, расчёта и построения доверительного интервала.

 

1. В физическом воспитании и спорте часто приходится делать вывод об общих закономерностях проявления какого-либо показателя: нормально или нет распределены результаты измерений этого показателя в генеральной совокупности, отличается ли среднее арифметическое значение результатов измерения в генеральной совокупности после тренировок от аналогичного параметра до тренировок, а обнаруженное расхождение между результатами не выходит за пределы случайных ошибок (эффективна или нет методика тренировок), отличается ли дисперсия генеральной совокупности результатов измерения показателя после тренировок от такого же показателя до тренировок (изменилась или нет стабильность результатов спортсмена) и т.д.

Так как указанные выводы делаются на основании относительно небольшого числа результатов измерения показателя (n = 30), необходима проверка достоверности (бесспорности) таких выводов.

Для этого применяются статистические гипотезы.

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Статистическую гипотезу обозначают символом H.

Обычно выдвигают и проверяют две противоречащие друг другу гипотезы:

1) нулевую (основную) H0;

2) конкурирующую (альтернативную) H1.

Примеры статистических гипотез:

1) Нулевая гипотеза H0: закон распределения результатов измерения является нормальным. Конкурирующая гипотеза H1: закон распределения результатов измерения отличен от нормального.

2) Нулевая гипотеза H0: среднее арифметическое значение генеральной совокупности результатов измерения показателя после цикла тренировок не изменилось. Конкурирующая гипотеза H1: среднее арифметическое значение увеличилось.

2. Для проверки выдвинутых нулевых гипотез применяют статистические критерии, разработанные математиками и носящие, как правило, их имена.

Статистическим критерием называют определенное правило, задающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо принять. При отклонении нулевой гипотезы принимается конкурирующая. Критерий обозначается буквой К.

Значение критерия, вычисленное по данным выборки, называют наблюдаемым значением критерия (Кнабл). Совокупность значений критерия, при которых отвергают нулевую гипотезу, называют критической областью. Совокупность значений критерия, при которых нулевую гипотезу принимают, называют областью принятия гипотезы (областью допустимых значений). Указанные области разграничены критическим (граничным) значением критерия, который находится по соответствующей таблице.

Односторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть только больше (или только меньше) другой величины.

Двусторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть как больше, так и меньше (не равна) другой.

Отклонение нулевой гипотезы, когда она фактически верна, называется ошибкой первого рода. Принятие нулевой гипотезы, когда фактически она не верна, называется ошибкой второго рода.

Уровень значимости a – это вероятность попадания критерия К в критическую область, если верна нулевая гипотеза, другими словами, уровень значимости – это вероятность ошибки первого рода. Он служит для определения по таблицам критических значений критерия (Ккрит), которые указывают положение критических точек, отделяющих критическую область от области принятия гипотезы. Обычно величина a выбирается малой. Поэтому попадание критерия К в критическую область при справедливости нулевой гипотезы мало вероятно. В этом случае, при попадании критерия К в критическую область считают, что должна быть принята конкурирующая гипотеза.

Часто a принимают равной 0,05. Это означает, что вероятность ошибочно принять гипотезу H1, если справедлива гипотеза H0, равна только
5 %.

Сформулируем основные этапы проверки статистических гипотез:

1) Исходя из задач исследования, формулируются статистические гипотезы.

2) Выбирается уровень значимости, на котором будут проверяться гипотезы.

3) На основе выборки, полученной из результатов измерения, определяется статистическая характеристика гипотезы.

4) Определяется критическое значение статистического критерия по соответствующей таблице на основании выбранного уровня значимости и объема выборки.

5) Вычисляется наблюдаемое (фактическое) значение статистического критерия.

6) На основе сравнения наблюдаемого и критического значения критерия в зависимости от результатов проверки нулевая гипотеза либо принимается, либо отклоняется в пользу альтернативной.

Для проверки статистических гипотез используются параметрические и непараметрические методы.

Параметрические методы служат для проверки гипотез о неизвестных параметрах генеральной совокупности, когда закон распределения случайной величины известен.

Непараметрические методы применяются в тех случаях, когда закон распределения случайной величины неизвестен, или когда условия применения параметрических методов не выполняются.

Параметрические методы эффективнее непараметрических.

Перейдем к ознакомлению с основными положениями теории надежности тестов.

3. В математической статистике разработан ряд критериев (параметрических и непараметрических) для сравнения средних арифметических.

Выбор критерия зависит от следующих условий:

1) объёма выборки (большие или малые);

2) законов распределения исследуемых совокупностей (нормальные, другие);

3) степени независимости выборок (зависимые, независимые);

4) известны или неизвестны генеральные дисперсии;

5) одинаковы или различны генеральные дисперсии;

6) возможна ли количественная или только качественная оценка рассматриваемого явления.

К параметрическим критериям для сравнения двух средних арифметических относятся критерии t для независимых и попарно зависимых выборок, имеющие распределение Стьюдента, а также критерий z, имеющий нормальное распределение. Последний разработан для сравнения двух средних арифметических независимых нормальных генеральных совокупностей, дисперсии которых известны. Так как в задачах из области физической культуры и спорта дисперсии генеральных совокупностей обычно неизвестны, критерий z для малых выборок не используется. Его рекомендуется использовать в качестве приближённого критерия для сравнения больших независимых выборок, имеющих любой закон распределения, так как для больших выборок (n ≥30) выборочные средние арифметические распределены приближённо нормально, а выборочные дисперсии приближённо равны генеральным дисперсиям.

Из существующих непараметрических критериев наиболее мощными являются X-критерий Ван дер Вардена для независимых выборок и U-критерий Уилкоксона для попарно зависимых выборок.

При сравнении средних независимых выборок рекомендуется поступать следующим образом:

1) Каждая в отдельности выборка проверяется на нормальность распределения по критерию Шапиро и Уилка

.

В случае, если обе выборки распределены нормально, следует переходить к следующему пункту, в противном случае – к п. 4.

2) Сравниваются дисперсии выборок

.

В случае равенства дисперсий следует переходить к следующему пункту, в противном случае – к п. 4.

3) Для сравнения средних арифметических используется критерий Стьюдента

.

Сравнение окончено.

4) Для сравнения средних арифметических используется критерий Ван дер Вардена

.

Сравнение окончено.

При сравнении средних попарно зависимых выборок рекомендуется поступать следующим образом:

1) Составляется выборка разностей парных значений .

2) Составленная выборка проверяется на нормальность распределения по критерию Шапиро и Уилка. В случае, если выборка распределена нормально, переходим к следующему пункту, в противном случае – к п. 4.

3) Для сравнения средних арифметических используется критерий Стьюдента

.

Сравнение окончено.

4) Для сравнения средних арифметических используется U-критерий Уилкоксона. Сравнение окончено.

4. По найденным характеристикам выборки судят о неизвестных характеристиках генеральной совокупности. Очевидно, что в общем случае они не будут точно совпадать друг с другом: истинное значение характеристики Q может быть больше или меньше выборочного значения характеристики Q*.

Чтобы статистически оценить искомое истинное значение характеристики Q, поступают следующим образом:

1) Задаются некоторой достаточно большой вероятностью p (например, p = 0,9; 0,95; 0,99; 0,999), чтобы событие, заключающееся в нахождении искомого значения Q с этой вероятностью в соответствующем интервале можно было считать статистически достоверным. Эту вероятность называют доверительной вероятностью. В спортивных исследованиях обычно принимают p = 0,95 (иногда 0,99).

 
 

2) Затем для заданной величины p рассчитывают по формулам математической статистики нижнюю Q1 и верхнюю Q2 границы интервала Jp.

Доверительным интервалом Jp называют случайный интервал (Q1, Q2), который накрывает неизвестную характеристику Q с доверительной вероятность p.

Границы доверительного интервала Jp называют:

Q1 = Q* - e1¾нижней доверительной границей;

Q2 = Q* - e2¾верхней доверительной границей.

Значения e1 и e2 могут совпадать (при симметричном распределении Q*) и быть разными (при несимметричном распределении Q*). Они характеризуют точность, а вероятность p¾надежность определения Q. Между надежностью и точностью существует обратная зависимость: чем выше надежность, тем ниже точность определения Q и наоборот.

С увеличением числа измерений при заданном p повышается точность определения Q (уменьшаются e1 и e2).

Для точного расчета границ доверительного интервала необходимо знать закон распределения выборочной характеристики Q*.

Задача определения доверительных интервалов для оценки генерального среднего арифметического значения xг нормального распределения решена математической статистикой для следующих двух случаев:

а) генеральная дисперсия известна;

б) генеральная дисперсия неизвестна.

Рассмотрим второй случай.

В этом случае искомое генеральное среднее арифметическое находится в следующем доверительном интервале:

,

где – среднее арифметическое значение выборки; ta – величина, которая находится по таблицам распределения Стьюдента в зависимости от числа степеней свободы k = n - 1, уровня значимости a; – стандартная ошибка среднего арифметического, рассчитывается по формуле:

.

Примечание: В практике научных исследований, когда закон распределения малой выборочной совокупности (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для приближенной оценки доверительных интервалов.

5. Для рассмотрения этого вопроса используется пример с двумя группами велосипедистов, прошедших подготовку с использованием разных методик (Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 38 – 43)

 

Контрольные вопросы для самопроверки:

1. Что называют статистической гипотезой?

2. Принцип выдвижения статистических гипотез.

3. В чём заключается основной принцип проверки статистических гипотез?

4. Односторонняя и двусторонняя критическая область.

5. Ошибки при проверке гипотез. Уровень значимости.

6. Основные этапы проверки статистических гипотез.

7. Параметрические и непараметрические методы проверки статистических гипотез.

8. Какие условия определяют выбор критерия для сравнения средних арифметических двух выборок?

9. Какие параметрические и непараметрические критерии используются для сравнения средних арифметических двух выборок?

10. Какие критерии в каких случаях используются для сравнения средних независимых выборок?

11. Какие критерии в каких случаях используются для сравнения средних попарно зависимых выборок?

12. Что такое доверительный интервал, доверительная вероятность?

13. Порядок построения доверительного интервала.

14. В каких случаях можно точно определить границы доверительного интервала?

 

Литература:

1. Основы математической статистики. Уч. пособие для ин-тов физической культуры (под общ. ред. В.С. Иванова). – М.: Физкультура и спорт, 1990. – С. 74 – 78, 81 – 103.

2. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 49 – 51, 62, 67 – 68.

3. Гинзбург Г.И., Киселев В.Г. Расчетно-графические работы по спортивной метрологии. – Минск: БГОИФК, 1984. – С. 34 – 51.

 

 

ЛЕКЦИЯ 6.

 

Тема: Математико-статистические основы теории тестов.

 

Вопросы для рассмотрения:

Требования к тестам.

 

1. Тестом называется измерение или испытание, проводимое с целью определение состояния или способностей спортсмена.

Тесты, в основе которых лежат двигательные задания, называют двигательными или моторными.

Тест, в основе которого лежат двигательные задания, называется двигательным. Существует три группы двигательных тестов:

1) Контрольные упражнения, выполняя которые спортсмен получает задание показать максимальный результат. Результатом теста является двигательное достижение. Например, время, за которое спортсмен пробегает дистанцию 100 м.

2) Стандартные функциональные пробы, в ходе которых задание, одинаковое для всех, дозируется либо по величине выполненной работы, либо по величине физиологических сдвигов. Результатом теста являются физиологические или биохимические показатели при стандартной работе либо двигательные достижения при стандартной величине физиологических сдвигов. Например, процент увеличения ЧСС после 20 приседаний или скорость, с которой бежит спортсмен при фиксируемой величине ЧСС 160 ударов в минуту.

3) Максимальные функциональные пробы, в ходе которых спортсмен должен показать максимальный результат. Результатом теста являются физиологические или биохимические показатели при максимальной работе. Например, максимальное потребление кислорода или максимальная величина кислородного долга.

2. Тестами могут считаться только те измерения, которые отвечают специальным требованиям:

1) цель тестирования;

2) стандартность (процедура и условия тестирования должны быть одинаковыми во всех случаях применения теста);

3) наличие системы оценок;

4) надежность – качество, характеризующее повторяемость результатов теста при одинаковых условиях тестирования с одними и теми же испытуемыми;

5) информативность – степень точности, с которой тест измеряет свойство, для оценки которого используется.

Тест, удовлетворяющий требованиям надёжности и информативности называется добротным.

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях. Вариацию результатов при повторных измерениях называют внутрииндивидуальной или (используя более общую терминологию математической статистики) внутригрупповой либо внутриклассовой. Четыре основные причины вызывают эту вариацию.

1) Изменение состояния испытуемых (утомление, врабатывание, научение, изменение мотивации, концентрации внимания и т.п.)

2) Неконтролируемые изменения внешних условий и аппаратуры (температура, ветер, влажность, напряжение в электросети, присутствие посторонних лиц и т.п.), т.е. все то, что объединяется термином «случайная ошибка измерения».

3) Изменение состояния человека, проводящего или оценивающего тест (и, конечно, замена одного экспериментатора другим или замена судьи).

4) Несовершенство теста (есть такие тесты, которые заведомо малонадежны, например, штрафные броски в баскетбольную корзину до первого промаха. Даже баскетболист, имеющий высокий процент попадания, может случайно ошибиться при первых бросках).

Говоря о надежности тестов, различают их стабильность (воспроизводимость), согласованность, эквивалентность.

Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом.

Степень надежности тестов определяется с помощью коэффициентов взаимосвязи, полученных из корреляционного или дисперсионного анализа.

Выбор коэффициента взаимосвязи зависит от типа применяемой шкалы измерений, от числа выполненных попыток (попыткой считается, например, исходное или повторное тестирование) и количества факторов, влияние которых надо исследовать.

Если изучается влияние только одного фактора и при этом количество попыток не более двух, то надежность теста может быть приближенно оценена с помощью коэффициента корреляции между тестом и ретестом. В остальных случаях рекомендуется использовать дисперсионный анализ.

Стабильность теста зависит от:

1) вида теста;

2) контингента испытуемых;

3) временного интервала между тестом и ретестом.

Например, морфологические характеристики при небольших временных интервалах весьма стабильны; наименьшую стабильность имеют тесты на точность движений (например, броски в цель).

У взрослых результаты тестирования более стабильны, чем у детей; у спортсменов¾более стабильны, чем у не занимающихся спортом.

С увеличением временного интервала между тестом и ретестом стабильность теста снижается.

Согласованность характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Согласованность определяется по степени совпадения результатов, полученных на одних и тех же испытуемых разными экспериментаторами, судьями, экспертами. При этом возможны два варианта:

1) лицо, проводящее тест, только оценивает его результаты, не влияя на них. Например, одну и ту же письменную работу разные экзаменаторы могут оценивать по-разному. Нередко различаются оценки судей в гимнастике, фигурном катании на коньках, боксе, показатели ручного хронометрирования, оценка электрокардиограммы или рентгенограммы разными врачами и т.п.;

2) лицо, проводящее тест, влияет на его результаты. Например, некоторые экспериментаторы более настойчивы и требовательны, чем другие, лучше мотивируют испытуемых. Это сказывается на результатах (которые сами по себе могут измеряться вполне объективно).

Согласованность теста¾это, по существу, надежность оценки его результатов при проведении теста разными людьми.

Особенно актуальна задача оценки согласованности при количественном определении качественных показателей. Для этого разработаны специальные мет


Поделиться с друзьями:

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.154 с.