Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначенные для поддерживания проводов на необходимой высоте над землей, водой...
Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...
Топ:
Выпускная квалификационная работа: Основная часть ВКР, как правило, состоит из двух-трех глав, каждая из которых, в свою очередь...
Генеалогическое древо Султанов Османской империи: Османские правители, вначале, будучи еще бейлербеями Анатолии, женились на дочерях византийских императоров...
Интересное:
Принципы управления денежными потоками: одним из методов контроля за состоянием денежной наличности является...
Лечение прогрессирующих форм рака: Одним из наиболее важных достижений экспериментальной химиотерапии опухолей, начатой в 60-х и реализованной в 70-х годах, является...
Инженерная защита территорий, зданий и сооружений от опасных геологических процессов: Изучение оползневых явлений, оценка устойчивости склонов и проектирование противооползневых сооружений — актуальнейшие задачи, стоящие перед отечественными...
Дисциплины:
2022-10-29 | 34 |
5.00
из
|
Заказать работу |
|
|
Предположим, что для исследуемых социально-экономических переменных и имеется выборочных наблюдений , . На рисунке в системе прямоугольных координат нанесено поле рассеяния, точки которого соответствуют парам чисел (, ),
=1,…, . На основе анализа поля рассеяния выдвигаем гипотезу о том, что зависимость от описывается линейной моделью вида: , где и - неизвестные постоянные коэффициенты, а ε – случайная переменная (случайное возмущение), отражающая влияние неучтенных факторов и погрешностей измерений. Для модели задача состоит в получении уравнения регрессии (прямая на рисунке), в котором коэффициенты и есть оценки неизвестных параметров и . Нахождение оценок и основывается на применении метода наименьших квадратов (МНК), суть которого состоит в следующем.
Рассмотрим точки A, B, C, изображенные на рисунке. Тогда |OC|= , |AC|= , |BC|= i= + . Отклонение точки A от искомой прямой , измеренное по вертикали, будет равно . Это отклонение может быть как положительным, так и отрицательным. Если все отклонения возвести в квадрат и сложить, то полученная величина будет непосредственно зависеть от разброса точек наблюдения от искомой линии.
Различные значения и определяют различные линии, и им будут соответствовать различные суммы квадратов. Таким образом, сумма квадратов отклонений есть некоторая функция от и , т.е. .
Далее пределы суммирования предполагаются такими же, и для упрощения записи будут опущены. Метод наименьших квадратов заключается в выборе таких значений и , для которых сумма квадратов отклонений становится минимальной. Эта сумма является функцией оценок параметров , : .
Поэтому нахождение оценок , неизвестных параметров и сводится к экстремальной задаче функции двух переменных F(, ):
|
.
Необходимые условия минимума функции F(, ) – равенство нулю частных производных:
,
.
Вычислим эти частные производные:
.
.
Приравняем их нулю и после элементарных преобразований получим систему двух линейных уравнений с двумя неизвестными и :
Эту систему уравнений называют системой нормальных уравнений. Ее решение может быть получено, например, по правилу Крамера:
Для оценки качества полученного уравнения регрессии существует ряд характеристик, одной из которых является коэффициент парной корреляции.
Коэффициент парной корреляции характеризует тесноту линейной зависимости между x и y. Он находится по формуле: .
Для коэффициента парной корреляции выполняется соотношение:
- 1£ £ 1. Чем ближе значение | | к единице, тем теснее линейная связь между x и y. Если
| | =1, то между x и y существует функциональная зависимость вида . Если величина | | близка к нулю, то это свидетельствует об отсутствии линейной зависимости между x и y, что не исключает возможность наличия нелинейной взаимосвязи между x и y. Близость значения коэффициента корреляции к нулю или единице носит относительный характер. Действительно, если =0,99, то можно с уверенностью говорить о близости значения к единице и достаточно сильной линейной взаимосвязи между x и y. Но если равен, например, 0,7, то говорить о его близости к единице оснований значительно меньше, а если =0,5, то можно с равными основаниями говорить как о близости к нулю, так и о близости к единице.
Для того чтобы с большей уверенностью полагаться на значение коэффициента корреляции, т.е. с большей уверенностью делать вывод о наличии или отсутствии линейной взаимосвязи между переменными y и x, разработан критерий проверки того, существенно ли отличие коэффициента корреляции от нуля или, как говорят, значимо ли значение коэффициента корреляции. Если в результате проверки выясняется, что коэффициент корреляции существенно отличается от нуля, то, несмотря даже на не очень близкое значение коэффициента к единице, делается вывод о наличии линейной взаимосвязи между переменными y и x. Если же подтверждается несущественное отличие от нуля, то, несмотря на возможно достаточно большое значение коэффициента, делается вывод об отсутствии линейной взаимосвязи между переменными.
|
Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме проверки статистических гипотез. Выдвигается нулевая гипотеза − коэффициент парной корреляции не является статистически значимым (). Вместе с ней выдвигается альтернативная гипотеза − существует положительная корреляционная зависимость (). Для проверки гипотезы в качестве статистического критерия используется статистика t −Стьюдента с степенями свободы: Если , то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае − отвергается. В формуле - квантиль порядка (1-a/2) распределения Стьюдента с ( -2) степенями свободы (см. таблицу 2).
Коэффициентпарной корреляции связан с коэффициентом уравнения регрессии следующим образом: , где , − выборочные среднеквадратические отклонения случайных переменных x и y соответственно, рассчитывающиеся по формулам:
, ,
, .
Следующей важной характеристикой качества подбора уравнения регрессии является коэффициент детерминации, обозначаемый . Определение и его содержательный смысл основан на следующей формуле: ,
где - выборочное среднее, − выборочные значения зависимой переменной y, - значения зависимой переменной, вычисленные по уравнению регрессии . Приведенная формула имеет глубокий содержательный смысл. Действительно, левая ее часть, т.е. интерпретируется как мера общего разброса или рассеивания переменной y относительно ее среднего значения . Эта мера раскладывается на две составляющие. Первая часть − это мера разброса, «объясненная» с помощью уравнения регрессии. Вторая часть − это мера разброса, «не объясненного» уравнением регрессии. Слова «объясненный» и «не объясненный» взяты в кавычки, так как объяснение, в сущности, может оказаться мнимым. В действительности y может зависеть от какой-то другой переменной z, и x может действовать как величина, заменяющая z.
|
Коэффициент детерминации определяется по формуле:
, или .
Очевидно, что 0 £ £ 1. Значение характеризует ту долю дисперсии переменной y, которая обуславливается, или которую можно «объяснить» уравнением регрессии . Таким образом, чем ближе значение к единице, тем точнее уравнение регрессии отражает имеющуюся зависимость между переменными y и x. Максимальное значение коэффициента детерминации, равное единице, достигается, когда линия регрессии точно соответствует всем наблюдениям, так что для всех наблюдений, и все остатки равны нулю. Если же в выборке отсутствует видимая связь между y и x, то будет близок к нулю. Коэффициенты корреляции и детерминации для уравнения парной регрессии связаны между собой простым соотношением: .
Качество уравнения регрессии оценивает F -тест. Он основан на проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fнаб и критического (табличного) Fтаб значений F-статистики Фишера. Если Fтаб < Fнаб то гипотеза отклоняется и признается статистическая значимость уравнения регрессии. Если Fтаб > Fнаб то гипотеза не отклоняется, и признается статистическая незначимость, ненадежность уравнения регрессии. Fнаб определяется как отношение объясненной суммы квадратов в расчете на одну независимую переменную к остаточной сумме квадратов в расчете на одну степень свободы:
.
Для парной регрессии =1, поэтому
.
F-распределение Фишера зависит от степеней свободы df1 и df2 и от уровня значимости α. Количество степеней свободы df1 равно числу объясняющих переменных модели. Количество степеней свободы df2 определяется объемом выборки за вычетом числа объясняющих переменных модели df1 минус единица: df2 = - df1 - 1. Значение Fтаб можно вычислить как по статистической таблице (см. таблицу 3), так и с помощью статистической функции из приложения MS Excel.
|
|
Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...
Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...
Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...
Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!