Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...
Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...
Топ:
Генеалогическое древо Султанов Османской империи: Османские правители, вначале, будучи еще бейлербеями Анатолии, женились на дочерях византийских императоров...
Эволюция кровеносной системы позвоночных животных: Биологическая эволюция – необратимый процесс исторического развития живой природы...
Интересное:
Влияние предпринимательской среды на эффективное функционирование предприятия: Предпринимательская среда – это совокупность внешних и внутренних факторов, оказывающих влияние на функционирование фирмы...
Принципы управления денежными потоками: одним из методов контроля за состоянием денежной наличности является...
Мероприятия для защиты от морозного пучения грунтов: Инженерная защита от морозного (криогенного) пучения грунтов необходима для легких малоэтажных зданий и других сооружений...
Дисциплины:
2022-10-29 | 41 |
5.00
из
|
Заказать работу |
|
|
Вопросы для изучения. Мультиколлинеарность и отбор наиболее значимых факторов. Модели с фиктивными переменными. Критерий Чоу объединения двух выборок.
8.1 Определения, формулы, справки
А) Мультиколлинеарность – наличие одного из двух типов линейной зависимости между факторами регрессионной модели. Первый тип - полная коллинеарность - следствие функциональной зависимости между факторами. Она приводит к неопределённости параметров регрессииb, поскольку при их нахождении происходит деление на 0, см (7.6) и (7.12).
Второй тип коллинеарности - частичный, он обусловлен статистической зависимостью между факторами регрессионной модели. Она обнаруживается, во-первых, по матрице парных коэффициентов корреляции - их высоким значениям, во-вторых, по неустойчивости оценок b.
Неустойчивость оценок выражается:1) в увеличениидисперсии оценок – последние могут сильно различаться для разных выборок, 2) в возникновении противоречия: модель может быть признана значимойпо F-критерию, а все её коэффициенты -.незначимыми по t-критерию. Другие последствия мультиколлинеарности: затруднена интерпретация модели, снижается информативность факторов, набор которых становится избыточным.
Б) Отбор наиболее значащих факт оров является одновременно и методом понижения мультиколлинеарности. Отбор производят, во-первых, с помощью корреляционной матрицы факторов: если rx1.x2 , то одну из переменных можно исключить, она не добавляет информации о результирующей переменной. Во-вторых, с помощью метода – назовём его так - «вращения факторов». Он более трудоёмкий, но даёт очень хорошие результаты. Алгоритм метода «вращения» на примере.
|
1). Экспертно отбираем, например, 5 наиболее подходящих факторов: Х1, Х2, Х3, Х4, Х5.
2). С каждым из 5-ти факторов образуем парную регрессию и вычисляем скорректированный коэффициент детерминации 2. Отбираем фактор с наибольшим 2, например, Х2.
3) С каждым из 4-х оставшихся факторов образуем тройную регрессию и фиксируем 2. Отбираем фактор с наибольшим 2, например, Х4.
4). С каждым из 3-х оставшихся факторов… И т.д.
5). Процедуру останавливаем, когда включение никакого фактора из оставшихся не повышает 2.
Отобранные, например, три переменных уже не создадут эффект мультиколлинеарности, будут наиболее значимыми.
В) Модели с фиктивными переменными. Речь идёт об атрибутивных переменных, которые можно ввести в регрессию с помощью фиктивных переменных. Обычно фиктивная переменная является булевской: принимает два значения: 0 и 1. Например, переменной пол фиктивно присваиваются значения: если М, то 0, если Ж, то 1. Другой пример: с помощью двух булевских переменных можно «закодировать» четыре уровня образования двоичными числами: 00, 01, 10, 11.
Г). Критерий Чоу объединения двух выборок. На практике часто возникает вопрос: можно ли две выборки «слить» в одну. Например, 1-я выборка – по мужчинам длиной n1, 2-я – по женщинам длиной n2. По методу Чоу строятся три регрессионные модели. Первые две - линейные регрессионные модели на выборках по М и по Ж соответственно с коэффициентами-векторами b‘ и b,,. Третья модель - по объединённой выборке. Нулевая гипотеза Н0: b‘=b,, и D(e‘)=D(e,,)=s2. Если Н0 верна, то эти две регрессионные модели «эквивалентны» и их можно объединять в одну. Гипотеза Н0 отвергается с уровнем значимости a, если выполняется неравенство - критерий Чоу:
, | (8.1) |
где å - оператор суммирования по i от 1 до n по ошибкам объединённой регрессии, å' - оператор суммирования по i от 1 до n1, å'' - оператор суммирования по i от n1+1 до n.
Работа с тестами
1 Три негативных последствия частичной мультиколлинеарности факторов:
|
А рост дисперсии оценок параметров
Б уменьшение дисперсий оценок параметров
В противоречие в значимостях уравнения и коэффициентов
Г избыточность в наборе факторов
2 Коллинеарными называются вектора, которые
А перпендикулярны друг другу
Б перпендикулярны друг другу и исходят из одной точки
В расположены на параллельных прямых и однонаправлены
Г расположены на параллельных прямых или на одной прямой
3 В модели регрессии мультиколлинеарными бывают вектора вида:
АXi=(xi1, xi2, …, xip), i=1, 2, …, n
БХj=(x1j, x2j,.., xnj), j=1, 2, …, p
В Y=(y1, y2, …, yn)
Г
4 Размерность корреляционной матрицы при 3-х факторах:
А 2х3; Б 2х2; В 3х3; Г 3х4
5 Понижение мультиколлинеарности на основе корреляционной матрицы:
А исключить один фактор из пары с высокой корреляцией
Б включить фактор с высоким коэффициентом корреляции
В исключить все факторы, у которых высокая парная корреляция
Г включить только те факторы, у которых наибольшая корреляция с Y
6 Частные коэффициенты корреляции особенно информативны
А при высокой мультиколлинеарности факторов Х1, …Хр
Б при низкой мультиколлинеарности факторов Х1, …Хр
В при полном отсутствии мультиколлинеарности факторов Х1, …Хр
Г в случае, если число факторов больше двух
7 Для отбора из 4-х факторов «методом их вращения» нужно построить регрессий:
А 7; Б 8; В 9; Г 10.
8 Критерий Чоу используется для проверки гипотезы о
А высокой мультиколлинеарности факторов
Б значимости уравнения регрессии
В возможности объединить две выборки в одну
Г целесообразности включения очередного фактора в модель
8.3 Решение задач и контрольные вопросы
Задача 1. На плоскости ХОY нарисовать два полностью неколлинеарных вектора Х1 и Х2. Как называются такие вектора. Записать и вычислить их скалярное произведение.
Задача 2. На плоскости ХОY нарисовать два полностью и два частично коллинеарных вектора Х1, Х2 и Х3, Х4. Записать и вычислить их скалярные произведения. Какое место в регрессионном анализе занимают эти вектора.
Задача 3. Построить корреляционную матрицу для выборок Х1=(1, 2, 4), Х2=(2, 4, 6) двух случайных величин. Провести по матрице отбор значащих факторов: Х1 и Х2.
Задача 4. Реализовать шаг за шагом процедуру отбора наиболее значимых факторов «методом вращения» для уравнения регрессии с переменными Х1-Х4, иллюстрируя её графически, все значения назначать «предположительно» (вычислять ничего не надо).
|
Задача 5. Для магазина - линейной парной регрессии =0,43+1,54x - построить функцию эластичности, исследовать её, определить значение коэффициента эластичности для х= сформулировать его экономический смысл.
Контрольные вопросы:
1) Раскройте дословно смысл двух терминов: ковариация, мультиколлинеарность.
2) Какие три и более проблем создаёт явление мультиколлинеарности
3) Создайте схему отбора значимых факторов с помощью корреляционной матрицы, какие сложности здесь возникают
4) Какова схема отбора наиболее значимых факторов с помощью «процедуры вращения». Какие показатели можно использовать на оси Y
5) Какие полезные результаты можно получить от применения критерия Чоу
8.4 Решение сквозной задачи №2: Построение и исследование
|
|
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...
Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...
Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!