Решение сквозной задачи №1: Построение и исследование модели магазина - линейной парной регрессии (п.п. 1-4) — КиберПедия 

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Решение сквозной задачи №1: Построение и исследование модели магазина - линейной парной регрессии (п.п. 1-4)

2022-10-29 41
Решение сквозной задачи №1: Построение и исследование модели магазина - линейной парной регрессии (п.п. 1-4) 0.00 из 5.00 0 оценок
Заказать работу

 

1) Постановка сквозной задачи №1 (одинакова для всех вариантов).ООО «Рыба» располагает семью небольшими магазинами «Рыба». Компания планирует создать 8-й магазин площадью 110кв.м. Менеджеры разрабатывают бизнес-план и, в частности, планируют:

· построить эконометрическую модель магазина.

· С помощью модели осуществить точечный прогнозсуточной выручки нового магазина,

· На модели осуществить точечный и интервальный прогноз суточной выручки.

· Исследовать полученную модель на достоверность.

 

2) Выбор варианта и исходных данных для задачи №1. Вариант состоит из двух букв. Первая буква выбирается по первой подходящей букве полного имени из набора: А, Е, И, О, Я; вторая буква - по первой подходящей букве фамилии из набора: А, Б, В, Г, Д, Е, Ж, К, Л, М, Н, О, П, Р. Пример: вариант для « Людм и лаИ в анова» - ИВ.

Исходные данные выписываются из таблиц А.1-А.5. По букве имени выбираем таблицу. В нашем примере это буква И - таблица А.3. Во 2-й графе таблицы А.3 находятся семь значений xi – площади магазинов. По букве фамилии из соответствующего столбца – в нашем примере это В - выписываем значения переменной уi - суточная выручка магазинов. К некоторым данным добавляется буква «г» - последняя цифра года, в котором получено задание (от 0 до 9).

Авторы для задач 1 и 2 использовали вариант АЪ, в таблице 3.4 исходные данные для него из таблицы А.1.

Таблица 3.4 – Исходные данные для сквозных задач примера – вариант АЪ

xi 1 1 2 3 4 5 8
yi 2 3 4 5 5 7 14

 

3) Нанесём в координатах ХY точки на плоскость (построим корреляционное поле), см рисунок 3.1. Делаем выводы: 1) точки корреляционного поля хорошо аппроксимируются прямой линией, 2) зависимость между Х и Y тесная и прямая. На этом основании выбираем в качестве модели магазина линейную функцию – уравнение парной регрессии:

ŷ=b0+b1x (3.3)

 

Рисунок 3.1 – Наблюденные точки и линия регрессии

 

4) Найдёмзначения параметров b1 и b0уравнения регрессии по формулам (метод наименьших квадратов):

(3.4)

Расчёты удобно сводить в таблицу 3.5 (графы с 1-й по 6-ю)

Таблица 3.5 – Промежуточные расчёты (нижняя строка – итого)

xi yi x2 у2 xiyi (xi-x ̄)2 y ̂xi ei2=(y ̂ xi -yi)
1 2 3 4 5 6 7 8
1 2 1 4 2 5,90 1,97 0,00
1 3 1 9 3 5,90 1,97 1,06
2 4 4 16 8 2,04 3,51 0,24
3 5 9 25 15 0,18 5,05 0,00
4 5 16 25 20 0,32 6,59 2,53
5 7 25 49 35 2,46 8,13 1,28
8 14 64 196 112 20,88 12,75 1,56
24 40 120 324 195 37,68 39,97 6,67

 


 

Вычислим средние арифметические:

    (3.5)

 

Находим искомые оценки параметров регрессии и само уравнение регрессии:

  b1= (27,86-3,43×5,71)/(17,14-11,76) =8,27/5,38=1,54 b0=5,71-1,54×3,43=0,43 =0,43+1,54x.

(Продолжение в разделе 4).


Тема №2 - начало. Парный регрессионный анализ

Вопросы для изучения. Метод наименьших квадратов и коэффициент корреляции. Основные предпосылки регрессионного анализа (теорема Гаусса-Маркова).

Определения, формулы, справки

А) Метод наименьших квадратов (МНК). Неизвестные параметры bo и b1 из (3.3) определяются с помощью МНК. Суть МНК состоит в отыскании оптимальных значений параметров bo и b1 таких, которые доставляют минимум сумме квадратов отклонений наблюденных значений yi от теоретических значений ŷ, определяемых регрессией (3.3):

S(bo, b1) = å (ŷ-yi)2 = å (bo +b1xi - yi)2 ® min. (4.1)

Для отыскания минимума Sприравняем нулю производные:

    ¶S/¶bo= 2å (bo +b1xi - yi) = 0 ¶S/¶b1 = 2å (bo +b1xi - yi) xi = 0. (4.2)

После преобразований получаем систему из 2-х линейных уравнений с неизвестными оптимальными bo и b1:

bon + b1åxi  = å yi, boåxi  + b1å  = å xi yi. (4.3)

Разделим 1-е уравнение на n и получим полезное выражение: линия регрессии проходит через точку средних (  , ):

= bo +b1x̄. (4.4)

Из решения (4.3-4.4) получаем:

bo =  - b1  b1 =   (4.5)

где sx2 - выборочная дисперсия переменной Х:

= å /n - ()2. (4.6)

- выборочная ковариация:

 = å xi yi/n - (4.7)

Б) Коэффициент парной корреляции rxy. Формулы для его вычисления.

r = b1 sx/sy (4.8)

Коэффициент корреляции отражает тесноту линейной статистической связи СВ Х и Y. Его свойства:

1) -1 £ r £ 1. Чем ближе модуль çrç к 1, тем теснее связь Х и Y.

2) Если r = ± 1, то связь между Х и Y - функциональная и линейная.

3) Если r = 0, то линейная корреляционная связи СВ Х и Yнет.

В) Основные предпосылки регрессионного анализа. Пусть для оценки параметров регрессии взята выборка из n пар (xi, yi). Тогда вероятностная (стохастическая) модель имеет вид:

yi = b0 +b1хi + ei. (4.9)

Пять основных предпосылок:

1)В (3.9) ошибка ei (а значит и yi) есть величина случайная, а фактор хi - неслучайная.

   2)М(ei) = 0 и, следовательно, М(yi) = b0 +b1хi. (4.10)

3) Должно выполняться условие гомо скедастичности (равноизменчивости) возмущения ei для всех значений Х:

D(ei) = s2 = D(yi) = const. (4.11)

4) Ошибки ei и ej (и переменные у i и у j) некоррелированы:

rei ejдлялюбыхiиj, i¹j. (4.12)

5) Ошибки ei (и переменная уi) есть НРСВ.

Модель, для которой выполняются все пять предпосылок, называется нормальной классической линейной регрессионной моделью (НКЛРМ).

 

Работа с тестами

1 Метод наименьших квадратов основан на:

А сумме квадратов модулей отклонений значений yi отŷi

Б сумме модулей квадратов отклонений значений yi от ŷi

В сумме модулей отклонений значений yi от ŷi

Г сумме квадратов отклонений значений yi от ŷi

 

2 Результат МНК – система из 2-х линейных уравнений относительно:

А переменных xiyi

Б параметров b0  и b1

В возмущенийei ej

Г СКО sxи sy

 

3 Оценки b0  и b1 оптимальные, потому что они:

А наибольшие

Б минимизируют функцию S(bo, b1) = å (ŷi- yi)2

В максимизируют функцию S(bo, b1) = å (ŷi- yi)2

Г наилучшие

 

4 Оценки b0  и b1

А несмещённые

Б состоятельные

В эффективные

Г имеют наименьшую дисперсию

 

5 Установить соответствие (b0 и b1 больше 0):

Зависимость у от х Коэффициент парной корреляции rxy
А у=b0+b1 х 1) 0
Б у=b0-b1 х 2) -1
В х22=R2 3) +1

 

6 Установить соответствие:

  Выборки Коэффициент парной корреляции rxy
А Х= 1, 3, 5, 10 и Y= 6, 8, 11, 15 1)  – 0,7
Б Х= 1, 3, 5, 10 и Y= 13, 10, 7, 2 2)  +0,7

 

7 Оценка остаточной дисперсии s2 при использовании МНК:

А несмещённая и состоятельная

Б несмещённая и эффективная

В состоятельная и эффективная

Г имеет наименьшую дисперсию

 

8 Три из пяти предпосылок парного регрессионного анализа:

А фактор Х – величина случайная

Б математическое ожидание ошибки равно нулю: М(

В выполняется условия гомоскедастичности: D()=const

Г возмущения некоррелированы: rei ej=0, i

 


 

4 .3 Решение задач и контрольные вопросы

    Задача 1. МНК. Уравнение (3.2) ¶S/¶bo= 2å (bo +b1xi - yi) = 0 привести к виду (3.3) bo n + b1 åxi = åyi.

    Задача 2. МНК. Уравнение (3.2) ¶S/¶b1 =2å (bo +b1xi - yi) xi = 0 привести к виду (3.3) bo åxi + b1 å  = åxiyi.

    Задача 3. Даны выборки двух СВ: Х= 1, 3, 5 и Y= 13, 10, 7. Рассчитать коэффициент корреляции, выполнить анализ алгоритма решения задачи:

1).Выбираем рабочую формулу, например,

2).Рассчитываем средние арифметические

3).Формула для расчёта дисперсий sx2 и sy2: sx2= /(n-1)

4).Подставляем все значения в рабочую формулу и вычисляем rxy.

Задача 4. Определить графически и аналитически прогнозное среднее значение выручки для нового магазина с площадью х=11 на основе регрессионной модели =0,43+1,54x. Выполнить анализ алгоритма решения задачи:

1).В координатах XYстроим прямую линии для уравнения регрессии

i=0,43+1,54x

2).Находим графически прогнозное значение выручки ŷiдля х=11

3).Вычисляем прогнозное значение выручки для х=11: ŷi=0,43+1,54×11=17,37

4) Результаты п.п 3 и 4 должны совпадать.

Задача 5. В рамках модели магазина дать точное определение переменным и на рисунке 2.1 показать их графические образы: у2, , 2, х3, 22, е3, sx, s.

 

Контрольные вопросы:

1) В чём суть метода наименьших квадратов

2) В каком смысле параметры регрессии, найденные с помощью МНК, можно называть оптимальными

3) Какие соображения возникают при анализе причин ненулевого значения параметра b0 в модели магазина

4) Если коэффициент корреляции между Х и Y равен 0, то какие из этого можно сделать выводы.

5) В чём смысл условия гомоскедастичности

 

 

    4.4 Решение сквозной задачи №1: Построение и исследование модели магазина- линейной парной регрессии (п.п. 5-11)

 

5) Представим уравнение регрессии =0,43+1,54x графически в виде прямой линии на плоскости XY (например, по двум каким-либо точкам.

 

6) Покажем графически и аналитически, что линия регрессии проходит через точку средних значений (x̄,ȳ) переменных х и у (способ проверки правильности расчётов).

Графически: на рисунке 3.1 видно, что линия регрессии проходит через точку “средних” (x̄=3,43; ȳ=5,71).

Аналитически:ŷ=0,43+1,54×3,43 = 5,71, что и требовалось доказать.

 

7) Определим: насколько вырастет средний объем продаж при увеличении площади х на 1 (10 кв.м). Ответ даёт значение коэффициента регрессии b1: объём продаж вырастет на 1,54 (15400 руб/день).

 

8) Определим: имеет ли смысл свободный член в уравнении регрессии. Ответ: свободный член b0=0,43 смысла не имеет, т.к. при нулевой торговой площади (х=0) положительного объема продаж быть не может.

 

9) Вычислим промежуточные значения выражений iи – графы 6 и 7 таблицы 3.2.

 

10) Вычислим коэффициент корреляции между переменными X и Y. Для этогоиспользуем данные из таблицы 3.2 и формулу:

(4.13)

Здесь нам известно все, кроме СКО в знаменателе. Выполним расчёты:

-дисперсия СВ Y
- СКОСВ Y sу= =3,70;
- дисперсия СВ Х
- СКО СВ Х

 

Окончательно, коэффициент корреляции:

Большое значение коэффициента говорит о высокойзависимости суточного объема продаж Yот размера торговой площади X.

 

11) Определим графически и аналитически точечное прогнозное значение объема продаж для будущего магазина "Рыба-8" с торговой площадью х=11 (110кв.м).

Графически: из рисунка 3.1 видно, что

Аналитически: =0,43+1,54×11=17,37.

(Окончание в разделе 5).



Поделиться с друзьями:

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.075 с.