Понятие о корреляционном и регрессивном анализе — КиберПедия 

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Понятие о корреляционном и регрессивном анализе

2017-11-17 143
Понятие о корреляционном и регрессивном анализе 0.00 из 5.00 0 оценок
Заказать работу

Существуют два вида зависимостей: функциональная и стохастическая (вероятностная). Функциональная: каждому значению одной переменной соответствует одно, определённое значение другой.

Пример 12. 1)

2)

Строгая функциональная зависимость между случайными величинами на практике встречается редко. Гораздо чаще другая, когда каждому численному значению одной случайной величины не соответствует одно, определённое значение другой.

Пример 13. Между ростом Х и весом Y человека (наугад выбранного) имеется зависимость, но она не является функциональной.

Связь между случайными величинами, имеющими общие случайные факторы, которые влияют как на одну, так и на другую случайную величину, наряду с другими, неодинаковыми для обеих случайных величин факторами, называется стохастической. В статистике её называют статистической.

 

: Определение. Статистической называют зависимость, при которой изменение одной случайной величины влечёт изменение распределения другой.

На рис. 8 приведены примеры функциональной и статистической зависимостей.

Статистическая (стохастическая) зависимость
Зависимость отсутствует
Функциональная зависимость

 

Рис. 8

 

Исследование взаимозависимости случайных величин рассматривается в корреляционном анализе (зависимость веса Y от роста Х – корреляционная зависимость). Исследование зависимости случайной величины от ряда неслучайных и случайных величин рассматривается в регрессионном анализе (зависимость между урожайностью сельскохозяйственных культур от природных и экономических факторов).

В корреляционном анализе оценивается сила стохастической связи, в регрессионном – исследуется её форма.

 

: Определение. Условной средней называют среднее арифметическое значение Y, соответствующее значению Х = х.

 

Пример 14. При х = 2 Y приняла значения: 5, 6, 10, тогда .

: Определение. Корреляционной зависимостью Y от Х называют функциональную зависимость условной средней от х:

.(16)

 

Это уравнение регрессии Y на Х. Функцию f(x) называют регрессией Y на Х, а её график – линией регрессии Y на Х.

Аналогично: условная средняя равна среднему арифметическому значений Х, соответствующих Y = у.

Уравнение регрессии Х на Y:

(17)

где j(y) – регрессия Х на Y.

Чаще всего теоретические регрессии (16) и (17) неизвестны, и их оценивают при помощи эмпирических регрессий. Экспериментальные данные изображают в виде точек в декартовой системе координат. Исходя из характера расположения точек выбирают вид функции регрессии и её оценки, т.е. эмпирической регрессии (прямая, парабола и т.д.):

эмпирическое уравнение Y на Х. Параметры находят методом наименьших квадратов.

Аналогично .

В зависимости от числа случайных величин различают простую и множественную регрессии.

Пример 15.

1. Простая регрессия – регрессия между затратами на производстве и объёмом продукции, производимой предприятием.

2. Множественная регрессия – регрессия между производительностью труда и уровнем механизации производственных процессов, фондом рабочего времени, материалоёмкостью, квалификацией рабочих.

По форме различают линейную и нелинейную регрессии.

Линейная регрессия: ,

,

где коэффициенты регрессии.

Обе линии регрессии Y на Х и Х на Y – прямые.

Выборочное уравнение прямой линии регрессии Y на Х имеет вид:

где – условная средняя;

– выборочные средние Х и Y;

– выборочные средние квадратические отклонения;

выборочный коэффициент корреляции.

,

где x, y – варианты;

– частота пары вариант (x, y);

– объём выборки (сумма всех частот);

коэффициент регрессии.

Аналогично определяется выборочное уравнение прямой линии регрессии Х на Y:

.


Связь коэффициентов регрессии и коэффициентов корреляции:

; ; .

Если , , то Х и Y одновременно возрастают, если < 0, < 0, то X и Y убывают. Чем меньше угол между прямыми регрессии Y на Х и Х на У, тем теснее связь между Х и Y.

Выборочный коэффициент корреляции служит для оценки тесноты линейной корреляционной зависимости.

Свойства выборочного коэффициента корреляции :

1. | |≤ 1.

2. Если = 0, то Х и Y не связаны линейной корреляционной зависимостью.

3. Если | |= 1, то Х и Y связаны функциональной зависимостью (линейной).

4. С возрастанием | | линейная корреляционная зависимость становится более тесной, при | |= 1 переходит в функциональную,

при | |→ 1 связь сильнее,

при | |→ 0 слабее.

Пример 16 (из тестов).

1. При построении уравнения парной регрессии y = α + βx + ξ были получены результаты: = 0.8; = 2; = 1,5, тогда коэффициент регрессии β равен:

-3; 0,6; -0,6; 2.

Решение.

.

Ответ: 0,6.

2. Выборочное уравнение парной регрессии имеет вид y = –3 + 2 x. Тогда выборочный коэффициент корреляции может быть равен…

-3; 0,6; -0,6; 2.

Решение.

| |≤ 1 (всегда), = 2 (из условия), (всегда), следовательно, = 0,6.

Задачи _______________________________________________________ ´

1. В магазине постельных принадлежностей были проведены в течение пяти дней подсчеты числа покупок простыней X и подушек Y:

X          
Y          

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.

2. На основании полученных по результатам измерений значений величин X и Y:

X            
Y            

найти выборочное уравнение линейной регрессии X на Y и выборочный коэффициент корреляции.

3. Найти выборочное уравнение линейной регрессии Y на X по данным следующей таблицы:

X              
Y   1,9 2,2 2,4 2,3 2,5 2,5

4. Найти выборочное уравнение линейной регрессии X на Y по данным следующей таблицы:

X     24,5 24,5   25,5     26,5 26,5      
Y 0,48 0,5 0,49 0,5 0,51 0,52 0,51 0,53 0,5 0,52 0,54 0,52 0,53

5. Найти выборочное уравнение линейной регрессии Y на X по данным следующей таблицы:

X 0,5   1,5   2,5   3,5   4,5  
Y                    

6. В следующей таблице приведены данные о зависимости стоимости эксплуатации самолета Y (млн руб.) от его возраста X (лет):

X                
Y   3,5 3,5          

Найти выборочное уравнение линейной регрессии Y на X.

7. С целью анализа взаимного влияния зарплаты и текучести рабочей силы на пяти однотипных фирмах с одинаковым числом работников проведены измерения уровня месячной зарплаты X и числа уволившихся за год рабочих Y:

X          
Y          

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.

8. В таблице приведены данные измерения веса Y и роста X двадцати курсантов школы МВД:

X                    
Y                    
X                    
Y                    

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.

ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ

№ 1. Построить гистограмму частот и гистограмму относительных частот по данному распределению выборки

Вариант i Частичные интервалы xi-xi+1 ni Вариант i Частичные интервалы xi-xi+1 ni
    8-11       0-2  
  11-14     2-4  
  14-17     4-6  
  17-20     6-8  
    6-9       5-8  
  9-12     8-11  
  12-15     11-14  
  15-18     14-17  
    4-7       3-6  
  7-10     6-9  
  10-13     9-12  
  13-16     12-15  
    2-5       1-4  
  5-8     4-7  
  8-11     7-10  
  11-14     10-13  
    0-3       11-13  
  3-6     13-15  
  6-9     15-17  
  9-12     17-19  
    9-11       7-9  
  11-13     9-11  
  13-15     11-13  
  15-17     13-15  
    5-7       3-5  
  7-9     5-7  
  9-11     7-9  
  11-13     9-11  
    1-3       1-2  
  3-5     2-3  
  5-7     3-4  
  7-9     4-5  
    10-12       8-10  
  12-14     10-12  
  14-16     12-14  
  16-18     14-16  
    6-8       4-6  
  8-10     6-8  
  10-12     8-10  
  12-14     10-12  
    2-4       1-3  
  4-6     3-5  
  6-8     5-7  
  8-10     7-9  

№ 2. Построить полигон относительных частот по данному распределению выборки объема n = 100 (предварительно найти значение a).

 

Вариант Распределение Вариант Распределение
  xi             xi   5,5   7,5  
ni       a   ni       a  
  xi 1.5 2,5 3,5 4,5 5,5   xi          
ni       a   ni       a  
  xi 1,2 2,3 3,1 4,5 5,2   xi          
ni       a   ni       a  
  xi -1           xi          
ni       a   ni       a  
  xi             xi 3,5 4,5 5,5 6,5 7,5
ni       a   ni       a  
  xi   3,5   4,5     xi   1,5   2,5  
ni       a   ni       a  
  xi   1,2 2,4       xi          
ni       a   ni       a  
  xi 1,5 2,5 3,5 4,5 5,5   xi          
ni       a   ni       a  
  xi 2,5   3,5   5,5   xi          
ni       a   ni       a  
  xi             xi 3,5   5,5    
ni       a   ni       a  
  xi             xi 5,5   6,5   7,5
ni       a   ni       a  

 

№ 3. По данным результатам измерений найти:

1) выборочную среднюю;

2) выборочную дисперсию;

3) несмещённые оценки генеральных средней и дисперсии.

 

Вариант Результат измерений Вариант Результат измерений
  15, 17, 19, 21   12, 13, 14, 15
  13, 15, 17, 19   12, 14, 16, 18
  10, 12, 14, 16   9, 11, 13, 15, 17
  7, 9, 11, 12   5, 7, 9, 11
  3, 5, 7, 9   1, 3, 5, 7
  2, 4, 6, 8   21, 22, 23, 24
  20, 21, 22, 23   19, 20, 21, 22
  18, 19, 20, 21   17, 18, 19, 20
  16, 17, 18, 20, 22   15, 16, 17, 18
  14, 15, 16, 17   13, 14, 15, 16
  12, 13, 14, 15   11, 12, 13, 14

ОТВЕТЫ И УКАЗАНИЯ

§ 3 _________________________________________________________________?

1.

xi              
wi 5/50 8/50 17/50 12/50 4/50 3/50 1/50

2.

[(xi; xi+1) [15; 20) [20; 25) [25; 30) [30; 35)
wi 0,08 0,14 0,18 0,3
[ xi; xi+1) [35; 40) [40; 45) [45; 50)  
wi 0,1 0,14 0,06  

Указание. Удобно взять a = 15, b = 50, , .

3.

xi              
wi 8/60 17/60 16/60 10/60 6/60 2/60 1/60

4.

[ xi; xi+1) [17; 17,5) [17,5; 18) [18; 18,5) [18,5; 19) [19; 19,5)
wi 5/50 6/50 4/50 8/50 4/50
[ xi; xi+1) [19,5; 20) [20; 20,5) [20,5; 21) [21; 21,5) [21,5; 22]
wi 6/50 2/50 6/50 4/50 5/50

Указание. Удобно взять a = 17, b = 22, k = 10, = 0,5.

5.

xi        
wi 31/54 14/54 7/54 2/54

6.

[ xi; xi+1) [150; 155) [155; 160) [160; 165) [165; 170) [170; 175)
wi 0,0381   0,0190 0,1810 0,1810
(xi; xi+1 ] [175; 180) [180; 185) [185; 190) [190; 195) [195; 200]
wi 0,2476 0,2000 0,0953 0,0190 0,0190

Указание. Удобно взять a = 150, b = 200, k = 10, = 5.

7.

xi            
wi 3/30 3/30 7/30 5/30 8/30 4/30

8.

[ xi; xi+1) [0; 5) [5; 10) [10; 15) [15; 20) [20; 25)
wi 0,0381   0,0190 0,1810 0,1810
[ xi; xi+1) [25; 30) [30; 35) [35; 40) [40; 45]  
wi 0,2476 0,2000 0,0953 0,0190  

Указание. Удобно взять a = 0, b = 45, k = 9, = 5.

9.

[ xi; xi+1) [130; 170) [170; 210) [210; 250)
wi 0,09 0,10 0,24
[ xi; xi+1) [250; 290) [290; 330) [330; 370)
wi 0,29 0,18 0,10

Указание. Удобно взять a = 130, b = 370, k = 6, = 40.

10.

[ xi; xi+1) [0; 2) [2; 4) [4; 6) [6; 8)
ni 0,0381   0,0190 0,1810
[ xi; xi+1) [8; 10) [10; 12) [12; 14) [14; 16)
ni 0,1810 0,2476 0,2000 0,0953

 

xi (- ¥;0]        
F* (x)   13/39 19/39 27/39 32/39
xi       (16;+ ¥)  
F* (x) 37/39 37/39 38/39    

Указание. При составлении ИСР удобно взять a = 0, b = 15, k = 5, = 3.

11.

a) F* (x) = б) F* (x) =

12.

a)

xi (- ¥;0]        
F* (x)   0,06 0,01 0,12 0,3
xi         (18;+ ¥)
F* (x) 0,59 0,7 0,8 0,97  

 

б)

xi (- ¥;11]        
F* (x)   0,06 0,4 0,7 0,77
xi       (35;+ ¥)  
F* (x) 0,85 0,91 0,96    

 

13–19. Указание. Найти предварительно отношения или (в зависимости от условий задачи) для каждого интервала и заполнить последнюю строку таблицы.

 

20–22. Указание. Найти предварительно относительные частоты wi, отношения и дополнить таблицу еще двумя строками.

§ 4–6 _______________________________________________________________?

1. .

 

2. .

 

3. .

 

4. DВ = 167,29.

 

5. .

 

6. .

 

7. .

 

8. S 2 = 6,93.

 

9. .

 

10. .

§8 _________________________________________________________________?

 

1. 7,63 < a < 12,77.

 

2. 48,7 < Mx < 51,3.

 

3. 992,16 < a < 1007,84.

 

4. n = 81.

Указание. Из формулы, определяющей точность оценки математи­ческого ожидания генеральной совокупности по выборочной средней , выразить n. По таблице приложения 1 найти значение аргумента t, при котором функция Лапласа F (t) принимает значение . Подставив значения t, s и d в формулу, выражающую объем выборки, получим искомое значение n.

 

5. n = 179.

Указание. См. указание к задаче 4.

6. 0,3 < a < 3,7.

Указание. Найти предварительно по данным выборки выборочную среднюю и исправленное среднее квадратическое отклонение . Далее по таблице приложения 2 по данным g, n найти tg. Затем вычислить точность оценки по формуле и найти нижнюю и верхнюю доверительные границы.

7. -0,04 < a < 0,88.

Указание. См. указание к задаче 6.

 

8. 7,98 < s < 20,02.

 

9. 7,83 < Mx < 10,27; 2,87 < sx < 4,68.

 

10. 4,19 < Mx < 6,41; 1,61 < sx < 6,05.

§ 9 _________________________________________________________________?

1. Гипотеза подтверждается.

Указание. c2набл = 5,267; c2кр = 7,8.

 

2. Гипотеза подтверждается.

 

3. Гипотеза отвергается.

 

4. Гипотеза подтверждается.

Указание. c2набл = 3,183; c2кр = 6,2.

 

5. Гипотеза отвергается.

Указание. c2набл = 14,702; c2кр = 11,5.

 

6. Гипотеза подтверждается.

Указание. c2набл = 1,63; c2кр = 6,2.

 

7. Гипотеза подтверждается.

Указание. c2набл = 1,57; c2кр = 11,5.

 

8. Гипотеза отвергается.

Указание. c2набл = 9,87; c2кр = 6,2.

 

9. Гипотеза подтверждается.

Указание. c2набл = 0,408; c2кр = 5,99.

 

10. Гипотеза подтверждается.

§ 10 ________________________________________________________________?

1. .

 

2. .

 

3. .

 

4. .

 

5. .

 

6. .

 

7. .

 

8. .


Приложения

 

Приложение 1

 


Приложение 2

 


Поделиться с друзьями:

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.206 с.