Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Особенности труда и отдыха в условиях низких температур: К работам при низких температурах на открытом воздухе и в не отапливаемых помещениях допускаются лица не моложе 18 лет, прошедшие...

Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...

Оснащения врачебно-сестринской бригады.

Интересное:

Распространение рака на другие отдаленные от желудка органы: Характерных симптомов рака желудка не существует. Выраженные симптомы появляются, когда опухоль...

Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...

Берегоукрепление оползневых склонов: На прибрежных склонах основной причиной развития оползневых процессов является подмыв водами рек естественных склонов...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Дискриминантный параметрический анализ

2017-08-11

517

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

Будем считать, что каждый S_j класс является р -мерной нормальной генеральной совокупностью с вектором средних значений = и общей ковариационной матрицей = , ; . Тогда в качестве функций следует использовать р -мерные нормальные плотности. Правило классификации наблюдений для двух классов эквивалентно следующему: наблюдение , относится к классу тогда, когда

Рекомендуемая литература [3, с. 19 - 37].

Пример 4. Имеется 12 предприятий, характеризуемых тремя экономическими показателями: производительностью труда; удельным весом потерь от брака (%) и фондоотдачей активной части основных производственных фондов. Из этих предприятий получены две обучающие выборки, первая из которых включает n_х= 4 предприятия группы А, а вторая – n_y = 5 предприятий группы В. С использованием данных табл. 16 требуется вычислить оценки значений дискриминантной функции для оставшихся предприятий и провести их классификацию. Дать экономическую интерпретацию результатов дискриминации.

Таблица 16

№ предприятия	Предприятия	Показатель
Производительность труда	Удельный вес потерь от брака	Фондоотдача
	Группы А, X	9,4 9,9 9,1 9,4	0,15 0,34 0,09 0,21	1,91 1,68 1,89 2,30
	Группы В, Y	6,6 4,3 7,4 6,6 5,5	0,48 0,41 0,62 0,50 1,20	0,88 0,62 1,09 1,32 0,68

Окончание табл. 16

Подлежат дискриминации, Z

2,5 5,7 10,0

0,05 0,66 0,32

1,02 1,43 2,62

Решение

Найдем оценки векторов средних значений

; и соответственно ; .

Найдем для класса А матрицу Х₀_j = , затем Х₀_j^Т и .

Х₀₁Х₀₁^ТS₁

-0,05	-0,05	-0,03	-0,05	0,45	-0,35	-0,05	0,33	0,10	-0,12
0,45	0,14	-0,27	-0,05	0,14	-0,11	0,01	0,10	0,03	-0,03
-0,35	-0,11	-0,05	-0,03	-0,27	-0,05	0,36	-0,12	-0,03	0,20
-0,05	0,01	0,36

Для класса В: Х₀₂Х₀₂^Т

0,52	-0,16	-0,04	0,52	-1,78	1,32	0,52	-0,58
-1,78	-0,23	-0,30	-0,16	-0,23	-0,02	-0,14	0,56
1,32	-0,02	0,17	-0,04	-0,30	0,17	0,40	-0,24
0,52	-0,14	0,40	0,52	-1,78	1,32	0,52	-0,58
-0,58	0,56	-0,24

S₂

5,79	-0,10	1,08
-0,10	0,41	-0,12
1,08	-0,12	0,34
5,79	-0,10	1,08

Найдем обратную матрицу .

Получим вектор оценок коэффициентов дискриминации

Найдем .

Запишем дискриминантную функцию

Тогда < Д класс В; > Д класс A; > Д класс A.

Компонентный анализ

В исследовательской и практической статистической работе приходится сталкиваться с ситуациями, когда общее число p признаков , регистрируемых на каждом из множества обследуемых объектов (стран, городов, семей и т.д.), очень велико Нормируем исходные данные . Возникает вопрос: можно ли каждое из наблюдений заменить векторами некоторых вспомогательных показателей с существенно меньшим, чем p, числом компонент так, чтобы система новых показателей сохранила в своей существенной части ту информацию, которая содержится в исходных данных. Пусть признаки F являются линейными комбинациями признаков X:

В матричной форме система имеет вид .

Элементы матрицы L будем искать, используя корреляционную матрицу вектора X. Все собственные числа этой матрицы положительны. Расположим их в порядке убывания l₁>l₂>…lr > 0. Найдем для каждого числа l_i нормированный собственный вектор . Тогда компонента вектора F, найденная по вектору l_i, называется первой главной компонентой. Затем для собственного числа строится вторая строка матрицы L и вторая главная компонента f⁽²⁾ и т.д. Таким образом, строится ортогональная матрица L и найдется вектор главных компонент F.

Критерий информативности может быть представлен в виде

Анализируя изменение относительной доли дисперсии, вносимой первыми p’ главными компонентами, в зависимости от числа этих компонент можно определить число компонент, которые целесообразно оставить в рассмотрении.

Матрица А, определяемая по формуле , называется матрицей нагрузок главных компонент на исходные признаки. Она дает экономическую интерпретацию полученным главным компонентам.

Рекомендуемая литература [3, с. 55 - 83].

Пример 5. Экономическая деятельность предприятий машиностроения характеризуется следующими показателями (табл. 17).

Требуется:

1. Найти главные компоненты, дать экономическую интерпретацию полученным результатам.

2. Ранжировать предприятия по первой главной компоненте. Дать экономическую интерпретацию полученным результатам.

3. Приняв за результативный показатель у рентабельность, построить уравнение регрессии на главной компоненте, наиболее тесно связанной с у, с помощью Пакета Анализ Данных в Microsoft Excel.

Таблица 17

№ п/п	Удельный вес покупных изделий,	Коэффициент сменности оборудования,	Премии и вознаграждения на одного работника,	Y
	0,30 0,56 0,42 0,26 0,16 0,45 0,31 0,08 0,63 0,03	1,40 1,20 1,15 1,09 1,26 1,36 1,15 1,87 2,17 1,61	0,67 0,98 1,16 0,54 1,23 0,78 1,16 2,44 1,06 2,13	9,8 13,2 17,3 7,1 11,5 12,1 15,2 31,3 11,6 30,1

Решение

1. Построим главные компоненты. С этой целью найдем выборочные средние , , ; средние квадратические отклонения , , ; построим матрицу нормированных данных Х₀:

Х₀ =

и найдем матрицу корреляции

Используя программу Maple, найдем собственные значения λ₁ = 1,766, λ₂ = 1,047, λ₃ = 0,188 и нормированные собственные векторы корреляционной матрицы .

Следовательно, первая главная компонента, построенная по нормированным значениям первоначальных признаков, имеет вид

Соответственно вторая и третья главные компоненты равны ; . Для проверки критерия информативности построим табл. 18.

Таблица 18

Главные компоненты f ⁽ⁱ⁾	f ⁽²⁾	f ⁽²⁾	f ⁽³⁾
Собственные значения λ_i	1,766	1,047	0,188
Вклад i -й главной компоненты (%) в суммарную дисперсию	58,851	34,884	6,264
Суммарный вклад первых главных компонент	58,851	93,736

Для анализа были оставлены две первые главные компоненты (р’=2), на которые приходится 94% суммарной вариации.

Выясним экономический смысл первой и второй главных компонент. С этой целью построим матрицу нагрузок:

Звездочкой отмечены элементы по столбцу, которые следует учитывать при интерпретации главных компонент f ⁽¹⁾ и f ⁽²⁾. Из вида матрицы нагрузок А следует, что первая главная компонента наиболее тесно связана с показателем х⁽³⁾, вторая главная компонента - с х⁽².⁾ Следовательно, первой главной компоненте можно придать экономический смысл –премии и вознаграждения на одного работника. Второй главной компоненте можно придать экономический смысл –коэффициент сменности оборудования.

2. Подставим последовательно в уравнения главных компонент нормированные значения признаков Х, в результате получим и далее аналогично получим табл. 19.

Таблица 19

№ п/п	f₁	f₁	Y_нор
	-0,747	-0,286	-0,78009
	0,610	-0,215	-0,34671
	0,315	0,367	0,175903
	-1,043	0,442	-1,12425
	-0,568	0,783	-0,5634
	-0,052	-0,471	-0,48692
	-0,093	0,631	-0,09178
	0,604	0,421	1,960427
	0,926	-2,597	-0,55065
	0,047	0,926	1,807468

Ранжируем эти значения в порядке их возрастания. Наименьшее значение первой главной компоненты - премии и вознаграждения - на четвертом предприятии, наибольшее - на девятом предприятии. Наименьшее значение второй главной компоненты - коэффициент сменности оборудования - на девятом предприятии, наибольшее - на десятом.

3. С помощью Пакета Анализ Данных в Microsoft Excel построим уравнение регрессии без свободного члена, взяв в качестве входного интервала У нормированное его значение.

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,798
R²	0,636
Нормированный R²	0,465
Стандартная ошибка	0,675
Наблюдения
Дисперсионный анализ
	df	SS	MS	F	Р(F)
Регрессия		6,36	3,18	6,989	0,021
Остаток		3,64	0,455
Итого
	Коэффициенты	Стандартная ошибка	t-статистика	P-значение	Нижние 95%	Верхние 95%
F₁	1,338	0,402	3,331	0,010	0,4112	2,265
F₂	0,775	0,25	3,095	0,015	0,198	1,352

Р(F_i) < 0,05, коэффициенты регрессии статистически значимы. Так как Р(F) < 0,05, то существует линейное уравнение регрессии t_Y = 0,77t_f₁ + 0,56t_f₂.

Вопросы для самоконтроля

1. Объясните необходимость многомерной классификации и типологизации в проблемах моделирования экономических систем.

2. Приведите примеры экономических задач и используемые для них методы классификации.

3. Какими причинами вызвано снижение размерности многомерного признака?

4. Какова общая математическая модель смеси распределений и какие предположения должны быть высказаны для ее применения?

5. Как определяется функция потерь неправильной классификации?

6. Сформулируйте методы параметрического дискриминантного анализа в случае нормальных классов.

7. Укажите алгоритм нахождения главных компонент.

8. Сформулируйте критерий информативности.

9. Являются ли главные компоненты центрированными и коррелированными?

10. Что называется матрицей нагрузок и какими свойствами она обладает?

11. Поясните геометрическую интерпретацию метода главных компонент.

12. Сформулируйте свойства главных компонент.

⇐ Предыдущая 1 234 Следующая ⇒

Поделиться с друзьями:

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...