Дискриминантный параметрический анализ — КиберПедия 

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Дискриминантный параметрический анализ

2017-08-11 517
Дискриминантный параметрический анализ 0.00 из 5.00 0 оценок
Заказать работу

Будем считать, что каждый Sj класс является р -мерной нормальной генеральной совокупностью с вектором средних значений = и общей ковариационной матрицей = , ; . Тогда в качестве функций следует использовать р -мерные нормальные плотности. Правило классификации наблюдений для двух классов эквивалентно следующему: наблюдение , относится к классу тогда, когда

.

Рекомендуемая литература [3, с. 19 - 37].

Пример 4. Имеется 12 предприятий, характеризуемых тремя экономическими показателями: производительностью труда; удельным весом потерь от брака (%) и фондоотдачей активной части основных производственных фондов. Из этих предприятий получены две обучающие выборки, первая из которых включает nх = 4 предприятия группы А, а вторая – ny = 5 предприятий группы В. С использованием данных табл. 16 требуется вычислить оценки значений дискриминантной функции для оставшихся предприятий и провести их классификацию. Дать экономическую интерпретацию результатов дискриминации.

Таблица 16

№ предприятия Предприятия Показатель  
Производительность труда Удельный вес потерь от брака Фондоотдача
  Группы А, X 9,4 9,9 9,1 9,4 0,15 0,34 0,09 0,21 1,91 1,68 1,89 2,30
  Группы В, Y 6,6 4,3 7,4 6,6 5,5 0,48 0,41 0,62 0,50 1,20 0,88 0,62 1,09 1,32 0,68
           

 

Окончание табл. 16

  Подлежат дискриминации, Z 2,5 5,7 10,0 0,05 0,66 0,32 1,02 1,43 2,62

Решение

Найдем оценки векторов средних значений

; и соответственно ; .

Найдем для класса А матрицу Х0j = , затем Х0jТ и .

Х01 Х01Т S1

-0,05 -0,05 -0,03   -0,05 0,45 -0,35 -0,05   0,33 0,10 -0,12
0,45 0,14 -0,27   -0,05 0,14 -0,11 0,01   0,10 0,03 -0,03
-0,35 -0,11 -0,05   -0,03 -0,27 -0,05 0,36   -0,12 -0,03 0,20
-0,05 0,01 0,36                  

Для класса В: Х02 Х02Т

0,52 -0,16 -0,04   0,52 -1,78 1,32 0,52 -0,58  
-1,78 -0,23 -0,30   -0,16 -0,23 -0,02 -0,14 0,56  
1,32 -0,02 0,17   -0,04 -0,30 0,17 0,40 -0,24  
0,52 -0,14 0,40   0,52 -1,78 1,32 0,52 -0,58  
-0,58 0,56 -0,24              

S2

5,79 -0,10 1,08
-0,10 0,41 -0,12
1,08 -0,12 0,34
5,79 -0,10 1,08
     

.

Найдем обратную матрицу .

Получим вектор оценок коэффициентов дискриминации

.

Найдем .

Запишем дискриминантную функцию

.

Тогда < Д класс В; > Д класс A; > Д класс A.

 

Компонентный анализ

 

В исследовательской и практической статистической работе приходится сталкиваться с ситуациями, когда общее число p признаков , регистрируемых на каждом из множества обследуемых объектов (стран, городов, семей и т.д.), очень велико Нормируем исходные данные . Возникает вопрос: можно ли каждое из наблюдений заменить векторами некоторых вспомогательных показателей с существенно меньшим, чем p, числом компонент так, чтобы система новых показателей сохранила в своей существенной части ту информацию, которая содержится в исходных данных. Пусть признаки F являются линейными комбинациями признаков X:

В матричной форме система имеет вид .

Элементы матрицы L будем искать, используя корреляционную матрицу вектора X. Все собственные числа этой матрицы положительны. Расположим их в порядке убывания l1>l2>…lr > 0. Найдем для каждого числа li нормированный собственный вектор . Тогда компонента вектора F, найденная по вектору li, называется первой главной компонентой. Затем для собственного числа строится вторая строка матрицы L и вторая главная компонента f(2) и т.д. Таким образом, строится ортогональная матрица L и найдется вектор главных компонент F.

Критерий информативности может быть представлен в виде

.

Анализируя изменение относительной доли дисперсии, вносимой первыми p’ главными компонентами, в зависимости от числа этих компонент можно определить число компонент, которые целесообразно оставить в рассмотрении.

Матрица А, определяемая по формуле , называется матрицей нагрузок главных компонент на исходные признаки. Она дает экономическую интерпретацию полученным главным компонентам.

Рекомендуемая литература [3, с. 55 - 83].

 

Пример 5. Экономическая деятельность предприятий машиностроения характеризуется следующими показателями (табл. 17).

Требуется:

1. Найти главные компоненты, дать экономическую интерпретацию полученным результатам.

2. Ранжировать предприятия по первой главной компоненте. Дать экономическую интерпретацию полученным результатам.

3. Приняв за результативный показатель у рентабельность, построить уравнение регрессии на главной компоненте, наиболее тесно связанной с у, с помощью Пакета Анализ Данных в Microsoft Excel.

Таблица 17

№ п/п Удельный вес покупных изделий, Коэффициент сменности оборудования, Премии и вознаграждения на одного работника, Y
    0,30 0,56 0,42 0,26 0,16 0,45 0,31 0,08 0,63 0,03 1,40 1,20 1,15 1,09 1,26 1,36 1,15 1,87 2,17 1,61 0,67 0,98 1,16 0,54 1,23 0,78 1,16 2,44 1,06 2,13 9,8 13,2 17,3 7,1 11,5 12,1 15,2 31,3 11,6 30,1

 

Решение

1. Построим главные компоненты. С этой целью найдем выборочные средние , , ; средние квадратические отклонения , , ; построим матрицу нормированных данных Х0:

Х0 =

и найдем матрицу корреляции

Используя программу Maple, найдем собственные значения λ1 = 1,766, λ2 = 1,047, λ3 = 0,188 и нормированные собственные векторы корреляционной матрицы .

Следовательно, первая главная компонента, построенная по нормированным значениям первоначальных признаков, имеет вид

.

Соответственно вторая и третья главные компоненты равны ; . Для проверки критерия информативности построим табл. 18.

Таблица 18

Главные компоненты f (i) f (2) f (2) f (3)
Собственные значения λi 1,766 1,047 0,188
Вклад i -й главной компоненты (%) в суммарную дисперсию 58,851 34,884 6,264
Суммарный вклад первых главных компонент 58,851 93,736  

Для анализа были оставлены две первые главные компоненты (р’=2), на которые приходится 94% суммарной вариации.

Выясним экономический смысл первой и второй главных компонент. С этой целью построим матрицу нагрузок:

 

Звездочкой отмечены элементы по столбцу, которые следует учитывать при интерпретации главных компонент f (1) и f (2). Из вида матрицы нагрузок А следует, что первая главная компонента наиболее тесно связана с показателем х(3), вторая главная компонента - с х(2.) Следовательно, первой главной компоненте можно придать экономический смысл –премии и вознаграждения на одного работника. Второй главной компоненте можно придать экономический смысл –коэффициент сменности оборудования.

2. Подставим последовательно в уравнения главных компонент нормированные значения признаков Х, в результате получим и далее аналогично получим табл. 19.

Таблица 19

№ п/п f1 f1 Yнор
  -0,747 -0,286 -0,78009
  0,610 -0,215 -0,34671
  0,315 0,367 0,175903
  -1,043 0,442 -1,12425
  -0,568 0,783 -0,5634
  -0,052 -0,471 -0,48692
  -0,093 0,631 -0,09178
  0,604 0,421 1,960427
  0,926 -2,597 -0,55065
  0,047 0,926 1,807468

Ранжируем эти значения в порядке их возрастания. Наименьшее значение первой главной компоненты - премии и вознаграждения - на четвертом предприятии, наибольшее - на девятом предприятии. Наименьшее значение второй главной компоненты - коэффициент сменности оборудования - на девятом предприятии, наибольшее - на десятом.

3. С помощью Пакета Анализ Данных в Microsoft Excel построим уравнение регрессии без свободного члена, взяв в качестве входного интервала У нормированное его значение.

 

ВЫВОД ИТОГОВ  
Регрессионная статистика  
Множественный R 0,798  
R2 0,636  
Нормированный R2 0,465  
Стандартная ошибка 0,675  
Наблюдения    
Дисперсионный анализ
  df SS MS F Р(F)
Регрессия   6,36 3,18 6,989 0,021
Остаток   3,64 0,455  
Итого      
  Коэффициенты Стандартная ошибка t-статистика P-значение Нижние 95% Верхние 95%
F1 1,338 0,402 3,331 0,010 0,4112 2,265
F2 0,775 0,25 3,095 0,015 0,198 1,352
                         

Р(Fi) < 0,05, коэффициенты регрессии статистически значимы. Так как Р(F) < 0,05, то существует линейное уравнение регрессии tY = 0,77tf1 + 0,56tf2.

Вопросы для самоконтроля

1. Объясните необходимость многомерной классификации и типологизации в проблемах моделирования экономических систем.

2. Приведите примеры экономических задач и используемые для них методы классификации.

3. Какими причинами вызвано снижение размерности многомерного признака?

4. Какова общая математическая модель смеси распределений и какие предположения должны быть высказаны для ее применения?

5. Как определяется функция потерь неправильной классификации?

6. Сформулируйте методы параметрического дискриминантного анализа в случае нормальных классов.

7. Укажите алгоритм нахождения главных компонент.

8. Сформулируйте критерий информативности.

9. Являются ли главные компоненты центрированными и коррелированными?

10. Что называется матрицей нагрузок и какими свойствами она обладает?

11. Поясните геометрическую интерпретацию метода главных компонент.

12. Сформулируйте свойства главных компонент.



Поделиться с друзьями:

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.042 с.