Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...
Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьшения длины пробега и улучшения маневрирования ВС при...
Топ:
Особенности труда и отдыха в условиях низких температур: К работам при низких температурах на открытом воздухе и в не отапливаемых помещениях допускаются лица не моложе 18 лет, прошедшие...
Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...
Интересное:
Распространение рака на другие отдаленные от желудка органы: Характерных симптомов рака желудка не существует. Выраженные симптомы появляются, когда опухоль...
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Берегоукрепление оползневых склонов: На прибрежных склонах основной причиной развития оползневых процессов является подмыв водами рек естественных склонов...
Дисциплины:
2017-08-11 | 517 |
5.00
из
|
Заказать работу |
|
|
Будем считать, что каждый Sj класс является р -мерной нормальной генеральной совокупностью с вектором средних значений = и общей ковариационной матрицей = , ; . Тогда в качестве функций следует использовать р -мерные нормальные плотности. Правило классификации наблюдений для двух классов эквивалентно следующему: наблюдение , относится к классу тогда, когда
.
Рекомендуемая литература [3, с. 19 - 37].
Пример 4. Имеется 12 предприятий, характеризуемых тремя экономическими показателями: производительностью труда; удельным весом потерь от брака (%) и фондоотдачей активной части основных производственных фондов. Из этих предприятий получены две обучающие выборки, первая из которых включает nх = 4 предприятия группы А, а вторая – ny = 5 предприятий группы В. С использованием данных табл. 16 требуется вычислить оценки значений дискриминантной функции для оставшихся предприятий и провести их классификацию. Дать экономическую интерпретацию результатов дискриминации.
Таблица 16
№ предприятия | Предприятия | Показатель | |||
Производительность труда | Удельный вес потерь от брака | Фондоотдача | |||
Группы А, X | 9,4 9,9 9,1 9,4 | 0,15 0,34 0,09 0,21 | 1,91 1,68 1,89 2,30 | ||
Группы В, Y | 6,6 4,3 7,4 6,6 5,5 | 0,48 0,41 0,62 0,50 1,20 | 0,88 0,62 1,09 1,32 0,68 | ||
Окончание табл. 16
Подлежат дискриминации, Z | 2,5 5,7 10,0 | 0,05 0,66 0,32 | 1,02 1,43 2,62 |
Решение
Найдем оценки векторов средних значений
; и соответственно ; .
Найдем для класса А матрицу Х0j = , затем Х0jТ и .
Х01 Х01Т S1
-0,05 | -0,05 | -0,03 | -0,05 | 0,45 | -0,35 | -0,05 | 0,33 | 0,10 | -0,12 | ||
0,45 | 0,14 | -0,27 | -0,05 | 0,14 | -0,11 | 0,01 | 0,10 | 0,03 | -0,03 | ||
-0,35 | -0,11 | -0,05 | -0,03 | -0,27 | -0,05 | 0,36 | -0,12 | -0,03 | 0,20 | ||
-0,05 | 0,01 | 0,36 |
Для класса В: Х02 Х02Т
|
0,52 | -0,16 | -0,04 | 0,52 | -1,78 | 1,32 | 0,52 | -0,58 | ||
-1,78 | -0,23 | -0,30 | -0,16 | -0,23 | -0,02 | -0,14 | 0,56 | ||
1,32 | -0,02 | 0,17 | -0,04 | -0,30 | 0,17 | 0,40 | -0,24 | ||
0,52 | -0,14 | 0,40 | 0,52 | -1,78 | 1,32 | 0,52 | -0,58 | ||
-0,58 | 0,56 | -0,24 |
S2
5,79 | -0,10 | 1,08 |
-0,10 | 0,41 | -0,12 |
1,08 | -0,12 | 0,34 |
5,79 | -0,10 | 1,08 |
.
Найдем обратную матрицу .
Получим вектор оценок коэффициентов дискриминации
.
Найдем .
Запишем дискриминантную функцию
.
Тогда < Д класс В; > Д класс A; > Д класс A.
Компонентный анализ
В исследовательской и практической статистической работе приходится сталкиваться с ситуациями, когда общее число p признаков , регистрируемых на каждом из множества обследуемых объектов (стран, городов, семей и т.д.), очень велико Нормируем исходные данные . Возникает вопрос: можно ли каждое из наблюдений заменить векторами некоторых вспомогательных показателей с существенно меньшим, чем p, числом компонент так, чтобы система новых показателей сохранила в своей существенной части ту информацию, которая содержится в исходных данных. Пусть признаки F являются линейными комбинациями признаков X:
В матричной форме система имеет вид .
Элементы матрицы L будем искать, используя корреляционную матрицу вектора X. Все собственные числа этой матрицы положительны. Расположим их в порядке убывания l1>l2>…lr > 0. Найдем для каждого числа li нормированный собственный вектор . Тогда компонента вектора F, найденная по вектору li, называется первой главной компонентой. Затем для собственного числа строится вторая строка матрицы L и вторая главная компонента f(2) и т.д. Таким образом, строится ортогональная матрица L и найдется вектор главных компонент F.
Критерий информативности может быть представлен в виде
.
Анализируя изменение относительной доли дисперсии, вносимой первыми p’ главными компонентами, в зависимости от числа этих компонент можно определить число компонент, которые целесообразно оставить в рассмотрении.
|
Матрица А, определяемая по формуле , называется матрицей нагрузок главных компонент на исходные признаки. Она дает экономическую интерпретацию полученным главным компонентам.
Рекомендуемая литература [3, с. 55 - 83].
Пример 5. Экономическая деятельность предприятий машиностроения характеризуется следующими показателями (табл. 17).
Требуется:
1. Найти главные компоненты, дать экономическую интерпретацию полученным результатам.
2. Ранжировать предприятия по первой главной компоненте. Дать экономическую интерпретацию полученным результатам.
3. Приняв за результативный показатель у рентабельность, построить уравнение регрессии на главной компоненте, наиболее тесно связанной с у, с помощью Пакета Анализ Данных в Microsoft Excel.
Таблица 17
№ п/п | Удельный вес покупных изделий, | Коэффициент сменности оборудования, | Премии и вознаграждения на одного работника, | Y |
0,30 0,56 0,42 0,26 0,16 0,45 0,31 0,08 0,63 0,03 | 1,40 1,20 1,15 1,09 1,26 1,36 1,15 1,87 2,17 1,61 | 0,67 0,98 1,16 0,54 1,23 0,78 1,16 2,44 1,06 2,13 | 9,8 13,2 17,3 7,1 11,5 12,1 15,2 31,3 11,6 30,1 |
Решение
1. Построим главные компоненты. С этой целью найдем выборочные средние , , ; средние квадратические отклонения , , ; построим матрицу нормированных данных Х0:
Х0 =
и найдем матрицу корреляции
Используя программу Maple, найдем собственные значения λ1 = 1,766, λ2 = 1,047, λ3 = 0,188 и нормированные собственные векторы корреляционной матрицы .
Следовательно, первая главная компонента, построенная по нормированным значениям первоначальных признаков, имеет вид
.
Соответственно вторая и третья главные компоненты равны ; . Для проверки критерия информативности построим табл. 18.
Таблица 18
Главные компоненты f (i) | f (2) | f (2) | f (3) |
Собственные значения λi | 1,766 | 1,047 | 0,188 |
Вклад i -й главной компоненты (%) в суммарную дисперсию | 58,851 | 34,884 | 6,264 |
Суммарный вклад первых главных компонент | 58,851 | 93,736 |
Для анализа были оставлены две первые главные компоненты (р’=2), на которые приходится 94% суммарной вариации.
Выясним экономический смысл первой и второй главных компонент. С этой целью построим матрицу нагрузок:
Звездочкой отмечены элементы по столбцу, которые следует учитывать при интерпретации главных компонент f (1) и f (2). Из вида матрицы нагрузок А следует, что первая главная компонента наиболее тесно связана с показателем х(3), вторая главная компонента - с х(2.) Следовательно, первой главной компоненте можно придать экономический смысл –премии и вознаграждения на одного работника. Второй главной компоненте можно придать экономический смысл –коэффициент сменности оборудования.
|
2. Подставим последовательно в уравнения главных компонент нормированные значения признаков Х, в результате получим и далее аналогично получим табл. 19.
Таблица 19
№ п/п | f1 | f1 | Yнор |
-0,747 | -0,286 | -0,78009 | |
0,610 | -0,215 | -0,34671 | |
0,315 | 0,367 | 0,175903 | |
-1,043 | 0,442 | -1,12425 | |
-0,568 | 0,783 | -0,5634 | |
-0,052 | -0,471 | -0,48692 | |
-0,093 | 0,631 | -0,09178 | |
0,604 | 0,421 | 1,960427 | |
0,926 | -2,597 | -0,55065 | |
0,047 | 0,926 | 1,807468 |
Ранжируем эти значения в порядке их возрастания. Наименьшее значение первой главной компоненты - премии и вознаграждения - на четвертом предприятии, наибольшее - на девятом предприятии. Наименьшее значение второй главной компоненты - коэффициент сменности оборудования - на девятом предприятии, наибольшее - на десятом.
3. С помощью Пакета Анализ Данных в Microsoft Excel построим уравнение регрессии без свободного члена, взяв в качестве входного интервала У нормированное его значение.
ВЫВОД ИТОГОВ | ||||||||||||
Регрессионная статистика | ||||||||||||
Множественный R | 0,798 | |||||||||||
R2 | 0,636 | |||||||||||
Нормированный R2 | 0,465 | |||||||||||
Стандартная ошибка | 0,675 | |||||||||||
Наблюдения | ||||||||||||
Дисперсионный анализ | ||||||||||||
df | SS | MS | F | Р(F) | ||||||||
Регрессия | 6,36 | 3,18 | 6,989 | 0,021 | ||||||||
Остаток | 3,64 | 0,455 | ||||||||||
Итого | ||||||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-значение | Нижние 95% | Верхние 95% | |||||||
F1 | 1,338 | 0,402 | 3,331 | 0,010 | 0,4112 | 2,265 | ||||||
F2 | 0,775 | 0,25 | 3,095 | 0,015 | 0,198 | 1,352 | ||||||
Р(Fi) < 0,05, коэффициенты регрессии статистически значимы. Так как Р(F) < 0,05, то существует линейное уравнение регрессии tY = 0,77tf1 + 0,56tf2.
Вопросы для самоконтроля
1. Объясните необходимость многомерной классификации и типологизации в проблемах моделирования экономических систем.
2. Приведите примеры экономических задач и используемые для них методы классификации.
|
3. Какими причинами вызвано снижение размерности многомерного признака?
4. Какова общая математическая модель смеси распределений и какие предположения должны быть высказаны для ее применения?
5. Как определяется функция потерь неправильной классификации?
6. Сформулируйте методы параметрического дискриминантного анализа в случае нормальных классов.
7. Укажите алгоритм нахождения главных компонент.
8. Сформулируйте критерий информативности.
9. Являются ли главные компоненты центрированными и коррелированными?
10. Что называется матрицей нагрузок и какими свойствами она обладает?
11. Поясните геометрическую интерпретацию метода главных компонент.
12. Сформулируйте свойства главных компонент.
|
|
Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...
Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!