Принятие решений в условиях неопределенности — КиберПедия 

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Принятие решений в условиях неопределенности

2019-05-27 633
Принятие решений в условиях неопределенности 0.00 из 5.00 0 оценок
Заказать работу

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

 

 

Цель занятия

Освоить и закрепить практические навыки по разработке, принятию и обоснованию управленческих решений в условиях неопределенности с использование классических критериев, а также с использованием критериев с сожалениями.

Теоретический материал

Условиями неопределенности считается ситуация, когда результаты принимаемых решений неизвестны.

Неопределенность подразделяется на стохастическую (имеется информация о распределении вероятности на множестве результатов), поведенческую (имеется информация о влиянии на результаты поведения участников), природную (имеется информация только о возможных результатах и отсутствует о связи между решениями и результатами) и априорную (нет информации о возможных результатах). Неопределенность, связанную с полным отсутствием информации о вероятностях состояний среды (природы), называют “безнадежной”.

Принятие решений в условиях неопределенности основано на том, что вероятности различных вариантов ситуаций развития событий лицу принимающему решение (ЛПР) неизвестны.

Задача обоснования решений в условиях неопределенности всех типов, кроме априорной, сводится к сужению исходного множества альтернатив на основе информации, которой располагает ЛПР. Качество рекомендаций для принятия решений в условиях стохастической неопределенности повышается при учете таких характеристик личности ЛПР, как отношение к своим выигрышам и проигрышам, склонность к риску. Обоснование решений в условиях априорной неопределенности возможно построением алгоритмов адаптивного управления [1].

Отличительная особенность принятия решений в условиях неопределенности состоит в том, что в ней сознательно действует только один из участников. Окружающая среда не действует сознательно против инвестора, а выступает как субъект, не имеющий конкретной цели, так и случайным образом выбирающий очередные состояния. Математическую модель принятия решений при таких условиях назовем методом принятия решений в условиях неопределенности.

Предположим, что ЛПР имеет  альтернатив решения ситуации, которые обозначим , ,..., . Результат выбора (выигрыш ЛПР) зависит от того, как будет развиваться ситуация, на которую ЛПР повлиять никак не может. Предположим, что ЛПР выделяет  вариантов развития ситуации, которые обозначим , ,..., . Данные варианты в теории принятия решений называют “состояниями природы”, т.к. в большинстве своем реальные задачи этого типа связаны с погодными, климатическими, социальными и другими неопределенностями.

Получаемый результат определяется двумя факторами: выбором альтернативы, осуществляемым ЛПР, и состоянием внешней среды. Допустим, что известен результат для ЛПР (выраженный количественно) при каждой альтернатива  () и состояния внешней среды  (). Обозначив его через , получим матрицу , которую называют матрицей выигрышей или матрицей потерь (см. табл. 1.1), в зависимости от того, максимизируется или минимизируется результат для ЛПР.

 

Таблица 1.1. Матрица выигрышей (матрица потерь)

Состояния
внешней среды

Альтернативы решения

… … … … … … … … … … … … … …

 

В условиях неопределенности ЛПР при выборе альтернативы руководствуется, с одной стороны, своим рисковым предпочтением, а с другой – соответствующим критерием выбора из всех альтернатив на основе составленной им матрице выигрышей.

Рассмотрим пример построения матрицы выигрышей.

Пример 1.1. Владелец небольшого магазина в начале каждого дня закупает для реализации некий скоропортящийся продукт, по цене 50 руб./ед. Цена реализации этого продукта в течение дня 60 руб./ед. Из наблюдений известно, что спрос на этот продукт за день может быть равен 1, 2, 3 или 4 ед. Если продукт за день не продан, то в конце дня его всегда покупают по цене 30 руб./ед.

Для данного примера состояния внешней среды описываются спросом на рассматриваемый продукт:

ед., ед., ед., ед.

Альтернативные решения в этом случае будут представлять собой объем ежедневной закупки продукта:

ед., ед., ед., ед.

В качестве выигрыша владельца магазина рассмотрим ежедневный доход с продажи продукта:

                                          (1.1)

По данным примера 1.1 имеем, что каждая реализованная в течение дня единица приносит доход 60 – 50 = 10 руб./ед., а каждая реализованная в конце дня единица приносит доход 30 – 50 = –20 руб./ед. (то есть убыток).

Таким образом, с использованием формулы (1.1) можно получить матрицу выигрышей, представленную в табл. 1.2.

 

Таблица 1.2. Матрица выигрышей (матрица потерь) для примера 1.1

Состояния
внешней среды
(спрос)

Критерий азартного игрока

Данный критерий является диаметральная противоположность принципу максимина. В основе критерий азартного игрока лежит основополагающая гипотеза о поведении внешней среды - среда благоприятствует ЛПР. Таким образом, ЛПР, имея возможность в некоторой степени управлять ситуацией, рассчитывает, что произойдет такое развитие ситуации, которое для него является наиболее выгодным. В этом случае каждая альтернатива характеризуется наиболее благоприятным исходом. При использовании матрицы выигрышей каждая альтернатива  () оценивается исходом, дающим наибольший выигрыш:

.                                                                     (1.4)

Лучшей альтернативой является та, у которой максимальный элемент наибольший. Формально это означает, что оптимальной альтернативой является -я альтернатива, дающая экстремум выражению:

.                                                (1.5)

Таким образом, при использовании этого критерия делается ставка на наиболее выгодный случай, т.е. становятся на точку зрения азартного игрока.

Критерий азартного игрока допустим в случаях очень низкого риска, а также когда выигрыш намного превышает возможные потери.

Пример 1.3. В примере 1.1 с использованием критерия азартного человека определить, сколько единиц продукта должен закупать владелец магазина каждый день.

В каждом столбце (то есть для каждого возможного решения) находим максимальное число. Это числа 10, 20, 30, 40 соответственно. Запишем их в строке “Показатель эффективности” табл. 1.4.

 

Таблица 1.4. Принятие решений по критерию азартного человека

Состояния
внешней среды
(спрос)

Критерий Гурвица

В этом критерии предпринята попытка объединить достоинства критерия Вальда и критерия азартного игрока. Это самый универсальный критерий, который позволяет управлять степенью “оптимизма – пессимизма” ЛПР путем расчета показателя эффективности стратегии , который находится между точками зрения крайнего оптимизма и крайнего пессимизма. Для этого вводится некий коэффициент , который называется коэффициентом доверия или коэффициентом оптимизма. Выбор коэффициента доверия – процесс субъективный. Исходя из этого, наихудший вариант можно ожидать с вероятностью () – коэффициент пессимизма. Коэффициент оптимизма  показывает, насколько ЛПР может управлять ситуацией и в той или иной степени рассчитывает на благоприятный для него исход. Таким образом, данный коэффициент можно интерпретировать как вероятность, с которой произойдет наилучший для ЛПР исход. Если вероятности благоприятной и неблагоприятной ситуации для ЛПР равны, то следует принять = 0,5.

Для реализации критерия Гурвица определяются наилучшие и наихудшие значение каждой альтернативы по формулам (1.3), (1.4). Далее, вычисляются показатели эффективности как средневзвешенные между наилучшим и наихудшим значением, где весами выступают соответствующие коэффициенты оптимизма и пессимизма:

.                                                   (1.6)

С использованием формулы (1.2) выбирается та альтернатива, для которой функция полезности максимальна.

Пример 1.4. В примере 1.1 с использованием критерия Гурвица определить, сколько единиц продукта должен закупать владелец магазина каждый день.

Сначала найдем эффективное решение, приняв коэффициент доверия = 0,5.

 

Таблица 1.5. Принятие решений по критерию Гурвица

Состояния
внешней среды
(спрос)

Критерий Лапласа

Еще одно возможное предположение о поведении внешней среды - среда нейтральна к ЛПР и, следовательно, все состояния среды появляются с одинаковой вероятностью. Поэтому, для принятия решения, необходимо рассчитать показатель эффективности  для каждой альтернативы, равный среднеарифметическому показателей привлекательности по каждому состоянию природы:

.                                                                   (1.7)

Критерий Лапласа по используемой гипотезе получил название нейтрального критерия.

Пример 1.5. В примере 1.1 с использованием критерия Лапласа определить, сколько единиц продукта должен закупать владелец магазина каждый день.

 

Таблица 1.7. Принятие решений по критерию Лапласа

Состояния
внешней среды
(спрос)

Критерий произведений

Критерий произведений тоже применяется при принятии решения в условиях неопределенности. Это более нейтральный критерий по сравнению с принципом максимина и критерием азартного игрока. Критерий произведений производит некое выравнивание между большими и малыми значениями . Критерий произведений применим только к матрицам выигрышей с положительными элементами.

Показатели эффективности стратегии  по критерию произведений находится по формуле:

, .                                              (1.9)

Если условие  нарушается, то тогда все элементы функции реализации увеличивают на некоторую константу  (). Константу  часто определяют соотношением:

.                                                              (1.10)

Пример 1.7. В примере 1.1 с использованием критерия произведений определить, сколько единиц продукта должен закупать владелец магазина каждый день.

Поскольку матрица выигрышей содержит отрицательные элементы, то необходимо увеличить все элементы матрицы на величину . Тогда получим новую матрицу для принятия решений, представленную в табл. 1.8.

 

Таблица 1.8. Принятие решений по критерию произведений

Состояния
внешней среды
(спрос)

Критерий Сэвиджа

Сэвидж предложил ввести в рассмотрение новую матрицу, элементы которой определяются по формуле:

.                                                            (1.11)

Для понимания этого критерия величины  можно трактовать как дополнительные выигрыши (или как сожаления, что упущены выигрыши). Эти выигрыши были бы получены, если бы при состоянии внешней среды  вместо альтернатив  () была выбрана альтернатива  (), для которой справедливо выражение  Величины  можно трактовать и как штрафы, на которые наказывается ЛПР, выбирающее неоптимальные решения. Фактически исходная матрица выигрышей  соотношением  преобразуется в матрицу , которая называется матрицей сожалений, где каждый элемент  выражает сожаление ЛПР по поводу того, что он не выбрал наилучшего решения.

При принятии решений в условиях неопределенности и предположении, что среда враждебна, каждая альтернатива с помощью соотношения

.                                                                     (1.12)

характеризуется возможным максимальным штрафом или сожалением.

Затем с помощью операции минимума выбирается альтернатива, минимизирующая негативные последствия при любых возможных состояниях внешней среды. Оценка эффективности по критерию Сэвиджа находится по формуле:

.                                                                     (1.13)

Таким образом, к матрице сожалений применяется критерий минимакса.

Пример 1.8. В примере 1.1 с использованием критерия Сэвиджа определить, сколько единиц продукта должен закупать владелец магазина каждый день.

Преобразуем исходную матрицу выигрышей в матрицу сожалений по формуле (1.11) (см. табл. 1.9).

 

Таблица 1.9. Принятие решений по критерию Сэвиджа

Состояния
внешней среды
(спрос)

Цель занятия

Освоить и закрепить практические навыки по разработке, принятию и обоснованию управленческих решений в условиях риска с использование классических критериев, а также с использованием критериев с сожалениями.

 

Теоретический материал

Математическая модель задачи принятия решения представляет собой формальное описание цели, средств, результатов, а также способа связи средств и результатов. Для формального описания средств и результатов задают множество  альтернатив и множество  исходов. Альтернативы - это то, что выбирает лицо принимающее решение, а исходы - то, к чему они приводят.

В задачах принятия решений с конечными множествами  и  существует несколько типов зависимости исходов от альтернатив. В данной лабораторной работе рассматривается тип связи, который предполагает, что каждая альтернатива может привести к одному из нескольких исходов, каждый из которых имеет определенную вероятность появления. Эта вероятность определяется двумя факторами: выбором альтернативы, осуществляемым ЛПР, и состоянием внешней среды. Обозначим множество всех состояний внешней среды через , тогда каждый исход  в силу сказанного есть функция двух аргументов: , где  () - выбранная альтернатива, () - состояние внешней среды.

Функцию  называют функцией реализации. Если множество альтернатив и множество состояний среды конечны, то удобно представлять функцию реализации в виде таблицы (табл. 2.1). Эта таблица для конкретных рассматриваемых задач определяет все их возможные решения, поэтому ее часто называют матрицей решений. Эти решения (исходы) должны допускать количественную оценку.

Рассмотрим матрицу решений для ситуаций, когда ЛПР знает вероятности  появления каждого состояния () внешней среды. В этом случае, если выбрана альтернатива , то для каждого исхода  можно найти вероятность  его наступления. Для этого нужно отметить в -й столбце табл. 1.2 все клетки, где стоит исход , и просуммировать вероятности соответствующих столбцов. Таким образом, каждой альтернативе соответствует вероятностная мера на множестве исходов; следовательно, получаем задачу принятия решения в стохастических условиях или в условиях риска.

 

Таблица 2.1. Матрица решений

F (x, y) ... ...
... ...
... ... ... ... ... ...
... ...
... ... ... ... ... ...
... ...

 

Необходимо отметить, что наиболее плохо формализуемой процедурой является оценка вероятностей состояний. Широко распространенными способами являются:

- субъективный подход системных аналитиков;

- объективный подход, основанный на анализе физических явлений;

- экспериментальный подход;

- оценочный подход к распределению вероятностей;

- применение для известных функций распределения экспертных оценок количественных параметров.

Субъективная вероятность состояния отражает степень уверенности системного аналитика в том, что рассматриваемое состояние наступает, и в ее основе лежит готовность лица, принимающего решения, действовать в соответствии с этой уверенностью. При оценке аналитиком субъективной вероятности состояния учитываются знания о физических явлениях, эмпирические данные, результаты моделирования физических явлений, экспертные суждения различных лиц и др.

Объективные вероятности основаны на применении различных комбинаторных схем и подтверждаются исчерпывающими экспериментами.

Экспериментальная оценка вероятности основывается на результатах испытаний.

Суть оценочного подхода состоит в том, что эксперту предлагается найти значение случайной величины, имеющей вероятность, равную 0,5, затем вероятности 0,25 и 0,75. На основе этих суждений формируется закон распределения случайной величины.

Наиболее перспективным является применение известных функций распределения случайной величины: эксперту предлагается оценить только одну либо две количественные характеристики выбранной функции или закона распределения. Например, выбран биноминальный закон распределения: эксперту предлагается дать оценку математического ожидания и дисперсии. Тогда вероятности состояний рассчитываются в соответствии с выбранным биноминальным законом распределения.

Пример 2.1. Модифицируем пример 1.1: пусть известно, что на практике спрос в одну единицу наблюдался 15 раз, спрос в две единицы наблюдался 30 раз, спрос в три единицы наблюдался 30 раз, спрос в 4 единицы наблюдался 25 раз.

Известные данные о том, сколько дней наблюдался тот или иной спрос на продукт, представляют собой частоту каждого из возможных состояний внешней среды.

Всего было 100 наблюдений (15+30+30+25). Определим относительную частоту (или вероятность) каждого состояния среды по формуле:

, .                              (2.1)

Составляем таблицу 2.2 вероятностей состояний внешней среды (спроса).

 

Таблица 2.2. Вероятности спроса

Возможный спрос 1 2 3 4 Сумма
Частота 15 30 30 25 100
Вероятность р 0,15 0,30 0,30 0,25 1

 

Критерий Байеса

По данному критерию предполагается полное доверие лица принимающего решения известным вероятностям  () состояний окружающей среды ().

Показатель эффективности стратегии  () по критерию Байеса находится по формуле:

.                               (2.5)

Заметим, что  – это математическое ожидание стратегии , поэтому критерия также называется критерий математического ожидания.

Применение критерия Байеса предполагает выполнение следующих условий:

- точное знание вероятностей появления состояний внешней среды;

- независимость вероятностей появления состояний внешней среды от времени;

- реализация решений (по крайней мере, теоретически) бесконечное число раз.

При выполнении этих условий критерий Байеса является абсолютно надежным критерием, исключающим какой-либо риск. Нарушение указанных условий делает критерий Байеса рискованным.

Пример 2.3. В примере 2.1 с использованием критерия Байеса определить, сколько единиц продукта должен закупать владелец магазина каждый день.

По формуле (2.5) с использованием вероятностей, полученных в ходе решения примера 2.1, определяем показатели эффективности для каждой стратегии. Результаты расчета приведены в табл. 2.4.

 

Таблица 2.4. Принятие решений по критерию Байеса

Состояния
внешней среды
(спрос)

Критерий Ходжа-Лемана

Критерий Байеса дает более оптимистичные прогнозы, чем критерий Вальда, однако он предполагает и более высокий уровень информированности, и многократные реализации.

Критерий Байеса надежен только тогда, когда точно известны вероятности появления состояний внешней среды, однако на практике точные цифры, как правило, отсутствуют. Это ослабляет доверие к критерию и заставляет обращаться к более надежному критерию Вальда, который гарантирует определенный минимум. Этот гарантированный минимум можно попытаться увеличить за счет использования взвешенной линейной комбинации рассматриваемых критериев.

Критерий Ходжа-Лемана привносит фактор определенной субъективности при принятии решения. У ЛПР есть некое недоверие к распределению вероятностей состояний окружающей среды. Поэтому вводится коэффициент доверия  кб вероятностям состояний окружающей среды . Этот коэффициент еще называют уровнем оптимизма.

Показатель эффективности стратегии  по критерию Ходжа-Лемана находится по формуле:

.              (2.10)

С помощью параметра , с одной стороны, выражается степень доверия к используемому распределению вероятности, а с другой - степень нежелательности появления очень малых значений. Если степень доверия велика и число реализаций принятого решения значительно, то акцентируется критерий Байеса, в противном случае предпочтение отдается критерию Вальда. Поскольку числовая оценка степени доверия к используемому распределению вероятности и степени нежелательности появления малых значений обычно затруднена, то выбор параметра , как правило, субъективен. Во многих случаях полагают, что . При  критерий Ходжа-Лемана переходит в критерий Байеса, а при  превращается в критерий Вальда.

 


Линейное программирование

В теории принятия решений большое место занимают оптимизационные задачи. Среди них наиболее известны задачи линейного программирования, в которых максимизируемая функция  является линейной, а ограничения  задаются линейными неравенствами.

Из всех задач оптимизации задачи линейного программирования выделяются тем, что в них ограничения – системы линейных неравенств или равенств. Ограничения задают выпуклые линейные многогранники в конечном линейном пространстве.

Впервые такие задачи решались советским математиком Л.В. Канторовичем (1912-1986) в 1930-х годах как задачи производственного менеджмента с целью оптимизации организации производства и производственных процессов, например, процессов загрузки станков и раскройки листов материалов. После второй мировой войны аналогичными задачами занялись в США. В 1975 г. Т. Купманс (1910-1985, родился в Нидерландах, работал в основном в США) и академик АН СССР Л.В. Канторович были награждены Нобелевскими премиями по экономике.

Формы записи ЗЛП

Общая форма записи.

Целевая функция:

или

Обозначим . Тогда , где , .

Ограничения – неравенства:

или

, где

Ограничения – равенства:

или

, где

Итак, общая форма записи ЗЛП:

Стационарная или основная форма записи. Отсутствуют ограничения – равенства.

3. Каноническая форма записи ЗЛП. Отсутствуют ограничения – неравенства.

Замечание:

1. Если имеем ЗЛП с максимизацией целевой функции, то есть  то она эквивалентна задаче .

2. Допустимое множество U является выпуклым множеством для всех поставленных задач.

3. От одной формы записи всегда можно перейти к другой.

 

Пример. Производственная задача

Цех может производить стулья и столы. На производство стула идет 5 единиц материала, на производство стола – 20 единиц (футов красного дерева). Изготовление стула требует 10 человеко-часов, стола – 15. Имеется 400 единиц материала и 450 человеко-часов. Прибыль при производстве стула – 45 долларов США, при производстве стола – 80 долларов США. Сколько надо сделать стульев и столов, чтобы получить максимальную прибыль?

Обозначим:  – число изготовленных стульев,  – число сделанных столов.

Задача оптимизации имеет вид:

, (1)
, (2)
, (3)
, (4)
. (5)

Целевая функция (1) – прибыль при выпуске  стульев и  столов. Ее требуется максимизировать, выбирая оптимальные значения переменных  и . При этом должны быть, выполнены ограничения по материалу (2) – истрачено не более 400 футов красного дерева. А также и ограничения по труду (3) – затрачено не более 450 часов. Кроме того, нельзя забывать, что число столов и число стульев неотрицательны. Если , то это значит, что стулья не выпускаются. Если же хоть один стул сделан, то  положительно. Но невозможно представить себе отрицательный выпуск, поскольку  не может быть отрицательным с экономической точки зрения, хотя с математической точки зрения такого ограничения усмотреть нельзя. Ограничения (4) и (5) констатируется, что переменные неотрицательны.

Условия производственной задачи можно изобразить на координатной плоскости. Будем по горизонтальной оси абсцисс откладывать значения , а по вертикальной оси ординат – значения . Тогда ограничения по материалу (2) и ограничения (4), (5) оптимизационной задачи выделяют возможные значения вектора  объемов выпуска в виде треугольника (рис. 1).

Рис. 1. Допустимое множество решений, построенное с учетом ограничений (2), (4), (5)

 

Таким образом, ограничения по материалу изображаются в виде выпуклого многоугольника, конкретно, треугольника. Этот треугольник получается путем отсечения от первого квадранта примыкающей к началу координат зоны. Отсечение проводится прямой, соответствующей второй строке исходной задачи, с заменой неравенства на равенство. Прямая пересекает ось , соответствующую стульям, в точке (80, 0). Это означает, что если весь материал пустить на изготовление стульев, то будет изготовлено 80 стульев. Та же прямая пересекает ось , соответствующую столам, в точке (0, 20). Это означает, что если весь материал пустить на изготовление столов, то будет изготовлено 20 столов. Для всех точек внутри треугольника выполнено неравенство, а не точное равенство – материал останется.

Аналогичным образом можно изобразить и ограничения по труду (3) (см. рис. 2).

Рис. 2. Допустимое множество решений, построенное с учетом ограничений (3), (4), (5)

 

Таким образом, ограничения по труду, как и ограничения по материалу, изображаются в виде треугольника. Этот треугольник также получается путем отсечения от первого квадранта примыкающей к началу координат зоны. Отсечение проводится прямой, соответствующей третьей строке исходной задачи, с заменой неравенства на равенство. Прямая пересекает ось , соответствующую стульям, в точке (45, 0). Это означает, что если все трудовые ресурсы пустить на изготовление стульев, то будет сделано 45 стульев. Та же прямая пе

Поделиться с друзьями:

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.148 с.