Критерии принятия решения в условиях неопределённости.
Системный подход к задачам принятия решения.
Объект управления (управляемая подсистема) воздействует на субъект управления (управляющую подсистему) посредством альтернативных управляющих воздействий.
На состояние объекта оказывают влияние управляющее воздействие + среда (среда не поддаётся воздействию, и полной информации о ней нет).
Наилучшее решение –управляющее воздействие, наиболее соответствующее цели управляющей подсистемы в рамках имеющейся у неё информации о среде.
Основные типы задач принятия решения (ПР):
1. ПР в условиях определённости. (состояние среды неизменно и управляющая система имеет о нём информацию)
2. ПР в условиях риска (известны все возможные состояния среды и распределение их вероятностей)
3. ПР в условиях неопределённости (известны только все возможные состояния среды)
4. ПР в условиях разумности среды (среда - другая управляющая подсистема, ситуация конфликта, игры).
Реализационная структура принятия решения – набор следующих объектов:
- множество допустимых альтернатив управляющего воздействия (АВ)
- множество возможных состояний среды (ССр)
- множество возможных исходов (И)
- функция реализации, определяющая соответствие между парами элементов (АВ; ССр) и элементами исходов.
Функция реализации задаётся платёжной матрицей. в которой строки соответствуют альтернативным стратегиям, а столбцы – множеству различных состояний среды. Элементы матрицы – исходы.
Оценочная структура принятия решения - указывает оценку результата с точки зрения принимающего решения. Способы задания оценочной структуры:
- оценочные функции, определяющие ценность исходов
- разбиение исходов на классы предпочтений и т.д.
Этапы исследования ЗПР:
1. построение математической модели ЗПР
2. Формулировка принципа оптимальности и нахождение оптимального решения.
3. анализ полученных результатов.
2. Выработка решения в условиях риска. Критерий ожидаемого выигрыша.
Задача описывается матрицей решений (платёжной матрицей), в которой строки соответствуют альтернативным стратегиям ЛПР (лица, принимающего решение), а столбцы – множеству различных состояний среды. Элементы матрицы – исходы, или отдачи от применения различных стратегий соответствующих различным состояниям среды.
Задачи принятия решений в условиях риска характеризуются наличием стохастической информации о состояниях среды (как правило, известны вероятности этих состояний).
Будем считать отдачу от i-той стратегии дискретной случайной величиной, принимающей свои значения с вероятностями, равными вероятностям различных состояний среды.
Тогда предполагаемая стоимость стратегии в условиях риска равна матожиданию исходов (отдач) стратегии, т.е. сумме произведений отдач на вероятности состояний среды, при которых они поступают.
E(Si)=
Критерий ожидаемого выигрыша:
ЛПР принимает стратегию с самой высокой предполагаемой стоимостью E(Si).
Если есть несколько стратегий с одинаковой предполагаемой стоимостью из них выбирают стратегию с наименьшим риском.
Степень риска – показатель разброса отдачот стратегииотносительно ожидаемого среднего значения.
Грубый способ оценки риска - размах – разность между наибольшей и наименьшей отдачей от стратегии.
R=xmax -xmin
Более точная оценка риска – среднеквадратическое отклонение отдач от стратегии (чем выше риск, тем больше дисперсия). где
Относительный риск – отношение среднеквадратического отклонения к предполагаемой стоимости
Индекс риска – относительный риск, увеличенный в сто раз.
Критерии принятия решения в условиях неопределённости.
Задача описывается матрицей решений (платёжной матрицей), в которой строки соответствуют альтернативным стратегиям ЛПР (лица, принимающего решение), а столбцы – множеству различных состояний среды. Элементы матрицы – исходы, или отдачи от применения различных стратегий соответствующих различным состояниям среды.
1. Критерий оптимиста (максимакс) – выбирают стратегию, наилучший результат которой лучше наилучших результатов других стратегий.
2. Критерий пессимиста (Вальда) (максимин) – выбирают стратегию, наихудший результат которой лучше наихудших результатов других стратегий.
3 Критерий компромисса с заданным коэффициентом оптимизма (Гурвица)
Для каждой стратегии определяют компромиссный результат как сумму наихудшего и наилучшего, взятых с коэффициентами α и (1-α). (α-коэффициент оптимизма). Выбирают стратегию с наилучшим компромиссным результатом.
α J +(1-α) L = K
4. Критерий недостаточного основания Лапласа (максимизация среднего отклика) – выбирается стратегия с наилучшим средним арифметическим откликов (результатов).
E(Si) /m
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|