ГЛАВА 8. ЭЛЕМЕНТЫ ТЕОРИИ ИГР N ЛИЦ
Бескоалиционные игры n лиц
Определение: Бескоалиционной игрой n лиц в нормальной форме называется объект
где – множество чистых стратегий i-го игрока, , – функция выигрыша i-го игрока в ситуации , сложившейся в результате выборов стратегий всеми игроками, .
Определение: Ситуация – называется ситуацией равновесия в бескоалиционной игре , если для каждого выполняется неравенство
Если сложилась равновесная ситуация, то каждому игроку в отдельности невыгодно от неё отклоняться. Если в игре имеется несколько точек равновесия, то разным игрокам может быть выгодно стремиться к разным точкам равновесия, а в результате они могут вообще не попасть в равновесную ситуацию.
Теорема: Если функции выигрыша игроков непрерывно дифференцируемы и точка равновесия является внутренней для множества , то необходимо выполнение условий
Условие теоремы вытекает из условий экстремума, так как в точке равновесия каждая функция достигает максимума по своей переменной при фиксированных остальных переменных. В общем случае необходимо учитывать возможную принадлежность равновесных стратегий границам множеств , для этого надо либо отдельно проверять граничные точки, либо вместо (2) использовать условия неположительности производных по всем допустимым направлениям.
Пример бескоалиционной игры n лиц
Пример. “Модель рынка”
Имеются n участников, которые могут производить некоторый однородный товар и продавать его на рынке. Потенциальные покупатели данного товара имеют все вместе сумму денег равную a. Если i-й участник производит и выставляет на рынке количество товара , то общее предложение
Предполагается, что в результате на рынке складывается такая цена, что весь предлагаемый товар покупается. Это значит, что цена
На производство не накладывается никаких условий, кроме условия неотрицательности, т. е. . Но производство связано с затратами. Возьмем простейший случай, когда затраты линейны, т. е. равны Следовательно, при таких условиях прибыль каждого участника будет определена следующим образом:
Решение. Пусть будет функцией выигрыша участников.
Для определения ситуаций равновесия, лежащих внутри прямого произведения пространств стратегий участников, необходимо найти частные производные по всем переменным от функции при . Получаем:
Преобразуем полученное уравнение:
Умножим каждую часть уравнения на
а затем разделим на константу a
Просуммировав n уравнений (4), получим с учетом одно уравнение определяющее x:
Преобразуем полученное уравнение (5)
т. е.
Следовательно,
Подставляя (6) в (4), получим
При условии
ситуация будет равновесной. Это условие означает близость производственных затрат всех участников. Если же данное условие не выполняется, то некоторые участники могут “выбыть из игры”. Участникам выгодно произвести всем вместе очень мало товара, получив сумму a и практически не произведя затрат. Эту сумму можно распределить так, что все участники получат бóльшую прибыль, чем в точке равновесия. Однако такая ситуация не будет равновесной, т. е. каждому участнику в отдельности выгодно её нарушить. Чтобы подобные ситуации могли выступать в качестве решений, необходимо выйти за рамки бескоалиционных игр.
ГЛАВА 9. БЕСКОНЕЧНЫЕ ИГРЫ
Непрерывные игры
Определение: Класс игр, в которых хотя бы один из игроков имеет бесконечное множество возможных стратегий, называется классом бесконечных игр.
Определение: Непрерывными играми называются бесконечные игры, в которых функции выигрышей непрерывно зависят от стратегий, выбираемых игроками.
Теорема: Если в непрерывной антагонистической игре функция выигрыша первого игрока непрерывна по всем переменным, то у игроков есть оптимальные смешанные стратегии.
Примеры бесконечных игр
Приведем примеры бесконечных игр двух лиц трех видов – непрерывной игры на единичном квадрате, дуэли и дифференциальной игры поиска. Играми с выбором момента времени, или играми типа дуэли, называются игры, характеризующиеся моментом выбора хода и вероятностями получения выигрыша в зависимости от времени, прошедшего от начала игры до момента выбора. В дифференциальных играх допускается делать ходы непрерывно и связывать поведение игроков условиями, описываемыми дифференциальными уравнениями.
Пример. “Борьба за рынки”
Одна из конкурирующих фирм – игрок А – пытается вытеснить другую фирму, игрока В, с одного из двух рынков сбыта. Предположим, что общая сумма средств, выделенная на это игроком А, равна 1.
Решение. Типичной стратегией игрока А является разделение выделенной суммы на две части: для первого рынка и для второго. Подобным образом выглядят и стратегии игрока В: выделение им части своей суммы на первый рынок и на второй.
Будем считать, что если игрок А добился превосходства на одном из рынков (на другом превосходства автоматически добивается игрок В), то он вытесняет противника с этого рынка и получает выигрыш, пропорциональный избытку вложенных средств с коэффициентом, характеризующим важность рынка. Этот коэффициент равен для первого рынка и для второго. Тогда функция выигрыша игрока А определяется формулой
Тогда функция выигрыша игрока В
Пример. “Игра типа дуэли”
Два дуэлянта, игроки А и В, начинают сходиться в момент времени У каждого пистолет заряжен одной пулей. Они встретятся в момент времени , если только ни один из них не застрелит другого раньше. Каждый из дуэлянтов может выстрелить, когда пожелает. Если при этом одному из них удастся поразить противника, а самому остаться невредимым, то он становится победителем, его выигрыш равен 1 и дуэль тут же прекращается. Если оба промахнутся, дуэль закончится вничью, выигрыш каждого из игроков равен 0. Если оба выстрелят одновременно, и каждый поразит противника, то дуэль также считается окончившейся вничью.
Решение. Если игрок А произведет выстрел в момент времени то его выстрел будет успешным с вероятностью Подобным же образом выстрел игрока В в момент времени будет успешным с вероятностью При условии игрок А выигрывает с вероятностью а проигрывает с вероятностью Его средний выигрыш при будет равен
С другой стороны, если его средний выигрыш будет равен
При средний выигрыш
Таким образом, функция выигрыша игрока А имеет вид
и антагонистическая игра задана.
В частности, если игроки стреляют без промаха, тогда
Пример. “Дифференциальная игра поиска”
Ищущий, игрок А, стремится обнаружить уклоняющегося, игрока В. Оба игрока перемещаются с постоянными скалярными скоростями a и b соответственно по плоскости внутри некоторой поисковой области W. В любой момент каждый из игроков управляет своим перемещением, задавая направление вектора скорости.
Решение: Пусть – координаты игроков. Тогда имеем
Игра поиска заканчивается в тот момент, когда игроки сблизятся на расстояние т. е. когда будет выполнено неравенство
В случае успешного обнаружения выигрыш игрока А считается равным 1. Построение решения в этой игре существенно зависит от характера и степени информированности игроков.
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|