Рефлексивные многочлены, порождающие дилемму заключенного

Предыдущая 1 2 345 6 7 8 9 10 11 12 13 14 15 16 Следующая

Дилемма заключенного является превосходной моделью, показывающей, что существуют ситуации, когда обыденные представления о рациональном поведении оказываются неприменимыми. Известный американский исследователь Анатоль Рапопорт полагает, что дилемма заключенного принадлежит к тем парадоксам, которые «иногда появляются на интеллектуальном горизонте, как предвестник важных научных и философских открытий» [26].

Дилемма, открытие которой приписывается американскому исследователю Таккеру, заключается в следующем. Двух подозреваемых берут под стражу и изолируют друг от друга. Прокурор убежден в том, что ими совершено серьезное преступление, но не имеет достаточных доказательств для предъявления им обвинения. Каждому заключенному говорится, что у него имеется альтернатива: признаться в преступлении или не признаться.

Если оба не признаются, то прокурор предъявит им обвинение в каком-либо незначительном преступлении, например, в незаконном хранении оружия, и оба получат небольшое наказание; если они оба признаются, то суд накажет обоих, но прокурор не потребует самого строгого приговора; если же один признается, а другой будет упорствовать, то признавшемуся приговор будет смягчен за выдачу сообщника, в то время как непризнавшийся получит самое строгое наказание. Любое решение, которое примет заключенный, неудовлетворительно с точки зрения рациональности, действительно, если он примет решение не признаваться, а его партнер признается, то он понесет значительный ущерб. Если же он признается, а партнер будет молчать, то он также понесет ущерб, по сравнению со случаем, если бы он не признался.

Мы попытаемся проанализировать некоторые рефлексивные механизмы, которые, как нам представляется, порождают эту дилемму, но построим другой пример, который облегчит анализ.

Представим себе следующую условную ситуацию. Пусть Х и Y — противники, вооруженные пистолетами. Если Х застрелит Y, то Х получит рубль. Если Y застрелит X, то Y получит рубль. Игроки не несут ни морального, ни юридического ущерба, если оказываются «убийцами». Решение игроки принимают независимо и не могут связаться друг с другом. Спрашивается, как они должны поступить. Х проводит такое рассуждение:

«Предположим, я выстрелю; тогда я либо выиграю рубль, либо погибну. Если я не выстрелю, я наверняка не выиграю рубль, но вероятность моей гибели не станет от этого меньше. Ведь мой противник принимает решение совершенно независимо ... Но противник проведет точно такое же рассуждение и тоже нажмет на спусковой крючок. Может быть, если я не нажму на крючок, то и он не нажмет на крючок... Нет, не проходит, ведь наши решения не связаны. Конечно, нам обоим выгодно не нажимать на спуск. Это он выведет. Он так и поступит! Ага, я выстрелю тогда и выиграю рубль. Но к такому же решению придет и он...».

В выделенном тексте приведено рассуждение игрока, который пытается принять решение, и сталкивается с непрерывными противоречиями. Оба варианта решения одинаково неубедительны. Чтобы выявить причину парадокса, представим себе следующую ситуацию: пусть те двое, вооруженные пистолетами, разделены перегородкой из тонкой зеркальной фольги, которая не является препятствием для пули. Х «видит» своего противника. Х медленно поднимает пистолет и видит, что модель противника также поднимает пистолет, и на лице модели появляется угрожающее выражение. Х понимает, что если он нажмет на крючок, то и модель нажмет на крючок. Поскольку эта модель—единственное средство прогнозировать поведение своего противника, то свой выстрел порождает и выстрел модели. Х медленно опускает пиcтолет. Противник также медленно опускает пистолет. «Я сейчас обману противника, — думает X, — он наверняка пользуется такой же моделью», — и тут же видит хитроватое выражение на лице модели и предупредительное движение пистолета.

Текст рассуждения, приведенный ранее, является порождением именно такой ситуации с зеркалом, когда сам игрок используется как модель своего противника. Любая мысль, которая приходит ему в голову, автоматически приходит в голову его сопернику. Они стоят друг перед другом и синхронно рассуждают, синхронно читают мысли друг друга. Игрока X, принимающего решение по такой схеме, можно изобразить следующим многочленом:

Qn=T+(Tx+Ty)x+{Tyx+Txy}x+(Txyx+Tyxy)x+ . .

Каждая картина с позиции X, лежащая перед ним самим, лежит и перед его партнером. С помощью внешнего множителя рефлексивный процесс, сохраняющий подобную симметрическую структуру «внутри» персонажа Х выразить невозможно. Мы должны ввести «вложенные» операторы осознания. Формально многочлен можно переписать так:

Q_n=T+[T(1+x+y)ⁿ]x.

Независимо от значения п внутренний мир персонаж Х будет представлять собой симметрический многочлен. Любое решение, которое выработал персонаж X, автоматически принимается его противником. Если Х принимает решение стрелять, то и противник принимает решение стрелять. Аналогично, если Х принимает решение не стрелять, то и противник принимает решение не стрелять, но тогда Х принимает решение стрелять, которое немедленно принимается противником. Таким образом, мы видим, что дилемма порождается тождественностью решений, которые принимают противники во внутреннем мире X.

Представляется очень важным точно сформулировать вопрос: перед кем стоит дилемма? Часто путают подлинную дилемму, которая в подобных ситуациях возникает перед игроком, с задачей, стоящей перед исследователем операций, который должен рекомендовать оптимальное решение.

Оптимальное решение в условиях дилеммы заключенного невозможно. Отсутствие возможности найти оптимальное решение само по себе не является парадоксом. Парадокс возникает перед игроком, который, имея определенную модель противника, принимает оптимальное решение, которое сразу же оказывается убийственным для него. Обратим внимание, что если бы игрок Х был «устроен» иначе, например, был бы «вооружен» оператором осознания w =1+x+ух, который бы приводил его в состояние

Q=T+(Q+Qy)x ,

то никакой дилеммы перед ним не возникало бы. Он должен стрелять. Действительно, предположим, что игрок Х принял решение не стрелять; поскольку Y - «всевидящий глаз», читающий его мысли, то он примет решение стрелять, чтобы выиграть рубль. Поэтому ему остается только другая альтернатива - стрелять. При этом, с позиции X, решение Y не определено. Мы ведь не предполагаем, что противники исповедуют принцип «зло за зло»^*.

Таким образом, мы приходим к выводу, что дилемма порождается симметрической рефлексивной структурой внутреннего мира игрока.

Дилемму заключенного нельзя разрешить, но ее можно объяснить.

Рассмотрим следующий многочлен по негативной формой.

Q=T+(T+Tx^з}x+(T+Tx+Tx²+Ty)y.

Как обычно, мы предполагаем, что такова система Q с позиции внешнего исследователя. Поставим задачу—сравнить «внутренние миры» персонажей с картиной, лежащей перед исследователем. Для этого построим следующую таблицу. (см. выше)

Пустые клетки второй и третьей строк соответствуют членам, которые присутствуют с позиции внешнего исследователя, но отсутствуют во внутренних мирах соответствующих персонажей. Из таблицы видно, что у персонажей Х и }' есть еще «лишние» члены, которых нет в многочлене с позиции внешнего исследователя: это Тх³и Тх².

Условимся особым образом изображать члены, которые «неизвестны» персонажам. Член Тх «неизвестен» персоналу X, поскольку его внутренний мир содержит только два члена Т и Тх³. Условимся этот факт фиксировать следующим образом: Тхх^-. Читается это так:

«Тх не лежит перед X».

Аналогично обозначим «неизвестность» персонажу Х остальных элементов:

Тх⁴х^-, Тух^-, Тхух^-, Тх²ух,Ty²x^-

Члены, неизвестные персонажу Y, обозначим соответственно Tx⁴y, Txyy^-, Тх²уу, Ту²у^-.

Теперь мы можем дополнить многочлен Q. этими членами и, распространив на х^- и у^- закон дистрибутивности и вынеся их за скобку, получим

Q*=T+(T+Tx³}x+(T+Tx+Tx²+Ty)y+

+ (Tx⁴+Ty+Txy+Tx²y+Ty²)x^-+ (Тх⁴+Тху+Тх²у+Ту²)y^-.

Легко видеть, что каждый конечный многочлен Q может быть представлен в виде

Q*=T+Q¹x+Q²y+Q³x^-+Q4y^-.

Такая запись позволяет фиксировать не только содержимое «внутренних миров», но и члены, которые отсутствуют во внутреннем мир персонажа, но присутствуют в системе с позиции внешнего исследователя.

Часть многочлена Q*, представляющую собой многочлен и, мы будем называть позитивной формой, сумму Q³x^-+Q⁴y^- - соответственно, негативной.

Предыдущая 1 2 345 6 7 8 9 10 11 12 13 14 15 16 Следующая

Не нашли, что искали? Воспользуйтесь поиском по сайту: