利用博弈思想分析扑克游戏

(整期优先)网络出版时间:2020-10-12
/ 2

利用博弈思想分析扑克游戏

纪 强

身份证号: 231083198501**** ,海林 市 ,157100

摘要:博弈论又称对策论,是使用严谨的数学模型研究现实世界冲突对抗条件下最优决策问题的理论。从博弈论观点看,扑克这个传统游戏是一个2人博弈,在性质上属于非合作的、零和的、静态的、完全信息博弈。利用博弈思想求出扑克游戏中相应的支付函数、策略集、纳什均衡解,从而得出游戏的某些步上可以存在绝对安全的策略。

关键词:博弈论;扑克博弈;策略;博弈支付;纳什均衡

Abstract:Game Theory, also known as game theory, is the use of rigorous mathematical model of the real world under the conditions of the conflict against the theory of optimal decision-making. Looking from the game theory viewpoint, the playing cards this tradition game is one 2 people gambles, belongs to the non-cooperation, zero in the nature and, the static state, complete information gambling. Extracts in the playing cards game using the gambling thought the corresponding payment function, the strategy collection, the Nash balanced solution, thus obtains the game certain on step to be possible to have the absolute safety the strategy.

Key words: game theory; poker game; strategy; game pay; Nash equilibri

本文首先介绍了利用博弈思想解决扑克游戏并将其推广到社会各个领域。在扑克博弈中总体上不存在必胜策略,但某些步上可以存在绝对安全的策略,我们通过求出博弈支付函数、构造博弈矩阵进而求解纳什均衡解,进而给出扑克游戏局中人最优策略的一致性预测。最终形成对可选策略的适合度评价,从而根据此评价选择合适的纳什均衡。

案例介绍:通过下面这个案例来利用博弈思想分析扑克游戏:A、B两人玩一种游戏:从标记为1、2、3的三张牌中各抽一张,并彼此互相保密。每人抓到1、2、3中任何一张可均选择不叫(pass,简写为p)或打赌(bet,简写为b)。试分别列出A、B两人各自的策略集,相应的收益函数,找出纳什均衡解。

一、扑克游戏的博弈支付模型

A、B两人玩一种游戏:从标记为1、2、3的三张牌中各抽一张,并彼此互相保密。每人抓到1、2、3中任何一张可均选择不叫(pass,简写为p)或打赌(bet,简写为b)。游戏规则分别列出A、B两人各自和策略集,相应的收益函数,找出纳什均衡解。

1.扑克游戏的博弈支付的合理性分析

第一局A第一轮抽到三张牌中的一张,A决定过,B也抽到剩下两张牌中的一张,B决定过,两人亮牌,牌大者赢对方1元;第二局A第一轮抽到一张牌,A决定过,B决定赌,第二轮A还是决定过,这样无须亮牌,A付给B 1元;第三局A第一轮抽到一张牌A决定过,B决定赌,第二轮A决定跟赌,赌注翻倍,两人亮牌,牌大者赢对方2元;第四局A第一轮抽到一张牌A决定赌,B抽完牌B决定过,第二轮B决定过,无须亮牌,B就付给A 1元;第五局的第一轮A抽到一张牌,A决定赌,B抽完牌,决定赌,赌注翻倍,两人亮牌,牌大者赢对方2元。

2.收益函数的分布求解

这是一个完全信息的动态的二人博弈。考虑到A,B各自抽完牌,有大有小,当抽到大牌时有两种玩牌策略、抽到小牌时也有两种牌策略,因此每人有四种策略。局中人A的策略集为5f83b21adfc58_html_94513f4b37eed6ad.gif5f83b21adfc58_html_c4323a30e4169d03.gif5f83b21adfc58_html_36d9a89d8b0b0a0e.gif5f83b21adfc58_html_6d2723dcba2fc71.gif 分别表示A的策略是(p)时牌大、牌小;A的策略是(b)时牌大、牌小。局中人B的策略集为5f83b21adfc58_html_fc44195b7193af51.gif5f83b21adfc58_html_342f6a4bfa80cb8e.gif5f83b21adfc58_html_25bcdbb01f5e3b3b.gif5f83b21adfc58_html_87c9c27f1b802f0c.gif 分别表示B策略是(p)时牌大、牌小;B的策略是(b)时牌大、牌小。5f83b21adfc58_html_ffae042c741e4150.gif 为局中人A采用的策略5f83b21adfc58_html_1b64a4dcef8b7856.gif 、局中人B采用的策略 5f83b21adfc58_html_771539536473ef64.gif 时A的收益(这时局中人B的收益为-5f83b21adfc58_html_ffae042c741e4150.gif )。当在第一局中A使用策略5f83b21adfc58_html_94513f4b37eed6ad.gif ,B用5f83b21adfc58_html_fc44195b7193af51.gif 策略时,A在游戏中可能赢得(1,-1)。类似的可以求出所有策略组合情况下局中人的期望赢。

局人都在一开始就确定自己的策略,并不允许在观察到对方行动后作 出娈化,则B方的策略有放弃(p)和赌(b);A方策略一是放弃(p),二是赌(b),在给予B放弃(p)时,针对B的策略有:B放弃(p)、B赌(b)。B放弃(p),且A牌最大(1,-1);B赌(b),A依然放弃(p)时(-1,1)。在给予B赌(b)时,针对B的对策:B放弃(p)时(1,-1),B赌(b)时,A牌大(2,-2),A牌小(-2,2)。

3.扑克游戏局中人的策略集

A的策略5f83b21adfc58_html_c4323a30e4169d03.gif 劣于5f83b21adfc58_html_94513f4b37eed6ad.gif5f83b21adfc58_html_c4323a30e4169d03.gif 劣于5f83b21adfc58_html_5257119bc0405395.gif ,,依据最大最小最大原则求解,因

5f83b21adfc58_html_fc68f4fe2dbe8e85.gif =max[min(2,1);min(2,4)]=max[1,2]=2

设局中A分别以5f83b21adfc58_html_a37895b7f508930f.gif5f83b21adfc58_html_a0c6188bad0662c3.gif5f83b21adfc58_html_85cda7437dfc26ba.gif 的概率使用5f83b21adfc58_html_94513f4b37eed6ad.gif5f83b21adfc58_html_36d9a89d8b0b0a0e.gif5f83b21adfc58_html_5257119bc0405395.gif 三个策略,局中人B分别以5f83b21adfc58_html_d0031e1c1aaf27f7.gif5f83b21adfc58_html_c5aa4c56f14577d.gif5f83b21adfc58_html_e17ddebb6282722c.gif 的概率使用5f83b21adfc58_html_fc44195b7193af51.gif5f83b21adfc58_html_25bcdbb01f5e3b3b.gif5f83b21adfc58_html_87c9c27f1b802f0c.gif 三个策略,则可分别定出如下线性规划:

5f83b21adfc58_html_771ee52c3aff8d8e.gif :min5f83b21adfc58_html_8d062f377f9843b0.gif =5f83b21adfc58_html_df9eedcf00184851.gif +5f83b21adfc58_html_88c5079a592f5e06.gif +5f83b21adfc58_html_b57e261370116620.gif5f83b21adfc58_html_226500eae913606b.gif :min5f83b21adfc58_html_46b9d5ea566681f0.gif =5f83b21adfc58_html_5caec160faa3d321.gif +5f83b21adfc58_html_da27b6c74370cd7b.gif +5f83b21adfc58_html_8e15df0d40af37b2.gif

s.t. 5f83b21adfc58_html_9dc0203e85ddd792.gif s.t. 5f83b21adfc58_html_97b2d374740dc1a7.gif

用单纯形法求解5f83b21adfc58_html_226500eae913606b.gif5f83b21adfc58_html_d5ac88681deaead2.gif5f83b21adfc58_html_ca1d9891981eff6f.gif 为松弛变量

5f83b21adfc58_html_5caec160faa3d321.gif =3,5f83b21adfc58_html_da27b6c74370cd7b.gif =4,5f83b21adfc58_html_8e15df0d40af37b2.gif =3,5f83b21adfc58_html_848f20fe684e84ae.gif =5f83b21adfc58_html_26eee74aec98e383.gif5f83b21adfc58_html_9913572ef1718937.gif =5f83b21adfc58_html_8a4bb5e1d2b42e8d.gif5f83b21adfc58_html_d0031e1c1aaf27f7.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_5caec160faa3d321.gif =5f83b21adfc58_html_3290436dd853c896.gif5f83b21adfc58_html_c5aa4c56f14577d.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_da27b6c74370cd7b.gif =10,5f83b21adfc58_html_e17ddebb6282722c.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_8e15df0d40af37b2.gif =5f83b21adfc58_html_5f0c9fc0dbaa115c.gif

又根据5f83b21adfc58_html_771ee52c3aff8d8e.gif5f83b21adfc58_html_226500eae913606b.gif 互为对偶,有5f83b21adfc58_html_df9eedcf00184851.gif =-1,5f83b21adfc58_html_88c5079a592f5e06.gif =-1/5,5f83b21adfc58_html_b57e261370116620.gif =2/5,5f83b21adfc58_html_9913572ef1718937.gif =5f83b21adfc58_html_b974693358191e15.gif5f83b21adfc58_html_a37895b7f508930f.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_df9eedcf00184851.gif =5f83b21adfc58_html_5e18d111dee6a274.gif5f83b21adfc58_html_a0c6188bad0662c3.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_88c5079a592f5e06.gif =-5f83b21adfc58_html_f00df9adb484fc6b.gif5f83b21adfc58_html_85cda7437dfc26ba.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_b57e261370116620.gif =1。

当A采用最优混合策略,B采用其他策略时,B的损失将增大;当B采用最优混合策略,而A采用其他策略时,A的收益将少。

二、扑克游戏的风险和收益的纳什均衡选择

纳什均衡是博弈的一般性均衡结果,是关于局中人最优策略的一致性预测。但纳什均衡的多重性使得一部分博弈的结果存在多个一致性预测,博弈参与人仍然面临不确定性的困境,这影响了博弈论的应用。纳什均衡的选择是博弈论研究的重要内容。风险和收益是人们经济活动及其他活动所具有的两个基本属性,是所有活动参与者共同关心和考虑的问题,基于风险和收益的普遍性和重要性,本节给出了一种基于扑克游戏风险和收益的纳什均衡选择方法。该方法以期望收益的标准差衡量由纳什均衡多重性引起的博弈风险,引入博弈参与人的风险特征和风险偏好程度,综合考虑风险和收益,选择适合相应博弈参与者的策略。

根据A,B两人博弈,各自的策略和收益值来分析一下扑克游戏的风险,通过判别表中是否存在劣策略,A的策略5f83b21adfc58_html_c4323a30e4169d03.gif 劣于5f83b21adfc58_html_94513f4b37eed6ad.gif5f83b21adfc58_html_c4323a30e4169d03.gif 劣于5f83b21adfc58_html_5257119bc0405395.gif ,并予以删除。

用划线法对解,看不出存在纯策略的纳什均解。设局中A分别以5f83b21adfc58_html_a37895b7f508930f.gif5f83b21adfc58_html_a0c6188bad0662c3.gif5f83b21adfc58_html_85cda7437dfc26ba.gif 的概率使用5f83b21adfc58_html_94513f4b37eed6ad.gif5f83b21adfc58_html_36d9a89d8b0b0a0e.gif5f83b21adfc58_html_5257119bc0405395.gif 三个策略,局中人B分别以5f83b21adfc58_html_d0031e1c1aaf27f7.gif5f83b21adfc58_html_c5aa4c56f14577d.gif5f83b21adfc58_html_5f710a5f299c5bdb.gif 的概率使用5f83b21adfc58_html_fc44195b7193af51.gif5f83b21adfc58_html_25bcdbb01f5e3b3b.gif5f83b21adfc58_html_87c9c27f1b802f0c.gif 三个策略,5f83b21adfc58_html_d0031e1c1aaf27f7.gif +5f83b21adfc58_html_c5aa4c56f14577d.gif +5f83b21adfc58_html_5f710a5f299c5bdb.gif =1,5f83b21adfc58_html_d0031e1c1aaf27f7.gif5f83b21adfc58_html_98e2e44cfdd59103.gif 0,5f83b21adfc58_html_c5aa4c56f14577d.gif5f83b21adfc58_html_98e2e44cfdd59103.gif 0,5f83b21adfc58_html_5f710a5f299c5bdb.gif5f83b21adfc58_html_98e2e44cfdd59103.gif 0,则可分别列线性规划模型如下:

5f83b21adfc58_html_771ee52c3aff8d8e.gif :(A) 5f83b21adfc58_html_226500eae913606b.gif :(B)

min5f83b21adfc58_html_8d062f377f9843b0.gif =5f83b21adfc58_html_df9eedcf00184851.gif +5f83b21adfc58_html_88c5079a592f5e06.gif +5f83b21adfc58_html_b57e261370116620.gif min5f83b21adfc58_html_46b9d5ea566681f0.gif =5f83b21adfc58_html_5caec160faa3d321.gif +5f83b21adfc58_html_da27b6c74370cd7b.gif +5f83b21adfc58_html_8e15df0d40af37b2.gif

s.t. 5f83b21adfc58_html_9dc0203e85ddd792.gif s.t. 5f83b21adfc58_html_7cb49635f74752e.gif

求解5f83b21adfc58_html_771ee52c3aff8d8e.gif 得:5f83b21adfc58_html_df9eedcf00184851.gif =-1,5f83b21adfc58_html_88c5079a592f5e06.gif =-1/5,5f83b21adfc58_html_b57e261370116620.gif =2/5,5f83b21adfc58_html_9913572ef1718937.gif =5f83b21adfc58_html_b974693358191e15.gif ,故5f83b21adfc58_html_a37895b7f508930f.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_df9eedcf00184851.gif =5f83b21adfc58_html_5e18d111dee6a274.gif5f83b21adfc58_html_a0c6188bad0662c3.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_88c5079a592f5e06.gif =-5f83b21adfc58_html_f00df9adb484fc6b.gif5f83b21adfc58_html_85cda7437dfc26ba.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_b57e261370116620.gif =1

求得5f83b21adfc58_html_226500eae913606b.gif 得:5f83b21adfc58_html_5caec160faa3d321.gif =3,5f83b21adfc58_html_da27b6c74370cd7b.gif =4,5f83b21adfc58_html_8e15df0d40af37b2.gif =3,5f83b21adfc58_html_848f20fe684e84ae.gif =5f83b21adfc58_html_26eee74aec98e383.gif5f83b21adfc58_html_9913572ef1718937.gif =5f83b21adfc58_html_8a4bb5e1d2b42e8d.gif ,故5f83b21adfc58_html_d0031e1c1aaf27f7.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_5caec160faa3d321.gif =5f83b21adfc58_html_3290436dd853c896.gif5f83b21adfc58_html_c5aa4c56f14577d.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_da27b6c74370cd7b.gif =10,5f83b21adfc58_html_e17ddebb6282722c.gif =5f83b21adfc58_html_9913572ef1718937.gif5f83b21adfc58_html_8e15df0d40af37b2.gif =5f83b21adfc58_html_5f0c9fc0dbaa115c.gif

[参考文献]

[1]胡运权.运筹学基础及应用[M].高等教育出版社,2007.

[2]张维迎.博弈论和信息经济学[M].上海:(二联}弓社,1999.

[3]向楠.网络安全投资与博弈策略研究[M].北京:北京邮电人学,2008.

作者简介:纪强,女,汉,1985.1.24,学科教学,研究生,齐齐哈尔大学。

II