MatrixGamePayoff

MatrixGamePayoff[mgame,{s1,,sn}]

给出矩阵博弈 mgame 中每个玩家的预期收益,其中策略配置为 {s1,,sn}.

MatrixGamePayoff[mgame,{s1,,sn},"prop"]

给出每个玩家的收益属性 "prop".

MatrixGamePayoff[mgame,"player1"s1,,"playern"sn]

使用关联给出矩阵博弈 mgame 中每个命名玩家的预期收益,其中策略配置为 {s1,,sn}.

更多信息

  • MatrixGamePayoff 亦称为预期收益或预期效用.
  • MatrixGamePayoff 通常用于计算每个玩家的预期收益,其中每个玩家的策略已知.
  • 策略配置 个玩家的策略列表. 玩家 的策略 是采取不同动作的概率向量 .
  • 玩家 的预期收益为 ,其中:
  • 玩家 采取动作 的概率
    当玩家 采取动作 时玩家 的收益
    玩家 的策略
    玩家 的收益数组
  • 收益属性 "prop" 包括:
  • "Expectation"每个玩家的平均收益
    "MarginalDistributions"每个玩家的收益分布
    "MultivariateDistribution"所有玩家收益的多元分布
    "Simulation"对一轮博弈随机生成的收益列表
    {"Simulation", n} 轮博弈的收益列表
    "Variance"每个玩家的收益方差

范例

打开所有单元关闭所有单元

基本范例  (4)

生成双人矩阵博弈:

求给定策略的预期收益:

生成三人协调博弈:

当所有玩家都选择第一个动作时,求预期收益:

求囚徒困境博弈中两个囚徒都愿意合作时的预期收益:

生成三人协调博弈:

求前两个玩家合作时的预期收益:

范围  (5)

生成双人矩阵博弈:

求给定策略的预期收益:

考虑一个给定策略的旅行者困境博弈:

求预期收益:

求收益方差:

求边际分布:

求多元分布:

生成猜均值的三分之二(Guess Two-Thirds Average)博弈:

当第三位玩家最有可能下最高赌注时,求预期收益:

当首选第一个动作时,求三人协调博弈的预期收益:

生成随机博弈:

当两组两名玩家的策略相关时,求预期收益:

求这些相关策略的方差:

求这些相关策略的分布:

求这些相关策略的多元分布:

使用这些相关策略重复模拟 10 轮博弈:

应用  (7)

社会学博弈  (2)

志愿者困境博弈描述了这样一种情况,即每个玩家都可以成为志愿者,或逃避. 如果至少有一名玩家成为志愿者,那么所有其他玩家都会从逃避中略微获益. 如果没有玩家是志愿者,那么所有玩家的收益都很低. 生成一个有一名志愿者和一名逃避者的志愿者困境博弈:

求可能的志愿者和不可能的志愿者的预期收益:

求可能志愿者的预期收益:

求不可能志愿者的预期收益:

失调博弈(Discoordination game)是协调博弈和反协调博弈的混合形式,其中一个玩家试图与对方协调(想选择相同的策略),而另一个玩家则试图与对方错开(想选择不同的策略). 生成一个有一名志愿者和一名逃避者的志愿者困境博弈:

求合作者的预期收益:

求不合作者的预期收益:

求有一名合作者和一名不合作者的预期收益:

经济学博弈  (2)

古诺寡头垄断博弈(Cournot Oligopoly game)描述了这样一种情况,一组企业生产相同商品,其中每家企业都必须考虑生产成本和其他企业的产量. 只有价格最低的企业才能卖出商品. 生成古诺寡头垄断博弈:

计算前两个玩家勾结时的预期收益:

价格战是指这样一种博弈:多个企业都有兴趣提供最低价格,但每个企业的收益都与其选择的价格直接相关. 让我们考虑三家企业之间的价格战,其中每家企业都可以在低价和高价之间做出选择:

可视化博弈:

显然,合作的玩家有兴趣选择高价. 通过比较多个策略的收益来证明这一点:

军事博弈  (1)

上校布洛托博弈(Colonel Blotto)描述了这样一种情况:军官(玩家)被要求同时将有限的资源分配到多个对象(战场)上. 在战场上投入最多资源的玩家将赢得该战场,收益等于赢得的战场总数. 生成上校布洛托博弈:

求 50-50 策略的预期收益:

交通博弈 (1)

令人惊讶的是,当在道路网络中添加一条或多条道路时,可能会导致整体交通状况变差,这被称为布雷斯悖论. 已知从 ab 有两条不同的路径,一条经过 c,一条经过 d. 道路 acdb 需要 20 n 分钟,其中 n 是道路上的驾驶员数量;cbad 需要 45 分钟,与驾驶员数量无关. 将道路网络表示为图:

对于两个驾驶员 n=2,找出从 ab 的所有路径:

计算每条路径选择的驾驶员数量,得出四种情况:

计算每种情况所花费的总时间:

最大化负通勤时间:

创建基于收益矩阵的交通博弈:

可视化交通博弈:

两种纯策略分别对应通勤者选择不同的路径:

这些纯策略也给出了最短通勤时间为 65 分钟:

按照上面的交通博弈,一般道路网络的建模和求解可以实现自动化. 这里的 startend 是始顶点和终顶点,每个道路段的容量使用边权重进行编码:

dc 之间添加一条短的高容量道路段:

这种情况定义了一种两名驾驶员的新的交通博弈:

可视化交通博弈:

求解该博弈:

在两条先前存在的路线之间切换的新可能性导致了类似囚徒困境的情形,其中唯一稳定的解导致与受限网络(65 分钟)相比更长的通勤时间(82 分钟):

收敛均衡  (1)

考虑双人博弈中每个玩家的预期收益:

求每个玩家收益的表达式:

假设每个玩家按照梯度改变其预期收益:

将梯度绘制为流线图:

从该图可以看到只有纯策略 {{0,1},{1,0}}{{1,0},{0,1}}稳定的,因为轨迹会向它们收敛:

巧妙范例  (1)

设想有三个规模相等的群体在进行石头剪刀布游戏. 每个群体都固定使用一种策略:要么总是出石头,要么总是出布,要么总是出剪刀. 在每轮游戏中,如果玩家 A 输了,那么玩家 A 就会采用对手的策略. 同时,为了模拟群体增长,每轮游戏结束后,所有群体的规模都会以 1.02 的倍率增长. 在完成指定轮数的游戏后,人数占比最高的群体将成为最终赢家:

Wolfram Research (2025),MatrixGamePayoff,Wolfram 语言函数,https://reference.wolfram.com/language/ref/MatrixGamePayoff.html.

文本

Wolfram Research (2025),MatrixGamePayoff,Wolfram 语言函数,https://reference.wolfram.com/language/ref/MatrixGamePayoff.html.

CMS

Wolfram 语言. 2025. "MatrixGamePayoff." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/MatrixGamePayoff.html.

APA

Wolfram 语言. (2025). MatrixGamePayoff. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/MatrixGamePayoff.html 年

BibTeX

@misc{reference.wolfram_2025_matrixgamepayoff, author="Wolfram Research", title="{MatrixGamePayoff}", year="2025", howpublished="\url{https://reference.wolfram.com/language/ref/MatrixGamePayoff.html}", note=[Accessed: 18-April-2025 ]}

BibLaTeX

@online{reference.wolfram_2025_matrixgamepayoff, organization={Wolfram Research}, title={MatrixGamePayoff}, year={2025}, url={https://reference.wolfram.com/language/ref/MatrixGamePayoff.html}, note=[Accessed: 18-April-2025 ]}