监督博弈期望
① 博弈的基本思路是怎样帮忙解释一下!
博弈,词语解释是局戏、围棋、赌博。现代数学中有博弈论,亦名“对策论”、“赛局理论”,属应用数学的一个分支, 表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。图书《博弈》介绍了博弈的发展。
博弈分为静态博弈和动态博弈。静态博弈是指在博弈中,两个参与人同时选择或两人不同时选择,但后行动者并不知道先行动者采取什么样的具体行动。对双方来说,都容易形成混沌的行为重组,由于规则的严密与精细,任何人因时间问题、资金问题、心理问题等等,致使在多次均衡后直到不明不白地造成大输,参与静态博弈和动态博弈的大部分都是这种人。动态博弈是指在博弈中,两个参与人有行动的先后顺序,且后行动者能够观察到先行动者所选择的行动。
根据参与者能否形成约束性的协议,以便集体行动,博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。
所谓合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟方均有利;而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动就是合作性的博弈,而囚徒困境以及公共资源悲剧都是非合作性的博弈。
博弈又分静态博弈和动态博弈。
静态博弈指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。
动态博弈指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。
从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息博弈。严格地讲,完全信息博弈是指参与者的策略空间及策略组合下的支付,是博弈中所有参与者的“公共知识”的博弈。对于不完全信息博弈,参与者所做的是努力使自己的期望支付或期望效用最大化。
以此博弈哲学语言也可体现出以下四种博弈分类:
完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈
其中策略性博弈应属于完全信息静态博弈,而完全信息动态博弈则包括扩展性博弈和重复博弈等;不完全信息静态博弈则是以贝叶斯均衡等理论完成对混合策略的重新解释,不完全信息动态博弈则是完美贝叶斯均衡为核心概念的信号博弈。
② 博弈论的一个问题,请高手解释一下.
1、首先要算努力和不努力的期望受益
双方努力:9/16*4-1=1.25
自己努力对方偷版懒:权3/8*4-1=0.5
自己偷懒对方努力:3/8*4=1.5
双方偷懒:1/4*4=1
则此博弈受益分布为:
努力 偷懒
努力 1.25/1.25 0.5/1.5
偷懒 1.5/0.5 1/1
由此可见,偷懒成为了最优策略,形成了典型的囚徒困境
2、没看懂,什么是巾现因子?能否先解释一下?
③ 监督博弈
1. 税务局
b越大, b-a也越大. 对单位对国家都有经处
2. 纳税人
c值越小, 利润越高, 但应对则税务局风险大.
④ 求助两道关于博弈论的计算题,望高手帮助回答
以第抄一个博弈为例设选择L的概率为p,那么袭选择R的概率就是1-p设选择T的概率为q1,选择M的概率为q2,那么选择B的概率为1-q1-q2那么博弈双方的期望收益分别为Eu1=Eu2=p*(10*q1+4*(1-q1-q2))+(1-p)*(10*q2+4*(1-q1-q2))=10*p*q1+10*(1-p)*q2+4*(1-q1-q2)分别求偏导可得dEu1/dp=10*(q1-q2)dEu2/dq1=10*p-4dEu2/dq2=10*(1-p)-4=6-10*p从以上三个式子可以得到的结论是:一,当q1=q2时,p*任意;当q1>q2时,p*=1;当q10.4时,q1*=1;当p0.6时,q2*=0;当p<0.6时,q2*=1;当q=0.6时,q2*任意所以可以看出,这个博弈的混合策略纳什均衡解是(1,0;1,0,0),(0,1;0,1,0)分别对应纯策略纳什均衡(L,T),(R,M)思路应该是这样的,你再演算下,看看有没有算错另外,博弈论只是我的一门选修,我当时只学了两个博弈者各有两种选择的博弈的混合策略纳什均衡,上面这种方法是我自己想出来的我不知道是不是有更简单的方法(推理不算)
⑤ 博弈论 雇主与雇员的监督博弈
顶下,真深奥,同求达人解答。。
⑥ 博弈论中的“期望收益”
期望收益就是收益的平均值。
期望的数学含义就是概率加权平均值。
群体成员的平均得益就是平均每人的期望收益。
⑦ 博弈论期望得益怎么算
期望收益就是收益的平均值.
期望的数学含义就是概率加权平均值.
群体成员的平均得益就是平均每人的期望收益.
⑧ 博弈是什么意思
弈,就是下棋的意思,
博弈,就是很多人下棋的意思。
博弈就像一个游戏,他的内最基本的概念就是每容个参与者都是游戏的一部分,会对其他人的决策产生影响。
一个小例子:
让10000个人从1-100里选择一个数,最后选择离大家的平均值的一半最接近的就获胜。
通常认为,人数够多,选择的数字就分散,所以最后的平均数应该接近50,所以我选25=50/2应该获胜把握大。
但我再想,我知道这个其他人也知道这个,所以假定他们也都选25,那我就该选12.5=25/2。
同样道理,别人也会想到这点,如此不断,最后大家都选1。没有获胜者。
这就是博弈,每个人的决定都建立在他对别人决定的预期之上。。。
深奥又有趣的学问。。。
网易像在博弈,可以简单的理解为网易在和一群对手赌博。。。不是很恰当。。呵呵