當前位置:首頁 » 城管服務 » 監督博弈期望

監督博弈期望

發布時間: 2021-02-15 19:04:26

① 博弈的基本思路是怎樣幫忙解釋一下!

博弈,詞語解釋是局戲、圍棋、賭博。現代數學中有博弈論,亦名「對策論」、「賽局理論」,屬應用數學的一個分支, 表示在多決策主體之間行為具有相互作用時,各主體根據所掌握信息及對自身能力的認知,做出有利於自己的決策的一種行為理論。目前在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。圖書《博弈》介紹了博弈的發展。

博弈分為靜態博弈和動態博弈。靜態博弈是指在博弈中,兩個參與人同時選擇或兩人不同時選擇,但後行動者並不知道先行動者採取什麼樣的具體行動。對雙方來說,都容易形成混沌的行為重組,由於規則的嚴密與精細,任何人因時間問題、資金問題、心理問題等等,致使在多次均衡後直到不明不白地造成大輸,參與靜態博弈和動態博弈的大部分都是這種人。動態博弈是指在博弈中,兩個參與人有行動的先後順序,且後行動者能夠觀察到先行動者所選擇的行動。
根據參與者能否形成約束性的協議,以便集體行動,博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。
所謂合作性博弈是指參與者從自己的利益出發與其他參與者談判達成協議或形成聯盟,其結果對聯盟方均有利;而非合作性博弈是指參與者在行動選擇時無法達成約束性的協議。人們分工與交換的經濟活動就是合作性的博弈,而囚徒困境以及公共資源悲劇都是非合作性的博弈。
博弈又分靜態博弈和動態博弈。
靜態博弈指參與者同時採取行動,或者盡管參與者行動的採取有先後順序,但後行動的人不知道先採取行動的人採取的是什麼行動。
動態博弈指參與者的行動有先後順序,並且後採取行動的人可以知道先採取行動的人所採取的行動。
從知識的擁有程度來看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內容。完全信息博弈指參與者對所有參與者的策略空間及策略組合下的支付有「完全的了解」,否則是不完全信息博弈。嚴格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的「公共知識」的博弈。對於不完全信息博弈,參與者所做的是努力使自己的期望支付或期望效用最大化。
以此博弈哲學語言也可體現出以下四種博弈分類:
完全信息靜態博弈、完全信息動態博弈、不完全信息靜態博弈、不完全信息動態博弈
其中策略性博弈應屬於完全信息靜態博弈,而完全信息動態博弈則包括擴展性博弈和重復博弈等;不完全信息靜態博弈則是以貝葉斯均衡等理論完成對混合策略的重新解釋,不完全信息動態博弈則是完美貝葉斯均衡為核心概念的信號博弈。

② 博弈論的一個問題,請高手解釋一下.

1、首先要算努力和不努力的期望受益
雙方努力:9/16*4-1=1.25
自己努力對方偷版懶:權3/8*4-1=0.5
自己偷懶對方努力:3/8*4=1.5
雙方偷懶:1/4*4=1
則此博弈受益分布為:
努力 偷懶
努力 1.25/1.25 0.5/1.5
偷懶 1.5/0.5 1/1
由此可見,偷懶成為了最優策略,形成了典型的囚徒困境
2、沒看懂,什麼是巾現因子?能否先解釋一下?

監督博弈

1. 稅務局
b越大, b-a也越大. 對單位對國家都有經處
2. 納稅人
c值越小, 利潤越高, 但應對則稅務局風險大.

④ 求助兩道關於博弈論的計算題,望高手幫助回答

以第抄一個博弈為例設選擇L的概率為p,那麼襲選擇R的概率就是1-p設選擇T的概率為q1,選擇M的概率為q2,那麼選擇B的概率為1-q1-q2那麼博弈雙方的期望收益分別為Eu1=Eu2=p*(10*q1+4*(1-q1-q2))+(1-p)*(10*q2+4*(1-q1-q2))=10*p*q1+10*(1-p)*q2+4*(1-q1-q2)分別求偏導可得dEu1/dp=10*(q1-q2)dEu2/dq1=10*p-4dEu2/dq2=10*(1-p)-4=6-10*p從以上三個式子可以得到的結論是:一,當q1=q2時,p*任意;當q1>q2時,p*=1;當q10.4時,q1*=1;當p0.6時,q2*=0;當p<0.6時,q2*=1;當q=0.6時,q2*任意所以可以看出,這個博弈的混合策略納什均衡解是(1,0;1,0,0),(0,1;0,1,0)分別對應純策略納什均衡(L,T),(R,M)思路應該是這樣的,你再演算下,看看有沒有算錯另外,博弈論只是我的一門選修,我當時只學了兩個博弈者各有兩種選擇的博弈的混合策略納什均衡,上面這種方法是我自己想出來的我不知道是不是有更簡單的方法(推理不算)

⑤ 博弈論 僱主與雇員的監督博弈

頂下,真深奧,同求達人解答。。

⑥ 博弈論中的「期望收益」

期望收益就是收益的平均值。
期望的數學含義就是概率加權平均值。
群體成員的平均得益就是平均每人的期望收益。

⑦ 博弈論期望得益怎麼算

期望收益就是收益的平均值.
期望的數學含義就是概率加權平均值.
群體成員的平均得益就是平均每人的期望收益.

⑧ 博弈是什麼意思

弈,就是下棋的意思,
博弈,就是很多人下棋的意思。

博弈就像一個游戲,他的內最基本的概念就是每容個參與者都是游戲的一部分,會對其他人的決策產生影響。

一個小例子:
讓10000個人從1-100里選擇一個數,最後選擇離大家的平均值的一半最接近的就獲勝。
通常認為,人數夠多,選擇的數字就分散,所以最後的平均數應該接近50,所以我選25=50/2應該獲勝把握大。
但我再想,我知道這個其他人也知道這個,所以假定他們也都選25,那我就該選12.5=25/2。
同樣道理,別人也會想到這點,如此不斷,最後大家都選1。沒有獲勝者。

這就是博弈,每個人的決定都建立在他對別人決定的預期之上。。。
深奧又有趣的學問。。。

網易像在博弈,可以簡單的理解為網易在和一群對手賭博。。。不是很恰當。。呵呵

熱點內容
影視轉載限制分鍾 發布:2024-08-19 09:13:14 瀏覽:319
韓國電影傷口上紋身找心裡輔導 發布:2024-08-19 09:07:27 瀏覽:156
韓國電影集合3小時 發布:2024-08-19 08:36:11 瀏覽:783
有母乳場景的電影 發布:2024-08-19 08:32:55 瀏覽:451
我准備再看一場電影英語 發布:2024-08-19 08:14:08 瀏覽:996
奧迪a8電影叫什麼三個女救人 發布:2024-08-19 07:56:14 瀏覽:513
邱淑芬風月片全部 發布:2024-08-19 07:53:22 瀏覽:341
善良媽媽的朋友李采潭 發布:2024-08-19 07:33:09 瀏覽:760
哪裡還可以看查理九世 發布:2024-08-19 07:29:07 瀏覽:143
看電影需要多少幀數 發布:2024-08-19 07:23:14 瀏覽:121