知識社群ePortfolio登入
賽局理論(Game theory)
by 趙永祥, 2014-09-18 00:59, 人氣(3668)

賽局理論(Game theory)


有時也稱為對策論,或者博弈論應用數學的一個分支,1944年馮·諾伊曼奧斯卡·摩根斯特恩合著《賽局理論與經濟行為》,標誌著現代系統博弈理論的的初步形成,因此他被稱為「賽局理論之父」。賽局理論被認為是20世紀經濟學最偉大的成果之一。

目前在生物學經濟學國際關係計算機科學政治學軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈)間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。

賽局理論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以他們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境


具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,并力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。賽局理論就是研究博弈行為中鬥爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。


生物學家使用博弈理論來理解和預測演化(論)的某些結果。例如,John Maynard Smith和George R. Price在1973年發表於《自然》雜誌上的論文中提出的「evolutionarily stable strategy」的這個概念就是使用了博弈理論。還可以參見演化博弈理論行為生態學(behavioral ecology)。

賽局理論也應用於數學的其他分支,如機率統計線性規劃等。


一般認為,博弈主要可以分為合作博弈非合作博弈。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。


從行為的時間序列性,賽局理論進一步分為兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:「囚徒困境」就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈。


按照參與人對其他參與人的了解程度分為完全信息博弈不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的準確信息,在這種情況下進行的博弈就是不完全信息博弈。


目前經濟學家們現在所談的賽局理論一般是指非合作博弈,由於合作賽局理論比非合作賽局理論複雜,在理論上的成熟度遠遠不如非合作賽局理論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。


與上述四種博弈相對應的均衡概念為:

納什均衡子博弈精鍊納什均衡貝葉斯納什均衡、精鍊貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。


賽局理論還有很多分類,比如:

以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;

以表現形式也可以分為一般型(戰略型)或者展開型等。

附件