前言:我們精心挑選了數篇優質進化博弈理論文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
一、進化博弈的基本理論
進化博弈論的研究起源于生物學領域,其目的是為了解決動物和植物的沖突及合作,為達爾文的自然選擇過程提供數理基礎。進化博弈理論結合經典博弈理論及生態理論研究成果,以有限理性的參與人群體為研究對象,利用動態分析方法把影響參與人行為的各種因素納入其模型之中,并以系統論的觀點來考察群體行為的進化趨勢。正是基于其在生物物種與種群的競爭進化演變規律分析中的成功,眾多學者紛紛將其概念和前提加以修正,將其廣泛應用于經濟領域、社會領域來解釋并預測人的群體決策行為。
二、進化博弈理論的應用研究
1.社會行為領域
Conlisk利用帶滯后項及隨機項的離散時間動態來分析參與人是否總是行為的最優者。它假定有“最優化”及“模仿”兩個純策略,其中非最優化者有一個二次損失函數,在此基礎上,他尋求一個滿足非最優化者損失函數等于最優化者正的常數成本的均衡群體比率,從而得出結論:當群體中幾乎都是最優化者時,模仿比最優化策略更合算,因此,群體中非最優化者在群體中最優化者所占比例并不漸進地收斂于1。Peyton Young認為現實中每個參與人都是在前人給定的經驗知識基礎上選擇策略,個人選擇策略是一個適應性的學習過程。個體在做出選擇時,盡管參與人存在一定的慣性及犯錯誤的可能性,經過行為的長期進化,這個適應性學習過程也會收斂于一個有效率的傳統或合約。Sandholm對個體行為偏好的進化進行了動態分析。Juang從進化的視角研究了規則的進化與均衡的選擇問題。Nyborg和Rege探討了有關吸煙行為的社會規范的深化,并運用挪威的經驗數據對結論進行了檢驗。
2.制度的演化
青木昌彥等運用進化博弈理論分析了社會經濟體制的變遷。他們認為:任何一種經濟體制的產生都具有一定的慣性,并隨著經濟所處的外部環境與所積累的內部環境的變化一起逐漸地進化。吳炯、彭飛以進化博弈的復制動態方法為工具解釋了公司治理結構演進過程中的“兩極化”現象。邱中華等通過演化博弈模型考察委托人和人在委托過程中行為策略的自發演化過程,發現這一博弈過程的所有均衡都是鞍點,從而得出委托人和人之間的監察博弈沒有進化穩定策略。Kandori和Rafael運用進化博弈理論研究了兩種具有網絡外部性的技術之間競爭的博弈過程,提出了解決“花車效應”問題的對策,論證了后發技術取代主導技術的可能性。
3.經濟行為的演化
Routledge基于Grossman和Stiglitz提出的經濟模型,探討了金融市場上個體行為人是如何通過適應性和進化學習來發現內生變化并運用這種內生關系的一種學習模型。他通過模仿過程和經驗過程來對個體的投資行為建模,而不是運用傳統上的顯性最優化方法放松關于知識和理性的假設。Cowen和Kroszner利用進化博弈理論研究了在自由競爭易貨貿易經濟中,在存在交易成本的情況下,交易媒介的選擇問題。羅發友等對集群內企業技術創新行為構建了鷹鴿博弈、鷹鴿反擊者博弈和鷹鴿應變者博弈三個模型,并得出集群內企業創新行為不存在純策略進化穩定均衡,但存在混合策略進化穩定均衡和行為策略進化穩定均衡,反映了集群內企業創新行為的協同競爭性以及這種協同競爭創新行為的進化穩定特性。
三、借鑒意義
1.進化博弈論從有限理性人出發,強調系統達到均衡的過程而非均衡本身。進化博弈理論是完全摒棄傳統理論中非現實的“理性人”假設,直接從有限理性參與人群體出發而提出的一種全新的動態分析方法,該方法認為經濟系統達到均衡需要一個長期的漸進過程,均衡結果依賴于達到均衡的過程。
2.進化博弈論納入了系統到達均衡的時間因素,有利于決策者控制系統向目標的進化。進化博弈理論的動態分析方法中一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強調系統達到均衡的過程。這樣有利于決策者控制經濟系統使之朝向既定的目標前進,也有利于決策者尋找能夠最大限度地促進系統向意愿均衡轉化的因素,使系統盡快達到有效率的均衡。
3.進化博弈理論引入突變因素較好的解決了多重均衡的選擇問題,即系統最終會趨于哪一個均衡依賴于系統的初始狀態。進化博弈理論的基本均衡概念――進化穩定均衡,描述了當經濟系統一旦進入到某一均衡的吸引域內,系統就會對其他的突變策略具有一定程度的抵抗力。
參考文獻:
[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)
[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998
[3] 青木昌彥 奧野正寬:經濟體制的比較制度分析.中國發展出版社,1999
[4]邱中華 金翔:基于進化博弈論研究的一類監察博弈. 南京郵電大學學報(自然科學版),2006,26
本文以進化博弈理論的基本均衡概念----進化穩定策略的提出、發展及不斷完善為主線,在指出原初概念缺陷的基礎上,文章從非對稱博弈、有限群體、隨機因素及動態過程四個方面分別介紹了博弈論理論家們對該概念的拓展。
關鍵詞:進化穩定策略;漸近穩定性;嚴格N群體ESS;隨機穩定集;群體穩定集
引言
進化博弈理論來自于達爾文的生物進化論,至少自雷威丁(Lewontin 1960)用于解釋生態現象 ②就已經產生了。但直到1973年梅納德·史密斯和普萊斯(Maynard Smith and Price)、梅納德·史密斯(1974)提出了該理論的基本均衡概念----進化穩定策略[3](evolutionary stable strategy, ESS)及泰勒和喬克(Taylor and Jonker)提出該理論的基本動態概念---模擬者動態以后,進化博弈理論得到了理論界的普遍關注。特別是1992年關于進化博弈理論發展的國際學術會議在康奈爾大學的召開,正式確定了進化博弈理論在經濟學上的學術地位,此后,該理論在經濟學便上獲得了迅速的發展及廣泛的應用。越來越多的經濟學家運用進化博弈理論來分析諸如社會制度變遷[阿克賽爾羅德和米爾頓(Axelrod and Hamilton 1981);阿克賽爾羅德(1984)]、行業發展趨勢[波特Porter 1980)]、股市發展方向[康利斯克(Conlisk 1980);利奈爾和羅爾(Cornell and Roll 1981)]、消費者對品牌的選擇[凱思和史培羅(Katz and Shapiro 1985)]、社會學習過程[弗登博格(Fudenberg 1995)]及社會習俗形成[彼特·楊,(H. Peyton Young 1993,1998)等領域的相關問題。進化穩定策略是進化博弈理論最基本的均衡概念,它具有廣泛的應用并在發展中得到了不斷完善。本文以進化穩定策略概念的發展為主線來介紹博弈論理論家們對它在不同條件下的拓展。
一、原初ESS定義及其缺陷
在梅納德·史密斯和普萊斯(1973);梅納德·史密斯(1974)提出進化穩定策略概念以前,進化博弈理論的發展還僅僅處于萌芽階段。在這一時期生態學家們主要應用純數學理論如極限環、分岔、奇異吸引子(羅森,Rosen 1970)等概念來描述生態演化系統并用于解釋生態現象,同時把生物之間的互動行為納入到進化模型之中(威爾·艾德瓦茲,Wynne-Edwards 1962),他們處理問題的方法已經蘊含了進化博弈理論的基本思想。
在七十年代,生態學理論和博弈理論在各自領域中都獲得了迅速的發展,同時實驗經濟學作為一門學科也獲得了經濟學界的一致認同,這些條件為進化論與博弈論的結合提供了理論和現實基礎。生態學家梅納德·史密斯和普萊斯(1973)在總結以前理論的基礎上,提出進化博弈理論的基本均衡概念----進化穩定策略③ ,該均衡概念的提出使得進化博弈理論的研究有了明確的方向,為進化博弈理論的進一步發展奠定了堅實的基礎。
所謂進化穩定策略就是指:如果占群體絕大多數的個體選擇進化穩定策略,那么小的突變者群體就不可能侵入到這個群體。或者說,在自然選擇壓力下,突變者要么改變策略而選擇進化穩定策略,要么退出系統而在進化過程中消失。下面我們給出梅納德·史密斯和普萊斯(1973)所定義的進化穩定策略(文獻[3]對此有詳細的介紹):
說是進化穩定策略,如果,存在一個④,不等式對任意都成立。其中A是群體中個體博弈時的支付矩陣;y表示突變策略;是一個與突變策略y有關的常數,稱之為侵入界限(Invasion Barriers);表示選擇進化穩定策略群體與選擇突變策略群體所組成的混合群體。從定義可以看出,當系統處于進化穩定狀態時(群體選擇進化穩定策略時所處的狀態就是進化穩定狀態),除非有來自外部強大的沖擊,否則系統就不會偏離進化穩定狀態,即系統會“鎖定”(Lock in)于該狀態。定義的直觀意思就是,當一個系統處于進化穩定均衡的吸引域范圍之內時,它就能夠抵抗來自外部的小沖擊。顯然,進化穩定策略是一個靜態概念,但它卻可以描述出系統的局部即吸引域內的動態性質。
原初進化穩定策略定義為以后的研究者提供了理論基礎,但它是建立在許多理想化的假定之上,存在著許多不夠完善的地方:第一,梅納德·史密斯等是在研究生態現象時提出的進化穩定策略概念的,由于動植物的行為完全是由其基因決定的。因而,每個種群體都被程式化為一個純策略,整個生態環境的所有種群也被看作一個大群體。然而,同一種群的個體由于其性別不同、需要不同、能力不同、基因突變或基因遺傳⑤ 等因素都會影響到它們的行為,把每一個種群行為程式化一個純策略是沒有太強說服力的,把一個生態環境中所有種群看作一個大群體也存在不妥之處;第二,從梅納德·史密斯等提出的進化穩定策略定義可以看出,它僅適應于互不重疊且相互獨立的突變因素的影響,其吸引域半徑只與單個突變因素y有關,也就是說只有等到一個突變因素對群體的影響消失之后,才能出現另一個突變因素,現實中出現這種現象是非常偶然的;第三,梅納德·史密斯等為了技術上處理的方便及更好地利用數學工具和博弈論來描述生態演化過程而假定群體規模無限大 ⑥,即隱含地假定博弈的支付⑦ 空間是一個連通、閉集,這個假定不符合現實;第四,從原初的進化穩定策略定義可以看出,它是一個靜態概念,只能描述系統的局部動態性質,沒有涉及到動態系統整體的調整過程,而現實中許多系統的均衡依賴于系統的整體動態性質。
從生態意義上說,進化穩定策略把種群之間的互動行為納入到模型之中,推廣了達爾文的優勝劣汰理論,然而與納什均衡概念相比,進化穩定策略并不能解釋群體如何達到穩定的。它只能回答一旦達到了這種穩定狀態,原群體就對突變者群體者具有較強的抵抗力。也就是說,它只能回答當系統處于某一個均衡點的吸引域時,在一定條件下,隨著時間的演化,該系統就會趨于這個均衡點,而當系統有多重均衡或者多個吸引域時,原初的定義就顯得無能為力了。事實上梅納德·史密斯和帕克(Maynard Smith and Parker 1976)、梅納德·史密斯(1978;1979)已經識到原初定義的某些缺陷,梅納德·史密斯(1982)給予了一定程度的修進并提出了修進的ESS(Modified ESS)概念。下面我們從四個方面來介紹理論家對進化穩定均衡所作的拓展。
二、非對稱群體中的ESS概念
梅納德·史密斯早在1979年就已經意識到,原初的進化穩定策略在處理多群體非對稱博弈時遇到了困難。他發現,在現實中,如生態學、經濟學和其他社會科學中的許多策略互動行為可能發生于兩個或多個群體的個體之間,個體之間進行的是非對稱博弈,單用原初定義不能很好解釋現實中的這些現象。如何把靜態的單群體進化穩定標準拓展到多群體情形呢?在單群體中,所有的個體都被程式化了一個純策略(梅納德·史密斯假定只有純策略是可以遺傳的),個體之間進行的是兩兩重復匿名博弈;并且在單群體中,規模很少的突變因素對群體所產生的影響是可以忽略的,因此,非嚴格納什均衡策略不可能侵入到最優反應的嚴格納什均衡策略群體。在多群體中,突變因素可能來自于各個群體,突變策略者的互動行為會對群體行為產生不可忽略的影響。因此,原初的進化穩定標準僅僅限于嚴格納什均衡之間的選擇就不能運用于解釋多群體情形。Selten(1980)認為,把均衡概念由單群體拓展到多群體不是一個簡單的過渡,而是涉及到系統的動態調整過程及動態穩定性等一系列的變化。哈曼斯頓(Hammerstein 1981)認為,在非對稱博弈中,個體更加傾向于應用穩定策略來選擇行為并決定競爭結果,而這些穩定策略與進化穩定策略相比,可能會有更少的“吸引域”。因此,由進化穩定策略定義所得的結論就顯得有點似是而非了,但他沒有作出進一步解釋。
澤爾騰(Selten (1980))首次深入地研究了非對稱博弈動態穩定性并利用兩群體博弈情形證明 “在非對稱博弈原初進化穩定策略必定是嚴格納什均衡”。后來,Van Damme(1987)在更一般的情形下證明了這個命題⑧ 。我們知道,嚴格納什均衡本來就顯示出很好的性質,如果一個理論把其主要的注意力集中于研究嚴格納什均衡,那么它就沒有任何理論價值;更重要的是許多非對稱博弈根本就不存在嚴格納什均衡,因而也就無法研究動態系統的穩定性;在非對稱博弈中,漸近穩定性(Asymptotic Stability)實質上也蘊含了嚴格納什均衡,因此,漸近穩定性在非對稱博弈中也不是一個合適概念;進化穩定策略是一個靜態概念,雖然能夠描述系統的局部動態性質,但在非對稱博弈中,原初的進化穩定均衡與動態演化過程極限結果之間的對應關系卻不明顯(即出現了局部與全局的矛盾)。因此,要研究非對稱博弈的動態穩定性就必須通過考察系統的動態演化過程來尋求能夠適應于對稱博弈與非對稱博弈的穩定性概念。為了能夠更精確地描述非對稱博弈,澤爾騰(1983,1988)通過對引入角色限制行為(Role Conditioned Behavior)而提出了適應于非對稱博弈的ESS概念。
他的定義如下:在有角色限制的博弈G中,一個行為策略稱為進化穩定策略,
如果 (ⅰ)對任意的,滿足
(ⅱ)如果那么對任意的有。
然而,澤爾滕的ESS概念盡管適應于描述兩群體非對稱博弈的情形,但它只能描述系統的局部動態性質,而且該定義并不能夠顯示出均衡概念與動態演化過程極限結果之間的關系。因此,要更好地描述非對稱博弈均衡,就必須正確處理好均衡概念與動態演化過程均衡結果之間的關系。于是,弗里德曼(Friedman 1991)考察了非對稱博弈的更一般的單調調整過程并得出了四個基本結論:(1)每一個納什均衡都是動態系統的靜止點(rest point)⑨ ;(2)漸近穩定結果必定是納什均衡;(3)在對稱和非對稱博弈中,對所有單調調整過程而言ESS不一定是漸近穩定的;(4)對某些單調調整過程而言,正規ESS是漸近穩定的。在此基礎上,他得出了“漸近穩定結果必定是納什均衡”結論。萊瑞·薩謬爾森和張建波(Larry Samuelson and Jianbo Zhang 1992)在弗里德曼(1991)的基礎上進一步考察了非對稱博弈的累積單調選擇動態(Aggregate Monotonic Selection Dynamic)并得出:在非對稱博弈中,單調調整過程能夠剔除所有嚴格劣的純策略,并且能夠確保均衡結果必定是納什均衡。同時,他們證明了“穩定點必定是納什均衡”及“漸近穩定結果必定是嚴格納什均衡”,進而強化了弗里德曼(1991)的“漸近穩定結果必定是納什均衡”的結論。
Swinkels(1992)認為,進化穩定標準不對突變策略組合給予適當限制是說不過去的。特別地,在處理某些經濟問題時,突變策略可能來自于參與人或者企業的創新、試驗等活動,這些突變策略組合本身可能會影響系統的穩定性。因此,考察相對于后進入突變群體最優反應策略組合的穩定性可能會更合理,并且這些穩定性概念很容易由單群體情形推廣到多群體N-人非對稱博弈。于是他定義了適應于非對稱博弈的策略穩健性概念。
定義:稱之為相對于均衡進入者的穩健策略(Robust against Equilibrium Entrants REE),如果存在對所有的策略組合及滿足:。其中表示突變策略;表示選擇突變策略者在群體中所占的比例;表示混合群體;表示突變策略相對于策略x的最優反應策略,他并且證明了REE是ESS的一個子集。然后,他又把REE概念推廣到了N-人非對稱博弈的情形而提出了均衡進化穩定(Equilibrium Evolutionarily Stable EES)概念:
定義:稱集合是均衡進化穩定的(EES),如果它是相對于下面性質的最小集: X是納什均衡策略集合一個非空閉子集,存在,如果及,那么。
換句話說,EES集是納什均衡策略集的最小閉集,它能夠保證任何小規模的均衡進入突變者不可能使得群體離開進化穩定均衡的吸引域。
三、有限群體上的ESS概念
梅納德·史密斯等提出的ESS概念另一個缺陷就是,他們為了在技術上處理的方便而認為群體規模無限大,這個假定與現實尤其應用于解決經濟問題時并不相符。為了使理論與現實更接近,許多博弈論理論家對有限群體的均衡問題進行了深入的研究。沙弗爾(Schaffer 1988)首次放開群體規模無限大的假定,考察了有限規模群體的進化穩定性并提出了有限群體ESS(Finite Population Ess)概念。他證明“在一般情況下,有限群體ESS并不是納什均衡策略”。漢森和薩謬爾森(Hansen and Samuelson 1988)分析了經濟博弈的演化過程,并把有限群體ESS稱之為“普遍生存策略”(universal survival strategy)。他們認為,在現實世界競爭中,未來的利潤和可供選擇的策略具有不確定性,這就會阻礙企業選擇最優化策略,企業必須通過不斷的試驗、學習過程來尋求有利可圖的滿意策略 ⑩(不一定是最優策略)。沙弗爾(1989)應用“普遍生存策略”來研究寡頭企業之間的競爭并得出結論:通過經濟自然選擇過程 ⑾而得以生存下來的策略是相對的而不是絕對的利潤最大化策略。泰尼克(Tanaka 2000)利用模擬者動態,考察了差別產品對稱寡頭企業競爭的情形并定義了“全局生存策略”(Globally Surviving Strategy GSS)。他得出結論的是:在價格與數量競爭的寡頭模型中,GSS都是隨機穩定的并且在兩種情況下它們是等價的。
以上所得到的均衡概念基本上是適應于單群體有限個體情形,并不適應于有限個體多群體博弈。哈佛保爾和西格蒙德(Hofbauer and Sigmund 1988)證明了“兩群體對稱博弈中不存在混合策略ESS”。澤爾騰(1988)在考察了大量的兩人對稱博弈的基礎上也得出了類似的結論。克瑞斯曼(Cressman 1992)定義了有限兩群體非對稱博弈的進化穩定策略,1996年對他所定義的概念作了進一步說明。他認為,在模擬者動態下,至少一個群體的突變者所得到的平均支付少于選擇穩定策略者所獲得的支付,才能保證靜止點的漸近穩定性。Garay and Varga(2000)認為,定義有限數目多群體的均衡概念應該滿足如下三點:其一是突變者不能侵入他自己的群體;其二是現有群體對來自外部的隨機沖擊具有較強的抵抗力;其三是多群體ESS定義應該與非對稱博弈理論的基本結論一致。眾所周知,純策略模擬者動態的漸近穩定集并不一定是ESS。那么,哪一種動態穩定概念等價于ESS呢?克瑞斯曼(1990)指出,在單群體條件下強穩定性等價于ESS,那么多群體的ESS定義也應該滿足多群體穩定性概念等價于多群體ESS。根據這個標準,Garay and Varga(2000)定義了嚴格N群體ESS概念。其定義如下:
定義:策略組合 稱之為N-群體進化穩定策略,如果對每一個,存在,對所有的都有:
框架。
四、隨機因素影響下ESS概念
梅納德·史密斯等提出的ESS概念第三個缺陷是要求突變因素是不連續且不重疊的。原初ESS定義由于僅僅考慮單個因素對系統的影響,所以任何偏離均衡狀態的行為都會隨著時間的演化自動回復到原來的進化穩定狀態。帕克和菲爾德曼(Peck and Feldman 1988)認為,由于群體規模和后代數目很大,因而隨機因素對動態系統的影響是可以忽略不計的。現實并不是這樣,經濟演化系統常常會受到來自突變和其他偶然事件的沖擊,這些因素可能會對系統產生不可忽略的影響。福斯特和楊(Foster and Young 1990)認為,首先,ESS概念把影響系統的因素都看成是一個個孤立的事件,而在現實中系統常常會受到連續的隨機沖擊。如果假定有一個因素的影響消失以后,再考慮另一個因素對系統的影響,那么,系統當然就不會遠離原來的均衡狀態;其次,現實中出現上述情況純屬偶然現象,一個只能處理偶然現象的理論是沒有任何存在價值。現實中,盡管單個隨機因素對動態系統的影響較少,但它們卻可能對系統產生累積作用而定量地改變系統的穩定性,使得系統離開進化穩定狀態,系統什么時候回復到當初的進化穩定狀態,依賴于動態過程的全局結構,而ESS定義是一個局部概念,因此在考慮隨機沖擊時就不能作為判斷系統穩定性的標準;再次,由于系統的極限行為依賴于初始條件,同時在吸引子集合中只有一部分狀態是隨機穩定的,且隨機穩定狀態的選擇還依賴于隨機過程特定的結構,因此,ESS和一般意義上的吸引子(Attractors)由于沒有充分地考慮到隨機因素對進化系統的影響,在描述隨機系統的穩定性時也很不理想。于是,他們首次把影響系統的隨機因素納入到進化模型之中并提出了一個既不同于傳統ESS也不同于吸引子(Attractor)概念的隨機穩定性(Stochastic Stability)概念。他們的定義如下:
定義:群體向量是隨機穩定的,如果隨著隨機影響,極限密度對的每一個小鄰域都賦有正概率;更精確地說,其中。其中是當時,的極限分布,表示隨機因素對系統所產生的影響。
粗略地說,一個狀態P是一個隨機穩定的,如果在長期中,隨著隨機沖擊因素影響的不斷變少,系統幾乎一定(nearly certain)不會離開P的任意少的鄰域。隨機穩定的群體向量總是存在的,它有如下性質:隨著及,它是一個最小閉集。接著,他們又提出了更一般的概念----隨機穩定集(Stochastic Stable Set)。隨機穩定集 是一個滿足如下條件的狀態集合,即從長期來看,隨著隨機沖擊的不斷變少,系統幾乎一定處于包含于S的任何一個開鄰域中。隨機穩定集概念的提出把傳統確定性動態模型中的ESS拓展到隨機性動態系統中,并且它是一個比進化穩定策略集更精練的概念,是進化穩定集的子集。隨機穩定集已經成為描述隨機動態系統的基本均衡概念。
五、ESS與動態的結合
從ESS的定義可以看出,它只能描述系統的局部動態性質而與系統的全局動態過程無關,然而,要更準確地描述一個系統的動態性質就必須對仔細考察整個系統的動態調整過程。泰勒和喬克(Taylor and Jonker 1978)首次把傳統的ESS定義用模擬者動態模型表示出來,他們證明在一個多群體的模型中,進化穩定策略是漸近穩定的充分但非必要條件。但他們沒有作出進一步的研究。鑒于此,吉爾博和馬特休(Gilboa and Matsui (1991))在考察群體行動態調整過程的基礎上,提出了“循環穩定集”(Cyclically Stable Set)又一均衡概念。“循環穩定集”直接來源于群體行為的調整過程,其基本思想是“可接近性”(Accessibility)。一個策略分布f稱為可以從另一個策略分布g接近是指,如果存在一條從f到g的道路,且在該道路方向上任何一點都是相對于該點的最優反應。“循環穩定集”是指在滿足“可接近性”條件下是封閉的策略分布集合(在該集合中任何兩個分布之間都是接近的)。與一般均衡理論不同,僅當參與人按照均衡策略而作出選擇時才有效,CSS并不要求群體保持這種決策狀態。CSS的直觀意義是,在一個很短的時間間隔內,只有少部分人離開或者死亡并且由一些新來的人(新生的孩子)代替,這些新來者從他們的母體那里繼承一些行為模式,并且在現行預期(也就是說他們并不關心行為模式未來的變化)條件下作出最優的反應,一旦新來者選擇了某一行動,他就會一直堅持下去(轉換成本的存在是他堅持這個行動的一個重要原因)。馬特休(Matsui 1992)給出了一個“穩定”策略的靜態表述,在存在對原群體中各策略的初始分布沖擊的情況下該策略能夠保持這種分布。斯溫克斯(1992)在馬特休的基礎上提出了“群體穩定策略”(Socially Stable Strategy SSS)。相對于均衡的進入者而言,所謂“群體穩定策略”是指如果存在一個突變群體(或者進入者群體,譬如說群體A),其支付高于原群體的支付,那么必定存在另外一個群體(如群體B),在這個包含大部分原群體個體而有一少部分群體A的個體的群體中,群體B將獲得高于群體A的支付。這個概念也稱為“穩健策略組合”。當然在某些情況下,“群體穩定策略”可能并不存在,但不是這個概念本身的缺點,出現這種情況與我們所研究的動態過程本身是分不開的。然而,我們可能會問,實際的行為模式又是怎么樣呢?如果這個過程并不是穩定狀態,那么穩定狀態又是什么呢?在對這個問題作出回答時,馬特休利用了吉爾博和馬特休(1991)所提出的集值解的概念(Set-valued Solution),同時他也證明了循環穩定集的存在性。Binmore and Samuelson(1993)把參與人的學習過程納入到了進化模型中并提出了自我強化均衡[10](Self-confirming Equilibrium)。他們認為,每個參與人都會通過自己的經驗來推斷對手可能選擇的策略而作出最優反應,這個學習過程可能使得系統在不同自我強化均衡的吸引域之間漂移而不會停留在某一個均衡,由于在非均衡路徑上的推斷不一定正確,所以自我強化均衡可能不一定是納什均衡。
結束語
進化博弈理論從發展到現在雖然只有二十幾年的歷史,但它卻受到社會學、經濟學、生態學們的普遍關注。特別是該理論的基本均衡概念----進化穩定均衡提出以后,理論界已經從不同的方面對它進行了拓展,并取得了令人矚目的成果,使進化博弈理論體系得到了在發展中不斷完善。進化博弈理論具有較強的實用性和廣闊的發展前景 ⑿,相信它會引起更多經濟學家的興趣,必將成為主流經濟學的一部分。
注釋: ①張良橋:中山大學嶺南學院經濟學系數量經濟學碩士研究生,廣東省順德職業技術學院經濟管理系教師(郵政編碼:528300;聯系電話:0765-2338029;13825507060,值此文發表之際謹向他們致以深深的謝意,同時要感謝經濟管理系的仇穎老師對此文中英文名字進行了認真的翻譯。 ②生物學家在研究生態現象時發現,利用納什均衡可以很好地解釋生物進化結果。然而,生物是沒有思維的更談不上理性要求了,它們的行為卻可以趨于納什均衡,因此,理性要求并不是納什均衡的必要條件。這樣,生物進化論與博弈論的結合便成為可能,為進化博弈理論的產生奠定了基礎。進化博弈理論以群體(Population)為研究對象,主要處理群體中近視且幼稚的(Navie)個體進行重復、匿名博弈的動態調整過程。其基本思想為:給定群體所處的狀態,隨著時間的演化更合適的策略會被更多參與者采用,其目的是為預測群體最終行為提供一個理論依據。 ③此后本文稱之為原初定義 ④實際上相當于吸引域的半徑,也就說進化穩定策略考察的是系統落于該均衡的吸引域范圍之內的動態性質,而落于吸引域范圍之外是不考慮的,所以說它只能夠描述系統的局部動態性質。 ⑤如長頸鹿進化的過程。 ⑥對群體模型為無限大的要求有兩個原因:其一是機械式的,為了假想的“侵入界限”(Invasion Barriers)也就是突變者群體在大群體中所占的份額(Population Share),當突變群體模型超過1/n時,n是大群體的個體數,突變群體就有可能侵入到大群體,進化穩定策略的條件就有不滿足了。其二是技術上的,群體模型足夠大,就可以忽略掉現行群體個體的行為對其他突變者群體未來行為的影響,即不考慮學習過程。 ⑦其中的支付是生態學上的適應度(Fitness)或繁殖成活率。 ⑧下面我給出Van Damme1987的證明:首先設是進化穩定的,并且令所有參與人都選擇不變的策略。令,對所有的。令,其中,那么對所有,滿足及,因此,由進化穩定性可知。所以,而是任意的,所以。其次,設是一個嚴格納什均衡策略,并且,那么至少存在一個滿足,由的連續性可知,至少存在一個,對所有及,至少存在一個 滿足:,這就說明 是進化穩定的。 ⑨靜止點(Rest Point)就是當動態系統處于靜止點時就不會離開該點。 ⑩Alchian(1950)指出,企業必須通過對所觀察到的市場參與者的行動與結果之間的比較來得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的選擇過程,每一個企業所能夠選擇的策略不隨環境的變化而變化。在每一個階段結束時,如果企業1的利潤大于企業2的利潤,那么企業1在下一階段生存下來的概率就大于企業2在下一階段生存下來的概率。相應地可以把企業的生存規則看作為策略的幸存,成功策略在群體中所占的比例通過企業之間對策略的模仿而得以增長 ⑿楊小凱教授(1995)認為,博弈理論當前最有趣的研究成果及日后有可能獲得諾貝爾獎的工作就是信息不對稱的動態博弈模型,以及對策游戲規則演化模型(也就是進化博弈模型)。事實上1996年及2001年的諾獎都屬于研究信息經濟學的經濟學家,這說明楊教授具有超前的預見性,進化博弈理論研究者雖然還沒有獲得諾貝爾經濟學獎,但也可以說明楊教授非常看重對進化博弈理論的研究。
[參考文獻]
[1] 王則柯(1999):《博弈論平話》,中國經濟出版社。
[2] 張維迎(1999):《博弈論與信息經濟學》,上海三聯出版社。
[3] 張良橋(2001):《進化穩定均衡與納什均衡:兼談進化博弈理論的發展》,《經濟科學》,3,103-111。
[4] 張良橋(2001):《理性與有限理性:論經典博弈理論與進化博弈理論之關系》,《世界經濟》,8,74-78。
[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .
[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.
[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.
[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.
[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.
[10] Fudenberg, D. (1998): Learning in Games, Cambridge MIT Press.
[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.
[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.
[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.
[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.
[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.
[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.
[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.
[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.
[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.
[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.
[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.
[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.
[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.
[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.
[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.
[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.
[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.
[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.
[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.
[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.
[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.
【關鍵詞】 會計信息博弈;披露;監管
一、研究背景
云南綠大地生物科技股份有限公司(簡稱綠大地)創立于 1996 年 6 月, 2007 年 12 月,公司向社會公開發行股票在深圳證券交易所掛牌上市,成為國內綠化苗木行業首家上市公司。2011 年 3 月中旬,綠大地公司公告稱,其董事長何學葵因涉嫌欺詐發行股票罪被公安機關逮捕。調查發現,公司涉嫌虛增資產、虛增收入、虛增利潤等多項違法違規行為。其實,在此之前,綠大地造假事件早已露出端倪,上市三年多來,公司頻繁更換高管人員和會計師事務所。可是問題如此之多的綠大地,為何能通過層層關口上市融資,并直至三年后才被揭穿呢?
從銀廣廈到綠大地,上市公司涉嫌財務造假背后總有會計師事務所如影隨形。本來,中介機構的任務是將真正優秀的公司輸送到市場中,可事實卻是中介機構與上市公司串通起來蒙騙投資者。這是由于這種行為的成本與收益不對稱:與上市公司串通可以獲得很大的收益,而一旦東窗事發,處罰卻十分有限。顯然,造假成本小而收益大。針對這種會計信息失真現象,本文從動態博弈的角度出發,對這種現象進行了分析,并提出了減少會計信息失真現象的建議。
二、博弈模型的建立與假設的提出
在會計信息的披露過程中,有披露方和監管方這樣兩個參與者,其中會計信息的披露方主要指企業的管理層即經營者,會計信息的監管方指會計師事務所等外部監督管理機構(這里暫不討論股東這個角色)。每個博弈方都有兩個純策略可供選擇,對于披露方可以選擇披露虛假的會計信息即不誠信,也可以選擇披露真實的會計信息即誠信;對于監管方則可以選擇實行監管,也可以選擇不監管。這里用I和H分別表示監管方和披露方的策略集合,Ii和Hi分別表示第i個純策略(i=1,2),即I={I1,I2}={監管,不監管},H={H1,H2}={不誠信,誠信}。同時可以作出如下假設:
假設1:披露真實的會計信息為企業帶來的效用是Y,而披露虛假的會計信息為企業帶來的效用是X(X>Y),其中偽造虛假會計信息的成本是a,這里a相對于X來說特別的小即X-a>Y,只有在這種條件之下,企業才有可能對會計信息進行造假。
假設2:若披露虛假的會計信息,則監管方遭受的損失是m,若披露真實的會計信息,則監管方既無收益也無損失。如果監管方發現企業有造假行為,則企業應向監管方交納f的罰款,而監管方在監管過程中需要付出c的成本。
假設3:如果披露方披露虛假會計信息,監管方進行監管,就一定能查出該造假行為,且需滿足f-c>0,否則根據理性人的假設,監管方不會實施監管。同時也假定監管方監管的懲罰力度是很大的,實施的是有效監管,使企業在被處以罰款之后的效用低于披露真實會計信息的效用,即X-a-f
從以上假設可以得到監管方和披露方的得益矩陣(見表1)
三、會計信息披露與監督的靜態博弈分析
基于上述假設可以得出,在靜態博弈分析中,如果監管方選擇I1監管,則披露方就會選擇H2披露真實會計信息即誠信;如果監管方選擇I2不監管,則披露方就會選擇H1披露虛假會計信息即不誠信;如果披露方選擇H1不誠信,則監管方就會選擇I1監管;如果披露方選擇H2誠信,則監管方就會選擇I2不監管。這樣博弈雙方就一直在博弈矩陣里循環往復下去,顯然這個博弈不存在占優策略,但是納什均衡存在性定理告訴我們:每一個有限博弈至少存在一個納什均衡(純策略的或混合戰略的)。從以上分析可以看出這個博弈不存在純策略納什均衡,因此它必然存在一個混合策略納什均衡。
假定監管方的混合策略為p={p,1-p},披露方的混合策略為 Q={q,1-q},這表示監管方以P的概率選擇監管,披露方以q的概率選擇不誠信即披露虛假的會計信息。這樣就可以推出博弈雙方的期望得益:
監管方選擇監管的期望得益值為:
Up=q(f-m-c)+(1-q)(-c) (1)
監管方選擇不監管的期望得益值為:
U1-p=q(-m) (2)
披露方選擇不誠信的期望得益值為:
Uq=p(X-a-f)+(1-p)(X-a)(3)
披露方選擇誠信的期望得益值為:
U1-q=PY+(1-p)Y(4)
在混合策略納什均衡中,應該使得無論披露方選擇哪一種策略,監管方選擇監管和不監管的期望得益都是相同的,同時,也應該使無論監管方選擇哪一種策略,披露方選擇不誠信和誠信的期望得益是相同的。因此可以得到以下兩個等式:
Up=U1-p,Uq=U1-q
計算可以得到P*=(X-a-Y)/1,q*=c/f,,這表示監管方分別以概率P*和1-P*選擇“監管”與“不監管”,披露方分別以概率 q*和1-q*選擇“不誠信”和“誠信”,即監管方和披露方博弈的唯一的混合策略納什均衡為{((X-a-Y)/f,(f+a+Y-X)/f),(c/f,(f-c)/f)}。從中可以得出當p>P*時,誠信是披露方的最佳策略,即q=0;當pq*時,監管方會選擇監管,即p=1;當q
四、會計信息披露與監督的進化博弈分析
在有限理性下人們不一定有能力找到納什均衡,每個博弈方通過把不同策略的得益與平均得益進行比較,然后逐步調整策略。這與生物進化過程很類似,在物種進化過程中,生物調整自身行為很緩慢。在這里,假設由披露方和監管方組成的大群體學習速度很慢,這樣就可以用復制動態來模擬博弈方的動態調整,在整個復制動態過程中,如果出現一種適應性較高的策略,就會被大多數人采用,否則就會被淘汰。
在演化博弈分析框架下,監管方博弈群體中采用監管策略的比例為p,披露方博弈群體中采用不誠信策略的比例為q,因此,由方程(1)和(2)得到監管方群體的平均得益UI為:
UI=pUp+(1-p)U1-p=pqf-pc-qm(5)
由方程(3)和(4)得到披露方群體的平均得益UH為:
UH=qUq+(1-q)U1-q=q(X-a-Y)-pqf+Y (6)
由方程(1)、(5)可以得到監管方采用監管策略比例的復制動態方程為:
從上述分析可以得出以下結論:
第一,適當提高罰款額有助于降低披露方不誠信的可能性。
上述不等式說明監管方監管的可能性和披露方不誠信的可能性是罰款額的減函數。對于披露方而言,罰款額越高,越會選擇誠信即披露真實的會計信息,這與現實也是相符合的,一旦被發現會計信息造假,企業不僅要承擔因虛假會計信息帶來的損失,還要額外地支付罰款,這樣企業將會承擔更大的成本和風險,因此披露方會更傾向于選擇誠信的策略。同時,對于監管方來說,他們考慮到由于罰款額上升會使披露方不誠信的可能性降低,因此他們監管的可能性也會降低;相反,較低的懲罰力度會使披露方產生不誠信的心理,使得監管方監管的可能性增強。
第二,降低監管成本可以減小披露方不誠信的可能性。
這個不等式表明披露方不誠信的可能性會隨著監管成本的降低而降低,是因為較低的監管成本使得監管方實施監管的可能性增加,披露方考慮到監管方的這種心理,自然就減少會計信息造假的可能性。所以,為了盡可能地減少會計信息失真的現象發生,監管部門應該采取一切可能的方法來降低監管成本,有效遏制會計信息造假的發生。
第三,誠信遵從的改善是緩慢的,即監管方監管的概率p*較高時,披露方處于規避風險的考慮,他不誠信的概率q*較低,同時,一旦監管方覺察到會計信息造假的事件比較少時,也會放松監管,即選擇監管策略的可能性就會降低,這樣就會使得披露方偏向于選擇不誠信,提高不誠信的概率q*。這就表明,提高披露方的誠信遵從度是一個非常緩慢的過程,并非在短時間內可以實現,為減少會計信息失真的現象,應該盡量使得p>p*,從而使披露方不誠信的概率q保持在一個較低的水平上。
五、總結
本文從理論的角度分析了會計信息的披露和監管過程中的靜態博弈和動態進化博弈,克服了經典博弈模型中要求參與者具有完全理性的缺點,而進化博弈正是有限理性的研究框架,降低了參與者的理性程度,更貼近現實。除此之外,動態進化博弈提供了各種可能的均衡狀態,并給出了均衡狀態下的方程,同時將罰款金額、監管成本和造假成本納入動態分析過程,更符合現實,還得出了降低監管成本和加大懲罰力度是減少會計信息失真的有效途徑。
【參考文獻】
[1] 李敏.上市公司會計信息失真博弈分析[J].合作經濟與科技,2008(2):80-81.
[2] 徐煥章,管慧芳,劉麗華.基于博弈論的會計信息失真研究[J].西安工程大學學報,2009(2):126-130.
[3] 張維迎.博弈論與信息經濟學(第二版)[M].上海:上海人民出版社,2005.