博弈論是什么?說通俗點
lz會下棋嗎,博弈論就是說下棋的道理。
當(dāng)你下出一子的時候,你要考慮到對方會應(yīng)在哪里。
你下出的這子效果好還是不好,不能完全由你自己決定,還要看對手能不能看破你的意圖,用更有效的方式來破解你。
推廣到任何方面,人都不是一個人在做事,你做任何一件事的效果,要看你的對手或者你的同伴的行動。
這就是博弈論。
誰知道《博弈論的詭計》啊
國內(nèi)最好的一本關(guān)于博弈論的普及書,2007和2008年連續(xù)兩年的“中國圖書榜中榜”科普類的第一名。
書評《博弈論的詭計》小磨咖啡 \\\/ 挑燈看劍May 7th, 2008聿之研習(xí)一下博弈論,已然是一個夙愿了。
博弈論好歹也是我大學(xué)之后聽聞的第一個偉大的經(jīng)濟學(xué)理論了。
倒不是經(jīng)濟學(xué)的課堂,而是思修課上放映的《美麗心靈》。
這一部當(dāng)年擊敗《指環(huán)王》并維護了奧斯卡“良知”的影片,確乎給我們這些初入經(jīng)濟學(xué)的小生,影響是莫大的。
而博弈論更是一些人即將并一直熱衷的一個分析工具。
出納什和博弈本身的神奇經(jīng)歷,一直想有所了解。
不過,作為一門經(jīng)過嚴(yán)謹數(shù)學(xué)證明的理論,要深入其中,卻也必定是艱難的。
在圖書館轉(zhuǎn)了一圈,在兩分類中發(fā)現(xiàn)博弈論的蹤跡:經(jīng)管類與數(shù)學(xué)類。
無論哪一種,都是些許專著,有那么點令人頭疼的專著。
幸好,倒是在數(shù)學(xué)類的夾縫中瞧見一本《博弈論的詭計》的白話書,對于只知囚徒困境以及以牙還牙的我對說,倒確是一本不錯的書。
《博弈論的詭計》提要與思考囚徒困境:這個簡單的例子,幾乎是博弈論的代名詞。
兩個基于“坦白從寬,抗拒從嚴(yán)”審訊的囚徒,從理性的角度出發(fā),會產(chǎn)生怎樣的結(jié)局
結(jié)果若是,從個人理性并追求個人利益最大化,那么二人皆坦白,也就是背叛。
這在四種策略中并不占優(yōu),那為什么不采用集體最有策略呢而合作。
很簡單集體的優(yōu)化,必然侵害個人利益的最大化。
當(dāng)然這一切前提是理性假設(shè),也就是著名的經(jīng)濟人假設(shè):經(jīng)濟學(xué)中的人都是“小人”(管理學(xué)則認為人是“君子”,有意思而有道理的比喻)。
破解這一困境的途徑則是打破信息孤立,而執(zhí)法者的反制則是維持孤立或者加強威脅。
無論背叛還是合作,誰在這里面堅持到最后,誰將取勝。
重復(fù)博弈:囚徒困境,砸了傳統(tǒng)經(jīng)濟學(xué)的場子。
因為個人的自利行為,并不一定導(dǎo)致集體利益的最大化,“看不見的手”拉不住,人類向墮落之城下滑的趨勢,難道這真是一個悲哀
索性并非如此,撇去博弈論的理性假設(shè)不說。
博弈論者很快發(fā)現(xiàn)囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重復(fù),合作將到來。
因為,未來的收益將左右目前的決策。
以牙還牙:重復(fù)的博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),因為之前已經(jīng)說過,合作的代價是建立在損害個人利益基礎(chǔ)之上的。
如果個人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險仍然存在。
那么在重復(fù)博弈中怎樣的策略才是最優(yōu)。
若干睿智而復(fù)雜在經(jīng)過計算機中PK之后,極其原始的“以牙換牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至于人們在短暫的欣喜之后,發(fā)現(xiàn)這把太阿指之劍倒持的可怕,一旦重復(fù)鏈條中出現(xiàn)一次(也許不經(jīng)意的)背叛,那據(jù)此原則行事的博弈將永無止境的背叛下去,個人利益極度膨脹的同時,集體利益無限衰微。
幸好,這個世界不是模型,也不是如此簡單。
很多時候,我們不必以牙還牙,第三方的規(guī)范:道德與法律就是我們的假牙,他們更加有利、有理、有節(jié)。
人質(zhì)困境:一場憋屈的博弈。
搶打出頭鳥,人質(zhì)聯(lián)合固然可以制服歹徒,但是誰愿出頭。
這一點給了無數(shù)處于劫持者地位的一方以機會,類似于秦的遠交近攻、各個擊破的策略,將最終全盤贏下。
人質(zhì)可有反制的策略,當(dāng)然有,不過艱難至極。
人質(zhì)可以選擇沉默,這樣他有一定時間茍延殘喘;或者聯(lián)合劫持者對付人質(zhì),結(jié)局還是取決于劫持者,萬一他過河拆橋怎么辦;同時反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。
這里是實力與勇氣的較量,而且實力暫居上風(fēng)。
酒吧博弈:如果人人理性,那么每一天到達酒吧的人數(shù)將是差不多正好的,但是人非圣賢,往往是有限理性的。
第一次到酒吧的人多,那么大多人人認為酒吧人太多,太擠。
第二次決定的時候,參考前次而不去酒吧。
少數(shù)去的人發(fā)現(xiàn)酒吧的人第二天很少,感覺很爽,第三次將繼續(xù)回來,并重新帶回許多人……循環(huán)就此開始。
酒吧博弈一方面顯示,現(xiàn)實的博弈參與者,是極其有限理性的,其理性只前延后伸一小段。
歷史數(shù)據(jù)只對計算機有用,對人,則不一定。
另一個方面,酒吧博弈指出,勝利者永遠只是少數(shù)。
盡管酒吧存在調(diào)諧的可能,譬如發(fā)短信時時提醒,但成本恐怕太高。
而在其他場合,少數(shù)派可能更加會設(shè)置種種障礙阻止后進者的上升。
也就是說,我們的世界仍然是操弄在少數(shù)派的手中。
不過,總算這個世界不是模型,少數(shù)派的道路到底還是有跡可循的。
老練的將軍仍舊會在八卦迷陣中找到唯一的生門。
若你想要,必須做一個更加老練的將軍。
槍手博弈:王者的悲哀。
三人對槍自決,甲乙丙槍法優(yōu)劣遞減。
最后無奈而神奇的結(jié)局,將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。
因為沒有人會把威脅最小的槍手列為一號清楚目標(biāo)。
在這里,后發(fā)制人的弱勢者將勝出。
以弱勝強,絕不是神話。
難道王者的命運就真如此不堪,呵,道別忘了每個理論模型都是有其前提的,擊破之中任何一個,王者仍將歸來。
這就是先發(fā)優(yōu)勢。
假設(shè)這是一場類似CS的競技,優(yōu)秀的槍手擊倒二號槍手,立刻獲得獎勵:盾牌。
那么三號槍手將陷入絕境。
不過,不管怎樣,這個博弈模型,到底給了弱勢者一份希望。
機會永遠存在。
獵鹿博弈:兩個獵人合作獵鹿獲得的收益將遠大于分別獵兔的收益,戰(zhàn)略聯(lián)盟將開始。
這或許是件好事,不過有取決于最后獵獲的鹿——這一公共資源的分配,如果分配得當(dāng),整體的效率將增加。
如果一方主導(dǎo),另一方受損,那么帕累托改善無法進行,合作可能終將破裂。
另外一個問題,更加大局的問題。
合作的示范性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內(nèi)將呈幾何級數(shù)增長。
但是最后,確是生態(tài)失衡,鹿群滅群。
短暫的繁華之后,獵人將再一次回歸于原始獵兔生活。
盡管為了避免這一悲劇,人類還有最后的希望:制度經(jīng)濟學(xué)的法寶——科斯定理以產(chǎn)權(quán)歸屬來解決外部經(jīng)濟問題。
但由于談判成本以及可行性,人類社會的公共悲劇仍將不斷上演。
智豬博弈:混沌之前最后的博弈。
小豬和大豬住在豬圈的一邊(食槽在這里),開啟食物的開關(guān)在另一頭,誰去踩,誰喪失先機。
結(jié)果怎樣
是小豬選擇“搭便車”,大豬勤跑。
因為小豬無論跑還是停,大豬的最優(yōu)策略都是策略都是去踩機關(guān)。
不過在實際生活中。
這里依舊存在兩種策略。
小豬的“搭便車”。
大豬有的時候,自覺或不自覺地自封“俠之大者,為國為民”,并因此承受一些不能承受之重。
《博弈論的詭計》指出美國戰(zhàn)后的行為極似大豬,戰(zhàn)后的美國竭力宣傳自己的普世價值觀,并深入到海外事務(wù),甚至不惜重金協(xié)助小國防務(wù)。
這樣小國不自覺地對大國進行了“剝削”。
大豬在擊破模型的一個假設(shè)之后,仍然有一個后發(fā)制人的機會。
因為大豬和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那只有一條豪賭的路子:龜兔賽跑式的豪賭,但愿大豬打了個盹兒,他回來的時候,還能吃上一兩口,要不然真是賠了夫人又折兵了。
據(jù)此,再也不難解釋為什么很多人切齒的騰訊,毫無顧忌地跟風(fēng),做QQ旋風(fēng),做拍拍,做滔滔。
因為不甘心的小豬早早把新技術(shù)研發(fā)的前期搞定了,大豬們只需要悄悄跟隨,適當(dāng)?shù)臅r候踢開擋路的,就可以了。
大豬在這里的后發(fā)制人和槍手博弈的后發(fā)并不一致,槍手后發(fā)是建立在他人惡斗的基礎(chǔ)上,大豬后發(fā)完全是以自身實力為基礎(chǔ)。
而且大豬完全不必采取任何激進措施,只要跟隨就好。
因為小豬獲勝的條件不是接近,還是距離。
警察與小偷:令人沮喪的博弈結(jié)局。
警察和小偷各只有一個機會去巡查或者偷盜A地或B地。
A地的價值大于B地,那么警察應(yīng)該為了保護價值大而一直保護A地嗎。
博弈論認為當(dāng)然不是,警察的合理策略應(yīng)當(dāng)是有傾向于A以一定概率的隨機巡查。
這個概率就是:p=A地價值\\\/AB地總價值。
這種情況下才能使小偷最大得手幾率降至最低。
但是很不幸的是,此時的小偷謀求的是,最小得手幾率的最大化。
也就是說,警察的最優(yōu)策略將把小偷的最差策略改良
這個便是馮·諾伊曼提出的“最小最大定律”。
我們必須再一次感謝這個不完美的世界,因為現(xiàn)實之中,類似的現(xiàn)象,對于一方仍然可以設(shè)法找到對手致命的規(guī)律性行動(當(dāng)然必須考慮到對方是不是一個更加老練的獵手,故意放出的誘餌)。
而保持自己的行動的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。
斗雞博弈:兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為納什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。
在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。
因此,兩個已經(jīng)在戰(zhàn)場的強勢力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時,另一方暫退。
雖然可能某方暫時受損,但較之于兩敗俱傷是好得多的。
不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動攻勢的時候,另一方同樣的后退。
于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。
這只不過是兩個巨頭玩弄的游戲,目的是警告后來者,想進來,那么也得陪我們一起玩,可是你玩的起么
這正是百事的廣告,即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。
協(xié)和謬誤:歐洲政府在大量投資協(xié)和飛機后,終于不能自拔。
即使前景黯淡,也撐著面子投下去,非要走頭無路才放棄。
而這時投入的成本已經(jīng)全打水漂了。
如果,發(fā)現(xiàn)不能繼續(xù)的時候,就果敢放手,損失會小得多。
可是他們會、能這么做么
壯士斷腕,是何等的壯烈,卻也是何等的艱難
沉沒成本很可能會延續(xù)人們無畏的堅持。
已經(jīng)沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的杠桿終將啟動。
可惜他們在爬到足夠撬動杠桿的支點之前,已經(jīng)窒息了。
協(xié)和謬誤,倒是給了人們半途而廢的理由,會不會有人擔(dān)心它的濫觴會左右一些本該堅持的目標(biāo)
的確有這個可能,但是應(yīng)該相信人們足夠理智,完全可以比較沉沒成本、機會成本與未來收益的關(guān)系。
看清了的,必定會坦然地走出協(xié)和謬誤。
蜈蚣博弈:一場顛前倒后的博弈。
蜈蚣博弈的機理是以最終的結(jié)果倒退至開始。
這是一個睿智的策略,因果相報,把握好因緣,自有好結(jié)果。
它的另一個好處,就是使得未來的計劃明晰化,是你不再徘徊。
只可惜,很多時候,碌碌無為的我們并沒有看透迷局的眼睛。
我們黑色的眼睛只習(xí)慣于黑夜。
蜈蚣博弈也有一個致命的悖論,仍舊是個人利益和集體利益的沖突,因為最后一次的背叛收益始終優(yōu)于合作。
可悲的是,這一次背叛將由于人性的理智,穿越時光隧道,回到原始的地點:人們將從開始就拒絕合作。
還是感謝我們這個不完美的世界吧,事實上人們很少這樣做。
當(dāng)然合作到最后的也很少,這意味著,倒推法只在中間階段突然發(fā)生了作用,只不過誰也不能預(yù)測,中間一步在哪里。
在那里,我們只有冀望信任、道德、良知等等。
分蛋糕博弈:兩個小孩怎么分蛋糕
經(jīng)典的故事,經(jīng)典的解答:一個分,一個選。
現(xiàn)實多如此,權(quán)利的合理分配將有效促進公平與效率。
經(jīng)營權(quán)與所有權(quán)的分置的確使得經(jīng)濟更加活力。
不過分蛋糕的進階模型卻強調(diào)了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現(xiàn)成本:蛋糕在融化。
時間稱本的加入,將使得分配變得復(fù)雜化。
雙方如果不能及時達成交易,不僅集體的收益將減量,而且個體的收益也將減少。
在此情況下,利用時間稱本以及威脅、承諾將對其中一方極其有利。
顧客可能迫于情勢,必須盡快結(jié)束談判,這時賣方卻不慌不忙,故意拖延,顧客一方將不得不在價格上作出妥協(xié)。
顧客一方當(dāng)然也有策略,它的策略就是貨比三家,要求承諾或威脅。
這個前提是買方市場的存在。
顧客還應(yīng)當(dāng)保護自己討價還價的能力,這就是顧客有權(quán)投訴商家。
鷹鴿博弈:這個博弈很多人等同于斗雞博弈。
不過,斗雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。
在只有鴿子一個苞谷場里,突然加入的鷹將大大獲益,并吸引同伴加入。
但結(jié)果不是鷹將鴿逐出苞谷場,而是一定比例共存,因為鷹群增加一只鷹的邊際收益趨零時(鷹群發(fā)生內(nèi)斗),均衡將到來。
由此產(chǎn)生了ESS進化上的穩(wěn)定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。
也就是鷹群飽滿后,再試圖加入的鷹將會被鷹群排擠。
進化上的穩(wěn)定均衡最大的好處莫過于保持穩(wěn)定。
但問題在于形成強勢的路徑依賴,也就是勝出的不一定是最好的。
因為最好的會被當(dāng)作出頭鳥干掉,這是個體的失敗,集團的勝利以及集體的止步不前。
臟臉博弈:恍然大悟的博弈。
三個人在屋子里,不許說話。
美女進來說:你們當(dāng)中至少一個人臉是臟的。
三人環(huán)看,沒有反應(yīng)。
美女又說:你們知道嗎
三人再看,頓悟,臉都紅了。
為什么
因為美女后一句廢話點破天機,三個人都知道臟臉的存在,而且推測知道對方也知道了臟臉的存在(因為另兩人臉沒紅,說明他們看到臟臉了),而且知道對方知道自己已經(jīng)想到上一步……循環(huán)開始,知識開始共同化,真相大白:三個人都是臟臉,所有人都臉紅了。
這就是共同知識的作用,它的作用顯得有點可怕的強大。
幾乎是一招無影腿,殺人不見血。
在臺面上的博弈之前,私下的算計已經(jīng)置對手于死地。
不過,很可能對方也預(yù)料到這一點,早也想到這一點,同時殺來。
終于,形成雙死局面。
當(dāng)然,現(xiàn)實雖然存在類似現(xiàn)象,不過共同知識更大的作用在于減少交易成本。
因為某些規(guī)則人盡皆知,雙方只要各自依之行事就可以了。
信息均衡:很想然,信息的作用在博弈之中非常重要。
將博弈論還原到現(xiàn)實,人們不再完全理性,信息存在不對稱,博弈就需要在搶占信息高地上作出努力。
信息不對稱,是一個很大的障礙。
信息的不對稱會造成“逆向選擇”和“道德風(fēng)險”,前者事前,后者事后。
信息不對稱短期內(nèi)對某一方會有利,但最終會破壞整個市場。
于是有兩個解決策略。
信息傳遞:傳達你的正面的信息的策略,也就是說吸引顧客走到你的柜臺面前。
它的要點是保持有效、減低成本。
信息甄別:誘導(dǎo)對手暴露其私下?lián)碛械恼鎸嵭畔ⅰ?/p>
就是給顧客一個放大鏡,保證顧客不會走到其他柜臺去。
這種策略顯然更加有效,不過風(fēng)險也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎么辦
再介紹一篇評論:王春永《博弈論的詭計》 標(biāo)簽:王春永 博弈論的詭計 歷史 文化 我們每天生活在博弈中,博弈論只是用數(shù)學(xué)的辦法解釋了我們長期進行的博弈。
即使這樣,當(dāng)我們看到數(shù)學(xué)推演出的結(jié)論時,也不免目瞪口呆。
雖然每天博弈,但因為復(fù)雜的因素,我們常??床磺宄嵸|(zhì)。
按照直覺出牌,時常落入別人的算計。
或許此書能幫我們解決些問題。
本書涵蓋范圍很寬,大到人生抉擇,小到一日三餐,用博弈的眼光解釋了我們一生中的各類問題,包括職業(yè),交往,愛情,經(jīng)濟,時間管理等等,有時讓你忘記了這是本博弈論的書,還以為是成功學(xué)。
但說起來,博弈還不是為了成功嗎
書里內(nèi)容很多。
作者恰當(dāng)?shù)膶⒉┺睦碚?、試驗案例和歷史、政治、文學(xué)、新聞、故事等等串聯(lián)在一起,融會貫通,縱橫肆意,文字優(yōu)美,令人佩服。
更有意思的是,每篇開頭,作者都是引用一段流行歌曲(其中大部分我都不知道)的歌詞作個引子,簡直有些古典小說的結(jié)構(gòu)意味了。
在中國的教育體系下,研究數(shù)學(xué)的人有幾人還會關(guān)注人文歷史呢,更不要說關(guān)注流行了
而本書作者看來頗具閱歷且閱讀雜廣,其中引用的不少東西都是近年來的新事物和新說法,想來都是敏銳的發(fā)現(xiàn)后總結(jié)到自己的研究中了。
所以我每讀到精彩處,都不免對作者的文理跨度感嘆一番。
文字中常看到作者的一些抱負。
他很聰明,把一些敏感的看法鋪墊清楚然后一筆帶過,讀者自明。
他常引用吳思先生的作品,但不像吳先生那么機鋒。
我想這也是博弈訓(xùn)練的結(jié)果。
書末尾的參考文獻讓人發(fā)笑。
可能是覺得參考文獻太少,作者竟然把羅貫中的三國演義也算在內(nèi)充數(shù)。
若是如此,他還引用的那些史記、通鑒等只怕就太感委屈了。
本書其實引用極為豐富,若一一列出參考,作者要累死,所以就這樣糊弄了一下吧。
尤侗 戒賭文
身邊好賭者甚眾,見有墮入深坑者,灰頭土臉,而有小進者尚在自得,有感發(fā)文。
戒賭文尤侗天下之惡,莫過於賭。
,陶公所怒。
一擲百萬,何苦
今有甚焉,打馬鬬虎。
羣居終日,一班水滸。
勢如刼盜,術(shù)比貪賈。
口哆目張,足蹈手舞。
敗固索然,勝亦何取
約有三費,未可枚舉。
既卜其晝,又卜其夜。
寢尚未遑,食且無暇。
不見日斜,寧聞漏下
讙呶辟寒,袒跣消夏。
賓客長辭,琴書都罷。
是曰費時,寸陰難借。
三人合力,以攻一樁。
兵不厭詐,敵必用強。
殺機潛伏,詭計深藏。
左顧右盼,千思萬量。
精神恍惚,面目焦黃。
是曰費心,終必病狂。
一文半文,千貫萬貫。
錙銖必較,泥沙無算。
贏乃借籌,負或書券。
家棄田園,祖遺寶玩。
慳者不吝,貪者不倦。
是曰費財,困窮立見。
始作俑者,公卿大夫。
退朝休沐,讌會相娛。
點籌狎客,秉燭監(jiān)奴。
間同姬妾,角技氍毹。
平章重事,豈在是乎
亦有儒生,厭薄章句。
博弈猶賢,詩書沒趣。
引類呼朋,攤錢爭注。
赤腳無成,白頭不遇。
文鬼誰憐,牌神莫助。
富人長者,公子王孫。
珠玉滿室,。
呼盧白日,喝采黃昏。
千金忽散,一畝無存。
墦間乞食,泉下埋魂。
至如商旅,間關(guān)萬里。
競利錐刀,窺窬倍蓰。
火伴誘人,牙行弄鬼。
囊破吳山,身漂越水。
夢斷嬌妻,饑啼稚子。
其下市人,肩挑步販。
體少完衣,廚無宿飯。
脫帽遶牀,投馬翻案。
登場醉飽,出門逃竄。
賣兒鬻女,盡供撒漫。
最恨奴仆,全無心肝。
暖衣飽食,游手好閑。
酒肴偷醵,房戶牢關(guān)。
忙中作耍,背后藏奸。
狐羣狗黨,非賭不歡。
故賭雖百族,惡實一類。
天理已絕,人事復(fù)廢。
蓋以大滅小者不仁,以私害公者不義,式號式呼者無禮,佹得佹失者非智。
分無貴賤,四座定位。
上攀縉紳,下接皂隸。
齒無尊卑,一家弗忌。
父子摩肩,弟兄紾臂。
閑無內(nèi)外,男女雜次。
繡閣拋妻,青樓挾妓。
交無親疏,惟利是視。
陌路綢繆,故人睚眥。
四端喪矣,五倫亡矣。
身家蕩矣,子孫殃矣。
賭必近盜,對面作賊。
戰(zhàn)勝探囊,圖窮鑿壁。
賭必誨淫,聚散昏黑。
艷婦絕纓,孌童薦席。
賭必釁殺,弱肉強食。
老拳毒手,性命相逼。
戒之戒之,凡戲無益。
今有貪夫,開肆抽頭。
創(chuàng)立規(guī)則,供給珍羞。
如張羅網(wǎng),鳥雀來投。
鷸蚌相持,漁利兼收。
更有險人,合成毒藥。
躡足附耳,暗通線索。
彼昏不知,束手就縛。
旁觀咨嗟,當(dāng)局笑樂。
人之過也,必藉箴規(guī)。
惟耽賭癖,陽奉陰違。
父師呵叱,妻孥涕涕。
勇足拒諫,巧能飾非。
貧而無怨,死且不辭。
及至悔悟,靡有孑遺。
嗚呼哀哉,誰為為之
吾聞此風(fēng),明末最盛。
曰闖曰獻,又曰大順。
流賊作亂,其名皆應(yīng)。
相公馬吊,百老阮姓。
南渡亡國,不祥先讖。
在上,豈容妖氛。
敢告司寇,宜制嚴(yán)刑。
,大盜余腥。
誅不待教,有犯必黥。
火其圖譜,殛此頑民。
圣人設(shè)教,君子反經(jīng)。
慢游用儆,驕樂當(dāng)懲。
人心禽獸,何去何存
借曰未知,請視斯文。
博弈論中帕累托效率意義上的最佳策略組合意思是不是該策略各博弈方得益都比其他策略組合大
經(jīng)濟學(xué)中的“智豬博弈”(Pigs’payoffs)這個例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。
豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。
如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。
當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會采取什么策略
答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在
因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。
對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。
反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。
規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。
如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎
試試看。
改變方案一:減量方案。
投食僅原來的一半分量。
結(jié)果是小豬大豬都不去踩踏板了。
小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。
誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。
如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個游戲規(guī)則的設(shè)計顯然是失敗的。
改變方案二:增量方案。
投食為原來的一倍分量。
結(jié)果是小豬、大豬都會去踩踏板。
誰想吃,誰就會去踩踏板。
反正對方不會一次把食物吃完。
小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。
對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?/p>
改變方案三:減量加移位方案。
投食僅原來的一半分量,但同時將投食口移到踏板附近。
結(jié)果呢,小豬和大豬都在拼命地搶著踩踏板。
等待者不得食,而多勞者多得。
每次的收獲剛好消費完。
對于游戲設(shè)計者,這是一個最好的方案。
成本不高,但收獲最大。
原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。
但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。
為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。
而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。
比如,公司的激勵制度設(shè)計,獎勵力度太大,又是持股,又是期權(quán),公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。
這相當(dāng)于“智豬博弈”增量方案所描述的情形。
但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。
最好的激勵機制設(shè)計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實現(xiàn)有效的激勵。
許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。
股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。
因此,對于制訂各種經(jīng)濟管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個中道理。
納什博弈論的原理與應(yīng)用1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。
他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。
從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。
納什的研究奠定了現(xiàn)代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。
然而,納什天才的發(fā)現(xiàn)卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。
但是骨子里挑戰(zhàn)權(quán)威、藐視權(quán)威的本性,使納什堅持了自己的觀點,終成一代大師。
要不是30多年的嚴(yán)重精神病折磨,恐怕他早已站在諾貝爾獎的領(lǐng)獎臺上了,而且也絕不會與其他人分享這一殊榮。
納什是一個非常天才的數(shù)學(xué)家,他的主要貢獻是1950至1951年在普林斯頓讀博士學(xué)位時做出的。
然而,他的天才發(fā)現(xiàn)———非合作博弈的均衡,即“納什均衡”并不是一帆風(fēng)順的。
1948年納什到普林斯頓大學(xué)讀數(shù)學(xué)系的博士。
那一年他還不到20歲。
當(dāng)時普林斯頓可謂人杰地靈,大師如云。
愛因斯坦、馮·諾依曼、列夫謝茨(數(shù)學(xué)系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這里。
博弈論主要是由馮·諾依曼(1903—1957)創(chuàng)所立的。
他是一位出生于匈牙利的天才的數(shù)學(xué)家。
他不僅創(chuàng)立了經(jīng)濟博弈論,而且發(fā)明了計算機。
早在20世紀(jì)初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經(jīng)開始研究博弈的準(zhǔn)確的數(shù)學(xué)表達,直到1939年,馮·諾依曼遇到經(jīng)濟學(xué)家奧斯卡·摩根斯特恩(Oskar Morgenstern),并與其合作才使博弈論進入經(jīng)濟學(xué)的廣闊領(lǐng)域。
1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經(jīng)濟行為》出版,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。
盡管對具有博弈性質(zhì)的問題的研究可以追溯到19世紀(jì)甚至更早。
例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產(chǎn)量與價格壟斷;2000多年前中國著名軍事家孫武的后代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統(tǒng)。
馮·諾依曼和摩根斯特恩的《博弈論與經(jīng)濟行為》一書中提出的標(biāo)準(zhǔn)型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。
合作型博弈在20世紀(jì)50年代達到了巔峰期。
然而,諾依曼的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有限。
正是在這個時候,非合作博弈———“納什均衡”應(yīng)運而生了,它標(biāo)志著博弈論的新時代的開始
納什不是一個按部就班的學(xué)生,他經(jīng)常曠課。
據(jù)他的同學(xué)們回憶,他們根本想不起來曾經(jīng)什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數(shù)拓撲學(xué)。
斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。
于是,又走人了。
然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個分支,如拓撲學(xué)、代數(shù)幾何學(xué)、邏輯學(xué)、博弈論等等,深深地為之著迷。
納什經(jīng)常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學(xué)術(shù)野心。
1950年整個夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。
殊不知這種暫時的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感
這一年的10月,他驟感才思潮涌,夢筆生花。
其中一個最耀眼的亮點就是日后被稱之為“納什均衡”的非合作博弈均衡的概念。
納什的主要學(xué)術(shù)貢獻體現(xiàn)在1950年和1951年的兩篇論文之中(包括一篇博士論文)。
1950年他才把自己的研究成果寫成題為“非合作博弈”的長篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報上,立即引起轟動。
說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之后,他遇到蓋爾,告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”(minimax solution)推到非合作博弈領(lǐng)域,找到了普遍化的方法和均衡點。
蓋爾聽得很認真,他終于意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現(xiàn)實的情況,而對其嚴(yán)密優(yōu)美的數(shù)學(xué)證明極為贊嘆。
蓋爾建議他馬上整理出來發(fā)表,以免被別人捷足先登。
納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。
結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。
納什寫的文章不多,就那么幾篇,但已經(jīng)足夠了,因為都是精品中的精品。
這一點也是值得我們深思的。
國內(nèi)提一個教授,要求在“核心的刊物”上發(fā)表多少篇文章。
按照這個標(biāo)準(zhǔn)可能納什還不一定夠資格。
1996年諾貝爾經(jīng)濟學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟學(xué)講座教授時也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學(xué)時就開始從事純數(shù)學(xué)的博弈論研究,1948年進入普林斯頓大學(xué)后更是如魚得水。
20歲出頭已成為聞名世界的數(shù)學(xué)家。
特別是在經(jīng)濟博弈論領(lǐng)域,他做出了劃時代的貢獻,是繼馮·諾依曼之后最偉大的博弈論大師之一。
他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。
后續(xù)的研究者對博弈論的貢獻,都是建立在這一概念之上的。
由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟學(xué)、管理學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。
囚徒困境博弈在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’ dilemma)博弈模型。
該模型用一種特別的方式為我們講述了一個警察與小偷的故事。
假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。
警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。
如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。
如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
表2.2給出了這個博弈的支付矩陣。
表2.2 囚徒困境博弈 [Prisoner's dilemma]——————————————————————————┃ B ┃ B ┃————————┃————————┃————————┃┃ 坦白 ┃ 抵賴 ┃————————┃————————┃————————┃A 坦白 ┃ –8, –8 ┃ 0, –10 ┃————————┃————————┃————————┃A 抵賴 ┃ –10, 0 ┃ –1, –1 ┃————————┃————————┃————————┃我們來看看這個博弈可預(yù)測的均衡是什么。
對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。
顯然,根據(jù)對稱性,B也會選擇“坦白”,結(jié)果是兩人都被判刑8年。
但是,倘若他們都選擇“抵賴”,每人只被判刑1年。
在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累托最優(yōu)的,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。
不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡。
要了解納什的貢獻,首先要知道什么是非合作博弈問題。
現(xiàn)在幾乎所有的博弈論教科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。
博弈論畢竟是數(shù)學(xué),更確切地說是運籌學(xué)的一個分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。
好在博弈論關(guān)心的是日常經(jīng)濟生活問題,所以不能不食人間煙火。
其實這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點玄奧,實際上卻具有重要現(xiàn)實意義。
博弈論大師看經(jīng)濟社會問題猶如棋局,常常寓深刻道理于游戲之中。
所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。
話說有一天,一位富翁在家中被殺,財物被盜。
警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。
但是,他們矢口否認曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。
于是警方將兩人隔離,分別關(guān)在不同的房間進行審訊。
由地方檢察官分別和每個人單獨談話。
檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。
但是,我可以和你做個交易。
如果你單獨坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。
如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。
但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。
”斯卡爾菲絲和那庫爾斯該怎么辦呢
他們面臨著兩難的選擇——坦白或抵賴。
顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。
但是由于兩人處于隔離的情況下無法串供。
所以,按照亞當(dāng)·斯密的理論,每一個人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。
因為坦白交代可以期望得到很短的監(jiān)禁———3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。
這種策略是損人利己的策略。
不僅如此,坦白還有更多的好處。
如果對方坦白了而自己抵賴了,那自己就得坐10年牢。
太不劃算了
因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。
所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。
這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。
因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。
也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。
沒有人會主動改變自己的策略以便使自己獲得更大利益。
“囚徒的兩難選擇”有著廣泛而深刻的意義。
個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。
他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。
只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。
“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。
按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。
不妨讓我們重溫一下這位經(jīng)濟學(xué)圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。
”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。
兩個囚徒的命運就是如此。
從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經(jīng)濟學(xué)的基石。
因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。
但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。
也就是中國人說的“己所不欲勿施于人”。
但前提是人所不欲勿施于我。
其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實中非合作的情況要比合作情況普遍。
所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。
我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。
如價格戰(zhàn)、軍奮競賽、污染等等。
一般的博弈問題由三個要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。
其中所謂贏得是指如果一個特定的策略關(guān)系被選擇,每一局中人所得到的效用。
所有的博弈問題都會遇到這三個要素。
價格戰(zhàn)博弈:現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費者。
每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn),百姓都會“沒事兒偷著樂”。
在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。
因為博弈雙方的利潤正好是零。
競爭的結(jié)果是穩(wěn)定的,即是一個“納什均衡”。
這個結(jié)果可能對消費者是有利的,但對廠商而言是災(zāi)難性的。
所以,價格戰(zhàn)對廠商而言意味著自殺。
從這個案例中我們可以引伸出兩個問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。
二是如果不采取價格戰(zhàn),作為一種敵對博弈論(vivalry game)其結(jié)果會如何呢
每一個企業(yè),都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。
如果壟斷可以形成,則博弈雙方的共同利潤最大。
這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。
另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。
從這一點,我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎(chǔ)上”。
事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。
在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。
在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格等于邊際成本。
在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟效率狀態(tài)。
如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞。
這就是為什么WTO和各國政府要加強反壟斷的意義所在。
污染博弈:假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。
按照看不見的手的原理,所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進入“納什均衡”狀態(tài)。
如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。
這是一個“看不見的手的有效的完全競爭機制”失敗的例證。
直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。
只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。
企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。
貿(mào)易戰(zhàn)博弈論這個問題對于剛剛加入WTO的中國而言尤為重要。
任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護主義的兩難選擇。
貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。
X國試圖對Y國進行進口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會進行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。
反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。
博弈論--這是一個熱得燙手的概念。
它不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟學(xué)獎就頻頻授予博弈論研究者),但如果你認為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。
實際上,博弈論甚至在我們的工作和生活中無處不在
在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。
在生活中,博弈仍然無處不在。
博弈論代表著一種全新的分析方法和全新的思想。
諾貝爾經(jīng)濟學(xué)獎獲得者包羅·薩繆爾遜如是說:要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。
也可以這樣說,要相贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
經(jīng)濟學(xué)的博弈指什么>?
經(jīng)濟學(xué)中的“智豬博弈”(Pigs’payoffs) 這個例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。
豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。
如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。
當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會采取什么策略
答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在
因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。
對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。
反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。
規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。
如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎
試試看。
改變方案一:減量方案。
投食僅原來的一半分量。
結(jié)果是小豬大豬都不去踩踏板了。
小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。
誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。
如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個游戲規(guī)則的設(shè)計顯然是失敗的。
改變方案二:增量方案。
投食為原來的一倍分量。
結(jié)果是小豬、大豬都會去踩踏板。
誰想吃,誰就會去踩踏板。
反正對方不會一次把食物吃完。
小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。
對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?/p>
改變方案三:減量加移位方案。
投食僅原來的一半分量,但同時將投食口移到踏板附近。
結(jié)果呢,小豬和大豬都在拼命地搶著踩踏板。
等待者不得食,而多勞者多得。
每次的收獲剛好消費完。
對于游戲設(shè)計者,這是一個最好的方案。
成本不高,但收獲最大。
原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。
但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。
為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。
而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。
比如,公司的激勵制度設(shè)計,獎勵力度太大,又是持股,又是期權(quán),公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。
這相當(dāng)于“智豬博弈”增量方案所描述的情形。
但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。
最好的激勵機制設(shè)計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實現(xiàn)有效的激勵。
許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。
股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。
因此,對于制訂各種經(jīng)濟管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個中道理。
納什博弈論的原理與應(yīng)用 1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。
他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。
從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。
納什的研究奠定了現(xiàn)代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。
然而,納什天才的發(fā)現(xiàn)卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。
但是骨子里挑戰(zhàn)權(quán)威、藐視權(quán)威的本性,使納什堅持了自己的觀點,終成一代大師。
要不是30多年的嚴(yán)重精神病折磨,恐怕他早已站在諾貝爾獎的領(lǐng)獎臺上了,而且也絕不會與其他人分享這一殊榮。
納什是一個非常天才的數(shù)學(xué)家,他的主要貢獻是1950至1951年在普林斯頓讀博士學(xué)位時做出的。
然而,他的天才發(fā)現(xiàn)———非合作博弈的均衡,即“納什均衡”并不是一帆風(fēng)順的。
1948年納什到普林斯頓大學(xué)讀數(shù)學(xué)系的博士。
那一年他還不到20歲。
當(dāng)時普林斯頓可謂人杰地靈,大師如云。
愛因斯坦、馮·諾依曼、列夫謝茨(數(shù)學(xué)系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這里。
博弈論主要是由馮·諾依曼(1903—1957)創(chuàng)所立的。
他是一位出生于匈牙利的天才的數(shù)學(xué)家。
他不僅創(chuàng)立了經(jīng)濟博弈論,而且發(fā)明了計算機。
早在20世紀(jì)初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經(jīng)開始研究博弈的準(zhǔn)確的數(shù)學(xué)表達,直到1939年,馮·諾依曼遇到經(jīng)濟學(xué)家奧斯卡·摩根斯特恩(Oskar Morgenstern),并與其合作才使博弈論進入經(jīng)濟學(xué)的廣闊領(lǐng)域。
1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經(jīng)濟行為》出版,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。
盡管對具有博弈性質(zhì)的問題的研究可以追溯到19世紀(jì)甚至更早。
例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產(chǎn)量與價格壟斷;2000多年前中國著名軍事家孫武的后代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統(tǒng)。
馮·諾依曼和摩根斯特恩的《博弈論與經(jīng)濟行為》一書中提出的標(biāo)準(zhǔn)型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。
合作型博弈在20世紀(jì)50年代達到了巔峰期。
然而,諾依曼的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有限。
正是在這個時候,非合作博弈———“納什均衡”應(yīng)運而生了,它標(biāo)志著博弈論的新時代的開始
納什不是一個按部就班的學(xué)生,他經(jīng)常曠課。
據(jù)他的同學(xué)們回憶,他們根本想不起來曾經(jīng)什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數(shù)拓撲學(xué)。
斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。
于是,又走人了。
然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個分支,如拓撲學(xué)、代數(shù)幾何學(xué)、邏輯學(xué)、博弈論等等,深深地為之著迷。
納什經(jīng)常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學(xué)術(shù)野心。
1950年整個夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。
殊不知這種暫時的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感
這一年的10月,他驟感才思潮涌,夢筆生花。
其中一個最耀眼的亮點就是日后被稱之為“納什均衡”的非合作博弈均衡的概念。
納什的主要學(xué)術(shù)貢獻體現(xiàn)在1950年和1951年的兩篇論文之中(包括一篇博士論文)。
1950年他才把自己的研究成果寫成題為“非合作博弈”的長篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報上,立即引起轟動。
說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之后,他遇到蓋爾,告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”(minimax solution)推到非合作博弈領(lǐng)域,找到了普遍化的方法和均衡點。
蓋爾聽得很認真,他終于意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現(xiàn)實的情況,而對其嚴(yán)密優(yōu)美的數(shù)學(xué)證明極為贊嘆。
蓋爾建議他馬上整理出來發(fā)表,以免被別人捷足先登。
納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。
結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。
納什寫的文章不多,就那么幾篇,但已經(jīng)足夠了,因為都是精品中的精品。
這一點也是值得我們深思的。
國內(nèi)提一個教授,要求在“核心的刊物”上發(fā)表多少篇文章。
按照這個標(biāo)準(zhǔn)可能納什還不一定夠資格。
1996年諾貝爾經(jīng)濟學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟學(xué)講座教授時也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學(xué)時就開始從事純數(shù)學(xué)的博弈論研究,1948年進入普林斯頓大學(xué)后更是如魚得水。
20歲出頭已成為聞名世界的數(shù)學(xué)家。
特別是在經(jīng)濟博弈論領(lǐng)域,他做出了劃時代的貢獻,是繼馮·諾依曼之后最偉大的博弈論大師之一。
他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。
后續(xù)的研究者對博弈論的貢獻,都是建立在這一概念之上的。
由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟學(xué)、管理學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。
囚徒困境博弈 在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’ dilemma)博弈模型。
該模型用一種特別的方式為我們講述了一個警察與小偷的故事。
假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。
警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。
如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。
如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
表2.2給出了這個博弈的支付矩陣。
表2.2 囚徒困境博弈 [Prisoner's dilemma] —————————————————————————— ┃ B ┃ B ┃ ————————┃————————┃————————┃ ┃ 坦白 ┃ 抵賴 ┃ ————————┃————————┃————————┃ A 坦白 ┃ –8, –8 ┃ 0, –10 ┃ ————————┃————————┃————————┃ A 抵賴 ┃ –10, 0 ┃ –1, –1 ┃ ————————┃————————┃————————┃ 我們來看看這個博弈可預(yù)測的均衡是什么。
對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。
顯然,根據(jù)對稱性,B也會選擇“坦白”,結(jié)果是兩人都被判刑8年。
但是,倘若他們都選擇“抵賴”,每人只被判刑1年。
在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累托最優(yōu)的,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。
不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡。
要了解納什的貢獻,首先要知道什么是非合作博弈問題。
現(xiàn)在幾乎所有的博弈論教科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。
博弈論畢竟是數(shù)學(xué),更確切地說是運籌學(xué)的一個分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。
好在博弈論關(guān)心的是日常經(jīng)濟生活問題,所以不能不食人間煙火。
其實這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點玄奧,實際上卻具有重要現(xiàn)實意義。
博弈論大師看經(jīng)濟社會問題猶如棋局,常常寓深刻道理于游戲之中。
所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。
話說有一天,一位富翁在家中被殺,財物被盜。
警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。
但是,他們矢口否認曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。
于是警方將兩人隔離,分別關(guān)在不同的房間進行審訊。
由地方檢察官分別和每個人單獨談話。
檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。
但是,我可以和你做個交易。
如果你單獨坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。
如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。
但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。
”斯卡爾菲絲和那庫爾斯該怎么辦呢
他們面臨著兩難的選擇——坦白或抵賴。
顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。
但是由于兩人處于隔離的情況下無法串供。
所以,按照亞當(dāng)·斯密的理論,每一個人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。
因為坦白交代可以期望得到很短的監(jiān)禁———3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。
這種策略是損人利己的策略。
不僅如此,坦白還有更多的好處。
如果對方坦白了而自己抵賴了,那自己就得坐10年牢。
太不劃算了
因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。
所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。
這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。
因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。
也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。
沒有人會主動改變自己的策略以便使自己獲得更大利益。
“囚徒的兩難選擇”有著廣泛而深刻的意義。
個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。
他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。
只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。
“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。
按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。
不妨讓我們重溫一下這位經(jīng)濟學(xué)圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。
”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。
兩個囚徒的命運就是如此。
從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經(jīng)濟學(xué)的基石。
因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。
但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。
也就是中國人說的“己所不欲勿施于人”。
但前提是人所不欲勿施于我。
其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實中非合作的情況要比合作情況普遍。
所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。
我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。
如價格戰(zhàn)、軍奮競賽、污染等等。
一般的博弈問題由三個要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。
其中所謂贏得是指如果一個特定的策略關(guān)系被選擇,每一局中人所得到的效用。
所有的博弈問題都會遇到這三個要素。
價格戰(zhàn)博弈: 現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費者。
每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn),百姓都會“沒事兒偷著樂”。
在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。
因為博弈雙方的利潤正好是零。
競爭的結(jié)果是穩(wěn)定的,即是一個“納什均衡”。
這個結(jié)果可能對消費者是有利的,但對廠商而言是災(zāi)難性的。
所以,價格戰(zhàn)對廠商而言意味著自殺。
從這個案例中我們可以引伸出兩個問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。
二是如果不采取價格戰(zhàn),作為一種敵對博弈論(vivalry game)其結(jié)果會如何呢
每一個企業(yè),都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。
如果壟斷可以形成,則博弈雙方的共同利潤最大。
這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。
另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。
從這一點,我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎(chǔ)上”。
事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。
在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。
在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格等于邊際成本。
在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟效率狀態(tài)。
如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞。
這就是為什么WTO和各國政府要加強反壟斷的意義所在。
污染博弈: 假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。
按照看不見的手的原理,所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進入“納什均衡”狀態(tài)。
如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。
這是一個“看不見的手的有效的完全競爭機制”失敗的例證。
直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。
只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。
企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。
貿(mào)易戰(zhàn)博弈論 這個問題對于剛剛加入WTO的中國而言尤為重要。
任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護主義的兩難選擇。
貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。
X國試圖對Y國進行進口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會進行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。
反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。
博弈論--這是一個熱得燙手的概念。
它不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟學(xué)獎就頻頻授予博弈論研究者),但如果你認為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。
實際上,博弈論甚至在我們的工作和生活中無處不在
在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。
在生活中,博弈仍然無處不在。
博弈論代表著一種全新的分析方法和全新的思想。
諾貝爾經(jīng)濟學(xué)獎獲得者包羅·薩繆爾遜如是說: 要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。
也可以這樣說,要相贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。