胡宗山：博弈論與國際關(guān)系研究：歷程、成就與限度

發(fā)布時間:2020-05-28 來源: 歷史回眸點擊：

　　[內(nèi)容提要] 從數(shù)學和經(jīng)濟學領(lǐng)域借鑒而來的博弈論自1950年代以后在國際安全和國際政治經(jīng)濟學領(lǐng)域中開始使用并迅速發(fā)展，借助博弈論，現(xiàn)實主義者在二十世紀六七十年代對大國沖突與對抗問題、自由主義者在八十年代對國家合作問題分別進行了有力的戰(zhàn)略分析和理論演繹。作為科學方法的重要組成部分，博弈論為促進國際關(guān)系學科的科學化進程和構(gòu)建統(tǒng)一的學科范式起到了重要的作用，同時，國際關(guān)系中的博弈論也存在很大的限度，需要學界進一步研究加以充實。

　　[關(guān)鍵詞] 博弈論國際關(guān)系理論現(xiàn)實主義自由主義

　　20世紀五六十年代以后，對數(shù)學和經(jīng)濟學領(lǐng)域中博弈論(Game Theory)的借鑒與運用成為國際關(guān)系研究發(fā)展的重要手段之一，博弈論不但對國際關(guān)系理論產(chǎn)生了廣泛而深遠的學理影響，還直接促進了諸多實踐議題的突破與解決，為國際關(guān)系研究簡潔化、精確化、模型化和科學化的進程作出了重要貢獻。同時也應看到，由于自身的固有缺陷以及國際關(guān)系學者對其認識及把握程度等原因，國際關(guān)系理論中的博弈論仍然存在著很大的限度。

　　一、社會科學中的博弈論

　　博弈論本是一種古老的思維游戲，20世紀以后正式用于科學分析。1928年，數(shù)學家諾伊曼(John Von Neumann)創(chuàng)立了二人零和博弈，1944年，諾伊曼與摩根斯滕（Oskar Morgenstern）合著《博弈論與經(jīng)濟行為》一書，開始將博弈論用于經(jīng)濟分析。1950年，數(shù)學家納什(John F. Nash，Jr.)推廣最優(yōu)反應策略，即納什均衡(Nash equilibrium)，將博弈論由零和博弈推進至非零和博弈，使其能更廣泛地貼近日常生活分析[1]。同一年，托克(A.W.Tucker)界定了“囚徒困境”，他們的著作奠定了現(xiàn)代非合作博弈論的基石。此后博弈論的研究進一步精煉化、延展化。1965年，澤爾騰（Reinhard Selten）引入動態(tài)分析，提出了“精煉納什均衡”概念，1967年，海薩尼(John C. Harsanyi)將不完全信息引入博弈論的研究，接著，克瑞普斯(D.Kreps)和威爾遜(R. Wilson)又在1982年合作發(fā)表了關(guān)于動態(tài)不完全信息博弈的重要文章[2]。這樣在正式的非合作博弈理論中就形成了4種博弈分析模型，分別是完全信息靜態(tài)博弈（納什均衡）、完全信息動態(tài)博弈（子博弈精煉納什均衡）、不完全信息靜態(tài)博弈（貝葉斯納什均衡）和不完全信息動態(tài)博弈（精煉貝葉斯納什均衡）[3]。20世紀80年代以后，實驗博弈和演化博弈進入博弈論，實驗博弈論用實驗研究策略行為的一般原理，而演化博弈則將達爾文的生物進化論引入博弈論，它假定參與人是有限理性的，由此與此前的假定人是完全理性的古典博弈論形成區(qū)別[4]，90年代以后，以質(zhì)疑傳統(tǒng)博弈論共同知識假定為起點，強調(diào)參與者的學習、模仿功能對博弈進程影響的博弈學習理論成為博弈論的一個重要發(fā)展方向。

　　博弈論的中心思想是將具有自主利益的行為體設定為理性行為者，假設它們在給定的規(guī)則條件下，在預測其他參與者行為的基礎(chǔ)上，對自己的行為類型（如合作、背叛等）所獲得的結(jié)果進行得失比較，進而決定采取何種行動策略。博弈論實質(zhì)上是關(guān)于策略相互作用和理性行為的理論，其三個要素是參與者、策略和支付[5]。博弈論有多種類型，根據(jù)博弈方式劃分，有囚徒困境、斗雞博弈、獵鹿博弈、調(diào)和博弈等博弈模型[6]，每一模型都是理想化的，但又可以運用于特定的現(xiàn)實案例。根據(jù)博弈結(jié)果，可分為常數(shù)和博弈和變量和博弈。根據(jù)博弈主體，可分為二人博弈和多人博弈。根據(jù)互動性質(zhì)，可分為合作博弈與非合作博弈，其區(qū)別在于博弈者能否達成一個具有約束力的協(xié)議，有就是合作博弈，沒有就是非合作博弈。在日常運用中，最受關(guān)注的是兩類博弈，一是博弈模型，應用最多的是囚徒困境、斗雞博弈、獵鹿博弈；
二是博弈的次數(shù)或進程，即簡單（單輪）博弈與重復博弈。簡單博弈假設博弈一次進行，重復博弈不是簡單博弈的重復與連續(xù)，而是指具有同樣結(jié)構(gòu)的博弈重復多次進行，但各個博弈階段彼此獨立，其總體結(jié)果影響博弈者的長期收益預期。

　　二、國際關(guān)系博弈論研究的發(fā)展歷程

　　在國際關(guān)系理論中，現(xiàn)實主義和自由主義對博弈論的運用最為廣泛，其所設定的博弈者主要是國家，重點體現(xiàn)在國際安全和國際政治經(jīng)濟學領(lǐng)域，包括實踐和理論兩個層面。自20世紀50年代至今，國際關(guān)系中的博弈論經(jīng)歷了3個主要發(fā)展階段。

　　1、20世紀50-70年代以研究沖突為主的階段。20世紀五六十年代是國際關(guān)系研究中博弈論的興起階段，學者們廣泛使用博弈論來研究國家間在沖突和外交決策中的互動過程，博弈論有時成為理性選擇范式的一個組成部分。1957年，卡普蘭在其代表作《國際政治的系統(tǒng)與過程》中就對各種類型的博弈進行了詳細的解釋與應用[7]。1960年代以后，謝林(Thomas C. Schelling)、博爾丁(K.E.Boulding)、拉帕波特(Anatol Rapoport) 、多伊奇等成為博弈論的重要代表人物，《沖突解決雜志》(Journal of Conflict Resolution)從這一時期開始成為發(fā)表研究沖突的博弈論學術(shù)成果的重要陣地。謝林用斗雞博弈分析了美蘇之間包括古巴導彈危機等在內(nèi)的多項沖突，他認為在斗雞博弈中，最佳方案是穩(wěn)站道路中央，而不要連續(xù)做出微小退讓，這樣做會避免雙方發(fā)生正面沖撞。如果避開大路走邊路，拒絕參與博弈的話，就會招致慘重損失[8]。在《沖突戰(zhàn)略》中，謝林重點研究了如何將威脅使用武力作為一種威懾戰(zhàn)略來加以使用，論述了威懾在國家互動中的實質(zhì)、作用及如何使用理性與非理性行為技巧。謝林認為在核時代，選擇戰(zhàn)爭無疑是最愚蠢的行為，但是向敵對方顯示有控制的威脅或戰(zhàn)爭的危險卻是正確的戰(zhàn)略措施，人們應該盡量讓自己的行為符合理性，但是沒有必要在任何情況下都表現(xiàn)得很理性。在此基礎(chǔ)上，他發(fā)展出博弈論中著名的討價還價理論，并使用博弈論模型來研究了相互依賴決策問題[9]。拉帕波特和查馬(Albert M. Chammah)則將囚徒困境模型應用到國際軍備裁減問題上，但分析的結(jié)果是發(fā)現(xiàn)參加軍備競賽的國家無法確定其他國家的長遠意圖，這樣就無法克服囚徒困境，不得不實施背叛戰(zhàn)略，即將成本高昂的軍備競賽進行下去才是慎重的選擇[10]。

　　布拉姆斯(Steven J. Brams)是20世紀七八十年代運用博弈論分析超級大國沖突的重要作者，他用斗雞博弈、囚徒困境和真相博弈三種模型分別分析了超級大國間的三種沖突類型—威懾游戲、軍備競賽游戲和核查游戲，他認為，大國沖突看似冒險與沖動，但實質(zhì)是理性的，是為謀求各自國家利益的，因而在很大程度上并不是人們通常認為的零和博弈，實際上雙方都可以從博弈中獲益。當然作者也承認這些博弈具有冒險性和不可控性，并提出了一些可能阻止其沖突所導致的毀滅性后果的措施[11]。這一時期，唐斯(George W. Downs)等人還用僵局博弈來分析軍備競賽問題[12]。

　　現(xiàn)實主義與自由主義都使用博弈論，但得出的結(jié)果卻大相徑庭。除了謝林等人在沖突與安全領(lǐng)域運用博弈論來為國家戰(zhàn)略提供政策建議這些實踐層面的運用外，20世紀80年代之前，現(xiàn)實主義者也經(jīng)常使用囚徒困境、獵鹿游戲等背叛博弈模型來從理論層面闡釋現(xiàn)實主義的經(jīng)典教義，即對國際社會和國家間關(guān)系的悲觀看法。霍布斯強調(diào)的國家在自然狀態(tài)下的“斗劍姿態(tài)”、盧梭的“獵鹿游戲”、赫茲的“安全困境”都說明了理性的國家人在無政府的國際環(huán)境中由于存在信任困難與背叛問題，導致沖突的盛行和合作的難以進行，它的核心是個體理性導致集體不理性或次優(yōu)結(jié)果的悖論或“困境”�，F(xiàn)實主義者由此認為，要使合作成為可能，就需要依賴中央政府或霸權(quán)國家解決理性利已國家間的不信任問題，以杜絕背叛，降低風險。強調(diào)沖突、對合作持悲觀態(tài)度成為現(xiàn)實主義運用博弈模型分析的結(jié)果。由此，探討背叛行為的解決之道，改變理性博弈者的占優(yōu)支付戰(zhàn)略，使博弈者之間即使在沒有權(quán)威干預的情況下也能建立信任，為博弈的持續(xù)開展和合作的發(fā)生提供可能性，便成為合作理論需要破解的難題。

　　2、20世紀80年代以合作研究為主的階段。要用博弈論來解釋合作的發(fā)生，就需要打破簡單、一次博弈的假設，引入重復多次博弈概念，并在此基礎(chǔ)上發(fā)現(xiàn)博弈者的戰(zhàn)略。實際上，無限次重復博弈的原理及在此背景下對合作發(fā)生問題的解決之道在20世紀50年代就為博弈論專家所共知，只是因不知道是誰最先發(fā)現(xiàn)的而被稱為民間定理（Folk Theorem），但早在16世紀，如投桃報李、以牙還牙(tit- for -tat)戰(zhàn)略就已經(jīng)流行于社會之中，而以眼還眼戰(zhàn)略(eye –for- an- eye)則源于圣經(jīng)[13]。1965年，奧爾森對集體行動困境（個體理性導致集體不理性的悖論，實質(zhì)是一種N人博弈）的解決之道是劃小行動聯(lián)盟，即K集團（N人中的小團體）[14]，依靠大團體中小團體的合作來解決“公共利益困境”即搭便車問題，因為小集團中的獲利者為集體行動所付出的成本要小于其收益，因而更具凝聚力和有效。1971年，霍華德(Nigel Howard)對重復博弈理論進行了突破性的研究[15]。1980年代以后，艾克斯羅德(Robert Axelrod)組織運用計算機程序?qū)χ貜颓敉嚼Ь碃顟B(tài)下的戰(zhàn)略選擇進行競賽，其結(jié)果是，由拉帕波特提供的“一報還一報”戰(zhàn)略獲得兩次勝利，成為解決囚徒困境的最佳策略[16]。此后，奧伊、基歐漢等人運用這一結(jié)果系統(tǒng)分析無政府環(huán)境下國家間的合作問題。艾克斯羅德、奧伊等人對背叛難題的解決之道是發(fā)現(xiàn)理性行為體對于報償結(jié)果的預期，即害怕招致懲罰，因為在現(xiàn)實世界中，博弈是重復進行的，對已方上一輪的背叛行為可能招致對方下一輪的報復這一點的害怕促使行為體在互動中約束自己的背叛行為。這就是報復戰(zhàn)略，用奧伊的話來說是未來的陰影(shadow of future)。奧伊重點強調(diào)了影響合作的三個變量：報償結(jié)構(gòu)、未來的陰影和行為體的數(shù)目問題，具體分別體現(xiàn)為報償結(jié)構(gòu)的區(qū)分強度[17]。上述研究使納什經(jīng)濟學中理想狀態(tài)的一次簡單博弈演變?yōu)槎啻沃貜筒┺�，更接近于現(xiàn)實世界。這樣，在制度主義正式出現(xiàn)之前，傳統(tǒng)的博弈論為困境中的合作得以發(fā)生的機理提供了三種進路：奧爾森的K集團理論、報復戰(zhàn)略、重復多次博弈。

　　然而，在基歐漢等國際機制論學者看來，國家間的合作僅僅依靠重復多次博弈和存在報復（互惠）的可能性并不足以保障，三種進路仍然存在缺陷。其一是在雙邊多次博弈中，單純依賴報復戰(zhàn)略或互惠戰(zhàn)略難以充分導致合作的發(fā)生，因為有效的互惠依賴三個條件：行為者必須能夠辨別背叛者；
對背叛者進行集權(quán)報復；
對背叛者存在足夠的報復誘因。這些都會導致一旦背叛者背叛的預期收益遠大于合作的成本的話，其仍然可能采取機會主義行為，進行背叛；
其二是在雙邊重復博弈中，合作的難度增加，博弈者的邊際收益遞減，導致在多數(shù)目博弈者中難以辨別真正的背叛者，因為每一個合作者在懲罰背叛者時也都有可能會搭便車。此外，在國家進行的多邊博弈中，信息的不對稱、合作伙伴行為的無法預期、討價還價等都構(gòu)成了交易成本。為解決這一缺陷，基歐漢等借鑒新制度經(jīng)濟學，認為不確定性、信息風險等的存在需要通過制度來化解。制度影響博弈者的預期，它可以改變國家對當前行為影響未來事務中其他博弈者期望程度的看法，它使國家關(guān)注先例，從而把未來和現(xiàn)在聯(lián)系起來，以增加他們可以懲罰對手的可能性[18]�？梢�，國際制度的作用在于培育并強化互惠戰(zhàn)略的有效性來減輕甚至制止背叛行為，以增強合作發(fā)生的可能性。制度具有穩(wěn)定性、可預期性，而在博弈論合作理論中，對背叛行為的制止主要取決于戰(zhàn)略互動，它具有不穩(wěn)定性、偶發(fā)性的缺陷。博弈論與制度主義實現(xiàn)結(jié)合，形成完整的利益—制度—合作的解釋模式。在艾克斯羅德與基歐漢合作的一篇論文中，他們論述了上述思想，并集中闡發(fā)了國際制度與互惠的關(guān)系，認為國際制度不能代替互惠，但可以強化互惠并使其制度化，制度與互惠的結(jié)合，使背叛失去合理性并因此而付出更多的代價[19]。

　　至此，經(jīng)過博弈論學者與制度主義學者的努力，以闡發(fā)國家間合作為主要目標的自由主義國際關(guān)系理論到1990年代前已經(jīng)基本成熟，它集中解決了信任困境即合作中的背叛這一難題[20]，由此成為反駁現(xiàn)實主義理論關(guān)于合作難以進行這一觀點的基本依據(jù)。(點擊此處閱讀下一頁)

　　博弈論與制度主義的結(jié)合為國家合作提供了有力的學理基礎(chǔ)，博弈論的運用由此成為自由主義對抗現(xiàn)實主義的重要工具。

　　3、冷戰(zhàn)后的多元化發(fā)展階段。1990年代以后，國際關(guān)系領(lǐng)域中的博弈論發(fā)展向度呈現(xiàn)出多元化趨向。一是在理論方面繼續(xù)深入發(fā)展。摩羅繼續(xù)探討國際合作的問題，如制裁和監(jiān)測、分布和信息等。弗倫（James D. Fearon）認為用共同戰(zhàn)略結(jié)構(gòu)來理解國際合作難題更為準確，并將國際合作的主要問題歸結(jié)為討價還價和執(zhí)行難題，認為這是兩個不同的階段，并用囚徒困境和重復囚徒困境分別加以解釋。馬丁（Lisa Martin）將利益、權(quán)力與多邊主義框架與博弈論結(jié)合起來[21]，進一步區(qū)分了協(xié)作博弈、協(xié)調(diào)博弈、保證博弈和勸說博弈。斯耐德爾則通過對不同博弈模型中行為者的報償次序如何影響其支付結(jié)構(gòu)的分析來試圖厘清現(xiàn)實主義與自由主義關(guān)于相對獲益與絕對獲益的爭論[22]�；拢ˋndrew Kydd）研究了信息博弈和再保證博弈，與傳統(tǒng)的現(xiàn)實主義理論強調(diào)安全困境和國家間的不信任導致沖突的觀點相反，他提出所謂的高成本信號理論(costly signaling theory)，認為通過具有一定代價的善意信號傳遞可以減輕國家間的不信任，以推動國家間的合作，并以此檢驗了冷戰(zhàn)結(jié)束問題[23]。

　　二是繼續(xù)運用博弈論分析國際政治沖突，包括海灣戰(zhàn)爭、科索沃戰(zhàn)爭、恐怖主義及其他各類安全管理和沖突[24]。唐斯、米爾納（Helen V. Milner）等也繼續(xù)運用博弈論對國際制度中的合作、國際貿(mào)易協(xié)定、國家的國際環(huán)境政策等問題進行研究[25]。此外，學者們也開始關(guān)注博弈論的效果問題，如格林（Kesten C.Green）認為，在分析沖突問題時，博弈理論家的預測準確率要比不使用任何方法的判斷者高，但要低于親身參與沖突者的預測[26]。最近十幾年來，對博弈論在國際關(guān)系中的應用總結(jié)也出現(xiàn)一些成果，例如本文所引用的許多方法論著作中都有關(guān)于博弈論的評述[27]。

　　三是就方法而言，這一階段對博弈論的運用由完全信息過渡到不完全信息狀態(tài)下的討價還價和和案例分析，不完全信息博弈論成為分析戰(zhàn)爭起源、威懾、聯(lián)盟政治、軍備競賽和民主和平論題的主導工具，博弈論還突破了國家是單一行為體的框架，和普特南等人的雙層次博弈理論結(jié)合起來，在考察國家的對外戰(zhàn)略互動時，也關(guān)注國內(nèi)政治力量在博弈過程中的作用[28]。

　　三、博弈論方法在國際關(guān)系研究中的成就

　　在幾十年的發(fā)展歷程中，作為借鑒性方法引進的博弈論在國際關(guān)系學科發(fā)展中取得了重要的成就，不但直接推動了國際關(guān)系學理研究與現(xiàn)實議題的發(fā)展，并且為國際關(guān)系學科的科學化提供了令人鼓舞的前景。

　　首先，博弈論及其模型的引進、展示及對其求解的不斷嘗試，不僅為主流學派強化其理論教義提供了工具，更重要的是為分析國家間合作與沖突問題提供了有力支撐。雖然僅僅依靠博弈論無法完成合作理論的完整構(gòu)建，但沒有博弈論，合作理論難以獲得堅實的學理基礎(chǔ)。同樣，通過博弈論及其他定量化方法的引進，人們極大地加強了對現(xiàn)實問題尤其是冷戰(zhàn)時期大國沖突與安全問題的研究。博弈論構(gòu)成六十年代的決策理論和威懾理論、七八十年代的沖突理論的重要內(nèi)容，盡管現(xiàn)實主義者運用博弈論的分析結(jié)果大多是悲觀性的或者無解的，但其結(jié)論卻能為當時怎樣緩解大國間的沖突程度提供一定的政策建議，豐富了外交、國家戰(zhàn)略研究。

　　第二，博弈論對于國際關(guān)系的精確化、科學化進程具有重要促進作用，能夠推動國際關(guān)系學科知識累積的進程。博弈論本質(zhì)上屬于形式模型方法或形式語言方法。所謂形式語言方法是與自然語言方法相對而言的。后者指用人類日常交流的方式如文字、語言等表述的陳述，形式語言則指通過數(shù)學、邏輯等專業(yè)語言表述的陳述，如數(shù)學公式、圖表、數(shù)列、曲線等[29]。形式方法如模型相關(guān)性和數(shù)學化在科學中的運用被視為是學科發(fā)展程度的重要標志[30]。數(shù)學方法能夠提供簡潔的語言來描述問題的關(guān)鍵要素，是延伸理論的邏輯力量的有力推理工具[31]。在國際關(guān)系中雖存在傳統(tǒng)方法與科學方法之爭，但使國際關(guān)系理論趨向精確化、普適化是學界主流的追求，作為科學方法論的組成部分之一，博弈論在這一進程中扮演著重要的角色。并且，與依靠大量數(shù)據(jù)的統(tǒng)計、量化分析不同的是，博弈論本質(zhì)上是演繹方法，依靠的是模型圖示和嚴格的邏輯分析來闡明問題的機理，能夠避免傳統(tǒng)主義者所詬病的歸納、量化等方法的缺點。博弈論適用于任何互動問題，包括安全和經(jīng)濟問題，而非僅僅是布爾所說的邊緣性問題[32]。自理查德森開啟數(shù)學模型方法在國際關(guān)系研究中的先河之后[33]，建立在博弈論基礎(chǔ)上的各種沖突、決策、威懾模型就頻繁在國際關(guān)系作品中出現(xiàn)，今天，人們可以從許多本著作中發(fā)現(xiàn)2X2、3X3一類的矩陣圖形或在此基礎(chǔ)上的博弈樹、線性方程、坐標圖。這些數(shù)學圖示雖然具有較強的專業(yè)性，但確實能夠簡化地總結(jié)事實、闡明原理，為知識的重復性、普適性提供極大的可能，促進國際關(guān)系學科作為學術(shù)共同體和知識累積的進程[34]，而這對于任何一門學科的發(fā)展和演進來說都是至關(guān)重要的。

　　第三，博弈論的運用和深化拓寬了國際關(guān)系中理性主義范式的范圍，推動其向戰(zhàn)略理性、有限理性的深度發(fā)展。理性范式是國際關(guān)系分析國家問題的一個基石，博弈論也屬于理性范式的組成部分，因為它對博弈者的行為分析是建立在行為體具有將自身利益或偏好效用最大化的利已主義追求這一理性基本假定之上的。傳統(tǒng)的理性分析沿襲經(jīng)濟學的基本定義，以行為體的個體收益最大化為效用函數(shù)，強調(diào)單向的個體理性。但在現(xiàn)實生活中還存在另一種理性，它更關(guān)注戰(zhàn)略互動及其結(jié)果，強調(diào)行為體的理性在于不僅追求自身的利益，同時也評估自身與對手的互動對利益實現(xiàn)的可能性，這可稱為戰(zhàn)略理性[35]，戰(zhàn)略理性認為處于博弈進程中的行為體的理性偏好或目標并不穩(wěn)定，而是隨著博弈進程不斷調(diào)整的。從大的方面來說，博弈論需要以理性分析作為支撐，但它與傳統(tǒng)理性的分析側(cè)重點有所不同。博弈論對戰(zhàn)略互動的強調(diào)拓寬了理性的運用范圍，使理性方法由個體效用最大化理性向戰(zhàn)略互動理性發(fā)展。另一方面，博弈論由古典博弈論向演化博弈論的發(fā)展進程以及博弈學習理論的出現(xiàn)也使得有限理性、共同知識問題等進入國際關(guān)系的研究視野，使國際關(guān)系研究更為深入、細分。

　　第四，為構(gòu)建統(tǒng)一的國際關(guān)系理論提供了希望。所謂統(tǒng)一理論，又稱一般理論或終極理論，是一門學科成為真正科學的形式上的標志[36]，它指涉學科中心命題和基本內(nèi)核，研究的是學科中大跨度、長時段的問題，探索的是主要研究對象的普遍行為規(guī)律和總體趨勢。國際關(guān)系中的博弈論解釋具有廣泛的優(yōu)點，它以無政府狀態(tài)這一中心特征為基礎(chǔ)，具有較強的包容性，能夠使國家的不同目標，無論是權(quán)力、安全還是福利都明確為國家的效用函數(shù)，以解釋合作與沖突這一國際政治核心問題。同時，博弈論能夠與結(jié)構(gòu)主義、行為主義、建構(gòu)主義等概念和方法實行嫁接，以尋求最合理的解釋[37]，尤其是在博弈學習理論出現(xiàn)后，其對共同知識背景的質(zhì)疑與建構(gòu)主義對傳統(tǒng)文化的質(zhì)疑有著很大的相似性，這昭示即使是有著不同的本體論基礎(chǔ)的理性主義范式和建構(gòu)主義范式也有可能統(tǒng)一在某一理論綱領(lǐng)之下。

　　博弈論將經(jīng)濟學成果推薦到國際關(guān)系研究中，也將經(jīng)濟學的科學化發(fā)展思路帶入國際關(guān)系學科中，為其學科發(fā)展提供借鑒性思考。在國際關(guān)系研究中，對于科學方法和科學化取向一直存在爭議。實際上類似的爭論在所有社會科學中都存在，但經(jīng)濟學之所以能夠成為公認的最發(fā)達的社會科學，在于它有一個以科學化為基本訴求的主線理論，即西方微觀經(jīng)濟學，作為相對統(tǒng)一的經(jīng)濟學范式，它已經(jīng)出現(xiàn)了若干年，其核心就是經(jīng)瓦爾拉斯—馬歇爾發(fā)展、帕累托數(shù)學化、薩繆爾森綜合而由阿羅—德布魯給予數(shù)學證明的價格理論。數(shù)學化的公式和模型包括瓦爾拉斯—帕累托均衡和阿羅—德布魯定理曾使經(jīng)濟學備受“黑板經(jīng)濟學”的指責，但時至今日，盡管理論經(jīng)濟學仍不能解釋許多實際問題，卻在學科演進上卻遠遠超過其他社會科學，在向所謂的硬科學邁進。這就是因為盡管在經(jīng)濟學中存在市場與計劃、價格學派與制度學派、歷史學派等的分歧，但始終是價格學派占據(jù)主流，成為整個學科的核心。即使是獲得諾貝爾經(jīng)濟學獎的科斯、諾斯等人，也是在接受新古典微觀經(jīng)濟學的核心假設基礎(chǔ)上發(fā)展出新的解釋變量—制度。國際關(guān)系領(lǐng)域目前欠缺的正是這一點。事實上，包括博弈論在內(nèi)的理性主義范式有利于促進統(tǒng)一的一般理論的建設，博弈論及其它數(shù)學方法的使用能夠促進理性范式的精確化，當然，如何用數(shù)學方式加以表達，則正是國際關(guān)系學界下一步需要突破的。

　　四、博弈論在國際關(guān)系研究中的運用限度

　　世界上不存在完美無缺的方法，博弈論在國際關(guān)系研究中取得了重要的成就，但由于各種原因，它仍然存在很大的發(fā)展限度。

　　作為一種模型方法，博弈論無法脫離簡單化與不符現(xiàn)實性的固有缺陷�，F(xiàn)實國際關(guān)系異常復雜，將各類博弈模型運用到現(xiàn)實的互動情形中受到很大的制約，這在一定程度上不能不影響博弈論對國際關(guān)系的解釋能力。二人博弈圖示雖多達幾十種，與現(xiàn)實較為貼切的只有少數(shù)幾種，就是獵鹿博弈、斗雞博弈和囚徒困境等常用模型也并不完全適合國際情形的模式。以囚徒困境為例，它假設只有兩個行為體，假設行為體只有單一的背叛或合作的二分選擇，只考慮大數(shù)目的可能報償結(jié)構(gòu)，只考慮一個議題，這些過于簡略的缺陷限制了它與現(xiàn)實中特定案例的貼切程度。并且，囚徒困境只預測非合作行為，忽略了現(xiàn)實生活中國家間的合作性行為，也忽略了國內(nèi)政治在對外決策中的作用，并且囚徒困境中的制度環(huán)境也要比國際層次的制度環(huán)境稀薄[38]。正因如此，奧伊承認，許多國際情形與博弈圖示的分類并不相符[39]。杰維斯也認為，博弈論的主要缺陷在于博弈圖示的簡單化，不能完全等同于現(xiàn)實生活。另外，一報還一報戰(zhàn)略設定的1%錯誤率顯然大大低于現(xiàn)實政治互動中可預期的錯誤率。唐斯等人進一步證明，當錯誤率提高時，該戰(zhàn)略不可能支持穩(wěn)定合作行為的發(fā)生[40]。

　　以邏輯推理為基礎(chǔ)的模型方法具有極強的形式主義色彩，由此博弈論也逃脫不了人們對形式化方法的批評，例如，作為一種演繹推理，它不能產(chǎn)生有用的知識，有著廢料進、廢料出的諷刺；
缺乏獨創(chuàng)性，沒有提供多少重要的可在經(jīng)驗上證實的觀點；
有時過于華麗而無法產(chǎn)生堅實的經(jīng)驗性蘊義等[41]。過強的形式化會切斷那些不能運用數(shù)學或邏輯語言的內(nèi)容與對實際問題的分析之間的聯(lián)系，并易于產(chǎn)生非原始并且不可檢驗的結(jié)果[42]。針對這些批評，也有很多學者進行了反駁。斯耐德爾認為正是簡單性提高了博弈論能夠解釋復雜國際政治的能力[43]。簡單性與合現(xiàn)實性本身就是一對矛盾，要追求理論的普遍性，就必須要簡化變量。米爾納認為，理性選擇中的形式化意味著精確的陳述，它雖然在日常生活中少見，但在理論研究中非常重要。邏輯一致必然優(yōu)先于原創(chuàng)和經(jīng)驗的精確性，形式化明顯是有利的。從理性選擇模型中得來的知識是否新穎與技術(shù)沒有多少關(guān)系，而與理論家對其的運用有更多的關(guān)系，至于缺乏可驗證性，這有時是與方法相關(guān)的[44]。

　　然而，對博弈論最大的挑戰(zhàn)或許還是體現(xiàn)在它的元假設方面，這些批評實際上是與理性選擇理論的限度聯(lián)系在一起的。

　　一是偏好的結(jié)構(gòu)與穩(wěn)定問題。博弈論秉承理性假定，沒有涉及偏好的形成、改變及其結(jié)構(gòu)問題，戰(zhàn)略理性雖然關(guān)注到偏好的改變問題，但目前還缺少完整的理論，在國際關(guān)系中還缺乏有效的運用。由此偏好成為許多學者批評的重點。杰維斯認為，博弈論預先設定了許多事實上在現(xiàn)實政治中存在極大問題的元素。如行為體的價值觀、偏好、信念以及對“自我”的定義都是外生于分析模式的，但事實上它們都會影響國家的偏好和行為，國家的偏好不能被簡單地假定為一致、穩(wěn)定和單一的[45]。

　　二是行為者彼此的互動預期問題。行為者對彼此共同知識的預期即偏好也被博弈論假設為是既定的，即每一博弈者都假定對手是以理性效用為行為目標的，并在此預期下展開互動，博弈者可能在原初期望方面存在分歧，博弈論卻假定每一個人都了解其他人所堅持的原初信念是什么，而不管他們是否贊同[46]。但實際上，與上一問題相聯(lián)系，在現(xiàn)實情形中，也會發(fā)生異常現(xiàn)象。突出的例子就是巴黎和會中克里孟梭、勞合•喬治的現(xiàn)實主義權(quán)力政治偏好與威爾遜的理想主義偏好之間的磨合，說明彼此的預期并不符合博弈論的原始假設。

　　三是行為者的自身素質(zhì)假設和長期、短期目標問題。(點擊此處閱讀下一頁)

　　博弈論假定行為者具有相等的博弈技巧[47]，實際上，即使在相同的環(huán)境條件和規(guī)則約束條件下，不同的博弈者由于素質(zhì)高低也會導致不同的結(jié)果，威廉二世與俾斯麥的外交技巧對比就是一例。正因如此，有人認為國際關(guān)系中的博弈論還需與演化理論結(jié)合起來，發(fā)展出演化博弈模式[48]。與技巧相比，行為者是否具有戰(zhàn)略遠見則更關(guān)乎到博弈論與合作理論的機理基礎(chǔ)�，F(xiàn)實主義和自由主義都運用博弈論，但為什么會有不同的看法？囚徒困境難題真的能夠破解嗎？如果是這樣的話，那么，對于現(xiàn)實主義來說，博弈論在理論方面的貢獻不是被證偽了嗎？安全困境一類的現(xiàn)實主義核心假設不就由此而被推翻了嗎？事實上，即使經(jīng)過傳統(tǒng)博弈論與制度主義結(jié)合的自由主義合作理論仍然存在重要的缺陷，這就是自由主義對合作的理解，無論是對制度的預期還是對被報復的畏懼都需要一個更原始的前提—國家需要具有長遠眼光而不是短視，即國家在長遠目標和眼前目標間的抉擇問題[49]，它還要求國家要具有承受第一次被欺騙的代價。換言之，只有在國家珍視未來利益的前提下，制度或重復博弈才具有意義。但國家是否具有戰(zhàn)略眼光，顯然是隨機的、任意的，這就使合作理論少了一個有力的支撐。這一理論缺陷使得國家間的合作是隨機的而不是必然的。也就是說，被推翻的只是現(xiàn)實主義的沖突決定論，但取而代之的只是沖突、合作隨機論，其最終結(jié)果是，在國家間關(guān)系中，沖突與合作都存在可能性，但都不是必然的，需要取決于兩國或多國間的歷史背景以及當時具體的宏觀、微觀戰(zhàn)略情勢�，F(xiàn)實主義、自由主義都只是一枚硬幣的兩面之一。

　　博弈論的缺陷是社會科學研究固有局限性的反映，與自然現(xiàn)象相比，導致社會現(xiàn)象的變量更為豐富和易變，社會科學面對的環(huán)境也復雜得多，并且與人自身的思想、價值觀念、情感等密切相聯(lián)，人既是研究的主體，也是研究的客體，要做到自然科學那樣的高度確定性，難度確實比較大。

　　與經(jīng)濟學對博弈論的運用相比，國際關(guān)系中的博弈論尚處于初始發(fā)展階段，在當前美國國際關(guān)系協(xié)會的300名會員中，真正運用博弈論模型的學者不超過兩打[50]，博弈論在國際關(guān)系中的運用深度和廣度都有待于進一步加強。例如，上文提到的偏好改變、戰(zhàn)略互動預期等問題在經(jīng)濟學博弈論中已經(jīng)得到部分解決，即經(jīng)過提煉的動態(tài)博弈。實際上，當代博弈論的一個重要理論方向是通過粗化信息結(jié)構(gòu)、放寬理性的共同知識，提供精煉納什均衡等方式使其部分更為嚴格的假設內(nèi)生化[51]，演化博弈和博弈學習理論的出現(xiàn)也為經(jīng)濟學更科學地使用博弈論提供了平臺。但在國際關(guān)系中，精煉動態(tài)博弈的運用非常罕見，演化博弈和博弈學習理論則基本是一片空白。除此之外，國際關(guān)系領(lǐng)域還有一些重要的難題有待突破，如怎樣用模型來研究權(quán)力平衡問題就被認為是安全領(lǐng)域博弈論的一個最大困難。國際關(guān)系理論中的博弈論模型相對來說比較簡單，主要是二人博弈模型，少數(shù)是三人模型，對N人模型的運用更少，這使得國際關(guān)系的多方戰(zhàn)略互動難以模型化。與經(jīng)濟學相比，國際關(guān)系中博弈論的使用在發(fā)展新類型和求解問題上仍然沒有重大突破，現(xiàn)有的博弈模型只是對相鄰學科的借鑒與直接運用，還無法對博弈論作為一種方法作出多少原創(chuàng)性貢獻。在經(jīng)濟學中，博弈論與經(jīng)濟學的結(jié)合已經(jīng)發(fā)展成為一門學科—信息經(jīng)濟學。在國際關(guān)系中，目前還難以直接發(fā)展出類似的次學科領(lǐng)域，即使不存在分歧，依靠博弈論發(fā)展出形式化、統(tǒng)一化、科學化的國際關(guān)系理論也仍然有很漫長的路要走。

　　注釋：

　　[1] 參見[美]約翰•納什著，張良橋、王曉剛譯：《納什博弈論論文集》，北京：首都經(jīng)濟貿(mào)易大學出版社2000年版，序言。

　　[2] 張維迎著：《博弈論與信息經(jīng)濟學》，上海：上海人民出版社1996年版，第6-7頁。

　　[3] 因博弈論在經(jīng)濟學中的廣泛運用，對博弈論做出重要貢獻的納什、澤爾騰和海薩尼榮獲1994年的諾貝爾經(jīng)濟學紀念獎。

　　[4] 肖條軍著：《博弈論及其應用》，上海：上海三聯(lián)書店2004的版，第3-4頁。

　　[5] 黃濤編著：《博弈論教程—理論、應用》，北京：首都經(jīng)濟貿(mào)易大學出版社2004年版，第1頁。

　　[6] 參見[美]大衛(wèi)•A•鮑德溫主編，肖歡容譯：《新現(xiàn)實主義和新自由主義》，杭州：浙江人民出版社2001年版，第177頁。

　　[7] [美]莫頓·卡普蘭著，薄智躍譯：《國際政治的系統(tǒng)與過程》，北京：中國人民公安大學出版社1989年版，第100-249頁。

　　[8] 參見羅伯特•杰維斯著，秦亞青譯：《國際政治中的知覺與錯誤知覺》，北京：世界知識出版社2003年版，第51頁。

　　[9] Thomas C. Schelling, The Strategy of Conflict, Harvard University Press, Cambridge:1980,pp3.-172. 由于謝林運用博弈論解釋經(jīng)濟、政治和國際關(guān)系中的沖突現(xiàn)象卓有成效，獲得了2005年諾貝爾經(jīng)濟學獎。

　　[10] 參見多爾蒂和普法爾茨格拉夫：閻學通、陳寒溪等譯：《爭論中的國際關(guān)系理論（第五版）》，北京：世界知識出版社2003年版，第612頁。

　　[11] Steven J. Brams, Superpower Games: Applying Game Theory to Superpower Conflict, Yale University Press, New Haven, 1985, pp.1-152.

　　[12] See George W. Downs, David M. Rocke, and Randolph M. Siverson, “Arms Races and Cooperation”, in Kenneth A. Oye eds., Cooperation Under Anarchy, Princeton University Press, New Jersey 1985,pp.118-146. 這一時期其他運用博弈論分析沖突問題的作品還有，Glenn H. Snyder and Diesing Paul, Conflict Among Nations (1977)，George Downs and David M.Rocke, Tacit Bargaining, Arms Races and Arm Control,(1990).

　　[13] 參見See Duncan Snidal, “Formal Models of International Politics”, in Detlef F. Sprinz and Yael Wolinsky-Nahmias eds., Models, Numbers , and Cases: Methods for Studying International Relations, The University of Michigan Press, Ann Arbor,2004,p.263,note 15;蘇長和：《全球公共問題與國際合作：一種制度的分析》，上海人民出版社2000年版，第196頁注3。

　　[14] 謝林、哈丁、泰勒、斯耐德爾等人都探討過多人囚徒困境博弈與合作的關(guān)系問題，其結(jié)果最終被總結(jié)為K集團問題。K集團是詹姆姆斯·A·卡帕拉索在一篇論述多邊主義的文章中命名的。見約翰·魯杰主編，蘇長和等譯：《多邊主義》，杭州：浙江人民出版社2003年版，第66頁。

　　[15] 王鳴鳴；
《外交決策中的理性選擇模式》，《世界經(jīng)濟與政治》2003年第11期，第19頁。

　　[16] [美]羅伯特·艾克斯羅德著，吳堅忠譯：《對策中的制勝之道：合作的進化》，上海：上海人民出版社1996年版，第3-53頁。

　　[17] Kenneth A. Oye eds., Cooperation Under Anarchy,pp.1-24.

　　[18] 《新現(xiàn)實主義與新自由主義》，第94頁、[美]羅伯特·基歐漢著，蘇長和等譯：《霸權(quán)之后：世界政治經(jīng)濟中的合作與紛爭》，上海人民出版社2001年版，第104-119頁。

　　[19] 艾克斯羅德、基歐漢：《無政府狀態(tài)下的戰(zhàn)略和制度合作》，參見鮑德溫：《新現(xiàn)實主義和新自由主義》，第110頁。

　　[20] 在這一階段，國家間的合作成為自由主義國際關(guān)系理論關(guān)注的核心問題，相關(guān)學術(shù)成果也較多，且多是使用博弈論原理來解決行動困境和背叛難題。斯坦的著作《國家為什么會合作》、摩羅的(James Morrow)的《政治科學中的博弈論》、哈�。≧ussell Hardin）的《集體行動》、泰勒(Michael Tayloer)的《合作的可能性》等都是這一時期論述博弈論與合作問題的重要作品。

　　[21] James Morrow, “Modeling the Forms of International Cooperation: Distribution and Information”, in International Organization48,3(Summer 1994),pp.387-423；
James D. Fearon ,“Bargaining, Enforcement, and International Cooperation”, in International Organization 52,2(Spring 1998),pp.269-305.Lisa Martin, “Interests, Power and Multimateralism” in International Organization 46,4(Autumn 1992),pp.765-792.

　　[22] 馬丁的文章是《理性國家對多邊主義的選擇》，參見《多邊主義》，第108-140頁。斯耐德爾的文章是《相對獲益與國際合作的模式》，見《新現(xiàn)實主義與新自由主義》第172-208頁。

　　[23] Andrew Kydd，“Trust, Reassurance, and Cooperation”，in International Organization 54,2(Spring 2000),pp.325-357.

　　[24] See Zeev Maoz eds. al., Multiple Paths to Knowledge in International Relations: Methodology in the Study of Conflict Management and Conflict Resolution, Lexington Books, Lanham, Maryland, 2004.

　　[25] Detlef F. Sprinz and Yael Wolinsky-Nahmias eds., Models, Numbers , and Case：Methods for Studying International Relations, The University of Michigan Press, Ann Arbor,2004,pp.279.

　　[26] Kesten C. Green, “Forecasting decisions in conflict situations: a comparison of game theory, role-playing, and unaided judgment”, International Journal of Forecasting,18 (2002) ,pp321–344.;Paul Goodwin，“Forecasting games: can game theory win? ”，International Journal of Forecasting,18 (2002),pp369–374.

　　[27] 研究博弈論的文獻除了斯耐德爾、杰維斯的作品外，還有Harrison Wagner, “The theory of Games and the Problem of International Cooperation”,(點擊此處閱讀下一頁)

　　 in American Political Science Review,Vol.77(1983), “The Theory of Games and the Balance of Power”, in World Politics, Vol.38 no.4(1986);Michael Nicholson, Rationality and the Analysis of International Conflict,1992,Martin Shubik, “the Uses of Game Theory”, in James C. Charlesworth ed., Contemporary Political Analysis(1967),and Game Theory and Related Approaches to Social Behavior(1964)等。

　　[28] Andrew Kydd, “The Art of Shaker Modeling: Game Theory and Security Studies”, pp.344-359.

　　[29] 關(guān)于形式語言、自然語言方法可見Michael Nicholson, “Formal Methods in International Relations”, in Frank P. Harvey and Michael Brecher eds., Evaluating Methodology in International Studies, The University of Michigan Press,2002,pp.23-42.

　　[30] 例如，經(jīng)濟學一般均衡理論的創(chuàng)始人之一瓦爾拉斯認為沒有被數(shù)學化的學科不是一門嚴密的科學，所以應用數(shù)學語言來表達經(jīng)濟理論。相關(guān)內(nèi)容可參見[美]A.S.艾克納主編，蘇通、康以同等譯：《經(jīng)濟學為什么還不是一門科學》，北京：北京大學出版社1990年版，第38頁。當然，對形式化和數(shù)學化的反對者也大有人在。瓦爾拉斯的批評者則認為，經(jīng)濟學不應被簡化為瓦爾拉斯正在試圖創(chuàng)建的公理化體系之類的東西。

　　[31] See Duncan Snidal, “ Formal Models of International Politics”, p.227.

　　[32] 布爾對科學方法缺點的批判可見，John. A. Vasquez eds., Classics of International Relations, Prentice-hall Inc. New Jersey 1996, pp.76-81.

　　[33] See Duncan Snidal,“ Formal Models of International Politics”, p.228 -245.

　　[34] Bruce Bueno de Mesquita, “Accomplishments and Limitations of a Game-Theoretic Approach to International Relations”, in Frank P. Harvey and Michael Brecher eds., Evaluating Methodology in International Studies, The University of Michigan Press,2002,p.59.

　　[35] Duncan Snidal, “The Game Theory of International Politics”, in Kenneth A. Oye eds., Cooperation Under Anarchy, Princeton University Press, New Jersey 1985,pp.38-49.

　　[36] 一般理論被視為是學科科學性的一個重要標志。如經(jīng)濟學的終極理論是一般均衡理論，古典物理學中的牛頓經(jīng)典力學理論、現(xiàn)代物理學中愛因斯坦的相對論和20世紀70年代的超弦理論都屬于不同時期物理學的一般理論。參見[法]安托萬·多迪默、讓·卡爾特里耶編，張增一譯：《經(jīng)濟學正在成為硬科學嗎？》，北京：經(jīng)濟科學出版社2002年版，第71-79頁、第307頁。

　　[37] Robert Jervis, “Realism, Game Theory and Cooperation”, in World Politics, Vol 40(April,1988),p.319。斯耐德爾和哈得森等人都持有類似的看法，參見Duncan Snidal, “The Game Theory of International Politics”, pp.25-57. Richard Carlton Snyder, H. W. Bruck, Burton Sapin, Foreign Policy Decision-Making (revisited), Palgrave Macmillan, New York 2002,.p.2.關(guān)于博弈論的貢獻與優(yōu)點， Mesquita列舉了5個方面，分別是（1）為行為提供動機基礎(chǔ)；
（2）解釋戰(zhàn)略行為；
（3）綜合其它理論和方法的能力；
（4）累積知識；
（5）為了解影響決定分析的方法論議題提供洞察力。See Bruce Bueno de Mesquita, “Accomplishments and Limitations of a Game-Theoretic Approach to International Relations”, p.60.

　　[38] See Duncan Snidal, “ Formal Models of International Politics”, p. 249.

　　[39] Kenneth A. Oye eds., Cooperation Under Anarchy,pp.6-7.

　　[40] Robert Jervis, “Realism, Game Theory and Cooperation” ,p.319.

　　[41] Andrew Kydd, “The Art of Shaker Modeling: Game Theory and Security Studies”, pp.344-345.

　　[42] Helen V. Milner, “Formal Methods and International Political Economy”, in Detlef F. Sprinz and Yael Wolinsky-Nahmias eds., Models, Numbers , and Cases：Methods for Studying International Relations, The University of Michigan Press, Ann Arbor,2004,pp.272-273.

　　[43] Duncan Snidal, “The Game Theory of International Politics”, p.44.

　　[44] Helen V. Milner, “Formal Methods and International Political Economy”, pp.272-273.

　　[45] Robert Jervis, “Realism, Game Theory and Cooperation”, pp.320-329

　　[46] 這被孟斯奎塔也歸為信息問題，但與完全信息/不完全信息的內(nèi)容并不相同。見Bruce Bueno de Mesquita, “Accomplishments and Limitations of a Game-Theoretic Approach to International Relations”, p.71.

　　[47] Bruce Bueno de Mesquita, “Accomplishments and Limitations of a Game-Theoretic Approach to International Relations”, pp.74-75.

　　[48] Ibid, pp.76-77.

　　[49] 布拉姆斯的分析表明，行為體的目標是短期還是長期的，將決定其在博弈中的支付戰(zhàn)略。因此，是目標或偏好決定行為體的理性和博弈，而不是相反。見Steven Brams, “Game Theory in Practice: Problems and Prospects in Applying it to International Relations”, in Frank P. Harvey and Michael Brecher eds., Evaluating Methodology in International Studies, The University of Michigan Press,2002,pp.82-83.

　　[50] Bruce Bueno de Mesquita, “Accomplishments and Limitations of a Game-Theoretic Approach to International Relations”, p.60.

　　[51] Steven Brams, “Game Theory in Practice: Problems and Prospects in Applying it to International Relations”, p.84.

相關(guān)熱詞搜索：國際關(guān)系限度歷程成就博弈論

胡宗山：博弈論與國際關(guān)系研究：歷程、成就與限度

熱點文章閱讀

胡宗山：博弈論與國際關(guān)系研究：歷程、成就與限度