設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

他用“玩具,球拍,鋼筆”發(fā)了一篇頂刊論文 —— 納什

2023/3/18 11:45:14 來源:中科院物理所 作者:Jørgen Veisdal 責(zé)編:夢澤

小約翰?納什( John F. Nash Jr. ,1928-2015)最著名的突破是發(fā)現(xiàn)納什均衡,但在這之前,他還針對另一個(gè)問題,納什議價(jià)(討價(jià)還價(jià))問題撰寫了一篇論文。納什議價(jià)問題是一個(gè)關(guān)于合作議價(jià)的研究,求證兩人討價(jià)還價(jià)問題的唯一解(Nash,1950).議價(jià)問題中的設(shè)定可以簡單總結(jié)如下:

兩個(gè)玩家各自要求獲得一些財(cái)物(一般是一些金錢)中的一部分。如果二人索取的總和少于財(cái)物總額,那么兩人都能如愿以償;如果總和超過了財(cái)物總額,那么兩人什么都沒有。

納什對于后面這種情況提出了一個(gè)公理化的解決方法,本文就將介紹納什剛涉足馮諾依曼和摩根斯坦新發(fā)現(xiàn)的博弈論領(lǐng)域時(shí)首先獲得的成果,這為日后關(guān)于納什均衡的工作提供了靈感。

1.不變性:在議價(jià)前后效用函數(shù)隨偏好的轉(zhuǎn)變應(yīng)保持不變。

2.弱帕累托有效:如果有兩人都能獲益更多的結(jié)果 s,那么玩家就不能同意另一種分配 t。

3.無關(guān)選擇的獨(dú)立性:如果玩家在兩個(gè)解 s 和 t 中選擇,其中 s 是首選;如果一個(gè)備選解 r 出現(xiàn),那么除非 r 的偏好變化,t 仍不會超過 s 被選擇為解。

4.對稱性:如果玩家之間沒有區(qū)別,那么他們之間達(dá)成協(xié)議不應(yīng)有偏袒。

納什證明,滿足上述公理?xiàng)l件的解 (x,y) 正好可以使下面的表達(dá)式 F 取最大值:(u (x) — u (d)) (v (y) — v (d))

其中,u 和 v 分別是玩家 1 和玩家 2 的效用函數(shù),d 則是無法達(dá)成協(xié)議的結(jié)果。這個(gè)解包含每個(gè)玩家獲得當(dāng)前收益(非合作收益)和合作收益。

背景

在離開位于西弗吉尼亞布魯菲爾德的家鄉(xiāng)三年后,20 歲的納什進(jìn)入了大學(xué)。1948 年,當(dāng)他還是卡耐基理工學(xué)院大三的學(xué)生時(shí),就已經(jīng)獲得了哈佛、普林斯頓、芝加哥和密歇根大學(xué),四個(gè)擁有美國頂尖數(shù)學(xué)項(xiàng)目的錄取。雖然納什的首選是相對更有名、社會地位和師資力量更強(qiáng)的哈佛大學(xué),但由于在備受推崇的普特南競賽中表現(xiàn)平平,他在哈佛的獎(jiǎng)學(xué)金略低于普林斯頓;同時(shí),納什在卡耐基的學(xué)術(shù)導(dǎo)師理查德?達(dá)芬( Richard Duffin,1909-1996)和約翰?辛格( John L. Synge,1897-1995)都力薦他選擇普林斯頓大學(xué),其中一位甚至稱他為“小高斯”,認(rèn)為普林斯頓是“純數(shù)學(xué)(拓?fù)鋵W(xué)、代數(shù)學(xué)和數(shù)論)家的搖籃”,與他完美契合 (納薩爾,1998) 。

而普林斯頓這邊,數(shù)學(xué)系主席所羅門?萊夫謝茨( Solomon Lefschetz,1884-1972 )同樣渴望說服納什,最終開出了每年 1 150(相當(dāng)于 2021 年的 13 200)美金的肯尼迪獎(jiǎng)學(xué)金:

我們喜歡把握住有前途的人,趁他們還年輕、思想開放。

—— 萊夫謝茨給納什的一封信

納什在獲得諾貝爾獎(jiǎng)的自述中提到,靠近自己的家鄉(xiāng)布魯菲爾德也是選擇普林斯頓大學(xué)的因素之一。于是由于種種原因,納什在 1948 年的夏天離開了新澤西,帶著卡耐基導(dǎo)師的鼓勵(lì)和萊夫謝茨個(gè)人的強(qiáng)烈歡迎,選擇了普林斯頓大學(xué)。

達(dá)芬給萊夫謝茨的推薦信里只有一句描述納什能力的話,后來變得非常有名:

他是一個(gè)數(shù)學(xué)天才。

下面展示了達(dá)芬和辛格的推薦信:

左:納什在卡耐基理工的論文導(dǎo)師達(dá)芬寫的推薦信,寄至普林斯頓大學(xué)的所羅門?萊夫謝茨教授;右:任卡耐基理工數(shù)學(xué)系主任的辛格寫的推薦信(圖源:Princeton University Archives )

普林斯頓大學(xué)就讀時(shí)期(1948-1951)

納什 20 歲離開家鄉(xiāng)赴卡耐基上大學(xué)時(shí),普林斯頓數(shù)學(xué)系充斥著聰慧的頭腦,系主任萊夫謝茨和拉夫???怂梗≧alph Fox,1913-1973)、諾曼?斯廷羅德(Norman Steenrod,1910-1971)帶頭在美國首先開展拓?fù)鋵W(xué)研究;埃米爾?阿廷(Emil Artin,1898-1962)主攻代數(shù);而萊夫謝茨的學(xué)生塔克(Albert W. Tucker,1905-1995)則主攻博弈論,這個(gè)學(xué)科在 1944 年馮?諾依曼(John von Neumann,1903-1957)和經(jīng)濟(jì)學(xué)家摩根斯特恩(Oskar Morgenstern,1902-1977)出版《博弈論與經(jīng)濟(jì)行為》一書后才剛剛興起。

普林斯頓大學(xué)的數(shù)學(xué)系位于名為 Fine Hall(直譯為“好樓”)的大樓中,是 40-50 年代數(shù)學(xué)圈內(nèi)傳奇的代名詞。如納薩爾(Sylvia Nasar)在 1998 年所描述的:

(如一位歐洲裔所說,)我想 Fine Hall 是用于數(shù)學(xué)研究的最豪華的建筑,是一個(gè)可以去度假的數(shù)學(xué)鄉(xiāng)村俱樂部。

它的基石由維布倫(Oswald Veblen)設(shè)計(jì),裝有著普林斯頓數(shù)學(xué)家們工作的副本和業(yè)內(nèi)一些常用工具的鉛盒:兩只鉛筆、一段粉筆,當(dāng)然,還有一塊橡皮。

“它代表數(shù)學(xué)家們‘賴著不走’的圣所,暗色石頭所包圍構(gòu)成的走廊既適合獨(dú)自散步,也適合‘?dāng)?shù)學(xué)社交’。為高級教授準(zhǔn)備的九個(gè)書房 —— 注意不是辦公室 —— 有著雕刻的石板、隱藏式櫥柜、黑板、東方地毯和厚重的軟墊家具。”

“每個(gè)辦公室都配有電話、盥洗室都配有閱讀燈;三樓庫存豐富的圖書館全天開放,擁有世界上最豐富的數(shù)學(xué)期刊和書籍;愛好網(wǎng)球的數(shù)學(xué)家們在回辦公室前無需再回家一趟(附近有個(gè)網(wǎng)球場),因?yàn)樗O(shè)有淋浴的更衣室。”

—— 納薩爾《美麗心靈》(1998)

納什當(dāng)時(shí)是一個(gè)由塔克領(lǐng)導(dǎo)的推進(jìn)初期博弈論發(fā)展的學(xué)派成員之一,他們從純數(shù)學(xué)意義出發(fā),基本不關(guān)心研究內(nèi)容在現(xiàn)實(shí)世界中的應(yīng)用。據(jù)經(jīng)濟(jì)學(xué)家、納什的好朋友、摩根斯特恩的學(xué)生舒比克(Martin Shubik,1926-2018)所說:

當(dāng)時(shí)數(shù)學(xué)系的學(xué)生和職工都沉浸在研究博弈論的幸福中,完全沒有意識到經(jīng)濟(jì)學(xué)系對此的態(tài)度,當(dāng)然他們即使知道,也不會關(guān)心。在普林斯頓沒待多久,經(jīng)濟(jì)學(xué)系和數(shù)學(xué)系之間鮮明不同的態(tài)度就根植在我心里了。經(jīng)濟(jì)學(xué)系有一種培養(yǎng)常規(guī)博士工廠、一切照舊的保守主義氛圍,其中不乏明星但毫無激情和挑戰(zhàn)可言;而后者則被靈感和狩獵的純粹樂趣所點(diǎn)亮。從心理學(xué)上來說,他們好像來自于不同的星球。如果在下午茶時(shí)間,一個(gè)光著腳、穿著破爛牛仔褲的十歲大的流浪小孩帶著一個(gè)非常有趣的理論走進(jìn) Fine Hall,那一定會有人去聽;但當(dāng)馮?諾伊曼進(jìn)行有關(guān)增長模型的研討會時(shí),除了少數(shù)幾個(gè)例外,普林斯頓那一大群經(jīng)濟(jì)學(xué)家肯定會無聊到只打哈欠。

—— 舒比克(參考 Düppe and Weintraub, Finding Equilibrium* , 2014 p. 94)

而學(xué)派的領(lǐng)導(dǎo)人塔克,則繼續(xù)指導(dǎo)普林斯頓未來的頂級博弈論學(xué)家,包括大衛(wèi)?戈?duì)枺―avid Gale,1921-2008)、2012 年諾貝爾獎(jiǎng)獲得者羅伊德?沙普利(Lloyd Shapley,1923-2016),當(dāng)然,還有納什。

議價(jià)問題(1949)

在研究納什均衡以前,納什發(fā)表了他第一篇期刊論文 —— 同樣關(guān)于博弈論,將經(jīng)典經(jīng)濟(jì)學(xué)問題視為議價(jià)過程。此前已經(jīng)有不少學(xué)者(包括 Cournot、Bowley、Fellner 等人)從包括雙邊壟斷調(diào)查等不同角度,對這個(gè)問題進(jìn)行過研究。

左:學(xué)生時(shí)期的納什;右:納什 1950 年的論文《議價(jià)問題》( The Bargaining Problem. Econometrica 18 (2), pp. 155-162. )

納什的文章描述了這樣一種議價(jià)的情況:兩個(gè)人都有機(jī)會互惠互利,但是沒有一方可以在未經(jīng)允許的情況下單方面影響另一方的牟利。類似于經(jīng)典的“劃分選擇協(xié)議”的情況:兩個(gè)人需要公平地分配一個(gè)蛋糕,那么其中一個(gè)人切蛋糕,另一個(gè)人可以優(yōu)先決定自己想要哪一份,這就是無嫉妒蛋糕分配機(jī)制。

納什的論文就是基于這樣的議價(jià)情況進(jìn)行理論分析,同時(shí)在特定條件或其他“理想化條件下”給出確定的“解”,即確定滿足個(gè)體期望的收益。這樣的理想化條件包括:假設(shè)兩個(gè)個(gè)體是理性的,并可以對各種物品有著精確的偏好感知,具有相同的議價(jià)能力,以及完全了解對方的偏好信息。

納什的解法采用了從馮?諾伊曼和摩根斯特恩的書中發(fā)展出的效用的概念,也使用了期望的概念定義不同玩家在給定策略下認(rèn)可的收益。在納什的文章中,他假設(shè)有一個(gè)人小明,知道自己第二天會獲得一百塊錢,那么可以說他有“一百塊的期望”;類似地,他也可以有“兩百塊的期望”。如果他知道,次日會通過拋一枚公平的硬幣來決定他獲得一百還是兩百,那么可以說他有“50% 一百和 50% 兩百”的期望。

對于在這種情形下的單個(gè)個(gè)體效用理論,納什提供了充分的假設(shè),并對他在 1944 年發(fā)表的論文《博弈論與經(jīng)濟(jì)行為》中提出的情形進(jìn)行區(qū)分。他認(rèn)為,論文中并未分別對每個(gè)人參與博弈的價(jià)值進(jìn)行估算,除非這個(gè)博弈是零和的(雙方收益相加為零)。于是對于雙人的非零和博弈,納什對參與玩家的預(yù)期值進(jìn)行了推導(dǎo):

首先定義一個(gè)雙人期望值為兩個(gè)單人期望值的某種組合:如果有兩位玩家,各自對未來的情形有準(zhǔn)確的期望,且單人期望值可以構(gòu)成雙人期望,那么單人效用函數(shù)可以用于求雙人效用函數(shù)的期望值。這樣如果有兩位玩家,各自對未來的情形有準(zhǔn)確的期望,且單人期望值是構(gòu)成雙人期望的元素,那么我們可以將單人的效用函數(shù)以及各自的概率用于求雙人的期望值:

如果 [A, B] 代表一個(gè)雙人期望,且 0 ≤ p ≤ 1,那么 p [A,B] + (1 - p)[C,D]= [pA + (1-p) C, pB + (1-p) D]。

納什定義了兩個(gè)個(gè)體的效用函數(shù)為 和 ,且將 c (S) 定義為包含原點(diǎn)的緊凸集合 S 內(nèi)的解點(diǎn)。首先他提出了一些必要的假設(shè),保證  最大時(shí)的解落在第一象限:集合的緊性保證解存在,而凸性保證解唯一。

圖 1 來自納什的論文《議價(jià)問題》,示意了玩家 1 和玩家 2 的效用集合 S 中唯一最優(yōu)點(diǎn)。

議價(jià)問題實(shí)例(納什,1950)

假設(shè)小明和小紅兩個(gè)很聰明的人,他們手上只有可以交換的貨物,但是沒有錢用來找零。為了簡單起見,再假設(shè)一個(gè)人獲得所有物品的效用是這部分中各貨品對他的效用之和。下面的表格列出了每個(gè)物品的所屬權(quán)和對每個(gè)人的效用,兩個(gè)個(gè)人的效用函數(shù)單位是任意的。

小明擁有的貨品:

小明的貨品小明的效用小紅的效用
24
鞭子22
21
球拍22
盒子41

小紅擁有的貨品:

小紅的貨品小明的效用小紅的效用
鋼筆101
玩具41
小刀62
帽子22

這個(gè)議價(jià)問題的圖像是一個(gè)凸多邊形,其中效用乘積最大的點(diǎn)在一個(gè)頂點(diǎn)上,對應(yīng)著唯一一個(gè)預(yù)期,其中:

小明給小紅:書、鞭子、小球和球拍;

小紅給小明:鋼筆、玩具和小刀。

納什在論文中對此議價(jià)問題進(jìn)行的作圖

實(shí)例:解點(diǎn)位于第一象限、矩形雙曲線與可選集合的唯一切點(diǎn)上。

目前我們還不清楚納什如何得出這樣結(jié)果的過程,他要好的朋友,出版于 2002 年的納什傳記《 The Essential John Nash 》的作者之一 —— 庫恩(Harold Kuhn,1925-2014)回憶這篇論文時(shí)說:

我記得(這篇文章)在納什畢業(yè)后的第一年就送到了馮?諾伊曼手中,納什當(dāng)時(shí)還提醒了馮?諾伊曼(這篇文章的)存在。如此看來,這篇文章應(yīng)該是納什還在卡耐基理工時(shí)上的唯一一門經(jīng)濟(jì)學(xué)選修課的課程論文。

但他補(bǔ)充道:

納什的記憶與我有出入,他在 1995 年某次和羅杰?梅耶森的午餐中說到,他是到了普林斯頓之后才寫的這篇論文。無論這篇文章的真實(shí)歷史如何,其中的舉例暗示寫作的是個(gè)年輕人,因?yàn)槲锲钒ㄇ蚺?、球或是鋼筆小刀之類的東西??梢源_定的是,當(dāng)時(shí)納什還從未讀過論文引文部分所提到的古諾、鮑利、廷特納以及費(fèi)爾納的工作。

—— 庫恩

納什 20 歲時(shí)到了普林斯頓大學(xué),終于在 1950 年的時(shí)候在著名期刊《計(jì)量經(jīng)濟(jì)學(xué)》上發(fā)表了自己的論文《議價(jià)問題》:

Nash (1950). The Bargaining Problem. Econometrica 18(2), pp. 155-162.

與馮?諾依曼的交流

盡管納什的推論在某種程度上與馮?諾伊曼和摩根斯特恩關(guān)于合作博弈論的工作相反,但他為非合作博弈理論打下的基礎(chǔ)顯然來源于前人工作。也因?yàn)槭艿搅诉@樣的啟發(fā),納什發(fā)現(xiàn)了納什均衡,得以在 1978 年獲得約翰?馮?諾伊曼理論獎(jiǎng)。

現(xiàn)存的文件中只找到了一份記載納什和馮?諾伊曼之間的交流,可以肯定的是其余多數(shù)都已經(jīng)隨著時(shí)間而丟失了。據(jù)納薩爾回憶,納什在 1949 年普林斯頓統(tǒng)考后沒幾天就與馮?諾伊曼進(jìn)行了談話 —— 在他發(fā)現(xiàn)納什均衡之前:

當(dāng)時(shí)他驕傲地告訴秘書,他準(zhǔn)備和馮?諾伊曼教授討論一個(gè)能激起他興趣的想法。對于一個(gè)研究生來說,這是件相當(dāng)大膽的事情。

… 這當(dāng)然像是納什會做出的事情,畢竟他前一年還帶著一個(gè)想法去見了愛因斯坦… 他聽得很認(rèn)真,輕敲著手指,時(shí)不時(shí)還偏一偏頭。納什開始描述腦海中對超過兩位玩家博弈的均衡的證明。

馮?諾伊曼在他說出更多雜亂的句子以前打斷了他,突然對納什未下定論的闡述說:“這沒什么意思,只是個(gè)不動(dòng)點(diǎn)理論罷了。”

—— 納薩爾《美麗心靈》 (1998)

看起來馮?諾伊曼并沒有在納什討論的非合作博弈論的概念中看到價(jià)值,但納什隨后便在給歷史學(xué)家羅伯特?萊納德的信中為這位偉人的反應(yīng)辯護(hù),他分析道:

我當(dāng)時(shí)在和馮?諾伊曼進(jìn)行一場非合作博弈,而不只是尋求加入他的聯(lián)盟;顯然從心理學(xué)上說他不會對一個(gè)競爭的理論完全滿意。

雖然如此,馮?諾伊曼和摩根斯特恩最終都給予了納什有價(jià)值的指導(dǎo),在納什發(fā)表的論文中,對兩人都進(jìn)行了致謝:

作者希望感謝馮?諾伊曼和摩根斯特恩教授的幫助,他們在閱讀完論文的初稿后都提供了非常有幫助的建議。

參考文獻(xiàn)

  • ? Düppe, T. & Weintraub, E.R. 2014. Finding Equilibrium*. Princeton University Press.

  • ? Nasar, S. 1998. A Beautiful Mind. Simon & Schuster.

  • ? Nash, J. F. 1950. The Bargaining Problem. Econometrica 18(2), pp. 155-162.

  • ? von Neumann, J. & Morgenstern, O. 1944. Theory of Games and Economic Behavior. Princeton University Press.

作者:J?rgen Veisdal

翻譯:zhenni

審校:藏癡

原文鏈接:Nash's Bargaining Problem (1950)

本文來自微信公眾號:中科院物理所 (ID:cas-iop),作者:J?rgen Veisdal

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:納什,數(shù)學(xué)

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知