「不用相信你自己,相信我就好了,相信那個『相信著你』的我!」 ─ 《天元突破 紅蓮螺巖》Episode 1
共有知識
相信上過高中公民課程的讀者,一定都聽過經濟學裡的經典例子:囚犯困境。在分析類似的賽局問題時,我們總可以看到一個簡易 2*2 的表格,刻劃進行遊戲的雙方在彼此不同行動下能得到的報償。如果上過大一經濟學原理,甚至還能求出賽局裡的 Nash 均衡 (Nash Equilibrium)。然而,這樣的操作背後卻隱含了一個很強烈的前提假設:「共有知識」 (Common Knowledge)。
什麼是共有知識呢?我們可以從表 1 這個例子來說明。小明和小美計畫周末一起出遊,他們可以去電影院看場恐怖片,也可以一起去欣賞一場籃球比賽。小明比較喜歡籃球比賽,小美則比較想看電影。如果兩人僵持不下,他們內心得到的報償就都是 0 。如果同意要去看電影或看球賽,比較喜歡的人可以得到更高的報償,另一方也可以比什麼都不做來得開心。
電影院 (小美) | 籃球場 (小美) | |
---|---|---|
電影院 (小明) | (3,5) | (0,0) |
籃球場 (小明) | (0,0) | (5,3) |
在這個例子裡,很明顯的, (電影院,電影院) 和 (籃球賽,籃球賽) 都是 Nash 均衡,給定一方選定要去看電影院,另一方沒有誘因會選擇不看電影而堅持要去看籃球賽。然而,要達到 Nash 均衡,卻有一個很強烈卻又不直觀的前提 ─ 那就是整個報償矩陣對於雙方而言是共有知識 (Common Knowledge) ,亦即,小明知道所有情況下彼此的報償,小明也知道小美知道所有情況下彼此的報償,小明還知道小美也知道小明知道所有情況下彼此的報償……直到無窮無盡。
共有知識的概念困擾個體理論學者們很長一段時間。 1994 年和 Nash 一起獲得諾貝爾經濟學獎的 John Harsanyi 就是以研究不完全信息賽局 (Incomplete Information Game) 聞名。我們今天要介紹的則是另一個以研究不完全信息的學者 Ariel Rubinstein 以及他設計的 Email 遊戲。
Rubinstein 和 Email 遊戲
想像有兩個超級好朋友籃球員,點偉和喇叭。他們都因為長年拿不到冠軍感到苦惱,所以想加入同一支球隊一起拚冠軍。點偉本來在火隊,而喇叭在騎隊。假如他們都留在原隊,或不小心沒講好,都跑去了對方的球隊,那跑去 (或留在) 火隊的人雖然還是拿不到冠軍,但卻可以享受火隊主場附近美好的海攤和開趴文化,所以一來一往心情不會太差,還是可以得到 0 的效用。如果不小心一個人跑去 (或留在) 騎隊,不只拿不到冠軍,還會因為待在無聊的小城市而得到 -10 的效用。
但是點偉和喇叭要一起去火隊還是騎隊卻還有一個不確定因素。他們兩人還有一個朋友霸許也想一起組團。霸許主見比較強,不受他人的決定影響。他有 80% 的機率會主動加盟火隊 (以下簡稱狀態1) , 20% 的機率跑去騎隊 (以下簡稱狀態2) 。如果在狀態1 (狀態2) 的情況下,霸許跑去了火隊 (騎隊) ,那點偉和喇叭也都在火隊 (騎隊) 組團,就可以都得到 +5 的效用,反之,如果兩人跑去了跟霸許不同隊,就只能都得到 0 的效用。
點偉和喇叭的隊友得到小道消息知道他們想轉隊,就把兩人分別反鎖在自己家中,不讓他們兩人溝通 1。因此他們各自的期望報酬最高也只有 4 ,也就是不論如何都加盟火隊,然後期待在 80% 的機率下等到霸許帶槍投靠。
火隊 (喇叭) | 騎隊 (喇叭) | |
---|---|---|
火隊 (點偉) | (5,5) | (0,-10) |
騎隊 (點偉) | (-10,0) | (0,0) |
火隊 (喇叭) | 騎隊 (喇叭) | |
---|---|---|
火隊 (點偉) | (0,0) | (0,-10) |
騎隊 (點偉) | (-10,0) | (5,5) |
現在讓我們改變一下前提。霸許和兩人約定好,他決定要去哪隊後會用飛鴿傳書的方式秘密通知點偉。因此點偉有辦法百分之百準確地知道現在處於狀態1或狀態2。但是只有點偉知道也沒有用,如果不和喇叭進行溝通,貿然做決定反而有可能跑錯隊。所幸點偉和喇叭兩個超級好朋友家中都有一種特別的老式電腦,可以向對方的電腦發送 email 。如果點偉發 email 給喇叭,喇叭的電腦接收到後就會自己回覆說「收到了」,而點偉的電腦收到喇叭的回覆後也會同樣回覆「收到了」,喇叭的電腦再一次收到回信後還是會繼續回覆「收到了」……。
點偉和喇叭意識到如果被隊友們關在家中監視著,即使有那個 email 系統也沒辦法好好打字,所以他們事先約定好,如果霸許通知點偉說要去火隊,那點偉就不用寄信;如果霸許要去騎隊,就寄封空白信給喇叭。但是這個寄信系統不是完美的,每次寄信都存在著一個微小機率 (1%) 會收信失敗。當「溝通」結束時 (可能因為在狀態1所以點偉根本就不用寄信,也可能是在狀態2彼此的電腦系統開始互相瘋狂寄信直到一方因為微小機率沒寄出信為止) ,雙方的電腦螢幕上會顯示出總共寄出的信件數目。
這個設計就是 Rubinstein 有名的 email game (AER 1989) 。聰明的讀者看到這應該能看出這樣刻意的設計就是為了去逼近那個「我知道你知道我知道你知道……」的共有知識型態。 Rubinstein 稱這樣的設計為「近乎共有知識」 (Almost Common Knowledge) 。假如所有的報償和狀態都是共有知識,那點偉和喇叭雙方不論身處何種狀態下都應該能成功合作,百分之百得到 5 的報償。那麼在這個近乎共有知識的框架下又如何呢?
因為雙方唯一的溝通方式只能透過 email ,所以雙方的策略都應該建立在最後自己的螢幕上顯示多少信件數上。我們接著用演繹法的推演看看:
假如身處狀態1,點偉因為能得知狀態,所以他一定會選擇留在火隊。他也不用寄email給喇叭。
對喇叭來說,如果他的螢幕上顯示信件數是 0 ,有兩種可能:
- 點偉知道現在在狀態1,所以根本沒寄信。(點偉的螢幕上顯示寄出信件數為 0 。)
- 點偉知道是狀態2,寄了信但在 1% 的機率下沒寄成功。(點偉的螢幕上顯示寄出信件數為 1 。)
喇叭因為讀過高中,所以學過高中數學裡的條件機率。給定喇叭的螢幕顯示寄出信件為 0 ,點偉的螢幕上也是 0 ,也就是現在處於狀態1的機率是 ( 80% / ( 80% + (20%*1%) ) ) = 99.75% ;點偉的螢幕上是 1 ,也就是現在處於狀態2的的機率則是 0.25% 。因此對喇叭來說,不論點偉的決定是什麼,喇叭還是選擇跳槽火隊,能帶給他更高的期望報酬。
我們再多想一層。假如點偉發現現在是在狀態2,因此寄出空白信,但卻沒有收到喇叭的回信。點偉會猜測喇叭的螢幕上可能顯示的寄出信件數是 0 或 1 。
- 喇叭的螢幕數字是 0 ,代表點偉的第 1 封信寄丟了。(回到上一段的邏輯。)
- 喇叭的螢幕數字是 1 ,代表點偉的第 1 封信寄到了,但喇叭的回信寄丟了。
讀過大學的點偉也學過條件機率,他算出前者發生的機率是 ( 1% / ( 1% + (1-1%)*1% ) ) = 50.25% ,後者發生的機率則是 49.75% 。點偉還知道,在前者的情況下,喇叭會循著前一段的邏輯,無論如何都選擇加入火隊。最有趣的是,點偉在後者的情況下還會這樣想:「雖然喇叭螢幕上顯示寄出 1 封信,但喇叭仍然會會循著同一套邏輯判斷點偉寄出 1 封信的機率大於寄出 2 封信。這種情況下,喇叭也會覺得點偉認為自己有大於一半的機率 (50.25%) 一定會加入火隊,因此點偉最後也會判斷要留在火隊比較保險,也因此喇叭會更傾向加入火隊。」即使點偉明明就知道現在是在狀態 2 ,他也不敢加盟已經有霸許的騎隊。
同樣道理,當點偉的螢幕上顯示寄出 T 封信件時,他總是認為喇叭的螢幕上寄出 T-1 封的機率大於寄出 T 封的機率,所以點偉永遠會認為喇叭比自己少想一層。當喇叭的電腦螢幕上顯示 S 封信時,喇叭認為點偉螢幕上顯示 S 封信的機率大於 S+1 封信的機率,代表喇叭也永遠覺得點偉不比自己多想一層。在這個情況下,雙方永遠達不到認知層次上的共識,都會認為加盟火隊比較保險。這就是最弔詭的地方了。當我們一層一層推上去,不論雙方螢幕上顯示多少信件,雙方都還是去火隊的期望報酬更高,所以從事前的觀點想,雙方永遠只能得到 4 的期望報酬 (都去火隊,然後在 80% 的事前機率下等到霸許來加盟) ,達不到完全信息時的 5 的期望報酬。
「不用去相信『相信著我』的你,也不用去相信『相信著你』的我,去相信『相信著自己』的你自己吧!」 ─ 《天元突破 紅蓮螺巖》Episode 8
Rubinstein 在這篇論文裡展現的是共有知識這個概念其實是非常脆弱的。即使我們將那個微小機率調降至 0.00000001% ,照理來說雙方應該已經近乎無窮的認知到對方想法的層次,這個問題依然存在,而且還跟共有知識的分析架構得出差異甚遠的結果。當然, Rubinstein 自己也在論文的結尾提到,假如你的螢幕上顯示寄出的信件是 17 封,你還會去回推對方是否比自己少想一層,然後一層一層回推到 0 封信件的情況嗎?答案當然是否定的。 Rubinstein 做到的僅是藉由經濟學家習以為常的分析工具去提出一個可能的警訊。或許下次當我們在討論 Nash 均衡和囚犯困境的時候,也能多想幾秒,而不是將一些前提視為理所當然去相信。
參考文獻:
Rubinstein, A. (1989). The Electronic Mail Game: Strategic Behavior Under “Almost Common Knowledge”. The American Economic Review, 385-391.
封面圖片來源:ESPN MediaZone。
NBA 球員將隊友反鎖在家中不讓隊友和其他球隊簽約是真實發生過的事件。 2015 年夏天,快艇隊中鋒 DeAndre Jordan 幾乎已經和小牛隊談好合約。快艇隊的其他隊友將 DeAndre Jordan 鎖在家中,不讓小牛隊老闆入門簽合約,最後還成功說服 DeAndre Jordan 留在快艇隊。 ↩︎