憑什么,好人要有好報(bào)?
“要做一個(gè)好人”,這是我的一個(gè)信念。所謂信念,是指導(dǎo)生活的最高準(zhǔn)則。
這個(gè)信念是怎么來的呢?閉上眼睛往回追溯的話,應(yīng)該是父母教給我的吧?!耙獙e人好,要大方,不要傷害別人。”這些縈繞耳邊的話語,傳達(dá)的是父母的生存之道。
高中階段,接觸到達(dá)爾文的生物進(jìn)化論,思維開始有一點(diǎn)混亂:如果生物為了有限的食物和生存空間不斷斗爭,適者生存下來并繁殖后代,不適應(yīng)環(huán)境的則被淘汰,那生存下來的生命應(yīng)該是極端自私的,對苦難無情的冷漠,殘忍的損人利己。
任何具有利他動機(jī),為了幫助別人而犧牲自己的人,應(yīng)該不會在這個(gè)世界存在太久。在生物一代代繁衍的過程中,無私的好人數(shù)量會越來越少,自私的壞人數(shù)量會越來越多。
那為什么,父母希望我做一個(gè)好人?或者說,自詡是好人的父母是怎么生存下來的?
如果一個(gè)公司告訴我,要做一個(gè)好人,我可能會懷疑這個(gè)公司的動機(jī)。我怕這公司的壞人,憋著勁教我學(xué)好,是方便他們使壞??晌覜]法用這樣的理由去懷疑我的父母,畢竟他們的基因還要靠我這個(gè)獨(dú)生子傳遞下去。
所以,一定有什么原因,讓好人還活在世上。
我想知道的這個(gè)答案,33年前,美國政治學(xué)教授阿克塞爾羅德也想知道。他從解決經(jīng)典的博弈論難題“囚徒困境”入手,利用計(jì)算機(jī)程序,模擬出了代表好人的策略和代表壞人的策略。
在好人和壞人共存的時(shí)期,好人得分獲得了領(lǐng)先;即使在一個(gè)都是壞人組成的社會,一旦壞人嘗到合作的好處,壞人會轉(zhuǎn)變成好人并迅速擴(kuò)大好人群體。
羅教授的研究成果,寫在了《合作的進(jìn)化》這本書里。首先,讓我們從介紹“囚徒困境”開始。
“囚徒困境”是1950年美國蘭德公司擬定的理論。兩個(gè)同案犯被關(guān)進(jìn)監(jiān)獄,不能互相溝通情況。如果兩個(gè)人都不揭發(fā)對方,則由于證據(jù)不確定,每個(gè)人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋,沉默者因不合作而入獄十年;若互相揭發(fā),則因證據(jù)確實(shí),二者都判刑八年。
這種情況下,怎么做才是對自己最有利的呢?現(xiàn)在我和你處在這樣的局面下,你有兩種選擇,揭發(fā)或沉默;我也有兩種選擇,揭發(fā)或沉默。我們互相不知道對方選擇什么,只能把兩種情況都考慮進(jìn)去:假設(shè)你選擇揭發(fā),臥槽你簡直不是人,說好的兄弟情深呢?我沉默幫你擔(dān)責(zé)我是傻子,老子也揭發(fā);假設(shè)你選擇沉默,臥槽沒見過你這么傻的人,老子果斷選擇揭發(fā)賣隊(duì)友享受免罪。
可見,無論你選擇什么,我最好的選擇都將是揭發(fā)。這也是槍戰(zhàn)片中壞人活得長好人死的快的重要原因。
如果只進(jìn)行一次”囚徒困境“的博弈,理智的雙方只會互相傷害,這樣的社會根本不會有好人存活的機(jī)會。幸運(yùn)的是,現(xiàn)實(shí)社會可以看成”囚徒困境“的重復(fù)博弈版本,一重復(fù),就像給好人開了外掛。
為方便講訴,重新設(shè)置一種”囚徒困境“的情形:我和你是兩位玩家,手上各有”背叛“和”合作“兩張牌,我們互相不知道對方的出牌。銀行家充當(dāng)裁判,每一輪都根據(jù)我們的出牌結(jié)果給予我們金錢,在無限次的輪數(shù)里,我們應(yīng)該從銀行家手里拿到盡可能多的錢。
結(jié)果1:
我們都選擇合作,銀行家給我們每人3分錢。
結(jié)果2:
我們都選擇背叛,銀行家給我們每人1分錢。
結(jié)果3:
你選擇合作,我選擇背叛,銀行家給我5分錢,不給你錢。
結(jié)果4:
我選擇合作,你選擇背叛,銀行家給你5分錢,不給我錢。
無限次的輪數(shù),有無數(shù)種背叛和合作的選擇。如果我們把背叛和合作的選擇稱為策略,則有無數(shù)種策略。面對這種情況,我們自然會問一個(gè)問題,哪種策略最厲害,能贏得最多的錢?
實(shí)驗(yàn)開始前,羅教授心里很怕,要是最壞最沒有人性的策略贏得最多的錢,預(yù)示著我們這個(gè)世界會越來越像哥譚市,犯罪橫行,貪污腐敗,民不聊生,只能依靠一兩個(gè)超級英雄,比如蝙蝠俠給人們帶來一點(diǎn)微弱的希望。
為了回答這個(gè)問題,羅教授設(shè)計(jì)了一場競賽。他請世界各地的博弈論專家來提交策略,也就是設(shè)計(jì)一種出牌的規(guī)則,他把這些策略轉(zhuǎn)換成計(jì)算機(jī)語言,在電腦里進(jìn)行模擬演算。當(dāng)然不可能進(jìn)行無限次的演算,先算個(gè)兩百次吧,看看到底誰厲害。
他一共收到了十四條精心設(shè)計(jì)的策略,再加上一條隨機(jī)策略,意思是每一步出背叛還是合作看心情,隨便出。任何一個(gè)策略,都和包括自己在內(nèi)的十五條策略一起比賽,看誰贏得多。
理論上,200個(gè)回合,每個(gè)回合5分都拿全了,一場比賽最多贏1000分。和15個(gè)對手比下來,最多拿到15000分。事實(shí)上,這是不可能的,沒有哪個(gè)策略會傻到每輪都信任你,讓你白白占便宜?,F(xiàn)實(shí)一點(diǎn)的最好情況是,每輪兩個(gè)人都合作拿到3分,200輪一共拿到600分。
把每個(gè)策略經(jīng)歷的15場比賽得分統(tǒng)計(jì)下來,名字為”一報(bào)還一報(bào)“的策略拿到了最高的平均分504分。這個(gè)策略最簡單,看起來最不聰明,事前也并不被看好,它最終獲得了冠軍,跌破了羅教授眼鏡。
這個(gè)策略這樣出牌:在第一回合采取合作行動,然后在接下來的每一個(gè)步驟里,重復(fù)對手上一步的行動。為了加深理解,我們來看看兩個(gè)”一報(bào)還一報(bào)“策略相遇競賽的情形。
第一步,雙方都合作,都拿到3分,然后互相重復(fù)對手上一步的合作行動,每一輪雙方都拿到3分。200輪過去,雙方都獲得600分的最高分?jǐn)?shù)。
現(xiàn)在換一個(gè)對手,”老實(shí)人探測器“。這個(gè)策略會在每十步中任意選擇一步,打出惡意的”背叛“牌,拿到5分,”一報(bào)還一報(bào)“還是傻傻的打出”合作“牌,拿到0分。但在下一步,”一報(bào)還一報(bào)“馬上開始報(bào)復(fù),打出”背叛“牌,而”老實(shí)人探測器“打出”合作“牌,拿到0分,兩輪雙方打平,各拿到2.5分。200輪結(jié)束后,雙方各得到590分。
如果遇到”總是背叛“呢?第一輪”總是背叛“拿到5分,之后”一報(bào)還一報(bào)“開始報(bào)復(fù),雙方互相打出”背叛“,得到1分,一直持續(xù)到結(jié)束。”總是背叛“拿到204分,”一報(bào)還一報(bào)“199分。
”一報(bào)還一報(bào)“在”總是背叛“身上損失的5分,在和其他策略競賽的過程中輕易贏了回來。我們看到它可以拿到600分滿分,而”總是背叛“死的很慘。教授把所有這些得分加起來,算出了一個(gè)結(jié)果。
分析結(jié)果可知:
這次競賽中的15個(gè)策略,有8個(gè)屬于”善良“策略。這里的”善良“指的是那些從不首先背叛的策略。令人吃驚的是, 善良策略霸占了前八名的位置。最差的善良策略得到472分,而最高的惡意策略得到401分,與善良策略有很大的差距。
在善良策略里,決定名次高低的關(guān)鍵在于”寬容“。一個(gè)寬容的策略只有短期記憶,雖然它也采取報(bào)復(fù)行動,但它會很快遺忘對手的背叛,報(bào)復(fù)過后就到此為止,不再繼續(xù)記仇。
排名第7的善良策略Friedman,它絕不寬恕,即使對手悔改,它不愿意打破相互背叛的惡性循環(huán),因此無法取得較高的分?jǐn)?shù)。
這場競賽表明,贏家策略具有兩個(gè)顯著特點(diǎn),善良與寬容。這很烏托邦,善良與寬容能得到好報(bào)。這讓我看到了一些好人有好報(bào)的希望。
且慢。會不會是因?yàn)檫@場競賽只有15個(gè)策略,對手太少,善良策略領(lǐng)先只是因?yàn)檫\(yùn)氣好?羅教授有這樣的疑惑。
于是,他把這次競賽的過程及結(jié)果還有分析原原本本公開,并請更多的專家來制定策略。這一次,有人專門制定了欺騙善良策略的惡意策略,期望靠偽裝得到高分。也有人試圖變得更加善良,制定了”兩報(bào)還一報(bào)“甚至”三報(bào)還一報(bào)“策略。
結(jié)果如何?還是”一報(bào)還一報(bào)“成為贏家,得到435分,更重要的是,善意的策略又一次贏了惡意的策略,前15名中只有一個(gè)惡意策略,而倒數(shù)15名中只有一個(gè)善意策略。
到這里,我們可以肯定的說,好人有好報(bào),并不是寄希望于上帝或者來世的一廂情愿,而是在這個(gè)自私自利的現(xiàn)實(shí)世界,理性人為了得到最大利益采取的必然步驟。
那么,得到好報(bào)的好人,能夠繁衍生存下去嗎?在這個(gè)壞人好人共存的世界,隨著世代更迭,是好人越來越多,還是壞人越來越多呢?羅教授帶著這個(gè)問題進(jìn)行了第三次競賽。
這次競賽,稱為生存之戰(zhàn)。
還是第二輪的63個(gè)策略,組成進(jìn)化演替的第一代。贏的人不再得到分?jǐn)?shù),而是得到與其完全相同的后代。世世代代如此傳遞,一些策略逐漸變得數(shù)目稀少,甚至完全絕跡,另一些策略則漸次增多。
最終在1000代以后,種群不再變化,穩(wěn)定的狀態(tài)形成。在這之前,各種策略的命運(yùn)起伏不定,”騙子“、”傻瓜“、”斤斤計(jì)較者“在200代之后徹底滅絕,剩下的策略都類似于”一報(bào)還一報(bào)“,既善良又容易被煽動報(bào)復(fù)。
答案揭曉:這個(gè)世界,好人”穩(wěn)定的“多于壞人。這并不是因?yàn)樾叛錾衩骰蜃駨哪撤N主義的結(jié)果,而是理性人出于自我利益最大化的必然選擇。
這里所說的好人,不是傻好人,而是不首先背叛,及時(shí)反擊,寬容大度、行為清晰的綜合體。羅教授對此做了總結(jié):
這一場33年前的計(jì)算機(jī)策略競賽,以及羅教授的分析,在今天看來,我仍然感到深深的震撼。他堅(jiān)定了我們做好人的信心,也告訴了我們應(yīng)該做一個(gè)怎樣的好人。
不首先背叛,及時(shí)反擊,寬容大度、行為清晰這四大原則,是好人立身成圣的擎天之柱。第一條容易,后面三條我自覺差距還很大。但這不妨礙我們把這些簡單的原則記錄下來,奉為以后行動的圭臬。
及時(shí)反擊是好人生存的基礎(chǔ),一個(gè)忍氣吞聲的爛好人沒人記得他的好,只記得他的軟弱。憤怒和生氣是我們維護(hù)邊界的有力武器。如何在反擊中掌握度,既表達(dá)憤怒又適時(shí)收手,讓位于寬容大度,那是下一篇文章的故事了。
聲明:本站內(nèi)容與配圖部分轉(zhuǎn)載于網(wǎng)絡(luò),我們不做任何商業(yè)用途,由于部分內(nèi)容無法與原作者取得聯(lián)系,如有侵權(quán)請聯(lián)系我們刪除,聯(lián)系方式請點(diǎn)擊【侵權(quán)刪稿】。
求助問答
最新測試
1696760 人想測
立即測試
1758673 人想測
立即測試
3985552 人想測
立即測試
1692514 人想測
立即測試
1750227 人想測
立即測試