1

五夜講場 - 哲學有偈傾 2020:向左揀向右揀

RTHK 香港電台 | 哲學類 | Mar 13, 2021

豬文:歡迎收看《五夜講場 - 哲學有偈傾》。我是本集的節目主持人豬文。本集題為【向左揀‧向右揀】未知大家聽到這個題目時會想到什麼?你可能想到一些浪漫的愛情故事或想到政治上的左右之爭,若你想到這些便要恭喜你。因為本集並非討論這些話題,你可能有智性上的驚喜,學到一些你完全沒有想過的東西。今天到底有討論什麼?話題是我們做選擇時,當一個理性的人應該做什麼選擇才是理性的?就是討論這個問題。事不宜遲我先介紹本集的拍檔主持,大家都見過幾位很多次,毋須多介紹但循例介紹一下幾位。第一位是坐在我身旁的 Alex,另一邊是有一段時間沒見的 Man姐。

鹽叔:她是負責帶領我們。

豬文︰是的,這是最理性的Man姐。

眾人齊聲︰理性Man。『Rational Man』。

豬文︰最遠處是頭髮又卷曲了的鹽叔。

鹽叔︰代表我非理性(irrational)~

豬文︰有直有曲,不知道你平時如何選擇。

鹽叔︰很流動的,代表我的性取向~

豬文︰事不宜遲,我們開始進入話題。Alex可否為我們簡介一下本集想討論一個怎樣的哲學問題?

Alex︰如你所說,有些哲學家會討論一個問題︰就是「何謂理性」是一個很複雜的問題。譬如有些哲學家會對比何謂感性。我們知道理性有一個很重要的功能︰無論是日常生活中或解決一些比較複雜的問題。譬如哲學問題,它可以幫到我們選擇,所以有些哲學家嘗試從選擇入手去看看何為理性,或者『選擇』這件事會否看到理性上的困難。有人稱它 Decision theory,決策理論。簡單來說它不是描述事實上我們是如何作決定或抉擇,而是指我們作為一個理性的人、假設我們是一個完美理性者(ideal rational agent) 應該如何去選擇。從而去看到底何謂理性以及『選擇』到底是怎樣一回事。會引伸出一些很有趣的困難。但說之前,我們可以先做一個 Paradox。Paradox中文應該是‥‥

眾人︰悖(發音︰勃)論。

Alex︰先從悖論入手說說,交給 Rational Man。

豬文︰她是新的超級英雄。他有什麼特長?

鹽叔︰最理性~

Man姐︰提到理性的選擇,當然給大家一個情境思考一下。假設你參加一個遊戲節目,你面前有兩個盒子。你知道這兩個盒子分別放了錢或者沒有錢。在第一個盒子裏一定放了一千元,但第二個盒子有少許不同︰它是根據一台超級機器,它百分之九十九猜對你接下來的行為。它會根據你的選擇,若它推測你把兩個盒子都拿走,你就可以選擇 兩個盒子都拿走 或者 只拿走第二個盒仔。若你把兩個盒子都拿走,它不會把錢放在第二個盒子裏。但它覺得你只選第一個盒子,而你選擇了第二個盒子,便會有一百萬元在盒子裏。這個時候你要想一下了︰到底你要兩個盒子都拿走,還是只拿第二個盒子?我們可以看看這張圖表。

選擇﹙1﹚|取盒 B ( $0 或 $1M)
選擇﹙2﹚|取盒 A ($1k) + 取盒 B ( $0 或 $1M)

豬文︰所以現在有兩個選擇選擇。選擇一是拿走一個盒子,就是第二個盒子。只拿第二個盒子便有一百萬元或者沒錢

鹽叔︰視乎那台電腦如何估算你的選擇。若它推測你只拿第二個盒子,你便會有……

Man姐︰只拿第二個盒子會有一百萬元!

眾人笑。

鹽叔笑道︰我很怕說錯,只拿第二個盒子有一百萬元。若它估算你兩個盒子都拿走,它不會在裏面放錢。可以看上圖表,我們清楚地寫出來。大家可以看看,這裏是個『選擇』選擇一是可以拿 盒子B︰零或一百萬元。零是它估計你拿走兩個盒子時。若你只拿 盒子B 它會給你一百萬元。(鹽叔指著 “$1M” ) 這是一百萬,Million。現在很流行錯誤地把M代表是一萬元。別算錯,要澄清一下,很多人混淆了。第二個選擇是你拿到盒子 A 和 B 。盒 A 是一千元。

豬文︰這是一定的?

鹽叔︰是的,盒子 A 是不變的。盒子 B 也一樣取決於超級電腦如何估算。關於這個超級電腦,有幾點需要補充。第一,它是一台很厲害的電腦。百分之九十九可以猜中。你會問有這個可能嗎?別管,這個是設定。舉個例子,之前有很多人玩過這個遊戲。它每次都是百分之九十九猜中。所以有很好的往績、成績紀錄。算出它有百分之九十九都猜中,所以它猜中你的機率也是百分之九十九。第二,這台電腦在你做決定之前已猜到。所以它一早已經估算了,它不許牽涉…有些人聽到認為它牽涉改變過去的能力。絕對沒有,雖然 Rational Man 是超級英雄。但這台電腦不是,它沒有超能力,所以你作出決定後。無法改變放了多少錢在第二個盒子裡。

Man姐︰意思是當你做決定時﹐兩個盒子已放在你的面前,已確定裡面是否有錢。它不會在你做決定時換了盒子裡的錢。它沒有這樣的能力。

豬文︰所以這台電腦已經估算好,然後按照其估算放了相應的錢在盒子裏。視乎你如何選擇,對嗎?

鹽叔︰沒錯。

豬文︰而且我做選擇時我也知道這台電腦會估算我。其估算有多準確?還有估算完它會做什麼?我做選擇時,我是都知道的。現在的問題就是我們如何選擇。

鹽叔︰是的,你到底會選擇只拿盒子 B 還是同時拿 A 和 B 兩個盒子。盒子 A 一定有一千元,盒子 B 取決於電腦如何估算你。

豬文︰各位和觀眾現在思考一下如何選擇。我第一次聽到這個問題時︰我覺得當然只拿一個盒子。

鹽叔︰只拿盒子 B,對嗎?

豬文︰對,只拿盒子 B 。我的想法很簡單。因為我知道電腦會做估算也知道它的估算很準確。所以我知道若它估算我只拿一個盒子︰若我只拿盒子 B 的這個決定,它便放一百萬進去。我豈不是有很大機會拿到一百萬元?所以我想不到理由去拿走兩個盒子。我第一次聽到這個悖論時,我完全不明白為何是悖論。雖然我平時不是很理性,不及 Rational Man。

鹽叔笑︰但你是叫 Irrational Man ( Irrational = 非理性 ) 叫 Irrational Chu Man (不理性豬文)

豬文︰我是『有時理性人』(Sometimes Irrational Man)

鹽叔︰即 Partially Rational Chu Man

豬文︰我心想理性的選擇不就是拿走一個盒子嗎?因為電腦會猜中。若我拿走一個盒子,它亦猜中我拿走一個,它會放一百萬元進去,我應該要這樣選,所以我即時反應是這樣。

鹽叔︰而且你認為它猜中你拿走兩盒子,它不會放錢進去,對嗎?

豬文︰是的。

鹽叔︰若你拿走兩個盒子,它有很大機會猜中,你豈不是只有一千元?

豬文︰是的。

鹽叔︰這樣很像很吃虧,所以…Partially Rational Chu Man選擇只拿一個盒子。

豬文︰只拿盒子 B ,你們有何看法?

Alex︰其實我也是直播覺只拿盒子 B。因為很簡單的理由,既然電腦的能力如此厲害。若它預計我只拿盒子 B 才放一百萬元進去﹐我當然只拿盒子 B 。因為這樣很大機率能保證我拿到一百萬元。剛才我們吃早餐時也有討論過。就是我們幾個幾乎…是空腹吃的。

鹽叔︰好像…是帶著思考在吃。

Alex︰不空腹應該吃不了早餐~ (眾人笑)

我們幾個都認同應該只拿一個盒子。可以百分之九十九保證我們拿到一百萬元。但我們看到一些文獻記載有另外一半的人。假設有一百人,其實接近有五十人選擇拿兩個盒子。為什麼?他們的理由很有趣,但聽起來亦不是不合理。不是『真有趣你們真笨』這個意思。

Man姐︰他們才不是那種『小朋友才做選擇,我兩個都要!』(眾人笑)

Alex︰不是的,可以看看一個圖表。

鹽叔︰我們先看不同的選擇有何後果。

|盒B有$1M |盒B有$0
取盒 B |$1M |$0
取盒 A+B |$1M+$1k |$1k

Alex繼續︰我們可以看到若只拿盒子 B。盒子B要麼有一百萬元,要麼沒錢。只有兩個可能性︰代表要麼你拿到一百萬元,要麼你毫無收穫。但問題是若你拿兩個盒子即是A和B盒子都拿,你想一下,A盒子一定有一千元,而B盒子要麼沒錢,要麼有一百萬元,所以只有兩種情況,要麼拿B盒子,要麼兩個盒子都拿,綜觀這兩種選擇,無論如何,我們似乎都看到兩個盒子都拿是比較划算。還有一點很重要,你決定拿一個盒子或拿兩個盒子,不會影響電腦把多少錢放進盒子B。所以你最初決定如何,或者你最初如何想,最後如何想,都不影響盒子B裏的金額。

Man姐:我覺得要先澄清一下,它不是不影響放多少錢進去,而你接下來做決定時,因為錢已經放進去了,所以變相不影響。事實上電腦會估算你的決定,所以你很難說完全不影響ₒ 只是你當下做決定時,錢已在盒子裏,所以在這樣的意思下,當然不影響ₒ

Alex:Man姐說話很理性 (哈哈哈哈) 我再補充一下,我當下決定拿一個還是兩個盒子,都不會影響當下盒子裏是否有錢,不會因為我拿走兩個盒子,盒子的錢突然消失, 諸如此類…因為我當然拿兩個盒子 因為計算了這麼多可能性之後,似乎拿兩個盒子比較划算。

鹽叔:這個圖表已很清楚,再展示一次,這個圖表為何很清楚,你可以看到現在有兩種選擇,第一個選擇是……(兩個可能)…你可以說是有兩種可能:就是「取盒子B」和「取盒子A+B」,你可以看看這兩個選擇,無論如何下方這一格「取盒子A+B」,都比上方這一格「取盒子B」多一千元,對嗎? 這一格是拿到「$1M+$1K」,即一百萬加一千元。這一格「$1M」拿到一百萬元, 所以下方這一格多一千元。這一格「$1K」也是,這裏拿一千元,這裏「$0」是毫無收穫,所以我們看到無論如何下方的選擇,都一定比上方的選擇要好。無論結果是你有一百萬元,還是盒子裏没錢的情況下。

豬文:這個表的意思盒子B只有兩種可能性,要麼没錢,要麼有一百萬元。而這兩個可能性,你做這兩個選擇都會多了錢。

鹽叔:没錯。

豬文:所以要選擇兩個盒子都拿走。

鹽叔:是的。

豬文:但我當時感到很驚訝。

鹽叔:所以很有趣,有很多人說:「不知道為何旁邊的五十人這樣選」,大家會看到不同的面向,有五十人是這樣的面向,我們稱為支配性(Dominance)。總是有一個選擇比另一個選擇更好,無論在甚麼情況下。

豬文:我們下一節繼續討論到底哪種選擇更理性。

第二節

豬文:歡迎來到《哲學有偈傾》第二節,我們第一節很簡單的介紹了一個悖論,指出了我們作為人,作為一個理性的存有去做選擇時,正如剛才的情況,兩個選擇都是理性。我剛才說自己的直覺,當然只拿一個盒子,因為電腦可以估算我,很大機會可以猜中, 我只拿一個盒子便可拿走一百萬元,這樣豈不是有更多錢?似乎這是一個理性的選擇,但第一節末指出了另一個可能性,拿兩個盒子才是最理性 因為鹽叔的圖表顯示了無論是甚麼情況,無論盒子B裏有多少錢,作出拿兩個盒子的選擇都一定得到一千元,這個選擇不是比較理性嗎?我估計悖論就在這裏,好像兩個選擇都是理性,兩種選擇在鬥爭,我想本集其中一個很重要的討論在於哪種選擇才是理性。

鹽叔:我想說這兩種選擇不是純粹用來選擇,是建基於一些理性上很合理的原則,是按照原則去選,我們從這一節開始逐漸透顯,剛才兩個不同的選擇,你選一個盒子,還是選兩個。可能正建基於不同的原則,似乎都是理性的原則,但有可能給我們不同的要求,建議我們做不同的選擇。1969年,一位很有名的哲學家,羅伯特.諾齊克(Robert Nozick)寫過一篇論文進行討論,剛才提出的悖論名為「紐康悖論」(Newcomb's paradox)。紐康是一位物理學家,傳說是他跟朋友提出這個想法後,他們共同的朋友告訴了諾齊克,於是諾齊克寫了一篇論文,即「是非當人情」(眾人笑)…沒錯,就是平時的是非。

豬文:但別人的是非比我們高級(眾人笑)

Alex:「是非當論文」

鹽叔:是的,諾齊克把它分析為兩條原則,支持了這兩種不同的選擇。第一節最後所提到的就是支配原則(Principle of Dominance)的一個原則,這是我們經常用到的。

下載檔案

下載檔案

1

1

營運經費相當貧乏,敬請體諒我們投放少量Google Ads!

1

豬文:那些「是非」是互相取笑對方,「你看他選兩個盒子,真是儍瓜」(眾人笑)

Alex:然後寫出一篇論文,讓後世討論幾十年。(眾人笑)

豬文:別人的是非是這種層次。

Alex:我先簡單用中文總結一下Principle of Dominance 的意思, 何謂Principle of dominance?

豬文:「用中文」是怎樣的? (眾人笑Alex用了英文)

Alex:就是支配原則,首先我這樣說,雖然有少許抽象,假設我們只有兩種選擇,A和B這兩種選擇。若我們選擇A,只有兩種可能性:要麼A在所有情況下,結果都比B;要麼A在某種情況下,結果與B一樣「但在其餘情況下,也是比B好。這樣說好像有少許抽象,可以舉一個簡單易懂的例子。假設你是有心臟病的人,瀕臨死亡,假設你一天後死亡。

|手術成功 |手術失敗
做手術 |生存 |死亡
不做手術 |死亡 |死亡


豬文:這麼糟糕? (眾人笑)

Alex:一天後要死亡,你需要面對的是甚麼? 就是醫生告訴你:你這種病,醫學界不知為何研發出一個手術,但尚未在人類身上做過實驗,所以不知道成功率有多大,你做還是不做手術?想一下,若你不做手術,一天後會死亡;若你做手術,假設一天後亦可能會死亡,即手術結束後,你做還是不做手術?我們可似看看這個圖表,若你是這種情況, 而你選擇做手術,並且手術成功,你便是……(豬文:可以生存下來) 。很簡單,因為手術成功。若手術失敗,你便會死亡。好的,但若你不做手術,無論手術成功或失敗 因為你不做手術,你都會死亡。在這種情況下,我們會看到,這正是應用了支配原則。看到我們會選擇一個決定,就是若這個決定在一些情況下,沒有哪個選擇比較好。手術失敗。的情況下,沒有哪個選擇較好,因為結果都是死亡。但在其餘的情況下,假設手術成功, 生存是比死亡更好,於是我們會選擇做手術這個選項。

鹽叔:取決於是誰,很多人覺得生不如死。

豬文:所以這些實驗都假設了。

鹽叔:起碼假設了生存比死亡好。

豬文:正如剛才提出的例子,紐康也假設了錢多是比較好,先不討論這一點。

Alex:對,是一個渴望獲得的結果,可見在日常生活中,我們起碼都會應用到配原則。

豬文:大家都認為做手術比起不做手術,是理性的選擇。

鹽叔:對。

豬文:背後如Alex所說,因為我們都應用了支配原則。

鹽叔:支配的意思是其中一個選擇,譬如第一個選擇是做手術,相比另一個選擇,就是不做手術,在所有的可能情況下都至少平手。但有些比較好,不會更差。至少係平手,有些情況比較好,當然選它。因為不會更差,而且在有些可能的情況下會更好。於是一個選擇是支配另一個選擇,因此稱為支配原則。它是比較好,所以選它。

豬文:而我們毋須知道手法成功的機會有多大,都知道它是支配了另一個選擇。

Man姐:我們平時有很多情況,都是依賴支配原則去做決定。譬如現在無法去旅行,香港人很喜歡去旅行,你會買機票。若有兩間航空公司,假設服務都一樣,但你聽到一個消息,某公司何能倒閉,意味着你無法成行,我們可能會面對這種情況。若你知道兩間公司的價格和服務一樣,在這種情況下,你當然選没有倒閉消息的公司。因為你要想像兩種可能發生的情況:一種消息是假的,即是那間公司不會倒閉(Alex:有政府入股),你選任何一間公司都没有分別。因為都有機票,可以出發。但若在另一種可能的情況下,這消息是真的,它真的倒閉,你選擇另一間公司當然比較好,你在比較兩種可能的情況下,一種情況是一樣的,另一種情況是選第一間公司比較好,你當然會選第一間公司。因此細微至買一張機票,也根據這種原則做選擇。

鹽叔:這叫決策理論,通常有兩種大的考慮情況。

Man姐:或超過兩種情況。

鹽叔:對,超過兩種情況。

Man姐:可能有幾種可能的情況,但你會比較每個可能的情況下,有一種選擇是所有可能情況下都比較好,或者至少在一些選擇下,它們是同樣好。但在某個特別的情況下,它比較好。你當然選在所有情況下都應該會比較好的情況。

鹽叔:沒錯。

鹽叔:但我原本想說的觀點是決策理論,討論這些話題時,往往把我們做決定的情況分為兩種。一種情況是我們已知所有選項的機率,譬如你已知那間公司倒閉的機率有多大?你已知那個手術的成功率有多高?有其他方法可以算出來,有很多因素可以思考,這種情況稱為風險決策(Decision under risk)。我們知道了每個選項的機率,但有另一種情況是我們人生時常要面對的,就是我們未知。譬如那個手術是新嘗試,我們聽到這消息,但完全沒有任何背景資料去判斷,到底這間航空公司倒閉的機率有多大?在這種情況下,我們仍要做決定,因為要買機票,於是在這種情況下,我們稱為無資訊決策(Decision under ignorance)。就是我們完全對於…Ignorance就是無知,但它是一個專業術語,意思是我們對這些不同選項的可能性,機率有多大完全沒有資訊。但你仍要做一個決定,你可以問做決定時何謂正確的理性決定,而支配原則很好用,只要在所有可能的情況下,若結果是A的選擇比B好,你便選A,毋須理會不同的可能情況的機率有多大。因此在我們日常生活中,它是非常有用的理性選擇原則。

豬文:所以節目一開始提到的悖論,人們為何選兩個盒子,也是應用這個原則,可以這樣說嗎?

鹽叔:對,沒錯。查看這個圖表(取盒AB圖),你能看到在所有情況下都是下方這一行這個選擇,「取盒A+B」是比「取盒B」更好,每一格都比上一格多一千元,現在毋須理會機率,你看到這個圖表與機率無關。

豬文:毋須理會盒子B有多大機會是有一百萬元或沒錢。

鹽叔:沒錯。機率完全不會出現在這個圖表上,但我們亦可判定下方這個選擇,兩個盒子都拿比只拿盒子B的結果要好,於是應用了支配原則。

豬文:這個原則還有什麼反對或要面對什麼問題之類?

鹽叔:或者反過來說,我認為可以解釋一下。剛才說那些人有兩種選擇,另一種選擇純粹是直覺上想選?還是基於一些稱得上理性的原則去選擇?是有這種情況,這是基於什麼原則?我們交給Rational Man。

Man姐:是建基於另一個原則,我們稱為Expected utility,中文叫預期效益原則。

鹽叔:甚至是最大化預期效益原則,視乎你要否上「最大化」。

Man姐:我們也有另一個圖表,我們知道電腦估算你是百分之九十九可以猜中,所以你知道第一格你有百分之九十九只拿盒子B,裏面有一百萬元,但沒錢是百分之一。因為電腦有可能估算錯誤,然後另一種情況下就是它估算錯誤。這種情況下,盒子B當然也有一百萬元,而且你還獲得那一千元,便有百分之一的這種情況。另外就是電腦猜中了,你便糟糕了,只剩下一千元。

1

1

|盒B有$1M |盒B有$0
取盒 B |$1M (99%) |$0 (1%)
取盒 A+B |$1M+$1k (1%) |$1k(99%)

我們可根據這些機率,然後根據你應該拿到的錢去做一個計算,計算我們預期得到的效益,就是這幅圖。好的。這裏…

取盒 B =0.99 x U($1M) + 0.01 x U($0) = 990,000
取盒 A+B =0.01 x U($1M) + 0.99 x U($0) = 10,000


鹽叔:我很喜歡你說「好的」

Man姐:哈哈,對不起。

豬文:而且這個不是圖。

Alex:也是圖,只是圖裏面有一些文字。

鹽叔:是的,這是一幅圖。

Man姐:我們有百分之九十九的機會獲得預期效益。

鹽叔:U是指Utility,一般而言是指預期效益。

豬文:即一百萬元的效益。

Man姐:接下來有0.01的機會沒錢。若你只拿B盒子,我們計算出來的數目有這麼多。

鹽叔:就是九十九萬元。

Man姐:九十九萬元,是的。我們要有兩條算式才可作比較,計算一下,若你把兩個盒子都拿走,預期效益是什麼?就是有0.01,因為電腦猜錯了。

豬文:它有機會算錯。

Man姐:我們是指它猜錯的情況,你便有0.01的機會可以拿到一百萬元。

Alex:換成百分比,0.01即百分之一。

Man姐:對。然後有百分之九十九的機會電腦猜對了,而且沒有把錢放在盒子裏。是的,盒子裏沒放錢,這樣你的預期效益只剩下一萬元。你在比較這兩種預期效益的情況下,當然選第一個,這樣好像比較理性。

鹽叔:因為九十九萬元比一萬元多很多,相差九十九倍。

豬文:而且我們假設了更多錢比較好,不在那部分爭辯了。

鹽叔:所以我們看到這個預期效益原則,在做的是什麼呢?我們在考慮它現在有兩個選項,我們總是在想這兩個選項各自的機率。

豬文:下一節繼續討論這種選項是否較好。

第三節

豬文:歡迎來到《哲學有偈傾》第三節。第二節我們繼續深入探討悖論有兩種選擇,選「取盒B」還是「取盒A+B」,背後顯示了理性思考、理性選擇兩種常用的原則。一種是支配原則,另一種是預期效益原則。剛才簡單地介紹了預期效益原則有一些數字,我不知道是否算是圖畫的東西。我認為是一些數學公式,我怕一般觀眾像我這樣的文科生,跟不上。我看到數字便很害怕,這些符號很抽象,請鹽叔為我們再作詳細解釋。

鹽叔:剛才的公式牽涉了兩點,我們平時思考也是這樣。若有一些情況,尤其是已知那些不同的選擇或不同的可能,結果會有什麼機率。譬如剛才舉Man姐姐的例子,若已知那間航空公司倒閉的百分比是多少,這樣容易計算得多,甚至可以算出來。用另一個例子來說,就是賭博,這是最多人用來解釋,很清楚。就是若你知道…我們稱為賠率,你知道得出結果的機率,譬如大和小,可以算出來,排除掉圍骰,大和小有多少機率,假設機率各佔一半,假設機率各佔一半,你可以想,我們應該買甚麼,做這個決定時考慮了兩點。首先,開大和開小各自的機率有多大,以及買大和買小開出來後賠多少錢。你可以算出來,譬如買大的機率較大,小的機率較小,但大的賠率可能比較低,小的可能比較高,你可以算出來,算一下我們應該買大還是買小,最終取決於乘出來的結果。開大的機率比較大,但賠的錢較少;開小的機率比較小,賠的錢比較多。若是這樣,我們計算最終買大還是買小,可以用剛才的公式,就是嘗試計算買大時,看看買大的機率有多少,乘以它可能的回報,給你什麼回報,再加上開小的可能性,這樣列出一條公式。公式是這樣計算,每次我們考慮買那個選擇時,便考慮一下那個選擇。譬如在這種情況下,百分之九十九猜中你拿兩個盒子。若你拿兩個盒子,0.99…(豬文糾正:只拿一個盒子) 只拿一個盒子,我常常說錯這個,只拿一個盒子,然後它給你一百萬元,這是機率乘以其回報。對,它的效益。回報加上可能性,加上另一種可能,0.99不是唯一的可能性,還是另一種可能性。另一種可能是0.01這個,百分之一是它猜錯了。

豬文:它猜錯了,以為你會拿兩個盒子。

鹽叔:以為我會拿兩個盒子。這時候你的回報是零,你便能找到…我們稱為預期效益,或Expected utility,就是九十九萬元。這幅圖可以算出另外一個選擇,當你同時選盒子A和B,它出現的機率和預期效益再相乘,你可以算出它最終的預期效益。這樣你可以找出…我們有時稱為最大化的預期效益,因為你按照平均來算,你猜到平均回報是多少,因此選最大的選項,最大的平均回報就是拿盒子B。若用這個選擇、思路,這個原則要求我們只選一個盒子,而不是同時選A和B兩個盒子。這個原則經常使用,包括賭博,有些人不是亂買的,但正常做決定時應該…

豬文:「捉路」(做估計)

鹽叔:正常而言,應該要思考這種方法。所有職業賭徒都是計算,這些我們稱為預期效益,把它最大化,尋找一個最佳策略,應該如何賭博,才可以賺到錢,若有機會可以賺到。當然最厲害的是賭場本身,賭場真的全部計算好他們的預期效益,他們的預期效益永遠是正數。

Man姐:即是你逢賭必輸。

鹽叔:我們一定是負的,所以長期我們不賭,短期有機會贏。

豬文:要是長期。

鹽叔:對,以長期來說,我們一定輸,因為賭場都算好,賭徒要想辦法突破它…

Alex:這裏我想補充少許,為何這是哲學問題?第一,我們會看到無論是用支配原則,還是鹽叔剛才解釋的預期效益最大化原則,兩者的背後都有理由,兩者都是理性的。你不會很明顯看到,譬如用支配原則一定是錯或不理性,或者用預期效益原則是沒用、不理性的。不是,我們認為兩者都是理性,問題在於我們用兩個都是理性的原則,但竟然會在這種悖論的情況下,出現了兩種不同的選擇,兩個有衝突的選擇,到底是怎樣一回事?選擇、理性到底是怎樣一回事?這個正是哲學問題。

Man姐:你先說(對鹽叔)

鹽叔:不,你先說,Rational Man先說。

Man姐:這個問題有更狡猾的地方,剛才休息時…

鹽叔:你已經想說新觀點?

Man姐:是的

1

1

鹽叔:先讓我說一句,我再補充一句,日常生活中,我們時常一起用這兩種原則,而大部份情況下,這兩種原則會給我們一致的建議,通常它給我們的建議是沒分別,我們沒察覺到這兩種原則有分別,因此理性上用哪個原則是沒分別。沒關係,但諾齊克這位很厲害的哲學家,他提出這個例子,竟然可以展現在紐康悖論上,平時都是理性的原則,竟然有可能給我們不同的建議,這樣便有一個哲學問題,到底哪個才是做理性決定時,應該遵循的一個原則?哪個才是真正的理性基礎?平時是不察覺的,因為平時都是給你一致的建議。

豬文:還是繼續收看《哲學有偈傾》,無論根據什麼原則,但到了選擇盒子的時候,一個原則讓你選盒子B,另一個原則讓你同時選盒子A和B,這樣彰顯了其實有衝突。Rational Man 請說…

Man 姐:紐康悖論更有趣的地方是,剛才第二節結束時,豬文靜悄悄問:現在有百分比,我們選預期效益的方法,因為我們有數據可以計算,這樣已代表是更好的選擇嗎?

豬文:我想補充少許,鹽叔解釋支配原則時,其中一個很常見的情況就是無資訊決策。因為我們不知道百分比和機率,所以我們要用支配原則做理性選擇。但紐康悖論的例子是:我們已知有多少百分比和機率,所以我們應該用預期效益來選。

鹽叔:我想解釋支配原則,即是在所有已知機率的情況下,按道理它也是獲勝、有用的。因為即使你知道那兩個可能的情況,無論它們各自出現的機率是多少,若選A這個選項,所有情況下都比B好,你不用管所有情況的機率,你都應該選A,因為A在所有的情況中都比B好。即是你知道百分比和機率,也毋需理會。

Alex:或者至少跟B一樣好。

鹽叔:對,至少是一樣好。

豬文:做手術的例子也一樣,若已知道手術成功的大概機率,假設成功和失敗的機率各佔50%,你仍是…因為做手術的這個選擇是支配了,無論如何都比死亡好。即使你知道成功和失敗的機率各佔一半,也沒分別。鹽叔大概是這種意思。

鹽叔:所以在這個例子下,似乎支配原則跟我們考慮紐康悖論的例子也是相關。

豬文:我們打斷了Rational Man 的發言很多次。

鹽叔:對不起,你繼續說。你使用超級英雄的能力反駁他。

Man 姐:紐康悖論有趣之處是即使解決了支配原則和預期效益原則之間的分歧,也無法解決它的問題。因為它最有趣之處是告訴你,若你只是計算預期效益,也有兩種算法,可以得出兩種不同的結果。

豬文:怎麼做?

鹽叔:有兩位哲學家很厲害,最後提出了這一點。

Man姐:是的。

鹽叔:諾齊克嘗試解釋為何有兩個不同的選擇,於是使用了兩種原則,有一種是關於效益。另外有兩位哲學家也很厲害,他們說其實不是,只是效益也有兩個很合理的算法,也有可能出現有人選一,有人選二。有人選盒子B,有人同時選盒子A和B。所以未必與諾齊克提出的這兩個原則有關。

豬文:對預期效益原則的理解,有那兩種閱讀?

Man姐:一種是證據…

鹽叔:先說因果決策理論嗎?不,先說證據決策理論。

Man姐:一種是證據決策理論(Evidential Decision Theory),一種是因果決策理論(Causal Decision Theory)。證據決策理論是剛才討論的第一種,它是計算條件機率(Conditional Probability)。

鹽叔:這個可以稍後再說,我認為先說因果決策理論比較好。

Man姐:那先說因果決策理論。因果決策理論是甚麼意思?因為它告訴你在這個例子裏,你的想法無法反過來影響已放多少錢進盒子的決定。所以你應該繼續保持這種信念,我現在再做任何決定,都無法影響盒子裏有多少錢。所以我計算出來,算法應該是一樣的。因為你現在無論做決定A,即是只拿盒子B或同時拿走兩個盒子,都不會影響盒子有多少錢的機率。在這情況下,你計算出來的結果是你應該拿走兩個盒子的預期效益較高。

鹽叔:這種叫因果決策理論,它計算預期效益的算法,正如剛才提出的算式。這個理論為何稱為因果?正因它的算法是在於理解世界的因果關係和結構,我們最後的決定是那盒子B,還是要盒子A加B ?你想一下,在因果層面不會對過去有影響,即反過來直接影響那個超級電腦的估算。超級電腦的估算已做好,在下方這條線決定好盒子裏有多少錢,然後上方這條線做一個決定,不會倒退去影響電腦。在這一刻,你做決定的那一刻,時間上不可以倒退。按照它的估算,當然會有影響,但它不會倒退去改變盒子裏有多少錢,所以你可以稱他為超級電腦。

1

1

一方面在估算你有多少錢,不……是在估算你做什麼決定,一方面再決定下面的盒子有多少錢,而這兩條線沒有直接的因果關係上的影響。在這種意義下,我們計算效益毋須考慮我做的決定會影響盒裏有多少錢,可以說這個機率已經設定好了。我想用另一個例子來講解比較好:譬如後來有人發現有這樣的實驗結果,就是收看《哲學有偈傾》。看到第四節的觀眾,若你熬得到,看到第四節也不轉換頻道。若是這樣,很有趣,原來99%的人之後都有相對很不開心的生活。因為他太沉迷於哲學,無法抽離。

Man 姐:你令觀眾都關電視了。

鹽叔:好的,你現在很不開心。重點是為何有99%的人會這樣,看到第四節的人會有這種情況,原來它有一種基因,有一種基因先天決定了,你會熬到收看第四節,竟然喜歡這種抽象的思考。同時這種基因,因為是抽象思考很容易有不好的人生,有99%的人會這樣,還有一分鐘第三節便結束,我問你,你現在會關電視嗎?這一刻,你要停止觀看下去嗎?若因果決策理論說你繼續觀看,沒關係,你繼續看,因為你的基因決定了…

Man姐:有否這個基因是早已經決定好?

鹽叔:沒錯,看第四節不影響你有沒有這個基因,若這個基因令你有不開心的生活,你沒救了,至少你看完這四節是開心的,有更多開心也值得你…

Alex:至少可以支持港台(眾人笑)

鹽叔:對,至少可以支持港台。若最後基因沒有決定你不開心,你又可以收看第四節,對嗎?所以這種想法就是建議你繼續收看,但你會退縮不看嗎?這是給每個觀眾的考核,你會不繼續收看下去嗎?這決定了你用哪個原則。

豬文:讀哲學的人連如何說服觀眾看完最後一節也說這麼多話,無論如何,若對這些思考感興趣,請收看最後一節,我們下一節繼續討論。

第四節

豬文:歡迎來到《哲學有偈傾》第四節,各位觀眾也很有勇氣繼續看下去...

鹽叔:因為你還活著…

Man姐:悲慘生命之後…

鹽叔:不,是悲慘生命,說錯了,未至於死亡…

豬文:我們繼續討論剛才的話題,發現事情越來越複雜,本來我們在問由悖論的情況,發現原來理性的決定有兩個原則,再慢慢發現原來只討論一個原則,就是計算預期效益,也有兩種算法:一種算法用因果,另一種算法用證據去計算。鹽叔開始解釋了兩種算法有何分別,我們本節最大的希望是各位觀眾有勇氣繼續收看,聽我們解釋到底這兩種原則有何差異和衝突,不如大家開始吧。

Alex:我嘗試說一下為何有些哲學家,認為應該考慮證據決策理論,我嘗試先說一種情況,假設一種人很討厭Psychopath,我姑且把Psychopath譯作瘋子,你很討厭瘋子,很不願意活在充滿瘋子的世界,或者有瘋子的世界,未必是充滿着。其次是你很喜歡生存,或者說你很討厭死亡,不是一個尋死的人,有這兩個條件。好的,在你面前有一個按鈕,它的功能是若你按下去,這個世界的瘋子會全部死亡,問題就是你會按嗎?但在你是否按下去之前,你亦有個信息。那個信息告訴你,通常…不是肯定的,通常按這個按鈕的人也是瘋子。

鹽叔:不瘋的人不會按。

Alex:是的,不瘋的人不會按。豬文,若在這種情況下,你會按下去嗎?

鹽叔:但他可能喜歡瘋子,不過你代入吧…

豬文:按不按…我認為不按。

Alex:為甚麼不按?

豬文:我有可能死亡。(眾人笑)若我按下去,很大可能我是瘋子。若我按下去,有可能連自己也殺掉。剛才說我想生存,當然不想冒這個險,便學習跟瘋子相處。(眾人又笑)

鹽叔:不要緊,我們人生隨時有很多經驗。

豬文:反正我一直跟你們做朋友。

鹽叔:彼此彼此

豬文:我認為不按是一個比較選理性的選擇。Rational Man,我這樣理性嗎?

Man姐:根據我們剛才提到的因果決策理論(Causal Decision Theory),它告訴你應該按下去。為甚麼?因為…

豬文:那它應該是不對。

Man姐:因為它告訴你,其實你是否瘋子。你在按那個按鈕之前已決定你是否瘋子。不管你是否選擇那一刻按下去,並不會令你由正常變成瘋子或者由瘋子變成正常。理論上你計算一個Expected Utility,即預期效益。你的機率不會受影響的情況下,很明顯,若你按下去,當然效益較高。因為你不是瘋子,你當然很開心,因為你根本不喜歡瘋子。

豬文:這個世界不再有瘋子。

Alex:而且你不會死亡。(眾人:是的。)

Man姐:但若你是瘋子,當然會死亡。你按下去與否不影響你是否瘋子,因此當然按下去。

鹽叔:而且多給你一個資訊,你是瘋子的機率很低。因為大家都知道這個世界當然有瘋子,但瘋子與正常人的比例很懸殊。譬如當十萬人當中有一人是瘋子,所以你知道即使你很討厭瘋子,但你知道瘋子的數量在比例上很低,所以你知道自己是瘋子的機率很低,若你用這種方法思考。於是,若你按下去,正常而言,往往給你很好的預期效益,是一個高的、正面的預期效益。或者我們嘗試用一條算式來說明,你可以這樣看。現在我們有兩種選擇,按或不按。我先說按下去這個選擇。在按的情況下會如何?我們需要考慮甚麼?

先說由機率乘以預期效益,再加上另一個有可能的機率乘以該情況的預期效益,我們看看第一個結果如何。P就是Probability的意思,機率。然後按的情況下,這個符號•代表按下去。若你按,然後引致死亡,這件事是真的。若你按會引致死亡,代表你是瘋子。你按下去會死亡的可能性,即機率乘以最後這件事是真的那個效益(Utility),代表你死亡了。這是很差勁的。

按:
P(按• ->死亡) x U 死亡
+ P(按• ->在沒有黐線佬的世界生存) x U (在沒有黐線佬的世界生存)
=(0.001 x -100)+(0.999 x 1)
=0.899


豬文:負面效益。

鹽叔:死亡的預期效益…先隨意設定。死亡的預期效益是負一百,假設是負一百,這是我瞎編的,負一百。但前面的機率很小,我們假設是0.001,為可設定這麼小的數值?

Man姐:因為你知道這個世界的瘋子佔少數。

鹽叔:沒錯,是瘋子的機率很低,舉例一萬人當中只有一人,所以你按完會死亡的機率也很小。一開始這個數值很小,後面這個儘管是負數,乘出來會有一個數值,還有另可能,是甚麼?就是你按下去,但你沒有死亡,而且生活在沒有瘋子的世界。你可以看到這是真的可能性乘以其預期效益,可以看到我們的設定是:譬如你有很大機率是不會死,因為0.001代表你會死亡。所以另一個機率是你不會死亡,不是瘋子,譬如0.999,乘以甚麼?乘以一,假設你享受沒有瘋子的世界。你的預期效益,開心快樂假設是一,這個數值不算很大,死亡是負一百,這個只有一,但得出的數值是0.899,這是你按下去時的平均預期效益,但與另一個相比便看到截然不同。

鹽叔:若你選擇不按,用因果決策理論(Causal Decision Theory)去計算預期效益,便會出現這種情況。百分比,甚麼機率,就是你不按,而且之後在沒有瘋子的世界生存。這個機率P乘以在沒有瘋子的世界生存的享受(你的預期效益U)。因為前面這個是零,應該是零乘以一,不可能你不按便沒有瘋子,因為我們知道世界有瘋子,這是事實。所以不按而且生存在沒有瘋子的世界,是不可能,數值為零,即使你在沒有瘋子的世界生活的開心快樂是一,乘出來的最終結果仍是零,你的預期效益。

不按:
P(不按• ->在沒有黐線佬的世界生存) x U (在沒有黐線佬的世界生存)
=0 x 1
=0


鹽叔:可以看到比較按還是不按:不按,你的預期效益是零;按,你的預期效益是0.899,所以數值是高出很多。如果用因果決策理論的想法,你應該選擇按,就是要你按下去。這個結果很奇怪,很多人認為很違反我們平時的直覺,覺得沒理由要按下去,尤其是人們通常認為違反直覺是哪部分?不合理是哪部分?他們計算按下去時,計算「按」…因為若是「按」,而在按的情況下,引致死亡的機率很小,是0.001。很多認為機率這麼小不合理,但因果決策理論認為這樣計算預期效益是合理。因為機率很小,大部分一萬人當中沒有一人是瘋子,按下去引致死亡的機率很小。

於是出現另一派,叫證據決策理論(Evidential Decision Theory),這一派認為因果決策理論計算這個部分,欠缺考慮一點,沒考慮到你選擇按這個按鈕是很強大的證據,顯示你是瘋子的機率大大增加。你不能只不考慮按下去這個動作、證據,去考慮本身有多少瘋子和正常人的比例,從而計算自己是瘋子的機率,還要考慮你按這個按鈕是很強大的證據,顯示你是瘋子的機率大大增加。鑑於有這個證據,你計算按下去自己會死亡的機率,不應該是這麼小,因為會按下去的大部分是瘋子,所以這個機率應該高很多。

豬文:意思是指這裏說按下去會死亡,機率是0.001,是根據甚麼?根據世界人口比比例和結構…

鹽叔:因果結構(Causal Structure)

豬文:考慮到世界上瘋子佔少數,所以設定按下去會死亡的機率是0.001,剛才鹽叔說證據決策理論不應該是這樣。因為你按下去是一個很強大的證據,顯示你很大機會就是瘋子,所以不應該用原本世界的結構比例來設定機率是0.001,而是應該更大的機率。

Man姐:我想補充少許,因為重點是比較按與不按,所以對於因果決策理論的算法來說,這部分的機率是不會因為你按或不按而產生轉變。但在證據決策理論的算法中,因為你按下令你變成瘋子的機會增加,所以計算到按下去的效益很低;但若你不按,顯示你是瘋子的機會降低。因為根據現有的證據,所以你計算的預期效益是改變了。

鹽叔:能看到若這個數值,根據證據決策理論的說法,若你按下去會死亡機率增加大大增加。你想一下,這個數值是乘以負一百,會得出更大的負數。(豬文:因為機率增加)對,機率大大增加。於是第一個負數變成更大的負數,很容易解釋了得出的數值不是0.899,可能甚至是負數。告訴你與不按比較,預期效益比零更低,因為這個數值大很多,最終得出負數,低於零。因此建議你選擇不按,而不是按。我想說就是另一些哲學家很聰明地想到,未必跟諾齊克提出的支配原則和預期效益有關,有可能只是跟預期效益有關。

如果計算預期效益,有兩種算法,我們應該計算世界的結構,還是用「你按下去」作為證據,計算機率,於是影響最終得出的預期效益是不一樣。可能只計算預期效益,毋須使用支配原則,都已經令有些人選擇只要一個盒子,有些人同時擇選A和B兩個盒子。視乎如何計算預期效益,所以變成至少有三個原則互相運作,而這三個原則似乎都有合理之處。因此我們做理性決定時要想清楚,到底使用哪個原則才是理性原則,是正確的原則。

豬文:回到節目一開始提到的紐康悖論,關鍵仍在盒子B有多大機會有一百萬元抑或沒有錢。我這個決定會否對此產生影響,因果決策理論認為已經放了錢,我的決定不是一個證據,顯示它有更大機會有多少錢,但證據決策理論卻認為還要考慮這一點。

鹽叔:沒錯。我認為這就是為何這麼多人即使計算了效益,直覺上仍會選盒子B。我們監製最也說選盒子B。因為這是很強大的證據,我們應該同時考慮這個證據,機率的算法是不一樣。

豬文:本集介紹三種對理性選擇的理解,包括支配原則(Principle of Dominance)和預期效益原則(Expected Utility),而且預期效益原則有兩種閱讀方法和算法。但我認為這應該是哲學家或其他學者很深究的觀點。

鹽叔:爭論很激烈。

豬文:對,但我們日常生活中往往有相同的決定。我推測收看《哲學有偈傾》也是其中一種,下集我們繼續討論。

***謄本內容只反映影片創作者之立場,與燕子生命一概無關***

1

IMG_1410.PNG

在囚手足能夠接觸外間資訊的渠道寥寥可數,Youtube 機頂盒為每星期從 Youtube 上挑選不同種類的專題影片並製作成謄本、印刷成信件並寄到在囚手足手上的長期計劃。

你唔需要使用真實身份同披露自己地址就可以同手足做筆友喇!

立即登記成為筆友啦!話俾在囚手足知我哋無忘記佢!

其他最新謄本

https-::www.youtube.com:watch?v=TSJwMZvw

環保飲食—減少食肉可以救地球 減二氧化碳排放紓緩全球暖化 少買動物製品轉食植物肉更有效 #專題​-果籽 香港 Apple Daily

果籽 | 時政類

https-::www.youtube.com:watch?v=TSJwMZvw

食煙飲酒就得!隊草吸毒就唔得?|哲學有飯開 ft. @好青年荼毒室 - 哲學部

點 Cook Guide | 哲學類

https-::www.youtube.com:watch?v=TSJwMZvw

盧鎮業:少年的成人禮:村上春樹《海邊的卡夫卡》

虛詞無形 | 哲學類

https-::www.youtube.com:watch?v=TSJwMZvw

日本水貨車攻略 .介紹最新車款,手續需知及注意事項

駕輛 UpCar | 汽車類

https-::www.youtube.com:watch?v=TSJwMZvw

《晚吹 - 總有一瓣喺左近》EP 158 - 預告死亡

ViuTV Scream | 娛樂類

0