立即加入會員,專屬活動優先通知!

當演算法不只會算數還懂人性,電腦思維如何改變人類決策邏輯?

當演算法不只會算數還懂人性,電腦思維如何改變人類決策邏輯?

演算法的思維其實與人類差異不大,但更有邏輯。學會像電腦那樣拆解問題,能幫助我們更好的決策。

Shutterstock

一聽到「演算法」,你也許會想到政府或大企業用數學模型「算計」我們。但演算法的本質,其實只是解決問題的一連串步驟。它長年為各領域提供洞見,也能幫我們跳脫直覺偏誤;而電腦面對的挑戰,其實與我們日常無異:在有限時間與資源下,做出最好的取捨。演算法的思維其實與人類差異不大,但更有邏輯。學會像電腦那樣拆解問題,不是要我們變得機械,而是更清楚什麼能掌控、什麼該放手。電腦科學還幫我們分辨,哪些問題有清楚解答、哪些沒有;於是我們更能安排自己要處理什麼,哪些交給別人,讓合作更有效率。

我們以為理性決策意味著掌握所有資訊、仔細思考後再採取行動,但現實往往不允許這種完美過程。

無論是買房、找工作、投資還是愛情,我們都在有限時間與資訊中掙扎於「要不要再等等」與「該不該現在出手」的兩難。這些看似人性的矛盾,其實與電腦在執行任務時面臨的挑戰相似。電腦必須在時間、記憶體與資訊有限的情況下,找出最可行的解答,這正是演算法的目標。

演算法不是冷冰冰的數學公式,而是一種決策的藝術。它可以在混亂中找出秩序,在不確定中找到行動準則。
舉例來說,所謂的37%法則教我們在做選擇時先花37%的時間觀察與學習,建立標準後再果斷出手。這是經過數學驗證的最佳策略。從找房、面試到談判,這種平衡探索與行動的思維都能讓我們更接近理想的決定。

科學家研究處理器如何分配注意力、記憶體如何高效使用、資料何時該蒐集或該行動,這些問題與我們日常的抉擇非常相似。
學會像電腦一樣思考不是要讓我們變得機械,而是讓我們更明白自己的有限性,知道什麼該掌控,什麼該放手。理解演算法的邏輯可以幫助我們在複雜的現實中找到更有效的決策方式,他不是電腦獨有的思考邏輯,他也能成為我們決策的幫手,讓我們減少錯誤的選擇與遺憾。

以下是精選書摘:

為什麼我們能跟電腦學決策?

想像你正在舊金山找房子。這城市可說是全美最難找到房子的地方,有繁榮的高科技業,加上嚴格的分區使用法規,因此房價跟紐約一樣昂貴,很多人認為甚至不輸給紐約。新物件出現沒多久就下架,房地產公開說明會人山人海,往往得私下先塞訂金支票給屋主才買得到。

由於市場如此熱絡,很難容許理性消費者先蒐集資料,深思熟慮後才下決定。四處閒逛或透過網路買屋的人,可以比較許多選擇後再下決定,但想在舊金山買房子的人,要不就買下眼前這棟房子,拋下其他選擇,要不就馬上走人,不再回頭。

為了簡化起見,我們姑且假設你只想盡可能提高買到最好房子的機率。你的目標是把在「錯過好機會」和「說不定還有好機會」之間徘徊的機率降到最低。你立刻發現自己陷入兩難:如果沒有判斷基準,要怎麼知道某棟房子是不是最佳選擇?但如果看過的房子不夠多,又怎麼知道判斷基準在哪?你取得的資訊越多,越能掌握真正的好機會,但在此之前錯過好機會的機率也越高。

那麼你該怎麼做?倘若蒐集資訊反而可能不利,那麼該如何做出明智決定?這種狀況十分殘酷,簡直可以說是矛盾。

大多數人面臨這類問題時,直覺上通常認為必須在取捨間取得某種平衡,得看過夠多的房子才能建立標準,再依據標準找出想要的房子。這種權衡概念非常正確,然而大多數人沒辦法明確說出平衡點在哪。所幸這確實有明確答案:

是37%。

如果你希望達成買到最佳房子的最佳機率,請把總時間的37%拿來看房子(如果打算花一個月找房子,那就是十一天)。把清單留在家裡,單純用來設定標準。但是花了37%的時間後,就要準備出手,只要一發現比已經看過的房子更好的選擇就買下來。這不只是尋找和放棄之間的平衡點,也是經過驗證的最佳解決方案。

我們之所以知道答案,是因為找房子屬於數學中的「最佳停止問題」。37%法則定義出一連串解答這類問題的簡單步驟,電腦科學家稱之為演算法。其實最佳停止問題可以用來解決生活中的許多狀況,找房子只是其中一例。生活中我們經常遇到選擇或放棄一連串選項的情形,比方說:要在停車場繞幾圈才找得到車位?投資高風險事業要多久才會開始回收?賣房賣車時要忍耐多久才能等到更好的價錢?

還有一種更難抉擇的狀況亦屬此類問題,那就是約會。最佳停止是連續單偶制的科學原理。

簡單的演算法不僅能協助你找到好房子,還適用於遭遇最佳停止問題的各種狀況。

我們每天都在跟這類問題纏鬥不休(只不過比起停車,詩人花比較多墨水描述愛情的磨難),有些狀況也真的很折騰。但其實沒必要這麼糾結,有些問題數學已經解決了。心急如焚的房客、駕駛人和忐忑不安的求婚者,其實都沒必要煩惱;他們不需要治療師,只需要演算法。治療師可以教他們如何避免過於衝動和過度思考;演算法則能明確告訴他們,這個平衡點就是37%。

由於我們生活的空間和時間都有限,每個人都遭遇到一類問題。在一天或十年中,我們應該做什麼、或應該不做什麼?應該容忍什麼程度的混亂?什麼樣的秩序算是過度?新事物和心頭好各佔多少比例,才能使生活最讓人感到滿足?

似乎只有人會面臨這類問題?其實不然。半個多世紀以來,電腦科學家一直在探究這類日常困境,有時還試圖解決,像是:處理器該如何分配它的「注意力」,以最少時間執行使用者要它做的工作,同時盡量少做白工?它什麼時候應該轉而處理不同工作,一開始又應該接受幾項任務?怎麼運用有限的記憶體資源最好?它應該蒐集更多資料,或是依據已有的資料採取行動?

人類要把握每一天已經很不容易,電腦卻能輕鬆寫意地把握每一毫秒。電腦的工作方式可以帶給我們許多啟發。

討論演算法對人類生活有何助益似乎有點奇怪。說到「演算法」,許多人想到的是大數據、大政府和大企業神祕難解的算計,這類算計在現代世界基礎建設中的比重越來越大,但稱不上實用智慧或人生指南。不過演算法其實是解決問題的一連串步驟,而且範圍比電腦更廣,歷史也更悠久。早在機器使用演算法之前,人類就開始使用它們了。

「演算法」這個詞,源自撰寫手算數學書的九世紀波斯數學家阿爾花拉子模(al-Khwārizmī)。他寫的書名為《還原和對消的規則》(al- Jabr wa’l-Muqābala),其中的al-jabr後來演變成代數(algebra)。然而目前已知最古老的數學演算法,其實早於花拉子模的著作。有一塊巴格達附近出土、歷史長達四千年的蘇美黏土板,上頭就記載了長除法。

不過用得上演算法的領域不只數學。你參考食譜做麵包、依照圖樣打毛衣,或是以一定方式用鹿角末端敲擊燧石,在燧石上形成尖銳邊緣(這是製作精細石器的重要步驟),都是依循演算法在做事。早從

石器時代開始,人類科技中就蘊含著演算法

奈許,就是賽局達到均衡

你知道規則,我也知道…… 我們了解這個遊戲,我們準備參與。──英國歌手瑞克.艾斯里(Rick Astley),上文引自〈Never Gonna Give You Up〉一曲
 
賽局理論涵括各種合作與競爭情境,但這個領域的起源相當類似撲克牌手對決:兩方互相角逐,一方的獲益就是另一方的損失。分析這些賽局的數學家試圖從中找出均衡(equilibrium),也就是一套可供雙方遵循、並且讓雙方知道對方的行動後,也不想改變本身行動的策略。
 
這種狀態稱為「均衡」是因為它很穩定,也就是雙方即使再怎麼考慮,都不會改變自身選擇。我用你的策略考慮後,很滿意我自己的策略;你用我的策略考慮後,也很滿意你自己的策略。

舉例來說,在剪刀石頭布中,均衡的意思是完全隨機從這三種手勢出一種,出每種手勢的機率大約是 1/3。使這個均衡穩定的因素是,如果雙方都採取這種1/3-1/3-1/3策略,那麼對雙方而言,除了堅持下去之外別無更好的方法(如果我們試著多出幾次石頭,對手很快就會注意到,開始經常出布,這樣又會使我們多出幾次石頭,如此不斷循環,最後雙方都會回歸原本的1/3-1/3-1/3策略)。

數學家約翰.奈許(John Nash)於1951年證明,所有雙人賽局至少有一個均衡狀態。這項重大發現在賽局理論領域影響深遠,也讓奈許獲頒1994年諾貝爾經濟學獎(並促成《美麗心靈》〔A Beautiful Mind〕這部講述奈許生平的小說和電影問世)。現在這樣的均衡經常被稱為奈許均衡,也就是前述的撲克牌手丹.史密斯想追求的狀況。

從表面上看來,雙人賽局一定存在奈許均衡這一點,似乎可以讓我們擺脫撲克牌和許多類似競爭中,常見的鏡廳遞迴現象。我們感到自己捲入遞迴漩渦時,一定有機會脫離對手的掌控,尋求均衡,發現最佳策略,採取合理的行動。在剪刀石頭布中,如果你知道隨機出拳其實就是長期而言的不敗策略,就不用花力氣觀察對手的表情,猜測對手下一手可能出什麼拳了

更籠統地說,奈許均衡能夠預測任何一組規則或誘因的穩定長期結果,因此它能做為預測和擬定經濟政策及一般社會政策的重要工具。諾貝爾獎得主羅傑.麥爾森(Roger Myerson)曾說,奈許均衡「在經濟學和社會科學領域擁有基本且廣泛的影響力,相當於DNA雙螺旋的發現在生物學領域中的影響力。」

然而,電腦科學把這件事變複雜了。大致上說來,數學研究的是事實,電腦科學研究的是複雜性。而我們已經知道,如果一個問題是難解問題,那麼單單取得解答是不夠的

賽局理論雖然讓我們知道有均衡存在,卻未說明這個均衡是什麼,也沒有說明如何達到均衡。加州大學柏克萊分校電腦科學家克里斯托斯.帕帕迪米崔歐(Christos Papadimitriou)曾在作品中提到,賽局理論「通常會預測參與者的均衡行為,但沒有說明要怎麼達到這狀態,但這通常是電腦科學家最看重的事。」史丹佛大學的提姆.羅夫加爾登(Tim Roughgarden)同樣不滿意奈許僅是證明均衡必定存在。他說:「好。不過我們是電腦科學家,對吧?給我們一些可以運用的東西。不要只是告訴我們有這東西,請告訴我們如何找到它。」因此原本的賽局理論衍生出演算法賽局理論,也就是說,研究賽局的理論性理想策略,轉變成研究機器(和人)如何擬定賽局策略。

思考太多關於奈許均衡的問題,其實很快就會讓我們陷入運算困難。二十世紀末,判斷某個賽局是否具有一個以上的均衡,或某個均衡是否給某個參與者特定報酬,或是某個均衡是否必須採取某個行動等,都已經確定是難解問題。然後從2005年到2008年,帕帕迪米崔歐等人證明,純粹尋找奈許均衡同樣是難解問題。

剪刀石頭布這類簡單賽局乍看之下,或許有明確的均衡,但現在已經知道,在複雜程度接近真實世界的賽局中,我們不能認為參與者理所當然一定能發現或達到賽局的均衡。因此這也表示,賽局設計者不一定能藉助均衡來預測參與者的行為。這個嚴酷的結果涵括的範圍相當廣:奈許均衡是經濟學理論建立模型及預測市場行為的重要方法,因此擁有崇高地位,但這個地位可能名過其實

帕帕迪米崔歐解釋:「如果一個均衡概念無法有效運算,那麼它預測理性參與者行為的可信度,將會大打折扣。」MIT的史考特.艾隆森(Scott Aaronson)也同意這一點,他說:「就我看來,如果奈許均衡存在的定理,被視為和自由市場與政府介入的爭議有關,那麼尋找這類均衡的定理(難解)也應該視為有關。」參與者找得到奈許均衡時,奈許均衡的預測能力才會造成影響。eBay前研究長卡馬爾.簡恩(Kamal Jain)曾說:「如果你的筆記型電腦找不到(奈許均衡),那麼整個市場也都找不到。」

不採取「均衡」作法的代價就算是我們能達到均衡的時候,單單只是穩定還不夠好。這點看來或許有點自相矛盾,但均衡策略(也就是所有參與者都不願意改變行動的狀態),不一定是可讓所有參與者獲得最佳結果的策略。說明這點的絕佳範例,是賽局理論中最著名、最刺激,也最惹爭議的雙人賽局:囚徒困境(prisoner’s dilemma)。

囚徒困境的狀況是這樣的:假設你和另一個共犯搶銀行後遭到逮捕,被關在不同牢房,現在你必須決定是要彼此「合作」,也就是保持緘默、打死不認,還是要背叛同伴,向警方告發對方。你知道如果你們彼此合作,保持緘默,警方沒有足夠證據可以判你們有罪,因此兩人都可以平安離開,瓜分贓款,可能是每人50萬美元。但如果你們其中一人背叛並告發對方,而對方沒有招供,則告密者就可以平安離開,獨吞100萬美元,拒絕招供的一方則會成為這樁案子唯一的罪犯,遭判 10年徒刑。如果你們互相告發,那麼兩人將共同承擔罪名和刑期,每人坐牢5年

問題就在於:無論你的共犯怎麼做,你都應該背叛對方。如果你的共犯告發你,那麼你告發共犯將可少坐5年牢,因為有人可以跟你分攤刑期,你不用自己承擔所有罪刑(坐牢10年)。如果你的共犯保持緘默,那麼告發他將可讓你獨吞這100萬美元,不用跟對方分贓。無論如何,不論你的共犯怎麼做,你背叛都比合作來得有利,不這麼做的話,無論對方怎麼做,都一定會使你的處境更糟。

事實上,這使得背叛不僅成為均衡策略,還成為「主導策略」(dominant strategy)。主導策略是因應對手各種可能策略,從而脫離對方的掌控,完全避免遞迴的最佳手段。主導策略的力量非常強大,但現在我們遇到了矛盾。如果每個人都很理性,採取主導策略,那最後你們兩人都會坐五年的牢。跟逍遙法外和白花花的 50萬美元相比,這個結果對每個人而言都差了很多,這到底是怎麼回事?

這是傳統賽局理論中的重要見解之一:對一群依據自身利益採取理性行動的參與者而言,「均衡」或許不是最好的結果。演算法賽局理論依據電腦科學的原理,採用了這個見解並加以量化,創造出「自主行為代價」(price of anarchy)這種度量。自主行為代價可衡量合作和競爭兩者間的差距(合作指集中設計或協調的解決方案,競爭指所有參與者各自試圖取得對自己最好的結果)。在囚徒困境這樣的賽局中,這個代價其實是無限大:提高贓款金額和拉長刑期,可能會使兩種結果間的差距變得更大,即使主導策略不變也一樣。對於參與者而言,不合作所造成的痛苦沒有極限。但演算法賽局理論學者發現,在另一些賽局中,自主行為代價其實沒有那麼糟

流量就是個不錯的例子。流量可以指每天通過擁擠車流到公司上班的通勤者,也可以指在網際網路上不斷收發TCP封包的路由器,系統中的每個成員只想取得對自己最有利的結果。駕駛人不在乎路線,只要最快到達就好;路由器也只想花最少的力氣收發封包,但在這兩種狀況中,這種想法都可能造成重要通道過度壅塞,進而影響所有人。不過影響程度究竟有多大?提姆.羅夫加爾登和康乃爾大學的伊娃.塔爾多斯(Éva Tardos)於2002年證明,這種「自私路徑」法的自主行為代價居然只有4/3 。也就是說,各行其是只比毫無阻礙地順利行進慢33%。

羅夫加爾登和塔爾多斯的研究成果,對有形車流的都市規劃和網路基礎建設,都造成深遠的影響。舉例來說,自私路徑規劃的自主行為代價很低,或許可以解釋為什麼網際網路沒有中央主管機關負責管理個別封包路徑,也能順利運作。即使可能執行這樣的協調,狀況也好不了多少。

在人類的交通方面,自主行為代價甚低有好處、也有壞處。好處是缺少中央協調最多只會讓通勤時間增加 33%。而另一方面,如果你期待有網路連線的自動駕駛汽車可以帶你進入交通的天堂,那你可能要失望了,因為現在自私駕駛人各行其是的情形,其實已經相當接近最佳狀態。自動駕駛汽車確實應該能減少行車事故,或許也能讓汽車行駛得更近,兩者都可加快車流。不過說到壅塞程度,自主行為的壅塞程度只有經過完美協調後的4/3,這代表經過完美協調後的壅塞程度只有現在的 3/4。這有點像是詹姆士.布蘭齊.卡貝爾(James Branch Cabell)的著名詩句:「樂觀的人說,我們生活在最好的時代,悲觀的人則害怕這句話是真的。」由規劃專家和整體需求來解決壅塞問題,一定比依據人類或電腦、自私或合作的個別駕駛人來決定更好。

量化自主行為代價讓這個領域擁有具體及嚴密的方法,來評估非集中系統的優缺點,這對人類本身參與賽局的許多領域造成廣泛影響(參與者可能知道、也可能不知道)。自主行為代價很低,代表這個系統無論是否細心管理,運作狀況都和放任不管差不多。另一方面,自主行為代價很高,則代表如果細心協調,狀況就可能好轉,但如果沒有任何介入,就可能造成災難。囚徒困境顯然就屬於後者。可惜的是,世界上的許多重要賽局都是這樣的。

公有地悲劇

1968年,生態學家賈瑞特.哈定(Garrett Hardin)研究雙人囚徒困境,把規模擴大到涵括一個農莊中的所有成員。哈定請讀者想像農莊裡有一塊「公有地」,這片草地可讓每個人放牲口吃草,但容量有限。

理論上,所有村民只能放一定數量的牲口,讓每個人的牲口都有草可吃。但實際上多放一點牲口對自己有利,影響則似乎很小,不會造成嚴重後果。然而如果每個人都這麼想,都多使用一點點公有地,就會造成可怕的均衡:草地完全遭破壞,使大家的牲口都沒草可吃。

哈定把這種狀況稱為「公有地悲劇」(tragedy of the commons),後來這成為經濟學家、政治學家以及環境運動,用於觀察汙染和氣候變遷等大規模生態危機的主要工具。卡內基美隆大學電腦科學家及賽局理論學者艾弗瑞姆.布魯姆(Avrim Blum)說:「我小時候有一種汽油叫做含鉛汽油。含鉛汽油便宜了一角左右,但它會汙染環境⋯⋯如果每個人都這麼做,那麼你使用有鉛汽油對你個人(健康)造成的影響,會增加多少?其實沒有很多。這就是囚徒困境。」對企業和國家而言,這類狀況同樣成立。日前有個新聞標題一語道破了這個問題:「少用化石燃料才能維持氣候穩定,但應該叫誰少用?」每個企業(某個程度上也包括每個國家)最好都能比其他企業或國家不顧後果一點點,以便維持競爭力。但如果大家都不顧後果,就可能破壞地球,最後討不到便宜:大家都無法取得想攫取的經濟優勢。

這類賽局的想法非常普遍,我們不需要特別觀察不當行為,也能發現它舉目可見。我們只要一不留意,就很容易形成惡性均衡。怎麼會這樣呢?只要看看公司的休假規定就好。美國人的工時是全世界最長的。經濟學家曾說:「在美國,工作的價值最高,但休閒的價值最低。」美國很少有法律規定雇主必須提供休假,甚至有些美國員工即使有假也不想用。近年一項研究指出,美國員工平均只用掉一半假期,更有15%完全沒有休假。

目前(兩個作者居住的)舊金山灣區正在對休假規定進行根本的典範轉移,試圖改變令人遺憾的現狀。這個轉移用意良好,但是徹底失敗。它的前提聽起來很正常:與其給予每個員工固定天數的假期,又要浪費人資的人力確認每個人的休假是否超過限制,何不讓員工自由管理?何不給員工無限的假期?目前為止的個案報告褒貶不一,但從賽局理論的觀點看來,這種作法是個惡夢。理論上,所有員工都希望盡量多休假,但也希望比其他人少休一點假,以便獲得忠誠、認真、負責的評價(這樣比較容易升遷)。每個人都以其他人為基準,比這個基準少休一點。
 
這個賽局的奈許均衡是0。軟體公司Travis CI執行長馬希亞斯.梅耶爾(Mathias Meyer)寫道:「許多人不敢休假,是因為不想被視為休最多假的人,這是少者獲勝的比賽。」

這是公有地悲劇發展到極致的結果。這類狀況在組織間的殺傷力,與在組織內部不相上下。假設某個小鎮上有兩家小店,兩位店東可以任意決定每天都開店,或是一星期只開六天,星期天休息,跟朋友和家人共度。如果兩人都選擇休息一天,就可以維持原本的市場占有率,壓力也比較小。然而如果有一位店東決定每天開店,就會招來更多顧客,這其實是從對方手中搶來客戶,因此會威脅到對方的生計。這時奈許均衡是每個人每天都工作。
 
2014年年底,這個問題在美國引發熱戰。當時許多零售商不想把市占率拱手讓給在感恩節後的購物季搶先開店的對手,因此相繼破壞這個糟糕的均衡。當時《國際財經時報》報導:「商店比以往更早開門。」梅西百貨決定比前一年提早兩個小時開店,Target隨之跟進。Kmart在感恩節當天早上六點就開店,而且連續營業42小時。

那麼,如果我們發現自己身陷這類狀況(無論是雙人的囚徒困境,或是多人的公有地悲劇),該怎麼辦?就某種意義而言,應該什麼都不做。令這類惡性均衡維持穩定(使它們均衡)的,正是最糟糕的特質。
 
基本上我們無法從內部改變主導策略,但這不表示這類惡性均衡無法矯正,只表示我們應該朝外尋求解決方案。

機制設計:改變賽局

不要再聯合外人對付家人,絕對不要。──電影《教父》

在許多關於人類合作天性的辯論和爭議中,囚徒困境都是焦點,但倫敦大學學院賽局理論學家肯.賓摩爾(Ken Binmore)認為,這類爭議有許多已經走偏。他認為,「說囚徒困境證明人類合作有多重要是完全錯誤的。相反地,在它呈現的狀況中,人類完全不應該合作。」

如果賽局規則迫使我們提出不好的策略,或許我們不應該試圖改變策略,而應該試圖改變賽局。如此一來,我們將進入賽局理論的另一個分支:「機制設計」(mechanism design)。賽局理論探討在一定規則下會出現什麼行為,機制設計(有時也稱為「逆向賽局理論」)則反其道而行,探討什麼規則會產生我們希望看到的行為。如果說賽局理論呈現的結果違反直覺(例如均衡策略或許對參與者而言合理,但對所有人都不好),則機制設計呈現的結果可能更是如此。


書名:決斷的演算:預測、分析與好決定的11堂邏輯課

作者:布萊恩‧克里斯汀

擁有布朗大學和華盛頓大學的哲學、電腦科學和詩歌學位,現在是加州大學柏克萊分校的訪問學者。他個人還著有Most Human Human,亦由行路出版翻譯引介,初版中文書名為《人性較量:我們憑什麼勝過人工智慧?》,這本書為《華爾街日報》暢銷書、《紐約時報》與《紐約客雜誌》年度推薦圖書。他還有眾多作品散見於Wired、《紐約客》雜誌、《大西洋》雜誌、《華爾街日報》、《衛報》和《巴黎評論》等,以及《認知科學》等科學期刊。

湯姆‧葛瑞菲斯
曾擔任加州大學柏克萊分校心理學和認知科學教授,現在是普林斯頓大學心理學與電腦科學教授,亦是該校的「運算認知科學實驗室」主任。他對於收集與分析資料的新方法(尤其是大數據)如何改變心理學研究,很感興趣,曾經發表數百篇科學論文,領域包含認知心理學和文化演變等。此外,葛瑞菲斯曾榮獲美國國家科學基金會、斯隆基金會、美國心理學會以及實驗心理學會等機構獎項。他現在住在紐澤西州的普林斯頓。

出版社:行路

出版日期:2025/09/03

#廣編企劃|年省86000!從Epson影印機開始的綠色革命,究竟如何再創低碳實績?|2025 關鍵字