專業人士的自我修練: 專家的自信

2022年6月7日星期二

「快思慢想」的作者Kahneman不斷提醒人們不要輕易相信他人的判斷 - 即使是專家的判斷也不要輕信。

在專業領域裡評估專家的意見並不容易，因為事件經常只有一次發生的機會，而且在不特定的環境下很難進行「試驗」進行比對，即使可以試驗，費用也很可觀。在大地工程的領域中有一個著名的案例，值得大家深思：

1974年MIT利用I-95公路的一段試驗路堤，邀請全世界知名的七個團隊來進行預測，看看這個路堤可以加高到多少高度，路堤下方的Boston Blue Clay不能承載，路堤才會破壞。這七個團隊被要求提出他們最佳的預測，同時提出他們認為信心程度的範圍 (interquartile range)。

最後這個路堤是被加高到18.7ft時破壞了！

大家都不期望任何一組能準確預測到這個高度。這七組專家分別提出他們各自的最佳預測 (best estimate) 大約是在10~26ft之間。最接近的預測約為23ft。但是七組的平均是15.6ft，這個平均值被認為是相當接近了！

但是比較令人意外的是這七組預測的範圍沒有一組涵括了18.7ft這個實際發生的路堤破壞高度！換句話說，18.7 ft沒有在這七組專家任何一組預測的範圍之內！

更令人意外的是除了七個專家組之外，MIT又另外邀請了26位工程師來做預測，這些工程師沒有專家們那麼多的時間來做分析，但是其中16組預測的範圍區間包含了18.7ft！

這個試驗的結果有許多後續的討論，也印證了一些其他的研究成果：

(1) 審慎選出的專家們可能在預測期望值時得到比較好的結果；一組專家意見的平均值可能得到更好的結果。這個觀察和Kahneman在「雜訊」(Noise: A Flaw in Human Judgment) 這本書中講的“總合多個獨立判斷” 是一致的。

(2) 專家們常有過於自信的傾向，對自己的預測充滿信心，但是低估了他們預測中的不確定性！這也和許多研究所發現的一致: 專家對於他們預估平均值兩側的離散程度經常是嚴重低估的！

#ExpertEliciation #Judgment #Overconfidence #I95TestEmbankment

(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(判斷:1）

專業人士的自我修練