「快思慢想」的作者Kahneman不斷提醒人們不要輕易相信他人的判斷 - 即使是專家的判斷也不要輕信。
在專業領域裡評估專家的意見並不容易,因為事件經常只有一次發生的機會,而且在不特定的環境下很難進行「試驗」進行比對,即使可以試驗,費用也很可觀。在大地工程的領域中有一個著名的案例,值得大家深思:
1974年MIT利用I-95公路的一段試驗路堤,邀請全世界知名的七個團隊來進行預測,看看這個路堤可以加高到多少高度,路堤下方的Boston Blue Clay不能承載,路堤才會破壞。這七個團隊被要求提出他們最佳的預測,同時提出他們認為信心程度的範圍 (interquartile range)。
最後這個路堤是被加高到18.7ft時破壞了!
大家都不期望任何一組能準確預測到這個高度。這七組專家分別提出他們各自的最佳預測 (best estimate) 大約是在10~26ft之間。最接近的預測約為23ft。但是七組的平均是15.6ft,這個平均值被認為是相當接近了!
但是比較令人意外的是這七組預測的範圍沒有一組涵括了18.7ft這個實際發生的路堤破壞高度!換句話說,18.7 ft沒有在這七組專家任何一組預測的範圍之內!
更令人意外的是除了七個專家組之外,MIT又另外邀請了26位工程師來做預測,這些工程師沒有專家們那麼多的時間來做分析,但是其中16組預測的範圍區間包含了18.7ft!
這個試驗的結果有許多後續的討論,也印證了一些其他的研究成果:
(1) 審慎選出的專家們可能在預測期望值時得到比較好的結果;一組專家意見的平均值可能得到更好的結果。這個觀察和Kahneman在「雜訊」(Noise: A Flaw in Human Judgment) 這本書中講的“總合多個獨立判斷” 是一致的。
(2) 專家們常有過於自信的傾向,對自己的預測充滿信心,但是低估了他們預測中的不確定性!這也和許多研究所發現的一致: 專家對於他們預估平均值兩側的離散程度經常是嚴重低估的!
#ExpertEliciation #Judgment #Overconfidence #I95TestEmbankment
(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)
(判斷:1)
沒有留言:
張貼留言