2020年4月14日 星期二

機率:表達和溝通不確定性的工具



專業人士也許不需要精通機率的理論,但是瞭解不確定性的本質,對我們的生活和工作,都有很大的幫助。

機率是一個我們在日常生活中經常聽到用到的一個名詞,好像大家都非常清楚它的意義,可是當我們越深究它的意義時,可能反而會覺得更不清楚。舉例來說,當我們聽到氣象預報說台北地區明天有10%的降雨機率,我們到底是指整個台北地區明天有10%的機會會下雨?還是台北地區有10%的地方明天下雨?或者當我們說,這段1公里的路堤有10%的機率會破壞(安全係數小於1)”,我們是說這段1公里的路堤全長有10%的機率破壞?還是"這段1公里路堤中有100公尺的路堤會破壞"?下雨是自然現象,安全係數是工程分析計算的結果,這兩個10%的機率是否代表相同的意義?

當我們更進一步了解不確定性的特質,我們才能更清楚的確認機率是什麼。不確定性的來源大致可以分為:隨機(aleatory)的不確定性與知識不足(epistemic)的不確定性。

隨機指的是完全的不可預測,就像我們擲骰子或是拋銅板,我們不知道它的結果,但是我們一直重複這個動作,雖然我們還是不知道每一次的結果但是我們會知道每一種可能性出現的相對頻率(relative frequency)。在這個意義上,隨機是一個自然界的性質(property of nature),是與任何人的知識無關,是有一個真正的值(“true” value),也就是說兩個旁觀者給予同樣的證據,對這個不確定的因素(相對頻率)會得到同樣的結果。美國National Research Council(NRC)則以自然的變異(natural variability)來表示隨機的不確定性,也有以客觀的”(objective)或是外部的”(external)來描述這類的不確定性。

知識不足的不確定性指的是不知道、沒有被確認,但是與完全的不可預測無關,我們可能對一個科學的理論,宗教的教義不確定,尤其我們經常對一個單一事件的結果不確定,這些不確定都是無法借重覆的嘗試得到確認,因此這類不確定意義是指相信的程度(degree of belief)。在這個意義上,這類的不確定性是一個心智的性質(property of mind),是與個人的認知相關,並沒有一個真正的值,也就是說兩個旁觀者給予同樣的事證,對這個不確定的因素(相信的程度)不一定會得到同樣的結果,也因為沒有一個真正的值,兩個旁觀者的結果可以同為正確。NRC則以知識的不確定性(knowledge uncertainty)來表示,知識不足的不確定性也有以"主觀的"(subjective)或是內在的”(internal)來描述這類的不確定性。

我們為什麼要去分辨隨機與知識不足的不確定性?如果我們說機率是不確定性的表達,那麼這兩種不確定性的特質,正是反應出兩種不同的角度來認識機率,分別為"機率是相對頻率的表達""機率是相信程度的表達"Gregory Baecher John Christian (2003)曾採用一個傳神的比擬來說明這兩種不確定性:擲骰子與打撲克牌。

擲骰子的時候,一顆公正(fair)的骰子出現幾點基本上是不可預測的,這個不確定性是隨機的不確定性。打撲克牌就完全不一樣了,一疊洗好的撲克牌,每一張牌的次序已經固定了,我們是不知道會出現哪一張牌,但是這個不確定是由於我們對這疊洗好的撲克牌的了解不足,所以玩家就是要從已出現的牌,來擷取最多的訊息(增加了解)以獲取勝利(降低不確定性)。這個不確定性是與知識不足的不確定性,而不是隨機的不確定性。

我們再從工程師的工作中來看這兩種不確定性的特質,當我們處理地震的不確定性時,我們不知道地震何時何處發生、規模多大?這基本上是不可預測的,這個不確定性是隨機的不確定性。但是我們處理地質資料的不確定時就完全不一樣了,我們要在一個預定的工址建一座結構物,我們不知道當土地層分佈的狀況、不知道是哪幾種土壤、不知道各種土壤的土層有多厚?這個不確定是由我們資料的不足,土層已經在那裡了,不會再有更動,土層的分佈就逐漸被揭露出來,而這個沒有把握的不確定性,是來自我們知識的不足。所以當我們說"這裡在10年內發生規模7的地震的機率是1%",這個1%是一個相對頻率的表達,而當我們說"這裡的土層是軟弱黏土的機率是20%",這是我們根據我們現在所知道的認為有20%的可能性這裡的土層是軟弱黏土,這個20%可以說是一個判斷,這個20%的機率即是所謂相信程度的表達。

我們前面問過這一個問題,當我們被告知"這段1公里的路堤有10%的機率會破壞(安全係數小於1)",我們是說這段1公里路堤中有100公尺的路堤會破壞?還是"這段1公里的路堤全長都有10%的機率會破壞"?現在我們可以來回答這一個問題了,這是看如何模擬這個問題而得到的結論。如果不確定的因素全屬隨機,那麼指的就是這段1公里路堤中有100公尺的路堤會破壞。如果不確定的因素全部來自知識經驗信心判斷的不確定,那麼指的就是這段1公里的路堤全長有10%的機率會破壞

這個例子從另個角度也反映了真實世界的一個情況:不確定的因素既非全屬隨機亦非全部來自知識不足,經常是兩者兼具。我們再來看氣象預報的例子,氣象預報一個地區的降雨機率是可以完全根據過去的資料,得到一個以相對頻率為基礎的降雨機率。實際上氣象預報經常會收集更多的資訊,根據經驗作出判斷。這個降雨機率,既反應了相對頻率的基礎,也反應了主觀的判斷。

許多人可能會認為以相對頻率為基礎得機率是客觀的、精確的、易於掌握的,但事實上真是比較客觀的嗎?我們不應該認為客觀一定優於主觀,大部份的情形是如我們前述氣象預報的例子,兩個觀念不是互相排斥而是相輔相成的。

機率是用來表達和溝通不確定性的工具,雖然它是一個量化後的數值,我們也要清楚它所傳遞的不確定性的本質。只有在相對頻率和相信程度雙重特性(duality)的這個架構中,我們才能掌握問題的核心。



(後記:這篇文章可能是這個粉絲頁中最“燒腦”的一篇,對不熟悉機率的讀者,看到這裡已經是非常有耐心的了!其實這篇文章是一篇舊作改編。多年前我與姚大鈞博士、趙曉周博士和陳皆儒博士共同研究機率理論、風險管理和可靠度分析,在這個基礎上,他們三位都在各自的領域中卓然有成,至感欣慰。現在重新整理,把當時研究討論的結果發表出來,也為我們這個團隊共同工作的美好時光留下一個紀錄。)

沒有留言:

張貼留言

永續發展不只是環保節能!

        很多人一談到永續發展就想到 環境保護、節能減碳,事實上 永續發展涵蓋之廣,牽涉之多,遠不止於此,看看聯合國在 2015 年推出的 17 項的永續發展目標  (Sustainable Development Goals, SDGs) 就可以知道。    ...