2022年3月29日 星期二

統計數字沒有騙人 是人的解讀出了問題

  

如果我們每天認真的讀報紙和媒體上的報導和評論,就會了解無怪乎Darrell Huff 1954年前寫的〝How to Lie with Statistics〞到今天還有很高的實用價值。

 

最近有一篇報紙的評論,認為有一個市長的「連任危機浮現」。如果這個結論是許多觀察得到的判斷,那就另當別論。可是他的論述很奇怪,他先說市民對這位市長的施政滿意度超過七成 - 看到這裡大家會認為連任的機會很大啊!但是他說這個滿意度是所有市長排名的後段班,所以「絕對是一個重大警訊!」

 

Huff提出不要被統計數字欺騙,要問五個問題:

 

1.        誰說的?(Who says so?):尋找蓄意的偏差,更要仔細的去探尋不自覺的偏差。

2.        他怎麼知道的?(How does he know?):樣本是否足夠,使得結論可靠?關聯性夠大到有實質意義嗎?

3.        漏了什麼?(What’s missing?):有很多時候缺少與其他事件的比較,很多數字會失去意義。

4.        是否有人改變了主題?(Did someone change the subject?):從原始數據推導到結論的過程中,有沒有什麼地方被改掉了?

5.        這有道理嗎?(Does it make sense?):固然很多數字一看就知道有問題,也有些數字精確的令人訝異!而根據過去的趨勢對未來作預測,有很多時候也是沒有道理的!

 

第四個問題可能不是那麼直接了當,但是上面的例子恰好提供了一個案例。把一個統計的結果,移轉到另一個議題上去做結論。

 

媒體上充斥了「機率」、「統計」、「風險」…這些看似科學又有根據的字眼,但是有很多實在是經不起考驗的!

 

 

(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(風險管理:22

2022年3月22日 星期二

重新認識機率 - 貝氏定理 (Bayes Theorem)

 

最近在讀Robert Matthews寫的「機率思考」(英文原名:Chancing ItThe Laws of Chance and How They Can Work for You )。作者認為這本書的中心思想是:〝雖然我們永遠無法擺脫機率、風險和不確定性,但我們如今擁有掌握它們,最後勝出的工具。〞他雖然這沒有很明確的說這最後勝出的工具是什麼,我相信其中的關鍵就是「貝式定理」(Bayes Theorem)。

 

貝式定理是Thomas Bayes1702-1761發展出來的公式。他是一位牧師,一位業餘的數學家。然而他那看似簡單,又訴諸直覺的研究成果,這幾十年來卻震撼了機率研究,徹底改變了對機率的看法,並且被廣泛的應用在各領域中。

 

用白話來說,貝式定理就是說對事件新的相信程度是由過去的相信程度和新產生的證據所決定。

 

傳統上認為機率是處理隨機的、以發生頻率為基礎的不確定性(aleatory),也有人稱為「客觀機率」。但是,也有出於知識不足的不確定性,這種認知上不確定(epistemic)的機率,也稱之為「主觀機率」。這種以相信程度為基礎的機率和以發生頻率為基礎的機率完全不同,從原理上來說,只要利用新的證據就可以減低不確定性,這也正是貝氏定理的研究焦點。

 

John Christian有一個很好的例子來說明兩種機率的不同:擲骰子的不確定性是aleatory,每次擲一粒骰子出現6的機率是1/6;然而有一疊撲克牌,取出黑桃A的機率是epistemic的不確定性,第一張牌就是黑桃A的機率是1/52,但拿走一張不是黑桃A的牌後,取出黑桃A的機率就成為了1/51

 

貝式定理被提出之後沒有被廣泛接納的一個原因是如何建立起對事件發生的初始相信程度。這就是所謂的「事前難題」(Problem of Priors。事實上這個初始相信的程度可以根據判斷,也可以根據過去的統計,但是重要的是隨著證據積累,無論一開始用什麼值,在貝式定理中都會愈來愈不重要。這是真正的讓證據自己會說話。

 

英國政府在2012年解密了當初Alan Turing破解納粹Enigma碼的技術文件,最核心的概念就是貝式定理。今天貝式定理被廣泛的應用在各領域救難搜尋、基因解碼、國土安全等各個領域。

 

短短一行的貝式定理,掀起了機率研究的瀰天巨浪!雖然「機率思考」這本科普書並不是那麼易讀有趣,但是他花了近1/3篇幅談貝氏定理和相關的應用,也不失為重新解讀機率的一本入門參考書!

 

 

(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(風險管理:21

2022年3月15日 星期二

第五項修練 — 系統思考

 

Peter Senge的這本書「第五項修練」(The Fifth Discipline1990年出版以來,全球暢銷,也得到很高的評價。他這本書主要講的就是副標題所說的「學習型組織的藝術與實務」(The Art & Practice of the Learning Organization)。有意思的是他的書名卻不直接講學習型組織,反而用的是「第五項修練」,顯然是另有深意。而打造學習型組織的這五項修練,依他的講法是:

 

第五項修練:系統思考

第一項修練:自我超越

第二項修練:改善心智模式

第三項修練:建立共同願景

第四項修練:團隊學習

 

他強調的第五項修練就是系統思考,而我認為系統思考在他書中有雙重的作用:

 

一、如他所說是〝整合其他各項修練成一體的理論與實務,防止組織在真正實踐時,將各項修練列為互不相干的名目或一時流行的風尚〞。

 

二、他用系統動力學的觀念,架構和術語來說明其他四項修練的一些特性與現象。

 

但是我總覺得在討論學習型組織時,他系統思考放在這麼特殊的地位,還是有些牽強。我的看法是:

 

一、即使把系統動力學/系統思考,從這本書中完全抽離,對於討探討學習型組織的影響恐怕也沒他講的這麼嚴重。

 

二、他雖然是以系統動力學為基礎,也用了許多系統動力學研究的成果,但是他只使用了三個元件〝不斷增強的回饋〞、〝反覆調節的回饋〞,和〝時間滯延〞與一般系統動力學所使用的圖形架構不同,在有些地方也顯得失之簡略。

 

這本書暢銷書的確讓很多人在系統動力學發展了50年之後又認識到了系統動力學,甚至被推薦是了解系統動力學的入門。但是我覺得真正了解系統動力學和系統思考的入門書,恐怕還是Donella H. Meadows的「Thinking in Systems – A Primer」。

 

#第五項修練 #學習型組織 #系統動力學 #系統思考

 

(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(系統思考:11

 

 

2022年3月8日 星期二

「每逢大事,就會停電」? - 推薦一本統計的科普書


Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.  - H.G. Wells

 

最近有人說每逢重大事件發生,台電就會停電。對於得到這樣推論的人士來說,我實在也不知道從何說起,我們就介紹一本1954年出版的〝How to Lie with Statistics〞吧!

 

這本書的作者Darrell Hutt並不是統計學家,他是一位專欄作家。這本書出版之後,洛陽紙貴,直到今天雖然書中舉的例子多已過時,但他指出人們常犯的錯誤,仍不時可見於今日,所以現在還可在Amazon和博客來上買到這本小書。中文版是淡江大學鄭惟厚教授的翻譯,書名並沒有直譯為〝如何用統計騙人〞而是〝別讓統計數字騙了你〞,輕鬆易讀,一口氣看下去大概兩小時就可以讀完!

 

鄭教授的譯序中就講到為什麼很多人會被統計數字給騙了呢?因為有數據支持的論點大家認為比較可靠,所以容易相信,但是解讀數字的是人,即使數據正確,但是藉由一些類似斷章取義、答非所問,或選擇性呈現之類的技巧,也很容易讓人被誤導!

 

在這本書的最後一章,作者建議去問五個問題來避免錯誤不實的訊息:

 

1.        誰說的?(Who says so?):尋找蓄意的偏差,更要仔細的去探尋不自覺的偏差。

2.        他怎麼知道的?(How does he know?):樣本是否足夠,使得結論可靠?關聯性夠大到有實質意義嗎?

3.        漏了什麼?(What’s missing?):有很多時候缺少與其他事件的比較,很多數字會失去意義。

4.        是否有人改變了主題?(Did someone change the subject?):從原始數據推導到結論的過程中,有沒有什麼地方被改掉了?

5.        這有道理嗎?(Does it make sense?):固然很多數字一看就知道有問題,也有些數字精確的令人訝異!而根據過去的趨勢對未來作預測,有很多時候也是沒有道理的!

 

看了這五個提問,我想大家對於「每逢大事,就會停電」這種推論,就更清楚是沒有什麼好討論的了!

 

 

 (這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(風險管理:20

2022年3月1日 星期二

「機率」與「信仰」是兩個相對的概念嗎?

  

自從台北市長柯文哲宣稱以「機率做決策」面對疫情的不確定性之後,報紙上有不少討論機率的文章。2/17聯合報名人堂刊出一篇台大薛承泰教授的「機率與信仰」。薛教授的文章中談到:

 

許多的宗教信仰,不就是從今生經驗來投射未來或不可知的世界嗎?信仰彌補了人們在經驗上的無知與空白,換言之,有了「信仰」即可以超越「機率」的思維。

 

走入現代,許多信仰一一被「科學」所除魅並改稱為「迷信」。科學透過資料蒐集與驗證將事件「機率化」,也是「理性化」即使至今科學未能達到百分之百的「真」,但越來越多人接受科學的「求真」而放棄一些非理性的信仰,而人類也自詡這就是「進步」!

 

俄烏最近是否會開戰,答案即將揭曉,筆者認為,真正的關鍵應在於強權領導者的「判斷」與「意志」,您說這是「機率」還是「信仰」?

 

對於這篇文章我完全不做評論,我只想談談機率。

 

機率是根據數學上的公理(axiom)進行推導和演算,但是數學並沒有告訴我們機率的意義是什麼,數學也沒有告訴我們如何決定一個事件的機率。

 

對機率的詮釋,基本上可以分為兩類:

 

1.          客觀(objective)機率或相對頻率(relative frequency)的機率。這種看法簡單的講,就是一個不確定事件的機率是它在不斷重複的嘗試或實驗樣本中出現的相對頻率。這是大部份人理解的機率,也是與統計密切相關的看法。

 

2.          主觀(subjective)機率或相信程度(degree-of-belief)的機率。指的是一個不確定事件的機率是根據一個人當時他所擁有的知識,所提出對事件結果的相信程度或信心程度的量化表達。主觀機率是和個人的判斷密切相關的,經常會用到貝氏定理 (Bayes Theorm),因此也被認為是貝氏機率 (Bayesian probability)。貝氏定理在18世紀就提出來了,到了近數十年,越來越受到重視,從Alan Turing破解德軍的密碼到近來人工智慧的發展,都有貝氏定理的應用!

 

在生活中,我們使用的機率可能是包含這兩種的詮釋,也有可能是其中的一種,但是絕大部分的時候我們並未明顯的認知並且區別這兩種詮釋。客觀機率和主觀機率,各有所指,也各有其用途。在許多工作中,這兩者的區別不太大,但是在有些工作中這個區別就造成了巨大的影響。

 

機率是溝通不確定性的語言。只有當我們正確了解機率有主觀機率和客觀機率的差異,我們才更能掌握不確定性的本質,我們的決策判斷和風險管理也才更有依據。

 

 

(這裡的所有文章都留存於Blogger中的「專業人士的自我修鍊」)

(風險管理:19

永續發展不只是環保節能!

        很多人一談到永續發展就想到 環境保護、節能減碳,事實上 永續發展涵蓋之廣,牽涉之多,遠不止於此,看看聯合國在 2015 年推出的 17 項的永續發展目標  (Sustainable Development Goals, SDGs) 就可以知道。    ...