貝葉斯定理一旦與演演算法相結合,就不再是一套枯燥的數學理論或認識論,而變成了應用廣泛的知識寶庫,催生了眾多現代數學定理,以及令人稱道的實踐成果。
正如它應用在數學方面,如何讓知識成為經驗,就給人帶來驚喜!
所謂進步,就是積累經驗,獲取更加正確的知識。每當遇到新資訊,我們需要擁有能夠改變之前判斷的勇氣和沉穩的內心。這也是我們從貝葉斯定理中學到的。
來源 | 《用數學的語言看世界(增訂版)》
作者:[日] 小栗浩
譯者:尤斌斌
01
用數學來“學習經驗”
下面我以特殊的骰子為例,來說明學習“經驗”是怎麼一回事兒。在學校學習概率時,老師們總是強調“雖然前一次擲骰子擲出 1,但是下一次擲骰子擲出任何一面的概率都是不變的”。也就是說,擲兩次骰子時,兩次的概率是相互獨立的。例如,假設不是特殊的骰子,第一次擲出 1 的概率是 1/6,第二次擲出 1 的概率也是 1/6。
不過,如果普通骰子和特殊骰子混在一起,分不清哪個是哪個時,第一次是否擲出 1 會影響第二次的概率。
普通骰子擲出 1 的概率為 1/6,假設特殊骰子擲出 1 的概率為1/2。公式表示如下:
正因為普通骰子和特殊骰子的數量相同,假設手頭上普通骰子和特殊骰子的概率是五五開,即
按照以上數據,擲出 1 的概率為
這個公式的導出方法請參考個人主頁上的補充說明。因為其中混有容易擲出 1 的骰子,所以擲出 1 的概率為 1/3,大於 1/6。
那麼,假設第一次擲出 1,再次擲同一個骰子時,第二次擲出 1 的概率為多少呢?首先要注意的是,第一次是否擲出 1 會改變骰子是否特殊的概率。代入貝葉斯定理的話,
因此,
本來骰子是否特殊的概率為 P(普通) = P(特殊) = 1/2,但是如果第一次擲出 1 的話,那麼骰子特殊的概率增至 3/4。
一旦擲出 1,那麼骰子中特殊骰子的概率會增加,所以再次擲同一個骰子時,擲出 1 的概率也會增加。計算公式如下:
第一次擲骰子時擲出 1 的概率為 P(擲出 1) = 1/3 ≈ 0.3。不過擲出 1後,再次擲同一個骰子時擲出 1 的概率增加至 P(擲出 1→ 擲出 1) =5/12 ≈ 0.4。知道第一次擲出的是 1 後,骰子屬於特殊骰子的概率從1/2 變成 3/4。因此,按照以上數據,下一次擲出 1 的概率從 1/3 更正為 5/12。這就是我所說的運用貝葉斯定理來學習“經驗”。
02
核電站重大事故再次發生的概率
這個概率的計算方法與日本人正在面對的重大問題有關。我們有時候必須從不確定的資訊中作出判斷。例如在福島第一核電站發生事故之前,據說日本的核電站發生事故的概率極小。但是,這次事故發生後才發現,原來核電站的構造如此複雜,連專家們都無法完全把握其安全性。也沒有人準確地算出事故發生的概率到底是多少。這類似於剛才所說的骰子是否特殊,擲出 1 的概率到底是 1/2 還是 1/6。
我在報紙中看到,在這次事故發生之前,東京電力公司向日本政府提交的數據是核電站發生爐心熔融等重大事故的概率為一座核電站在10 000 000 年運行期內會發生 1 次事故。但是,日本開始使用核電站才不過 50 年。目前日本國內差不多有 50 座核電站,再加上最近剛建成的核電站,將核電站數除以運行年數,運行的核電站總計約為 1500座 × 1 年。那麼,如果東京電力公司計算的概率正確的話,在過去 50年日本發生重大事故的概率為 1500/10 000 000 = 0.00015。表示如下:
另一方面,反對建造核電站的人們主張要重視發生重大事故的概率。我不知道他們估算的危險性有多高,不過假設他們擔心每隔幾個世代就會在日本的某地發生一次重大事故的話,難道是每 100 年發生一次嗎?如果反核電運動人士主張重視的概率是正確的話,那麼在過去 50 年間發生重大事故的概率為 50/100,也就是
如果比喻成特殊骰子,“東京電力公司估算正確”相當於“拿到普通骰子”,“反核電運動估算正確”相當於“拿到特殊骰子”。正如特殊骰子擲出 1 的概率會變高,假設反核電運動的主張正確,那麼發生重大事故的概率也同樣會變高。
在接下來的計算中,為了計算方便,假設東京電力公司估算的概率和反核電運動人士主張的概率中有一個是正確的。當然,也有一種可能性是東京電力公司和反核電運動人士估算的概率都是錯誤的,所以這是一個很大的假設。不過我們的目的在於說明貝葉斯定理的使用方法,在這個假定下計算即可。
在事故發生前,很多人都相信東京電力公司的所言。至少允許建造核電站的政府官員判斷核電站是安全的。假設相信東京電力公司主張正確的概率為 99%,那麼記作:
按照上述數據,計算 50 年之中發生重大核事故的概率為:
換言之,即使反核電運動人士強調 100 年間發生一次事故也很危險,如果他們正確的概率只有 1%,那麼在日本國內某處發生重大事故的概率約為 0.005 次,估算為 10 000 年間發生一次。
然而在日本,核電站的運行時間才不過 50 年,就發生了爐心熔融。一旦發生了事故,我們需要重新審視東京電力公司那個正確概率為 99% 的主張。於是,運用貝葉斯定理的話,
因此,
事故發生以後,東京電力公司的主張正確率從 99% 急降為 3%。原因在於東京電力公司主張的事故概率 P(東電 → 事故) 為 0.00015,這個數值極小。雖然主張幾乎不會發生事故,既然發生了事故,東京電力公司的主張正確率變低也在情理之中。運用貝葉斯定理,通過數學的語言來表現什麼叫作“失去信任”。
那麼在事故發生以後,下一次發生事故的概率又是多少呢?如果設備的運行率與事故之前相同的話,那麼
反核電運動人士所說的每 50 年發生 0.5 次,也就是每 100 年發生 1 次。為了方便說明貝葉斯定理的使用方法,簡單地假設“東京電力公司和反核電運動人士估算的概率中有一個是正確的”。當然,也有一種可能性是東京電力公司和反核電運動人士估算的概率都是錯誤的。而且,因為 P(反核電 → 事故) = 0.5 或者 P(反核電) = 0.01 等數值是我自己隨意計算得出的數位,不能這個按照表面意思來理解這些計算結果。
這次事故發生半年後,大概在 2011 年 10 月 17 日,東京電力公司重新公開發表了福島第一核電站再次發生爐心熔融的概率,改為每5000 年發生一次。在日本國內約有 50 座核電站,所有核電站重新運行的話,在日本某地發生重大事故的概率為每幾百年發生 1 次。
當我們獲取新資訊,只要根據這些新資訊來修改概率,就可以降低不確定性。這就是學習“經驗”。繼續使用核電站存在風險。另一方面,對於依賴大量進口化石燃料的日本來說,停止運行核電站同樣存在風險。
而且,當然還要考慮化石燃料對地球氣候變化的影響。比較各方面的風險后再作判斷,也就是說,計算風險需要正確理解概率。
所謂進步,就是積累經驗,獲取更加正確的知識。每當遇到新資訊,我們需要擁有能夠改變之前判斷的勇氣和沉穩的內心。這也是我們從貝葉斯定理中學到的。
推薦閱讀
《用數學的語言看世界(增訂版)》
作者:[日] 小栗浩
譯者:尤斌斌
美國加州理工學院理論物理研究所所長,日本東京大學Kavli數學物理學聯合宇宙研究機構研究主任 小栗浩 教授
突破傳統數學教育教學順序、方式 / 以“語言思維”講解數學核心概念、原理 / 回歸“基本原理”重新認識數學本質
02
《貝葉斯的博弈:數學、思維與人工智慧》
作者:黃黎原
譯者:方弦
法國數學類科普書、大學數學參考及教材類圖書暢銷書目,在機器學習、人工智慧、邏輯學和哲學等眾多領域中,探索貝葉斯定理蘊藏的智慧與哲理。
貝葉斯定理一旦與演演算法相結合,就不再是一套枯燥的數學理論或認識論,而變成了應用廣泛的知識寶庫,催生了眾多現代數學定理,以及令人稱道的實踐成果。
02
《趣學貝葉斯統計:橡皮鴨、樂高和星球大戰中的統計學》
作者:[美] 威爾·庫爾特(Will Kurt)
譯者:王凌雲
本書用十余個趣味十足、腦洞大開的例子,將貝葉斯統計的原理和用途娓娓道來。你將從直覺出發,自然而然地習得數學思維。讀完本書,你會發現自己開始從概率角度思考每一個問題,並能坦然面對不確定性,做出更好的決策。
Like
Share
Popular
Comment