6/30/2014

看穿統計 naked statistics - 機率的問題

當我們處理不確定的事情時,我們往往會用機率來描述未來發生的事情,或是求出期望值來比較。
機率的應用分四種,已知的機率去推測(例如丟骰子的機率1/6,可以計算賭骰子的賠率),從歷史經驗中獲得的機率去推測(例如從過去飛機或汽車失事率推測未來的失事率,以及計算理賠金額或保費),根據已有的樣本推論其它的樣本重複的機率(例如DNA比對,推測這個DNA和其它DNA相似的機率,進而判斷嫌疑犯涉案機率);計算期望值(例如根據不同的情況發生幾率,計算總計的期望值,以便於和成本比較,或和其它投資組合比較,作為決策參考)。

當討論機率時,我們必須了解發生的事件數量更多時,發生的實際比例會越來越接近機率。例如丟骰子出現4點的機率為1/6,當你丟骰子的次數在10次, 100次,1000次,到10000次,4點出現的次數除以丟的總次數, 會越來越接近1/6 。

買保險(壽險,汽車險,家電延長保固)的概念,都是一群精算師計算某些事件發生的機率,乘上期望的理賠金額,算出保險公司的期望成本,然後加上X%的利潤率,然後收取保費。所以,對於賣保險的公司, 一定保證獲利; 對於買保險的人,這N個民眾, 有些賺到,有些賠錢,整體來說,大家的損益相加的結果,一定是賠錢給保險公司。對於少數民眾,他們的確賺到了,其他人賠了錢卻賺了安心。

對於投資決策,決策樹(分析不同情境發生機率,以及不同情境的損益OUTCOME,然後計算期望值)是個分析工具,但是我們在學企業決策時,就有些學生問老師,為何企業界很少人會拿決策樹來跟老闆建議最好的決策?例如本書的案例,某個決策的PAYOFF = 70%x250K +30%x40%x0 + 30%x60%x 10%x0 + 30%x60%x90%x 25M =4225K,若是成本 2225K,則這是個很好的投資。但是企業老闆,大多不會相信部屬對這些情境預估的機率,對於每個OUTCOME 的金額也不會完全採信。因為任意個OUTCOME計算錯誤,整個PAYOFF就可能翻盤了。

機率用在對醫療行為的判斷或是對犯罪嫌疑犯的拘捕,必須非常小心。有一群人做血清檢驗,判斷有些人出現AIDS陽性反應, 這些人未必真的患有AIDS,如果因而告知他們有得到AIDS,則可能影響他們的家庭生活與夫妻關係。透過DNA比對,以其機率判定某些人有罪,則可能造成冤獄,延伸許多人的終身遺憾。

總之,機率是個很好的工具,但也是必須妥善處理的。





沒有留言: