7/09/2014

看穿統計naked statistics - 結論

許多研究採用統計方法去進行分析,目的在求證一些假設是否正確,或是在投入巨額資金前,作為決策的參考。但是這些專案的評估,面臨取樣的難題,控制組/實驗組隨機抽樣的問題,控制組無法做到一定程度對某些變數一致性控制。以下幾個例子說明困難點:
Q:美國攻打伊拉克是否讓美國更安全?
A:這個問題沒有答案。因為,如果美國沒有入侵伊拉克,海姍可能會發瘋的使用化學武器,也可能向北韓購買化學武器,也可能一點都沒有影響美國。但是,美國已經入侵伊拉克了,卻沒有發現化學武器,確保海姍不會用化學武器攻擊。但這是事後諸葛,在入侵前,這是沒有答案的。

Q:祈禱能不能提高心導管手術的病人治癒率?
A:實驗分三組,一群手術病人沒有被祈禱;一群被祈禱且被告知;一群被祈禱但未告知。結果這三群人的手術治癒率沒有差異。這是典型的實驗組,控制組,干擾組。實驗結果是否可靠?有些人說,這些人在醫院沒有被醫院志工祈禱,但也許他們在家中的親友有幫他們祈禱,也許他們教會的牧師或教友幫他們祈禱有效。(這個實驗花了240萬美元做完研究)

Q:伊利諾州A城市執行勞工訓練以提升就業率。2年後,發現A城市失業率依然上昇,請問A城市的勞工訓練是否失敗?
A:不確定,必須進行比較。 difference in differences 方法,就是去比較和A城市類似的B城市,如果B城市2年前失業率與A城市相同,2年來沒有勞工訓練,比較看B城市2年前與現在的失業率是否明顯提升, 來看出A城市勞工訓練有效性。這種方法也可適用在比較某種教學方式,考試方式,囚犯改造方式等,在差異中找到差異比較,進而推論其效果。

作者最後一章,問了5個問題,並透過這5個問題的討論,總結這本書:
(1)足球隊員受到腦傷後,往往造成永久性的神經傷害,因此,足球比賽只是為了取悅觀眾,但對與參與者卻是永久傷害,這種活動是否應該禁止? 利用本書的工具,可以更清楚的找出足球員VS一般人, 他們的腦傷比例與永久性神經傷害的關係。
(2)美國小孩的自閉症患者比例,從10年前的 6%,成長到5年前 9%, 2012年到12%。什麼原因造成兒童自閉症的升高?是手機,代糖,超音波還是生活環境?統計分析,發現在嬰兒1和2歲生日為好發期,所以是疫苗造成的?如果從疫苗中移除某些成分,是否可以改善?透過統計可以這樣一步步的抽絲剝繭,了解潛在的因素。
(3)我們如何找出並獎勵好學校與好老師?分辨對象的前提就是設定 KPI,然後進行衡量。設定KPI本身就是困難的, 衡量的方法也是另一個挑戰。接下來獎勵的制度設計,又會影響到老師與學校的做法,如何透過獎勵來督促他們走向KPI的方向?獎勵是否會扭曲部份學校老師的避重就輕,達到權重較高的KPI,而忽略其他重要卻權重不高的項目?
(4)對抗全球貧窮最佳的工具是什麼?法國經濟學家利用控制組實驗組方式來統計分析,印度教師曠課率過高造成學生教育差,他設計激勵鼓勵教師與學生上課打卡,比較曠職教師班級的學生成績;他對肯亞農夫分成兩群,贈送農藥與不贈送,比較他們農作物生產量,得出農藥重要性與農民貧窮買不起農藥的現象;他比較開發中國家的家庭開銷由男性或女性控制,對於兒童有沒有吃飽的影響。較富裕的國家女性對開銷掌控權高,小孩較容易吃飽,較貧窮國家為男性掌控,他們則把收入花在酒吧,小孩則較不容易吃飽。
(5)誰會搜尋然後知道你在做什麼?google 和 facebook 手上握有所有會員的行為和資料,他們可以經過資料分析, 知道你是誰以及過去行為,然後預測未來的變化。

總之,我們可以列出許多生活中不可或缺的事物,例如火,刀子,汽車,美容用品等,然後找出規律性。統計在這裡也扮演不可或缺。但是水可載舟,也可覆舟,使用統計,不能完全依賴數字,而要彈性。

沒有留言: