11/05/2019

統計的檢驗

在推論統計學中,虛無假設(英語:null hypothesis,又譯零假設、原假設,符號:H0)是做統計檢驗時的一類假設。虛無假設的內容一般是希望能證明為錯誤的假設,
備擇假設(或對立假設 alternative hypothesis H1),即希望證明是正確的另一種可能。

第一型及第二型錯誤(英語:Type I error & Type II error)或型一錯誤及型二錯誤
若H0事實上成立,但統計檢驗的結果拒絕H0(接受H1),這種錯誤稱為第一型錯誤。
若H0事實上不成立,但統計檢驗的結果不拒絕H0(接受H0),這種錯誤稱為第二型錯誤。
H0成立,統計檢驗也接受 H0, 正確
H1成立(H0不成立), 統計檢驗也拒絕H1 (拒絕H0),正確

顯著性差異
A、B兩數據在0.05水平上具備顯著性差異,兩組數據具備顯著性差異的可能性為95%。兩個數據還有5%的可能性是沒有差異的。這5%的差異是由於隨機誤差造成的。如果拒絕兩組數據一致的假設,就有 5%的可能性犯第一類錯誤。

引入p值作為檢驗樣本(test statistic)觀察值的最低顯著性差異水平。在ρ= 0.01 or 0.05 的情況下,若實際算得的概率小於ρ,則在該顯著性差異水平下,拒絕(reject)該假設。
P(X=x)<ρ=0.05為「顯著(significant)」,統計分析軟體SPSS中以*標記;
P(X=x)<ρ=0.01為「極顯著(extreme significant)」,通常以**標記。
檢驗某實驗(hypothesis test)中測得的數據,當數據之間具備顯著性差異,實驗的零假設就可被推翻,備擇假設(alternative hypothesis)則得到支持;反之若數據之間不具備顯著性差異,則實驗的備擇假設可以被推翻,零假設則"不能被推翻"。

4個主要的檢驗方式:
Z檢驗(U檢驗)--常態分佈(正態分佈)平均值=0,標準差=1
在H0假設情況下測試數據能否可以接近常態分布的一種統計測試。
根據中心極限定理,在大樣本條件下許多測驗可以被貼合為常態分布。

https://zh.wikipedia.org/wiki/學生t檢驗
學生T檢驗(檢定) -- t 分佈 --平均值=0,標準差較大
當實際標準差未知,而樣本容量較小(小於等於30)時,學生T檢驗更加適用。
最常用t檢驗的情況有:
(1)單樣本檢驗:檢驗一個常態分布的母體的均值是否在滿足虛無假設的值之內,
(2)雙樣本檢驗:其虛無假設為兩個常態分布的母體的均值之差為某實數,
(3)「配對」或者「重複測量」t檢驗:檢驗同一統計量的兩次測量值之間的差異是否為零。


F檢驗(F-test)
聯合假設檢驗(英語:joint hypotheses test),變異數比率檢驗、變異數齊性檢驗。
通常是用來分析用了超過一個參數的統計模型,以判斷該模型中的全部或一部分參數是否適合用來估計母體。
F-分布(F-distribution)是一種連續機率分布,被廣泛應用於似然比率檢驗,特別是ANOVA中。似然比檢驗(英語:likelihood ratio test),在建立統計模型時,用於檢定證據是否支持某個複雜的模型(使用變數較多)優於簡單的模型(使用變數較少),其中簡單模型所使用的變數全部包含於複雜模型中。
變異數分析或變方分析(Analysis of variance,簡稱ANOVA)為資料分析中常見的統計模型,主要為探討連續型(Continuous)資料型態之應變數(Dependent variable)與類別型資料型態之自變數(Independent variable)的關係,
https://zh.wikipedia.org/wiki/方差分析

卡方檢驗(Chi-Squared Test或 χ2 \chi ^{2} Test)是一種統計量的分布在零假設成立時近似服從卡方分布的假設檢驗。一般指的是皮爾森卡方檢驗。
觀察量的值劃分成若干互斥的分類,並且使用一套理論(或零假設)嘗試去說明觀察量的值落入不同分類的概率分布的模型。
兩種用途,分別是「適配度檢定」(Goodness of Fit test)以及「獨立性檢定」
運用方式:
(1)建立零假說(Null Hypothesis),即認為觀測值與理論值的差異是由於隨機誤差所致;
(2)確定數據間的實際差異,即求出卡方值;
(3)如卡方值大於某特定概率標準(即顯著性差異)下的理論值,則拒絕零假說,即實測值與理論值的差異在該顯著性水平下是顯著的。
https://zh.wikipedia.org/wiki/卡方检验

沒有留言: