文華閱讀筆記: 統計的檢驗

在推論統計學中，虛無假設（英語：null hypothesis，又譯零假設、原假設，符號：H0）是做統計檢驗時的一類假設。虛無假設的內容一般是希望能證明為錯誤的假設，

備擇假設（或對立假設 alternative hypothesis H1），即希望證明是正確的另一種可能。

第一型及第二型錯誤（英語：Type I error & Type II error）或型一錯誤及型二錯誤

若H0事實上成立，但統計檢驗的結果拒絕H0（接受H1），這種錯誤稱為第一型錯誤。

若H0事實上不成立，但統計檢驗的結果不拒絕H0（接受H0），這種錯誤稱為第二型錯誤。

H0成立，統計檢驗也接受 H0，正確

H1成立（H0不成立），統計檢驗也拒絕H1 （拒絕H0），正確

顯著性差異

A、B兩數據在0.05水平上具備顯著性差異，兩組數據具備顯著性差異的可能性為95％。兩個數據還有5％的可能性是沒有差異的。這5％的差異是由於隨機誤差造成的。如果拒絕兩組數據一致的假設，就有 5%的可能性犯第一類錯誤。

引入p值作為檢驗樣本(test statistic)觀察值的最低顯著性差異水平。在ρ= 0.01 or 0.05 的情況下，若實際算得的概率小於ρ，則在該顯著性差異水平下，拒絕(reject)該假設。

P(X=x)<ρ=0.05為「顯著(significant)」，統計分析軟體SPSS中以*標記；

P(X=x)<ρ=0.01為「極顯著(extreme significant)」，通常以**標記。

檢驗某實驗（hypothesis test）中測得的數據，當數據之間具備顯著性差異，實驗的零假設就可被推翻，備擇假設（alternative hypothesis）則得到支持；反之若數據之間不具備顯著性差異，則實驗的備擇假設可以被推翻，零假設則"不能被推翻"。

4個主要的檢驗方式：

Z檢驗（U檢驗）－－常態分佈（正態分佈）平均值＝0，標準差＝1

在H0假設情況下測試數據能否可以接近常態分布的一種統計測試。

根據中心極限定理，在大樣本條件下許多測驗可以被貼合為常態分布。

https://zh.wikipedia.org/wiki/學生t檢驗
學生T檢驗（檢定）－－ t 分佈－－平均值＝0，標準差較大
當實際標準差未知，而樣本容量較小（小於等於30）時，學生T檢驗更加適用。
最常用t檢驗的情況有：
（1）單樣本檢驗：檢驗一個常態分布的母體的均值是否在滿足虛無假設的值之內，
（2）雙樣本檢驗：其虛無假設為兩個常態分布的母體的均值之差為某實數，
（3）「配對」或者「重複測量」t檢驗：檢驗同一統計量的兩次測量值之間的差異是否為零。

F檢驗（F-test）
聯合假設檢驗（英語：joint hypotheses test），變異數比率檢驗、變異數齊性檢驗。
通常是用來分析用了超過一個參數的統計模型，以判斷該模型中的全部或一部分參數是否適合用來估計母體。
F-分布（F-distribution）是一種連續機率分布，被廣泛應用於似然比率檢驗，特別是ANOVA中。似然比檢驗（英語：likelihood ratio test），在建立統計模型時，用於檢定證據是否支持某個複雜的模型（使用變數較多）優於簡單的模型（使用變數較少），其中簡單模型所使用的變數全部包含於複雜模型中。
變異數分析或變方分析（Analysis of variance，簡稱ANOVA）為資料分析中常見的統計模型，主要為探討連續型（Continuous）資料型態之應變數（Dependent variable）與類別型資料型態之自變數（Independent variable）的關係，
https://zh.wikipedia.org/wiki/方差分析

卡方檢驗（Chi-Squared Test或 χ2 \chi ^{2} Test）是一種統計量的分布在零假設成立時近似服從卡方分布的假設檢驗。一般指的是皮爾森卡方檢驗。
觀察量的值劃分成若干互斥的分類，並且使用一套理論（或零假設）嘗試去說明觀察量的值落入不同分類的概率分布的模型。
兩種用途，分別是「適配度檢定」（Goodness of Fit test）以及「獨立性檢定」
運用方式：
（1）建立零假說（Null Hypothesis），即認為觀測值與理論值的差異是由於隨機誤差所致；
（2）確定數據間的實際差異，即求出卡方值；
（3）如卡方值大於某特定概率標準（即顯著性差異）下的理論值，則拒絕零假說，即實測值與理論值的差異在該顯著性水平下是顯著的。
https://zh.wikipedia.org/wiki/卡方检验

文華閱讀筆記

11/05/2019

統計的檢驗

沒有留言: