首頁 > 軟體

基於R語言 資料檢驗詳解

2022-03-02 13:00:24

1. W檢驗(Shapiro–Wilk (夏皮羅–威克爾 ) W統計量檢驗)

目標:檢驗資料是否符合某正態分佈,如:標準正態分佈N(0,1)
R函數:shapiro.test().
結果含義:當p值小於某個顯著性水平α(比如0.05)時,則認為樣本不是來自正態分佈的總體,否則認為樣本來自正態分佈的總體。

2. K檢驗(經驗分佈的Kolmogorov-Smirnov檢驗)

目標:檢驗資料的分佈是否符合函數F(x)
R函數:ks.test(),如果P值很小,說明拒絕原假設,表明資料不符合F(n,m)分佈。

3. 相關性檢驗:

R函數:cor.test()
cor.test(x, y,
alternative = c("two.sided", "less", "greater"),
method = c("pearson", "kendall", "spearman"),
exact = NULL, conf.level = 0.95, ...)

結果含義:如果p值很小,則拒絕原假設,認為x,y是相關的。否則認為是不相關的。

4. T檢驗

目標:用於正態總體均值假設檢驗,單樣本,雙樣本都可以。  
R函數:t.test()

t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)

結果意義:P值小於顯著性水平時拒絕原假設,否則,接受原假設。具體的假設要看所選擇的是雙邊假設還是單邊假設(又分小於和大於)

5. 正態總體方差檢驗

R函數:t.test()
t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, ...)

結果意義:P值小於顯著性水平時拒絕原假設,否則,接受原假設。具體的假設要看所選擇的是雙邊假設還是單邊假設(又分小於和大於)

6. 二項分佈總體假設檢驗

binom.test(x, n, p = 0.5,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95)

原假設:p=p0,p<p0,p<p0 計算結果p-值很小,表示拒絕假設,否則為接受假設.

7. Pearson 擬合優度χ2檢驗

chisq.test(x, y = NULL, correct = TRUE,
p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000) 

原假設H0:X符合F分佈。

8. Fisher精確的獨立檢驗:

fisher.test(x, y = NULL, workspace = 200000, hybrid = FALSE,
control = list(), or = 1, alternative = "two.sided",
conf.int = TRUE, conf.level = 0.95)

原假設:X,Y相關。

9. McNemar檢驗:

mcnemar.test(x, y = NULL, correct = TRUE)

原假設:兩組資料的頻數沒有區別。

10. 秩相關檢驗

cor.test(x, y,
alternative = c("two.sided", "less", "greater"),
method = "spearman", conf.level = 0.95, ...)

原假設:x,y相關.

11. Wilcoxon秩檢驗

wilcox.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
conf.int = FALSE, conf.level = 0.95, ...)

原假設:中位數大於,小於,不等於mu

到此這篇關於R語言 資料檢驗的文章就介紹到這了,更多相關R語言 資料檢驗內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com