當前位置:首頁 » 操作系統 » 演算法的P值

演算法的P值

發布時間: 2022-12-18 00:11:30

⑴ 「p值」是什麼意思

P值(P value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果P值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由越充分。總之,P值越小,表明結果越顯著。但是檢驗的結果究竟是"顯著的"、"中度顯著的"還是"高度顯著的"需要我們自己根據P值的大小和實際問題來解決。

⑵ 統計學p值的計算公式是什麼

P值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的P 值,一般以P < 0.05 為有統計學差異, P<0.01 為有顯著統計學差異,P<0.001為有極其顯著的統計學差異。

P<0.05時,認為差異有統計學意義」或者「顯著性水平α=0.05」,指的是如果本研究統計推斷得到的差異有統計學意義,那麼該結果是「假陽性」的概率小於0.05。

(2)演算法的P值擴展閱讀:

P值的計算:

一般地,用X 表示檢驗的統計量,當H0為真時,可由樣本數據計算出該統計量的值C,根據檢驗統計量X的具體分布,可求出P值。具體地說:

左側檢驗的P值為檢驗統計量X 小於樣本統計值C 的概率,即:P = P{ X < C}

右側檢驗的P值為檢驗統計量X 大於樣本統計值C 的概率:P = P{ X > C}

雙側檢驗的P值為檢驗統計量X 落在樣本統計值C 為端點的尾部區域內的概率的2 倍:P = 2P{ X > C} (當C位於分布曲線的右端時) 或P = 2P{ X< C} (當C 位於分布曲線的左端時) 。

若X 服從正態分布和t分布,其分布曲線是關於縱軸對稱的,故其P 值可表示為P = P{| X| > C} 。

計算出P值後,將給定的顯著性水平α與P 值比較,就可作出檢驗的結論:

如果α > P值,則在顯著性水平α下拒絕原假設。

如果α ≤ P值,則在顯著性水平α下不拒絕原假設。

在實踐中,當α = P值時,也即統計量的值C剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

⑶ 假設檢驗中的P值怎樣計算呢

P值的計算:
一般地,用X 表示檢驗的統計量,當H0為真時,可由樣本數據計算出該統計量的值C,根據檢驗統計量X的具體分布,可求出P值。具體地說:
左側檢驗的P值為檢驗統計量X 小於樣本統計值C 的概率,即:P = P{ X < C}
右側檢驗的P值為檢驗統計量X 大於樣本統計值C 的概率:P = P{ X > C}
雙側檢驗的P值為檢驗統計量X 落在樣本統計值C 為端點的尾部區域內的概率的2 倍:P = 2P{ X > C} (當C位於分布曲線的右端時) 或P = 2P{ X< C} (當C 位於分布曲線的左端時) 。若X 服從正態分布和t分布,其分布曲線是關於縱軸對稱的,故其P 值可表示為P = P{| X| > C} 。
p值的計算公式:
=2[1-φ(z0)]
當被測假設h1為
p不等於p0時;
=1-φ(z0)
當被測假設h1為
p大於p0時;
=φ(z0)
當被測假設h1為
p小於p0時;
其中,φ(z0)要查表得到。
z0=(x-n*p0)/(根號下(np0(1-p0)))
最後,當p值小於某個顯著參數的時候我們就可以否定假設。反之,則不能否定假設。
注意,這里p0是那個缺少的假設滿意度,而不是要求的p值。
沒有p0就形不成假設檢驗,也就不存在p值
統計學上規定的p值意義:
p值
碰巧的概率
對無效假設
統計意義
p>0.05
碰巧出現的可能性大於5%
不能否定無效假設兩組差別無顯著意義
p<0.05
碰巧出現的可能性小於5%
可以否定無效假設
兩組差別有顯著意義
p
<0.01
碰巧出現的可能性小於1%
可以否定無效假設
兩者差別有非常顯著意義

⑷ P值的計算

為理解P值的計算過程,用Z表示檢驗的統計量,ZC表示根據樣本數據計算得到的檢驗統計量值。
左側檢驗 H0:μ≥μ0 vs H1:μ<μ0
P值是當μ=μ0時,檢驗統計量小於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值 = P(Z≤ZC|μ=μ0)
右側檢驗 H0:μ≤μ0 vs H1:μ>μ0
P值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值 = P(Z≥ZC|μ=μ0)
雙側檢驗 H0:μ=μ0 vs H1:μ≠μ0
P值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值 = 2P(Z≥|ZC||μ=μ0)

⑸ 統計學中p值的含義是什麼

p值是指在一個概率模型中,統計摘要(如兩組樣本均值差)與實際觀測數據相同,或甚至更大這一事件發生的概率。

換言之,是檢驗假設零假設成立或表現更嚴重的可能性。p值若與選定顯著性水平(0.05或0.01)相比更小,則零假設會被否定而不可接受。然而這並不直接表明原假設正確。p值是一個服從正態分布的隨機變數,在實際使用中因樣本等各種因素存在不確定性。產生的結果可能會帶來爭議。

發展史

R·A·Fisher(1890-1962)作為一代假設檢驗理論的創立者,在假設檢驗中首先提出P值的概念。他認為假設檢驗是一種程序,研究人員依照這一程序可以對某一總體參數形成一種判斷。也就是說,他認為假設檢驗是數據分析的一種形式,是人們在研究中加入的主觀信息。

當時這一觀點遭到了Neyman-Pearson的反對,他們認為假設檢驗是一種方法,決策者在不確定的條件下進行運作,利用這一方法可以在兩種可能中作出明確的選擇,而同時又要控制錯誤發生的概率。這兩種方法進行長期且痛苦的論戰。

雖然Fisher的這一觀點同樣也遭到了現代統計學家的反對,但是他對現代假設檢驗的發展作出了巨大的貢獻。

假設檢驗的P值方法

假設檢驗的p值方法使用計算出的概率來確定是否有證據拒絕原假設。零假設(也稱為猜想)是有關總體(或數據生成過程)的最初主張。備選假設指出總體參數是否與猜想中所述的總體參數值不同。

在實踐中,預先聲明了顯著性水平,以確定p值必須有多小才能拒絕無效假設。由於不同的研究人員在研究問題時會使用不同級別的重要性,因此讀者有時可能難以比較兩種不同測試的結果。P值提供了解決此問題的方法。

例如,假設一項比較兩種特定資產收益的研究是由使用相同數據但不同顯著性水平的不同研究人員進行的。對於資產是否不同,研究人員可能得出相反的結論。

如果一位研究人員使用90%的置信度而另一位研究人員要求95%的置信度來拒絕原假設,並且兩次收益之間觀察到的差異的p值為0.08(對應於92%的置信度) ,那麼第一個研究人員將發現這兩種資產具有統計上的顯著差異,而第二個研究人員將發現收益之間在統計上沒有顯著差異。

為了避免這個問題,研究人員可以報告假設檢驗的p值,並允許讀者自己解釋統計學意義。這稱為假設檢驗的p值方法。獨立的觀察者可以記錄p值,並自己決定這是否代表統計學上的顯著差異。

以上內容參考網路-P值

⑹ 如何計算統計學中的P值(200分)

P值即為拒絕域的面積或概率。

P值的計算公式是

=2[1-Φ(z0)] 當被測假設H1為 p不等於p0時;

=1-Φ(z0) 當被測假設H1為 p大於p0時;

=Φ(z0) 當被測假設H1為 p小於p0時;

總之,P值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要我們自己根據P值的大小和實際問題來解決。

p值是指在一個概率模型中,統計摘要(如兩組樣本均值差)與實際觀測數據相同,或甚至更大這一事件發生的概率。換言之,是檢驗假設零假設成立或表現更嚴重的可能性。

p值若與選定顯著性水平(0.05或0.01)相比更小,則零假設會被否定而不可接受。然而這並不直接表明原假設正確。p值是一個服從正態分布的隨機變數,在實際使用中因樣本等各種因素存在不確定性。產生的結果可能會帶來爭議。

⑺ 數據分析中的P值怎麼計算、什麼意義

一、P值計算方法

左側檢驗P值是當時,檢驗統計量小於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值。

右側檢驗P值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值。

雙側檢驗P值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值。

二、P值的意義

P 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的P 值,一般以P < 0.05 為顯著, P <0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。

(7)演算法的P值擴展閱讀:

數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便採取適當行動。

數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,並使得數據分析得以推廣。數據分析是數學與計算機科學相結合的產物。

在統計學領域,有些人將數據分析劃分為描述性統計分析、探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特徵,而驗證性數據分析則側重於已有假設的證實或證偽。

⑻ 統計學中的P值應該怎麼計算

P值的計算公式是

=2[1-Φ(z0)] 當被測假設H1為 p不等於p0時;

=1-Φ(z0) 當被測假設H1為 p大於p0時;

=Φ(z0) 當被測假設H1為 p小於p0時;

總之,P值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要根據P值的大小和實際問題來解決。

(8)演算法的P值擴展閱讀

統計學中回歸分析的主要內容為:

1、從一組數據出發,確定某些變數之間的定量關系式,即建立數學模型並估計其中的未知參數。估計參數的常用方法是最小二乘法。

2、對這些關系式的可信程度進行檢驗。

3、在許多自變數共同影響著一個因變數的關系中,判斷哪個(或哪些)自變數的影響是顯著的,哪些自變數的影響是不顯著的,將影響顯著的自變數加入模型中,而剔除影響不顯著的變數,通常用逐步回歸、向前回歸和向後回歸等方法。

4、利用所求的關系式對某一生產過程進行預測或控制。回歸分析的應用是非常廣泛的,統計軟體包使各種回歸方法計算十分方便。



⑼ 生信課程筆記11-關於p值

假設檢驗是使用來自總體的采樣(sampling)提供的信息,做出關於一個對總體的決策。需注意抽樣應能夠代表總體。

 對總體的某種規律提出一個假設,通過樣本數據推斷,決定是否拒絕這一假設,這樣的統計活動稱為假設檢驗。

1. 建立檢驗假設,確定檢驗水準

2. 選擇並計算檢驗統計量

3. 確定p值,做出推斷

統計假設是一種關於感興趣的總體的陳述。一般我們有一個 原假設/零假設/無效假設/H0/ null hypothesis 和一個 備擇假設/替代假設/HA/alternative hypothesis 。無效假設通常代表「無效」的狀態,即「沒有影響、沒有效果、沒有差異」。

例如:H0 性別對身高沒有影響/男女平均身高沒有差異。

A p-value is the probability that random chance generated the data, or something else that is equal or rarer.

p值是生成某數據的隨機機率,包括三部分:隨機產生這個事件的概率,產生與該事件相同概率的其它事件的概率,產生比該事件的概率更小的事件的概率,這三部分概率加起來就是p值。

統計假設檢驗的結果通常用p值來表示。為了從我們的變數的觀測值獲得p值,首先需要構造一個測試統計量,如果零假設確實成立,我們可以從理論上計算統計量的分布情況。然後,我們可以將從我們的采樣數據中計算出的值與該分布進行比較,並假設如果零假設為真,那麼將獲得觀測數據或比觀測數據更極端的測試統計值的概率是p值。

p值是當原假設成立時,出現目前觀察到的情況的概率、加上出現和目前情況概率相同或概率更低的事件的概率。如果p值比較小,可以認為當原假設成立時出現目前的情況是小概率事件,不太可能發生,而更有可能是原假設不成立。

 p值並不能告訴你零假設是真的可能性。同樣,它也沒有告訴你替代假設是真的可能性。

如果你不能拒絕零假設,你還沒有證明零假設是正確的。但簡單地說,當前的數據集沒有提供足夠的證據來拒絕它。

p值只關心數據與原假設有多麼不一致,不能代表你所發現的效應(差異)的大小,更不能告訴我們這種效應是否有實際意義。

規定一個顯著性水平α,如果p值小於顯著水平,就可以拒絕原假設,認為得到的結果是顯著的。從另一個角度看,α是在原假設為真時拒絕原假設的概率(假陽性錯誤),是在大量重復實驗時我們能承受的第一類錯誤的概率的上限。從相同的總體取樣進行檢驗的p值是均勻分布的,假陽性的比率與α值相等。

第I類錯誤(type I error): 假陽性錯誤。 把沒有差異說成有差異,把沒病說成有病,把無效說成有效等。

第II類錯誤(type II error): 假陰性錯誤。 把有差異說成沒有差異,把有病說成沒病,把有效說成無效等。

如果我們只執行一個測試(在數據集中只有一個變數),那麼使用p值來解釋統計測試的結果很好。一旦測試次數增加,p值作為顯著性度量的有用性就會降低。

多重比較使假陽性的概率大量增加。對一個變數進行統計檢驗,假陽性的概率為α=5%,不犯假陽性錯誤的概率為95%;對5個變數一起進行檢驗,不犯假陽性錯誤的概率為0.95^5=0.77,至少出現一次第I類錯誤的概率就是1-0.95^5=0.23;如果檢驗的次數m更多,幾乎必然會有至少1個假陽性錯誤。我們把這個「至少有1個錯誤」的概率稱為 總體錯誤率(Family-Wise Error Rate,FWER) ,FWER = 1- (1- α)^m。

假設我們的數據集中有10000個變數,並且對於每一個變數,原假設都是正確的(沒有差異)。現在對每個變數進行統計檢驗。在這個例子中我們將有大約0.05×10000=500個變數的p值低於0.05。這些都被稱為 假發現或假陽性(false discoveries or false positives) 。如果數據中存在一些確實有差異的變數,則它們將與假陽性混合。在判斷差異表達基因時,大部分基因都是沒有明顯變化的,小部分基因是顯著差異的,這樣統計得到的顯著性結果中,會有很大比例的假陽性。

在進行多次假設檢驗的時候,為了避免增大犯I型錯誤的概率,常用bonferroni、fdr(BH) 以及q值等方法對比較結果的p值進行校正(嚴格來說,q值並不是用來校正p值的)。

adjust p-values是經過校正後的p值,通過一些演算法,比如Benjamini-Hochberg method,使p值變的更大一些,從而控制假陽性的數量。

bonferroni是特別保守的一種多重比較校正方法,它拒絕了所有的假陽性結果發生的可能性。FWER = 0.05,α = 0.05/m,p<0.05/m時才拒絕原假設。相當於每一個檢驗做出來的p值都要乘以m,作為校正後的P值。這樣進行10000次檢驗後,平均假陽性次數也依然被控制在0.05次。

t.df1$bon <- p.adjust(t.df1$sim_p, method = "bonferroni")

錯誤發現率(false discovery rate,FDR)是假陽性的預期分數,即假陽性數量除以所有認為是陽性結果的數量, FDR=FP/(FP+TP)

如果FDR<0.05,那麼在顯示為顯著性的結果里,有不到5%為假陽性。當FDR=0.05時,一共有1805個陽性,但是這些陽性樣本中,有5%是假陽性,即有90個是誤診的。

有多種模型用來從p-value估算FDR值,其中使用的最多的是Benjaminiand Hochberg的方法,簡稱 BH法。BH法雖然不夠精確,但是簡單好用。

fdr默認Benjamini-Hochberg method,仍然略顯保守。它關注的是所有認為是陽性的結果中,假陽性的比例,FDR的目的就是要將這個比例降低到α。

其方法是:把所有的p值從小到大排序並編號i,然後最大的p值不變,其餘的p值調整後變成 原始p值×(p值總數m/這個p值排序的編號i)。可以從數學上證明經過BH方法校正後的adjust p-values(即q-values或FDR)可以控制FDR在α以內。

實際上,BH法的原始演算法是找到一個最大的編號i,滿足P≤i/m*FDR閾值,此時所有編號小於i的數據就都可以認為是顯著的。在實踐中,為了能夠在比較方便的用不同的FDR閾值對數據進行分析,會計算所有的FDR,這樣無論FDR閾值選擇多少,都可以直接根據FDR的數值來直接找到所有顯著的數據。

t.df1$fdr <- p.adjust(t.df1$sim_p, method = "fdr")

FDR的控制方法,延伸出了一個被校正後的p value的概念(比P value更嚴格),稱之為Q value,這個概念是最早是John Storey(2002)提出的。 一般情況下,我們可以認為q value = FDR = adjusted p value。 據說Storey方法是最流行的FDR control procere(For details see Storey's paper published on PNAS ,2003)。這是一種利用多重比較結果中的p value 分布,來預估真實的陽性率的方法,從而提高了FDR值預估的准確性。

q值是傳統p值的FDR模擬(analog)。對於給定的變數(p-value = p*), q值估計p值低於p*的所有變數中錯誤發現的分數 。q值表示在檢測陽性個體中,假陽性個體所佔的比例。取q=0.05,假陽性/(假陽性+真陽性)=0.05。此時p值並不是0.05(可能是0.058)。

t.q1 <- qvalue(t.df1$sim_p)

t.df1$qval <- t.q1$qvalue

FDR控制了假陽性,但是也丟失了很多真正有差異的結果。所以還有獨立篩選(independent filtering)減少假陰性。獨立篩選認為表達量很低的基因可能不能提供有用信息,可以先把它們去掉,減少參與分析的基因總數,從而減少丟失的真陽性結果。

熱點內容
蜜蜂編程官網 發布:2025-05-14 19:59:28 瀏覽:57
優酷怎麼給視頻加密 發布:2025-05-14 19:31:34 瀏覽:635
夢三國2副本腳本 發布:2025-05-14 19:29:58 瀏覽:860
phpxmlhttp 發布:2025-05-14 19:29:58 瀏覽:434
Pua腳本 發布:2025-05-14 19:24:56 瀏覽:449
蘋果像素低為什麼比安卓好 發布:2025-05-14 19:13:23 瀏覽:461
安卓機微信怎麼設置紅包提醒 發布:2025-05-14 19:00:15 瀏覽:272
androidsystem許可權設置 發布:2025-05-14 18:56:02 瀏覽:971
mq腳本 發布:2025-05-14 18:45:37 瀏覽:25
仙境傳說ro解壓失敗 發布:2025-05-14 18:45:01 瀏覽:868