當前位置:首頁 » 操作系統 » 資料庫的標准化

資料庫的標准化

發布時間: 2025-05-21 13:51:54

⑴ geo資料庫數據如何標准化

標准化的方法就是Counts值:

對給定的基因組參考區域,計算比對上的read數,又稱為raw count(RC)。

aw count作為原始的read計數矩陣是一個絕對值,而絕對值的特點是基因長度、測序深度不同不可以比較。所以我們要進行標准化把count矩陣轉變為相對值,去除基因長度、測序深度的影響,我們採用分析的。

標准化的三種方法得出的三種值:

RPM (Reads per million mapped reads):RPM方法:10^6標准化了測序深度的影響,但沒有考慮轉錄本的長度的影響。

RPKM/FPKM方法:

103標准化了基因長度的影響,106標准化了測序深度的影響。TCGA的數據分析多採用這種結果。

TPM (Transcript per million):TPM的計算方法也同RPKM/FPKM類似,TPM可以看作是RPKM/FPKM值的百分比。



具體判斷方法:

表達量是否需要重新標准化。

可以通過boxplot函數觀察一下樣本表達豐度值的分布是否整齊進行判斷。

是否需要log2:根據數據值的大小。

如果表達豐度的數值在50以內,通常是經過log2轉化的。如果數字在幾百幾千,則是未經轉化的。




熱點內容
抹零演算法 發布:2025-06-19 11:27:17 瀏覽:397
浙江圖書館資料庫 發布:2025-06-19 11:17:13 瀏覽:449
ip地址怎麼看伺服器 發布:2025-06-19 11:16:10 瀏覽:445
網銀登錄密碼如何重置密碼 發布:2025-06-19 11:15:13 瀏覽:95
BDC編程 發布:2025-06-19 11:14:25 瀏覽:194
看門狗二如何用無人機解密碼 發布:2025-06-19 11:08:06 瀏覽:380
光遇安卓和蘋果哪個區有白鳥 發布:2025-06-19 10:41:07 瀏覽:508
同步存儲器非同步存儲器 發布:2025-06-19 10:34:33 瀏覽:931
價保伺服器是什麼 發布:2025-06-19 10:32:16 瀏覽:922
河北省聯通外網伺服器地址 發布:2025-06-19 10:30:58 瀏覽:527