當前位置:首頁 » 操作系統 » 資料庫的標准化

資料庫的標准化

發布時間: 2025-05-21 13:51:54

⑴ geo資料庫數據如何標准化

標准化的方法就是Counts值:

對給定的基因組參考區域,計算比對上的read數,又稱為raw count(RC)。

aw count作為原始的read計數矩陣是一個絕對值,而絕對值的特點是基因長度、測序深度不同不可以比較。所以我們要進行標准化把count矩陣轉變為相對值,去除基因長度、測序深度的影響,我們採用分析的。

標准化的三種方法得出的三種值:

RPM (Reads per million mapped reads):RPM方法:10^6標准化了測序深度的影響,但沒有考慮轉錄本的長度的影響。

RPKM/FPKM方法:

103標准化了基因長度的影響,106標准化了測序深度的影響。TCGA的數據分析多採用這種結果。

TPM (Transcript per million):TPM的計算方法也同RPKM/FPKM類似,TPM可以看作是RPKM/FPKM值的百分比。



具體判斷方法:

表達量是否需要重新標准化。

可以通過boxplot函數觀察一下樣本表達豐度值的分布是否整齊進行判斷。

是否需要log2:根據數據值的大小。

如果表達豐度的數值在50以內,通常是經過log2轉化的。如果數字在幾百幾千,則是未經轉化的。




熱點內容
信息存儲與信息檢索 發布:2025-08-21 02:22:32 瀏覽:122
android非同步數據載入數據 發布:2025-08-21 02:09:33 瀏覽:245
凱美瑞20e配置怎麼樣 發布:2025-08-21 02:08:43 瀏覽:504
雲伺服器停止運行 發布:2025-08-21 02:03:55 瀏覽:805
如何把手機相冊加密碼 發布:2025-08-21 01:58:14 瀏覽:211
開緩存 發布:2025-08-21 01:51:38 瀏覽:667
編程自行車 發布:2025-08-21 01:45:24 瀏覽:156
殺毒軟體解除ftp連接 發布:2025-08-21 01:45:14 瀏覽:472
安卓手機怎麼提取音頻做鈴聲 發布:2025-08-21 01:43:58 瀏覽:201
android按鈕頁面跳轉頁面 發布:2025-08-21 01:34:49 瀏覽:227