存儲key

發布時間: 2023-02-11 02:14:37

❶ 保存字元串『key』需要多少位元組儲存單元

保存字元串『key』需要24位元組的存儲單元，因為key這個單詞比較簡單，所以並不需要特別復雜的位元組輸入，只需要24位元組就可以了。

❷ 雲存儲key不能為空

必須需要設置密碼。雲存儲key不能為空是由於開啟雲存儲必須需要設置密碼。雲存儲是一種網上在線存儲的模式，即把數據存放在通常由第三方託管的多台虛擬伺服器，而非專屬的伺服器上。

❸ Android KeyStore密鑰存儲

利用 Android KeyStore System，您可以在容器中存儲加密密鑰，從而提高從設備中提取密鑰的難度。在密鑰進入密鑰庫後，可以將它們用於加密操作，而密鑰材料仍不可導出。此外，它提供了密鑰使用的時間和方式限制措施，例如要求進行用戶身份驗證才能使用密鑰，或者限制為只能在某些加密模式中使用。

密鑰庫系統由 KeyChain API 以及在 Android 4.3（API 級別 18）中引入的 Android 密鑰庫提供程序功能使用。本文說明了何時以及如何使用 Android 密鑰庫提供程序。

1、存儲密匙：Android提供的這個KeyStore最大的作用就是不需要開發者去維護這個密匙的存儲問題，相比起存儲在用戶的數據空間或者是外部存儲器都更加安全。注意的是這個密匙隨著用戶清除數據或者卸載應用都會被清除掉。
2、得益於Android獨立的一套密匙庫系統，可以提高安全性

Android 密鑰庫系統可以保護密鑰材料免遭未經授權的使用。首先，Android 密鑰庫可以防止從應用進程和 Android 設備中整體提取密鑰材料，從而避免了在 Android 設備之外以未經授權的方式使用密鑰材料。其次，Android 密鑰庫可以讓應用指定密鑰的授權使用方式，並在應用進程之外強制實施這些限制，從而避免了在 Android 設備上以未經授權的方式使用密鑰材料。

Android 密鑰庫密鑰使用兩項安全措施來避免密鑰材料被提取：

為了避免在 Android 設備上以未經授權的方式使用密鑰材料，在生成或導入密鑰時 Android 密鑰庫會讓應用指定密鑰的授權使用方式。一旦生成或導入密鑰，其授權將無法更改。然後，每次使用密鑰時，都會由 Android 密鑰庫強制執行授權。這是一項高級安全功能，通常僅用於有以下要求的情形：在生成/導入密鑰後（而不是之前或當中），應用進程受到攻擊不會導緻密鑰以未經授權的方式使用。

支持的密鑰使用授權可歸為以下幾個類別：

作為一項額外的安全措施，對於密鑰材料位於安全硬體內部的密鑰（請參閱 KeyInfo.isInsideSecurityHardware()），某些密鑰使用授權可能由安全硬體實施，具體取決於 Android 設備。加密和用戶身份驗證授權可能由安全硬體實施。由於安全硬體一般不具備獨立的安全實時時鍾，時間有效性間隔授權不可能由其實施。

您可以使用 KeyInfo.() 查詢密鑰的用戶身份驗證授權是否由安全硬體實施。

在需要系統級憑據時請使用 KeyChain API。在應用通過 KeyChain API 請求使用任何憑據時，用戶需要通過系統提供的 UI 選擇應用可以訪問已安裝的哪些憑據。因此，在用戶同意的情況下多個應用可以使用同一套憑據。

使用 Android 密鑰庫提供程序讓各個應用存儲自己的憑據，並且只允許應用自身訪問。這樣，應用可以管理僅能由自己使用的憑據，同時又可以提供等同於 KeyChain API 為系統級憑據提供的安全優勢。這一方法不需要用戶選擇憑據。

要使用此功能，請使用標準的 KeyStore 和 KeyPairGenerator 或 KeyGenerator 類，以及在 Android 4.3（API 級別 18）中引入的 AndroidKeyStore 提供程序。

AndroidKeyStore 注冊為 KeyStore 類型以用於 KeyStore.getInstance(type) 方法，而在用於 KeyPairGenerator.getInstance(algorithm, provider) 和 KeyGenerator.getInstance(algorithm, provider) 方法時則注冊為提供程序。

生成新的 PrivateKey 要求您同時指定自簽署證書具備的初始 X.509 屬性。之後，您可以使用 KeyStore.setKeyEntry 將證書替換為由證書頒發機構 (CA) 簽署的證書。

要生成密鑰，請使用 KeyPairGenerator 和 KeyPairGeneratorSpec：

要生成密鑰，請使用 KeyGenerator 和 KeyGenParameterSpec。

AndroidKeyStore 提供程序的使用通過所有的標准 KeyStore API 加以實現。

通過調用 aliases() 方法列出密鑰庫中的條目：

通過從密鑰庫提取 KeyStore.Entry 並使用 Signature API（例如 sign()）簽署數據：

類似地，請使用 verify(byte[]) 方法驗證數據：

生成密鑰或將密鑰導入到 AndroidKeyStore 時，您可以指定密鑰僅授權給經過身份驗證的用戶使用。用戶使用安全鎖定屏幕憑據（模式/PIN/密碼、指紋）的子集進行身份驗證。

這是一項高級安全功能，通常僅用於有以下要求的情形：在生成/導入密鑰後（而不是之前或當中），應用進程受到攻擊不會導緻密鑰被未經身份驗證的用戶使用。

如果密鑰僅授權給經過身份驗證的用戶使用，可以將其配置為以下列兩種模式之一運行：

❹ Redis百億級Key存儲設計方案

該應用場景為DMP緩存存儲需求，DMP需要管理非常多的第三方id數據，其中包括各媒體cookie與自身cookie（以下統稱supperid）的mapping關系，還包括了supperid的人口標簽、移動端id（主要是idfa和imei）的人口標簽，以及一些黑名單id、ip等數據。

在hdfs的幫助下離線存儲千億記錄並不困難，然而DMP還需要提供毫秒級的實時查詢。由於cookie這種id本身具有不穩定性，所以很多的真實用戶的瀏覽行為會導致大量的新cookie生成，只有及時同步mapping的數據才能命中DMP的人口標簽，無法通過預熱來獲取較高的命中，這就跟緩存存儲帶來了極大的挑戰。

經過實際測試，對於上述數據，常規存儲超過五十億的kv記錄就需要1T多的內存，如果需要做高可用多副本那帶來的消耗是巨大的，另外kv的長短不齊也會帶來很多內存碎片，這就需要超大規模的存儲方案來解決上述問題。

人⼝標簽主要是cookie、imei、idfa以及其對應的gender（性別）、age（年齡段）、geo（地域）等；mapping關系主要是媒體cookie對supperid的映射。以下是數據存儲⽰示例：

媒體編號-媒體cookie=>supperid

supperid => { age=>年齡段編碼，gender=>性別編碼，geo=>地理位置編碼 }

imei or idfa => { age=>年齡段編碼，gender=>性別編碼，geo=>地理位置編碼 }

顯然PC數據需要存儲兩種key=>value還有key=>hashmap，⽽而Device數據需要存儲⼀一種

key=>hashmap即可。

存儲吃緊的一個重要原因在於每天會有很多新數據入庫，所以及時清理數據尤為重要。主要方法就是發現和保留熱數據淘汰冷數據。

網民的量級遠遠達不到幾十億的規模，id有一定的生命周期，會不斷的變化。所以很大程度上我們存儲的id實際上是無效的。而查詢其實前端的邏輯就是廣告曝光，跟人的行為有關，所以一個id在某個時間窗口的（可能是一個campaign，半個月、幾個月）訪問行為上會有一定的重復性。

數據初始化之前，我們先利用hbase將日誌的id聚合去重，劃定TTL的范圍，一般是35天，這樣可以砍掉近35天未出現的id。另外在Redis中設置過期時間是35天，當有訪問並命中時，對key進行續命，延長過期時間，未在35天出現的自然淘汰。這樣可以針對穩定cookie或id有效，實際證明，續命的方法對idfa和imei比較實用，長期積累可達到非常理想的命中。

Hash表空間大小和Key的個數決定了沖突率（或者用負載因子衡量），再合理的范圍內，key越多自然hash表空間越大，消耗的內存自然也會很大。再加上大量指針本身是長整型，所以內存存儲的膨脹十分可觀。先來談談如何把key的個數減少。

大家先來了解一種存儲結構。我們期望將key1=>value1存儲在redis中，那麼可以按照如下過程去存儲。先用固定長度的隨機散列md5(key)值作為redis的key，我們稱之為BucketId，而將key1=>value1存儲在hashmap結構中，這樣在查詢的時候就可以讓client按照上面的過程計算出散列，從而查詢到value1。

過程變化簡單描述為：get(key1) -> hget(md5(key1), key1) 從而得到value1。

如果我們通過預先計算，讓很多key可以在BucketId空間里碰撞，那麼可以認為一個BucketId下面掛了多個key。比如平均每個BucketId下面掛10個key，那麼理論上我們將會減少超過90%的redis key的個數。

具體實現起來有一些麻煩，而且用這個方法之前你要想好容量規模。我們通常使用的md5是32位的hexString（16進制字元），它的空間是128bit，這個量級太大了，我們需要存儲的是百億級，大約是33bit，所以我們需要有一種機制計算出合適位數的散列，而且為了節約內存，我們需要利用全部字元類型（ASCII碼在0~127之間）來填充，而不用HexString，這樣Key的長度可以縮短到一半。

下面是具體的實現方式

參數bit決定了最終BucketId空間的大小，空間大小集合是2的整數冪次的離散值。這里解釋一下為何一個位元組中只有7位可用，是因為redis存儲key時需要是ASCII（0~127），而不是byte array。如果規劃百億級存儲，計劃每個桶分擔10個kv，那麼我們只需2^30=1073741824的桶個數即可，也就是最終key的個數。

碎片主要原因在於內存無法對齊、過期刪除後，內存無法重新分配。通過上文描述的方式，我們可以將人口標簽和mapping數據按照上面的方式去存儲，這樣的好處就是redis key是等長的。另外對於hashmap中的key我們也做了相關優化，截取cookie或者deviceid的後六位作為key，這樣也可以保證內存對齊，理論上會有沖突的可能性，但在同一個桶內後綴相同的概率極低(試想id幾乎是隨機的字元串，隨意10個由較長字元組成的id後綴相同的概率*桶樣本數=發生沖突的期望值<<0.05,也就是說出現一個沖突樣本則是極小概率事件，而且這個概率可以通過調整後綴保留長度控制期望值)。而value只存儲age、gender、geo的編碼，用三個位元組去存儲。

另外提一下，減少碎片還有個很low但是有效的方法，將slave重啟，然後強制的failover切換主從，這樣相當於給master整理的內存的碎片。

推薦Google-tcmalloc， facebook-jemalloc內存分配，可以在value不大時減少內存碎片和內存消耗。有人測過大value情況下反而libc更節約。

1）kv存儲的量級必須事先規劃好，浮動的范圍大概在桶個數的十到十五倍，比如我就想存儲百億左右的kv，那麼最好選擇30bit_{31bit作為桶的個數。也就是說業務增長在一個合理的范圍（10} 15倍的增長）是沒問題的，如果業務太多倍數的增長，會導致hashset增長過快導致查詢時間增加，甚至觸發zip-list閾值，導致內存急劇上升。

2）適合短小value，如果value太大或欄位太多並不適合，因為這種方式必須要求把value一次性取出，比如人口標簽是非常小的編碼，甚至只需要3、4個bit（位）就能裝下。

3）典型的時間換空間的做法，由於我們的業務場景並不是要求在極高的qps之下，一般每天億到十億級別的量，所以合理利用CPU租值，也是十分經濟的。

4）由於使用了信息摘要降低了key的大小以及約定長度，所以無法從redis裡面random出key。如果需要導出，必須在冷數據中導出。

5）expire需要自己實現，目前的演算法很簡單，由於只有在寫操作時才會增加消耗，所以在寫操作時按照一定的比例抽樣，用HLEN命中判斷是否超過15個entry，超過才將過期的key刪除，TTL的時間戳存儲在value的前32bit中。

6）桶的消耗統計是需要做的。需要定期清理過期的key，保證redis的查詢不會變慢。

人口標簽和mapping的數據100億條記錄。

優化前用2.3T，碎片率在2左右；優化後500g，而單個桶的平均消耗在4左右。碎片率在1.02左右。查詢時這對於cpu的耗損微乎其微。

另外需要提一下的是，每個桶的消耗實際上並不是均勻的，而是符合多項式分布的。

上面的公式可以計算桶消耗的概率分布。公式是唬人用的，只是為了提醒大家不要想當然的認為桶消耗是完全均勻的，有可能有的桶會有上百個key。但事實並不沒有那麼誇張。試想一下投硬幣，結果只有兩種正反面。相當於只有兩個桶，如果你投上無限多次，每一次相當於一次伯努利實驗，那麼兩個桶必然會十分的均勻。概率分布就像上帝施的魔咒一樣，當你面對大量的桶進行很多的廣義的伯努利實驗。桶的消耗分布就會趨於一種穩定的值。接下來我們就了解一下桶消耗分布具體什麼情況：

通過采樣統計

31bit（20多億）的桶，平均4.18消耗

100億節約了1.8T內存。相當於節約了原先的78%內存，而且桶消耗指標遠沒有達到預計的底線值15。

對於未出現的桶也是存在一定量的，如果過多會導致規劃不準確，其實數量是符合二項分布的，對於2^30桶存儲2 32kv，不存在的桶大概有（百萬級別，影響不大）：

Math.pow((1 - 1.0 / Math.pow(2, 30)), Math.pow(2, 32)) * Math.pow(2, 30);

對於桶消耗不均衡的問題不必太擔心，隨著時間的推移，寫入時會對HLEN超過15的桶進行削減，根據多項式分布的原理，當實驗次數多到一定程度時，桶的分布就會趨於均勻（硬幣投擲無數次，那麼正反面出現次數應該是一致的），只不過我們通過expire策略削減了桶消耗，實際上對於每個桶已經經歷了很多的實驗發生。

總結：信息摘要在這種場景下不僅能節約key存儲，對齊了內存，還能讓Key按照多項式分布均勻的散列在更少量的key下面從而減少膨脹，另外無需在給key設置expire，也很大程度上節約了空間。

這也印證了時間換空間的基本理論，合理利用CPU租值也是需要考慮的。

關注分布式存儲技術以及分布式計算方法

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：1032

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1308

python中的init方法發布：2025-10-20 08:17:33 瀏覽：991

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：1167

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：1038

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1395

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：607

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：501

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：1171

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：1169

存儲key

與存儲key相關的資訊