雲存儲中心建設方案
A. 如何搭建私有雲存儲
虛擬化技術在企業私有雲IT基礎架構中仍然占據重要地位,同時,為了進一步提升應用效率,越來越多的生產環境也正在逐步變革,從以虛擬機為中心的架構向以容器和微服務為中心的雲原生架構過渡,在這個過程中,存儲如何有效支撐各種雲主機應用與微服務應用,對於企業的私有雲數據中心提出了新的挑戰。
企業面臨的問題
存儲設施七國八制,硬體鎖定缺少彈性
多種雲平台對於存儲的要求各不相同,塊/文件/對象存儲對應不同類型的應用,對外提供不同的服務介面,一種存儲設備無法滿足多種類型的雲平台存儲需求,而且傳統存儲在擴展性方面不能滿足雲時代大規模雲平台對存儲在線彈性擴容的需求,在可維護性方面則面臨硬體架構綁定、運維復雜、難以維保等問題,而且這些問題會隨著存儲設備種類和數量的增多進一步放大。
業務調度變更頻繁,資源不能共享
隨著開發測試虛擬機以及容器、微服務平台在企業私有雲平台的上線,大型企業的應用快速迭代、頻繁發布對存儲系統的支撐提出了嚴峻挑戰,不同業務的數據保存在不同廠商的存儲設備中,數據流動性差,不僅導致存儲空間及性能資源浪費嚴重,數據災備方案也很難統一化。
開源產品難以維護,不能實現企業級產品化
基於開源虛擬化技術的雲平台如OpenStack為眾多客戶提供了快速構建私有雲基礎設施的能力,但是存儲部分卻不一樣,開源的存儲系統如Ceph雖然可以小規模部署試用, 但在大規模商用時會遇到很多問題:與硬體和企業級應用生態融合程度不高,嚴重依賴人工開發運維,在性能和服務質量方面不能滿足核心業務的需求
杉岩私有雲存儲解決方案
杉岩私有雲存儲解決方案充分發揮了杉岩統一存儲平台(USP)的雲適配、開放等優勢,支持各種復雜的應用負載,可靈活支撐私有雲的虛擬化平台,如VMware、Citrix、OpenStack等虛擬化和雲平台,以及通過Kubernetes軟體一致性認證的所有容器雲平台,如:Rancher、Openshift、Kubernetes等。
通過杉岩統一存儲平台,用戶可快速構建能夠兼容所有主流虛擬化平台與容器微服務平台的統一存儲資源池,面對各種虛擬機和微服務需求,池化的存儲平台為大規模雲環境提供了可靠的存儲基礎架構支撐,幫助用戶從紛繁復雜的基礎架構運維工作中解放出來,更關注於私有雲上運行的業務本身。
客戶價值
資源整合,鏈接企業信息孤島
單資源池提供塊、文件、對象多種存儲服務,支持虛擬化平台和資料庫應用;強大的存儲資源生命周期管理能力,跨雲平台在線遷移數據,實現數據共享和提高資源利用率;存儲卷QoS等級和性能優先順序在線調整,可根據企業資源和業務需求合理配置資源。
開放兼容,適配多種私有雲平台
通過VMware VAAI和Citrix Ready認證,針對主流虛擬化平台優化I/O性能,大幅提升虛擬機訪問的性能。通過OpenStack Cinder認證,可提供塊和對象存儲基礎架構支撐支持容器平台CSI介面認證,為Kubernetes生態的容器應用提供塊和文件存儲服務。
智能管理,解決規模化運維難題
向導式安裝部署和自助擴容配置,極大提升易用性和可維護性,管理自動化降低運維成本;針對大規模集群優化的可靠性管理,檢測和修復硬碟軟錯誤的專利技術,節約用戶硬體投資。存儲視角的管理功能,可視化展示主機、容器與存儲的映射關系和性能監控協助管理員快速定位和解決問題。
B. 10TB超大容量不限速!個人雲存儲有這一個就夠了
數據的重要性是不言而喻的,所以我們需要把電腦、手機上日積月累的數據進行保存、備份,甚至對重要的數據進行加密避免隱私泄露。由於產生的數據量更大,此前使用的U盤、小容量硬碟等已經無法滿足需求,而且隨著智能設備的發展,人們還需要把一些數據分享出去,所以更大容量、能分享的雲存儲方案成為人們關注的焦點。但是目前常用的第三方網路存儲,一方面受到容量的限制,另一方面也受到網速的限制,而且在成本的投入上也是持續的,即便如此,對於數據的安全和隱私也無法得到保障。所以,聯想最近推出了一款個人雲存儲設備,最大支持10TB存儲容量,上傳下載不限速,還能夠實現多設備數據存儲,數據集中管理,實時備份和分享,完成多場景下的數據自由傳輸,為我們提供了無縫連接數字生活與工作的存儲解決方案。
聯想個人雲存儲提供了無盤版、4TB單盤版和4TB*2雙盤版,售價分別為999元、1799元和2899元。除了硬體上的一次性投入,在功能上與網路網盤有著非常相似的使用體驗,但是在容量、傳輸速度以及數據的私密性上,聯想個人雲存儲有著先天的優勢。究竟這兩款設備該選誰?不妨讓我們來做個對比。
由於聯想個人雲存儲是以物理硬體的方式存在,而網路網盤只需要安裝應用即可,所以這里我們首先來看看聯想個人雲存儲的設備是怎樣的,之後再進行功能對比。
聯想個人雲存儲包裝與外觀特點
智能安全、智能健康、智能娛樂、智能辦公學習,是聯想SIoT戰略的四大細分場景,定位家庭級智能存儲設備的聯想個人雲存儲,承擔著智能化數據管理以及完善聯想智能化布局的主要一環。
沉甸甸的包裝內部除了一個聯想個人雲存儲主機,還包括一塊全新的2.5英寸4TB SATA 3.0介面的機械硬碟,配件包括電源適配器、一根網線、固定硬碟用的螺絲釘,一把十字起子和一個簡易說明書。主機和硬碟都採用了較厚的泡沫棉保護,確保運輸中的萬無一失。
聯想個人雲存儲機身為白色,採用豎紋理設計,這樣的設計能夠減少機身厚度,同時利於散熱。正面看機身猶如羅馬殿堂的柱子,庄嚴而典雅。頂部的蓋子和底座採用了金色點綴,增添了時尚色彩,能夠與家庭家居完美地融合。
介面位於機身後部,從上到下為 RESET 孔、2 個 USB 3.0介面、千兆網線介面和圓形的電源插口。2個USB 3.0還可以外接個人雲伴侶(磁碟陣列存儲),將空間輕松擴展至128TB,所以對於家庭用戶來說,無須擔心容量不夠用。
在連接與速度方面,聯想個人雲存儲不受條件限制,可穿透各種防護網路,支持全球內外網訪問。在安裝與部署方面,相較於傳統復雜的NAS流程,聯想個人雲存儲只需要連接網線、電源,下載APP後綁定、格式化硬碟,輕松幾步就能完成,無需專業的網路、硬體技能。
開啟頂蓋後可以看到內部的A、B 兩個硬碟托架,能夠同時放下兩塊 2.5'' 的 HDD,抽屜式的托架,取出後安裝好硬碟再放下去插緊就OK了,非常簡單。硬碟支持RAID及LARGE模式,上蓋內里印有設備綁定二維碼,用來綁定APP(管理員)。但是這里也提醒一下,硬碟托架可能會很緊,取出或插入時需要用一些力。同時也建議在下一代能設計成彈出式,或者改進一下抽拉時的順暢感。
可能很多網友也會疑問為什麼不用固態硬碟?簡單的說,一方面是成本,大容量的固態硬碟價格依然居高不下;另一方面眾所周知的使用壽命和數據可恢復性,機械硬碟目前還是最佳的選擇。但並不是說聯想個人雲存儲設備就不能使用固態硬碟,用戶仍然可以自行安裝SATA介面的SSD。
由於聯想個人雲存儲設備是長期在線使用,尤其是長時間的數據讀寫時,硬碟還是會產生熱量,所以還在機身底部設計了散熱風扇,並通過底座隱藏的散熱口排出,而且在噪音控制方面也做的很好,即便是放在卧室的床頭邊也不會被干擾。
簡單了解完聯想個人雲存儲設備的外觀和基本功能,大家更加關注的是這個設備究竟能做什麼?與一些網盤相比有哪些優點?所以我們接下來就以使用者眾多的網路網盤為例來做個對比,看看聯想個人雲存儲是否值得購買。
客戶端:無縫連接 支持平台廣泛
目前能夠連接網路的設備越來越多,除了電腦和手機,還包括平板電腦、電視等,可以說有屏幕的地方就有江湖。在操作系統上分為Windows、Linux、iOS和安卓系統,聯想個人雲存儲和網路網盤都對各平台和系統進行適配,實現無縫連接,尤其是在布局智慧家庭方面,聯想個人雲存儲結合的更加緊密。
聯想個人雲存儲的數據守護者APP界面與網路網盤功能基本類似,包括對文件的自動分類,但是聯想個人雲存儲還支持對網路網盤的數據存取和離線下載,所以在兼容性和文件管理方面,聯想個人雲存儲更加貼心。
安裝數據守護者app可以輕松的在手機上存取資料和管理文件,以及用於配置個人雲存儲設備,這也是與網路網盤不太一樣的地方。圖形化的界面,以及指引綁定、設置,即便是新手也能輕松勝任,非常人性化。但是需要提醒大家的是,聯想個人雲存儲設備支持RAID1和Large兩種模式,兩者只能選擇其一,中途如果想要切換模式,則會對磁碟進行重新格式化,會刪除所有數據,所以需要謹慎操作。
除了常規文件的存取,網路網盤app還加入了筆記、小說、沖印商城等第三方合作應用,在個人服務方面更加多樣化,畢竟網路網盤已經做了很多年,也有著龐大的用戶群,在用戶體驗方面積累了更多的經驗。
除了作為存儲,網盤最大的功能特色就是分享,聯想個人雲存儲APP在分享功能上支持好友分享和鏈接分享,其中鏈接分享還支持1天和7天期限。網路的分享功能相對要全面,包括微信、朋友圈、QQ、微博,以及私密鏈接和二維碼等多種方式,同樣支持分享的有效期。
客戶端的對比方面,差別並不是很大,只是在分享方面,數據守護者相對弱一些,以及暫時不支持壓縮包的在線解壓縮等。網路網盤APP對非會員的限制比較多,比如想要在線解壓縮,需要超級會員;此外,如果用戶想要在線播放音樂、視頻,由於非會員限速問題,網路網盤的體驗要差很多。而聯想個人雲存儲,我們可以看做是「點對點」的讀取,沒有中間的轉換,所以讀取會流暢的多。
容量對比:聯想個人雲存儲最大支持10TB容量 還可擴展
以目前個人或家庭對存儲容量的需求,GB級別不夠用,但是上升到TB、數個TB的時候就足夠用了。
聯想個人雲存儲內置雙硬碟位,最大支持10TB容量,相當於可容納200萬張高清照片,或100萬首無損音樂,或1萬部高清影片。如果你是骨灰級玩家,對容量有更大的需求,那麼這款個人雲存儲還可以通過2個USB 3.0高速介面外接個人雲伴侶(磁碟陣列存儲),就能輕松擴展至128TB。正是因為採用的是物理硬碟,聯想個人雲存儲理論上可以無限擴展,但畢竟是定位家庭、個人雲存儲,能達到10TB容量需求的用戶已經極少,所以我們幾乎可以忽略空間的限制。
簡而言之,聯想個人雲存儲一次投入,容量無限。
網路網盤初始免費容量是根據完成一定任務量來決定的,普通會員提供2TB容量。需要注意的是,網路在2018年底宣布此前注冊用戶至2019年底沒有登錄過的免費用戶,將調整至100GB,超級會員可以擴展至最大5TB容量,連續包年的會員費為263元。
實際上5TB的容量對於大多用戶也足夠使用,但是卻以會員年費為代價,而且一旦不續費,您的文件可能就不再是您的文件,對功能的限制也是頗多。如果只是作為小文件的備份,比如手機圖片、辦公文檔等,網路網盤也是足夠使用。但是對於較大的文件、尤其是高清影視,無論從容量還是上傳、下載的速度等方面,並不建議使用網路網盤收藏。
所以兩者對比很明顯,聯想個人雲存儲成本更低、容量更大、並具有無限可擴展性,更是作為資料收藏的絕佳存儲方案;而網路網盤容量和功能受會員限制,具有很多不確定性,推薦存儲較小文件、臨時性文件,如果是重要資料且需要永久收藏的,就要慎重考慮網路存儲的方案。
傳輸速度比拼:聯想個人雲存儲不限速
對於大多數用戶來說,使用網盤或個人雲存儲,最多的行為就是上傳和下載文件。
首先說說網路網盤,相信所有免費用戶在使用網路網盤上傳下載文件時,都會體會到那種龜速到痛不欲生吧。不管你是百兆寬頻,還是光纖,只要不充值,網路網盤限速能限到你哭。
圖:網路網盤非會員限速
如果你存儲的文件很大,或者是朋友分享給你一個很大的文件,或者是數百張圖片,而且你還不是超級會員,那千萬不要用網盤分享,還不如用QQ發送來的快。此外,對於非會員,傳輸的文件還不能超過4GB。
圖:非會員限制不能超過4GB
但如果你是長期網盤依賴用戶,那就不妨充個超級會員,上傳和下載的速度還是有保障的。
圖:超級會員可解除限速
如果把網路網盤看作是公有雲,那麼聯想個人雲存儲就是私有雲。聯想個人雲存儲不僅能夠適應各種網路環境,包括身處海外也能輕松連接使用。上傳和下載速度方面,得益於聯想的全球網路節點支持,無論是內外網訪問或是海外訪問,聯想個人雲存儲都擁有高速上傳下載加速系統,能夠無縫連接用戶的數字生活與工作。需要說明的是,在上傳或下載時,聯想個人雲存儲最多支持5個文件多任務同時進行,單文件上傳、下載速度最快。
圖:多文件上傳時,網速被優先順序分配
圖:單文件上傳時速度最快
圖:單文件下載時速度最快
在上傳和下載的網速對比方面,聯想個人雲存儲在整個傳輸過程中不參與任何數據交換,所以文件傳輸不受限制,也就有著絕對的優勢,你的網速有多快就能上傳、下載多快。但是在使用中,我們也發現聯想個人雲存儲客戶端,暫時還不支持文件、文件夾的拖拽,只能通過一級一級的路徑選擇,相信在升級版本中會添加這一快捷功能。
安全與隱私
個人數據的安全和隱私性越來越受到人們的重視,但是存儲在公有雲上的數據,實際上是保存在人家伺服器上,盡管各家都聲稱絕不會泄露,但是誰知道呢?你把寶貝放在別人家櫃子里總是不讓人放心吧。
而聯想個人雲存儲是您的「私有雲」,所有的數據都是保存在您私人的硬碟之上,從根本上避免了公有雲端隱私泄露的問題。同時還採用SDVN技術加密傳輸,所有應用數據均在虛擬化層上傳輸,確保數據在內網或互聯網上的安全可靠,有效保護個人數據安全和隱私問題。
此外,聯想個人雲存儲設立多賬戶管理機制,一台主機多人共享的同時,還能夠設定公共空間和私密空間。通過管理員設置不同許可權,將家庭賬戶進行空間隔離,並配置加密保險箱技術,進行二次保護,管理員也無法訪問他人賬戶,方便多人共享數據的同時,又能夠保護個人數據隱私。
實際上很容易理解,保存在你個人硬碟上的數據永遠都是你的,保存在網上的資料不一定就是你的,哪怕是交了費。
體驗總結:
綜合來看,聯想個人雲存儲在更大容量、更快速度、更加私密等方面都具有無可比擬的優勢,而網路網盤僅僅是對續費的超級會員提供最多5TB容量、不限速的服務,但是在數據的私密性和安全性上,尤其上長遠來看,網路網盤還是存在不少後顧之憂。
個人雲存儲無論在數據傳輸方面、數據安全和用戶隱私方面,以及在未來智慧家居的構建上,都將逐漸成為家庭的數據中心,成為每個家庭的剛需的智能設備。所以相對於建立在公有雲上的網盤,聯想個人雲存儲可以說已經先入為主,並將主導未來。還是那句話,一次性投入,就能擁有一個永久、安全的個人數據中心。
C. 企業內網雲存儲是怎麼創建的
企業內網雲存儲的創建涉及到多個方面,首先必須對當前網路能力與容量有深刻理解,評估網路延遲的可能性。對於特定的內部雲解決方案,需融入最佳實踐以確保實施順利。在評估新技術時,考慮管理與實施的簡便性同樣重要,尤其是依賴現有團隊進行部署的場景。明確所需角色與職責分配,以及所需時間,是提高團隊整體效率的關鍵步驟。
決定企業是否適合採用雲存儲,需要細致分析。首先,評估數據中心內的數據,確定哪些數據可以遷移到雲。然後,IT人員需判斷數據以何種方式遷移至雲。簡單數據遷移可能如同復制過程,而復雜數據可能需要特定工具來保證遷移後符合政策要求。
考慮雲存儲經濟可行性也至關重要。對於對現有存儲成本敏感且風險規避的公司,外部雲可能是理想選擇。反之,對成本與風險敏感的公司可能更傾向於部署內部雲。外部雲服務基於存儲數據量和合約期限定價,而內部雲則需考慮總擁有成本,與其它內部存儲方式類似。
D. 如何建立單位內部雲存儲伺服器
看雲存儲的需求,是做雲盤,做大文件存儲,小文件存儲,或者塊讀寫等等。
開源系統就不少,自己建的話,省錢就用開源。
OpenStack裡面有Swift,是一個對象存儲,適合於存放比較小的,以對象為單位的文件。
SeaFile開源雲存儲系統平台是由國人開發的新一代的開源雲存儲系統軟體,SeaFile提供豐富的文件同步和管理功能,搭個網盤是比較方便的。
還有GlusterFS,是一個集群的文件系統,支持 PB 級的數據量。
Ceph,分布式文件系統,支持作為塊設備進行讀寫訪問。
按照教程來,搭建起來不難。當然,要深入使用,解決生產運行中的各種坑,還是需要一定時間的積累的。
我們就是選擇的Swift,然後在此基礎上開發的文檔管理系統。
E. 如何部署雲存儲
如何部署雲計算中的雲存儲?本文將從七個方面介紹,希望對大家有所幫助。 在公共雲和私有雲之間做出選擇 明確你的選擇:私有雲還是公共雲,哪種最符合你的機構呢?用最簡單的方法來描述這兩種雲:公共雲,即可以在互聯網上,存儲你的信息和運行應用程序;私有雲,是在企業內部區域網中具有以上功能,相比之下具有更大的靈活性、可控制和安全性。 全面的虛擬化策略 當你明確選擇之後,就要將更全面的虛擬化策略,選擇數據中心最恰當的位置進行部署。將計算能力和存儲資源虛擬起來是使雲計算真正運作的關鍵。業界認為首要是虛擬化的伺服器,但IT數據中心也同樣需要虛擬化存儲。反之,如果沒有雲計算,將大大降低企業在應用層上所能做的。 根據雲特點提供最佳服務 當部署了雲之後,就要知道何時使用公共雲和私有雲,以最經濟的方式,提供給終端用戶最恰當的服務。 對現有系統進行測試和研發,也許是最好的解決之道。私有雲的優勢是部署速度和安全優勢,以虛擬化技術為基礎建立的私有存儲雲,可以兼容多種伺服器和桌面虛擬化平台。如果是風險較低的商業應用,則可建立公共服務的主機上。 雲存儲的兩大好處 那麼雲存儲能帶給我們哪些好處呢?我們知道,選擇一個雲存儲環境,提供一些必要工具,諸如自動存儲分層和自動精簡配置,以應對自動化的共同復雜任務。這一切都始於虛擬存儲,它使得系統能夠在正確的存儲資源,以合適的時機,自動遷移工作量。如果沒有它,則不能運行這些先進的功能。 存儲架構選擇要謹慎 此外,確定公司的數據存儲解決方案,足以應對快速、無計劃的數據增長之需求。選擇一種存儲架構,允許在任何方向存在合理有序增減比例。先要問問自己:需要給SAN增添哪些功能?如果不僅要停機,還要加之很多工作人員的重視和維護。那麼說明,從這套系統中,也許你並沒有得到真正最佳的應用價值。 雲存儲的功能廣受業內推崇 雲存儲在業內逐步被推廣,其功能得以廣泛的認知。建立管理工具和報告功能,不可忽視SRM工具,如存儲扣款和使用准確地收益性分析。 三種環境適合採用雲存儲 以下三種環境,最適合採用雲存儲。其實也正是這些實際需求,催生了雲存儲,也為雲存儲的發展提供了可能。 首先,判定是否存在著這種相關性,就是軟硬體升級的費用和系統"無限"的可擴展性密切關聯。此時就要注意了:當系統的能力受到限制後,一些架構隱含著驚人的再次認證許可費用。例如:你是否受到軟體許可費的困擾呢?當你不得不再次增加驅動器或存儲陣列的數量,這種做法實際上已超出了邊際的最優成本。 其次,在系統維護過程中或軟硬體重新配置時,確認存儲環境是否在線、數據是否可用。包括軟硬體,所有的存儲系統有可能隨時需要升級。當更新時,一定要知道在系統上會產生哪些影響。 最後,如果選擇數據和災難備份產品,如自動讓快照和復制。但要提醒的是,提防一些隱性成本,如帶寬要求。它可能限制一些快照的次數或復制(即每次都要更改或整個復制的容量)。
F. 如何通過智能路由搭建家庭存儲中心
智能路由器+移動硬碟的優點和不足
智能路由器+移動硬碟,這個方案最大的優勢自然是省錢。不過,總讓人覺得不太「專業」,實際上,不少智能路由器已經對存儲方案進行了優化,像迅雷離線下載,幾乎是每個智能路由器的標配。而在文件共享方面,這一方案主要取決於智能路由器的固件或插件對於文件共享的支持程度如何。
隨著雲存儲重要性的提升,大多數智能路由器也在這方面進行了改善,這樣,文件多平台共享、遠程操作等也都可以實現。當然,這一方案也存在不足,即其傳輸速率略顯不足,尤其在在使用中低端智能路由器時。由於路由處理器的性能較低,文件傳輸速度在5MB/s甚至更低,這樣的速度,在面對多設備訪問或者有高碼率的高清視頻播放需求時,還是略顯不足。所以,有這方面需求的用戶,在使用這一方案時要注意。
智能路由+移動硬碟方案組建難度不高
如果只從硬體角度考慮,智能路由器+移動硬碟方案實現起來非常簡單,只需要將移動硬碟插入智能路由器的USB介面,頂多在供電不足時,考慮外接供電就可以了。而在移動設備端,一般只需要安裝路由的應用或是ES文件管理器這樣的第三方管理器,就可以順利訪問移動硬碟上的內容。但由於各種路由器設置有所差異,我們很難統一說清各種智能路由器的共享設置。但一般來說,只要在智能路由器的設置中,找到文件共享選項,並設置硬碟上的共享目錄就可以了,操作起來是比較簡單的。
注意散熱性和移動硬碟的介面
要用移動硬碟構建家庭雲存儲中心,除了基本的路由功能外,智能路由器還必須擁有USB介面,才能接入移動硬碟。當然,我們還要注意智能路由器是否在固件或插件上提供對存儲和文件共享的支持,以減少搭建家庭雲存儲中心時的波折。另外,智能路由器的散熱也必須重點考慮,要知道,在接上移動硬碟並開啟文件共享後,路由處理器的負載將加重,從而導致路由器發熱量增加,對於那些只要溫度一高,穩定性就立馬降低甚至死機的路由器來說,那可是不可承受之重。當然,從智能路由器的官方信息,我們難以得知其散熱表現,但我們可以在電商網站或者產品論壇,看看使用者對其評價如何,尤其是在夏季時,是否有網友反映其頻繁死機等,這樣就可以粗略得知某款智能路由器的散熱設計能力。
雖然從搭建家庭雲存儲中心的角度考慮,USB2.0埠並非性能瓶頸,但考慮到USB3.0介面的移動硬碟價格已與USB 2.0介面的相差無幾,且移動硬碟往往有獨立使用的需求,因此現階段購買移動硬碟,還是優選USB3.0介面的。如果家裡有USB2.0介面的硬碟,就放心使用吧,它不會成為系統瓶頸的。
當然,這也不是說家庭雲系統對移動硬碟全無要求,實際上,不少家庭雲存儲都是7×24小時工作,這就要求移動硬碟有良好的散熱和穩定性。在這種情況下,選擇使用鋁合金外殼的移動硬碟或選擇品牌移動硬碟,更有利於讓移動硬碟長時間工作。
G. 數據湖系列之二 | 打造無限擴展的雲存儲系統,元數據存儲底座的設計和實踐
海量數據的存儲挑戰與解決方案
在數據湖存儲系統中,元數據面作為核心底層系統,直接決定了系統的擴展性。本文旨在揭秘雲存儲系統的元數據面存儲底座,探討如何設計支撐無限擴展的存儲容量。
隨著互聯網、物聯網和AI技術的發展,數據量呈指數級增長,預測未來全球數據量將從33ZB增長至175ZB。雲存儲系統的擴展性面臨巨大挑戰。
雲存儲系統由數據面和元數據面構成,數據面用於存儲用戶數據,元數據面存儲數據對應的元信息。元數據面的擴展性直接影響整個存儲系統的性能。
TafDB是網路滄海·存儲的統一元數據底座,支撐網路智能雲對象存儲和文件系統元數據存儲,提供萬億級元數據規模和千萬級QPS的存儲能力,滿足海量數據湖存儲的擴展性需求。
本文首先介紹元數據面技術的演進趨勢,從層級和平坦命名空間兩類技術架構入手。
層級命名空間適用於文件系統,支持文件和目錄操作,而平坦命名空間則適用於對象存儲。隨著對HDFS語義的支持,對象存儲也開始支持層級命名空間。
接著,本文詳細闡述層級命名空間的技術演進,包括文件屬性、目錄樹結構等元數據信息的維護,以及支持的文件操作。
平坦命名空間主要存儲對象文件塊的位置信息,通過分布式事務資料庫解決擴展性問題。當前主流方案如AWS、Google的對象存儲,元數據分別存放在Dynamodb和Spanner。
通過分析命名空間技術演進,可以發現分布式事務資料庫在解決擴展性問題上具有優勢,能夠支持層級和平坦命名空間,滿足萬億級元數據底座需求。
本文深入探討元數據底座的技術選型,分析分布式事務資料庫流派,最終決定自主研發一套類Spanner架構的資料庫作為元數據底座,以適應網路滄海·存儲的元數據場景。
TafDB面向元數據場景設計,作為網路滄海·存儲統一的元數據底座,支撐網路智能雲對象存儲BOS和文件存儲CFS的元數據存儲,提供萬億級別元數據規模、千萬級別QPS的元數據存儲能力。
TafDB系統架構基於RocksDB實現單機存儲,Multi Raft協議保障副本數據一致性。該系統解決了元數據操作ACID的同時降低分布式事務開銷、提供高性能寫操作的同時保證范圍查詢性能、以及消除數據流程單點,提供極致擴展性和可用性。
實現上述功能的分布式事務資料庫系統面臨挑戰,主要包括ACID保證下的性能開銷、范圍查詢性能優化和數據流程的單點消除。本文通過優化事務處理、垃圾數據管理、分布式時鍾方案和多維度系統統計,解決了這些挑戰,實現了高性能、高擴展性和高可用性的元數據存儲系統。
TafDB在文件系統Namespace存儲中應用,實現線性擴展,降低延遲,滿足傳統應用及AI場景的需求。在對象存儲Namespace存儲中,單Bucket容量提升至萬億級別,顯著提升圖片類業務的上傳和下載體驗。
TafDB通過優化設計和實現,提供了一套功能完備、性能卓越的元數據存儲系統,簡化了多套系統帶來的復雜性,滿足了海量數據存儲和處理的需求。