海量數據如何存儲的
『壹』 自動駕駛下的海量數據,業界如何安全高效存儲
近幾年來,各行業紛紛跨界加入造車行列,不說傳了多年要造車的國外手機巨頭、出資純電動汽車的科技互聯網大廠,國內的科技企業也在躍躍欲試,比如阿里巴巴、華為、網路、小米和滴滴出行。
除了這些高科技企業,還有小馬智行、文遠知行、AutoX、贏徹科技和主線科技等新興的自動駕駛初創企業;超星未來、奧特貝睿、宏景智駕等專注於私家車高階自動駕駛研發的新型一級供應商;以及純電動車起家的蔚來,小鵬,理想等造車新勢力,都紛紛加入汽車產業鏈,推動了汽車電動化和智能化的進程。
西部數據資深產品市場經理額日特
也正是這些新玩家的加入,使得傳統汽車產業鏈受到了前所未有的壓力,同時也推動了傳統汽車廠商加速新技術和新應用的落地。在西部數據資深產品市場經理額日特看來,隨著汽車智能網聯的不斷推進,汽車的電子電氣架構(E/E)也隨之變化,從最初的分布式架構向域融合和中央控制單元過渡。
輪子上的智能手機,對存儲架構提出更多要求
如今,不少人業內人士都認可汽車在向“輪子上的智能手機”演變,這個轉變,讓廠商開始將越來越多的攝像頭、雷達、激光雷達等感測器、電動機,甚至乙太網、人工智慧等技術都引入汽車。
額日特認為,更多感測器的引入,網聯技術、人工智慧技術的增加,以及汽車電子電氣架構的改變,對汽車內存儲產品的要求發生了很大的變化。
“在汽車存儲領域,單車存儲的 數量將會顯著降低,容量則會顯著提升 。”額日特在不久前廣州舉辦的Auto Tech 2021上演講時指出。
Counterpoint的報告也印證了這一點,該分析機構預計,未來十年內,汽車單車的存儲容量將會達到2TB左右。“目前車內存儲主要用在智能座艙和中控系統,且燃油車以32GB為主,電動汽車一般使用64GB,或128GB,相對於2TB來說,還有一個巨大的提升空間。”額日特表示。
他分析稱,為了應對汽車電動化、智能化、網聯化,及自動化方向的發展,存儲產品也面臨這很多挑戰,主要有四個比較重大的挑戰:
一是數據 的可靠性 和 安全性 ,這是存儲廠商所面臨最基本和最嚴苛的挑戰,也是相關法規及保險責任靠量的關鍵因素。因為對於自動駕駛來說,數據的可靠性和安全性意味著生命的安全。
存儲廠商在數據可靠性和安全性方面也做了不少工作,額日特拿e.MMC、UFS和SSD來說,存儲單元是由兩個部分組成的,一部分是存儲介質Raw NAND,另一部分是控制器和固件。
為了保證更好的TBW(Total Bytes Written),即產品生命周期里能承受的總寫入數據量,存儲廠商一般都會 通過控制器和固件對底層做一個讀寫均衡 。“TBW通俗地講就是耐擦寫,意思是NAND Flash是有壽命的,如果數據手冊里規定了NAND Flash的擦寫次數是3,000次,客戶就需要考量該TBW是否滿足自己的應用需求。”
還有一個是主機鎖定 ,即在汽車主機上焊上一個內存,加了主機鎖的內存放到另外一個主機上是沒有用的,因為它已經與原來的主機做了鎖定,這樣也可以確保數據的安全。
另外,防寫也是一個很重要的功能 ,比如汽車如果出事故了,有的用戶擔心數據會被汽車廠商篡改,“我們存儲廠商在與主機廠商、Tier 1企業一起共同努力,協商一個有效的協同保護機制,確保車輛在發生事故後,在警察沒有查看數據之前,沒有任何一家,包括內存廠商都無法篡改存儲器內的數據,以確保司法監管在調查的時候的公正性和嚴肅性。”額日特表示。
二是復雜的應用場景 ,隨著電子電氣架構向域及中央控制單元轉變,應用的融合對存儲的要求也變得更加復雜,不再是單一的讀或寫。比如導航是一個讀密集型操作,行車記錄儀是一個寫密集型操作。
特別是隨著電子電氣架構的改變,融合中央控制單元的使用,使得內存需要承受更加復雜的操作系統環境。比如高通的8155平台把智能座艙、數字儀表和中控融合到了一起,此時就需要使用Hypervisor,以允許多個操作系統和應用共享同一個硬體。 但實際上,現在的內存結構,只能做到邏輯分區,不能做到物理分區。
“舉一個簡單的例子,我們現在所使用的電腦有C盤、D盤、或者E盤,實際上C、D、E盤只是邏輯分區,底層的內存是沒有做到物理分區的,這些盤存儲的數據都是打散存儲在一塊內存里,不論是哪個盤壞掉,代表的就是整個內存檔都壞了。”額日特指出。
因此,這就會帶來一個問題,比如行車記錄儀是一個需要高擦寫支持的應用,如果把行車記錄儀也融合到智能座艙內的話,做起來很容易。但要是不做物理分區,由於行車記錄儀的高擦寫,可能整個內存很快就會壞掉。
為了適應這個改變,也為了數據的更加安全,“西部數據現在可以提供一種解決方案,那就是在底層做讀寫均衡的隔離,比如 一塊內存裡面,可以分別使用 TLC 和S LC 兩種N AND F lash ,由於SLC可以支持高擦寫,因此,SLC部分就可以作為行車記錄儀的存儲。”額日特表示。
三是海量數據存儲 ,為了適應自動駕駛的需求,越來越多的雷達和攝像頭被部署在汽車上,行車過程中會產生大量的數據。
特別是自動駕駛計程車的企業對數據的存儲容量需求是很大的,現在單車一天生成的數據量在8GB左右,但實際上,現在主流汽車的存儲容量在2GB到4GB之間。
額日特以西部數據與Waymo的合作為例,西部數據在Waymo自動駕駛計程車上安裝了10塊2TB的工業級SSD,也就是說Waymo的單車存儲容量要求是20TB。其實這也是大部分自動駕駛汽車的存儲需求。
四是高性能, 雷達和攝像頭會在行車過程中產生大量的數據,為了防止數據丟失,必然需要高性能、大帶寬存儲的支持。
其實存儲產品也在通過不停地創新來獲得更高的傳輸速率。在嵌入式存儲器方面,目前汽車領域使用的主流存儲產品是e.MMC,比e.MMC更快的是UFS產品,目前汽車領域主要採用的還是UFS2.1。實際上,消費類電子已經在大規模採用UFS3.0的產品了。額日特預計汽車級UFS3.1的產品,應該會在兩年內面市。
另外,在SSD方面,目前汽車領域的SSD主要還是採用SATA介面,未來帶寬更高、速度更快的NVMe介面的SSD產品也可能會在汽車上得到應用。使用SSD的好處就是容量可以做得更大,比如UFS介面能做到的最大容量可能是512GB,但SSD可以輕松做到4TB、8TB,甚至更大。
滿足汽車需求的解決方案
據額日特介紹,西部數據可以提供從端到雲的完整解決方案,以支持當前和未來的車輛系統要求,它為多樣的應用場景和數據中心,提供了小尺寸嵌入式終端存儲和可移動存儲,用於獲取和分析從車輛收集的大量數據。他特意強調,西部數據的汽車級快閃記憶體產品通過了IATF16949認證,符合AEC-Q100標准。
產品方面,有iNAND汽車級嵌入式存快閃記憶體檔(EFD),支持UFS和e.MMC介面,具有多種容量,採用11.5×13mm的小包裝,可為汽車OEM和一級供應商提供符合其需求的選擇。比如iNAND AT EU312 是一款基於 3D NAND 技術的汽車級UFS(通用快閃記憶體存儲),具有高數據傳輸速度的UFS 2.1介面和額外的UFS 3.0汽車功能,可提供最高256GB的容量,性能是前代基於e.MMC的產品的2.5倍。AT EU312利用第5代SmartSLC 技術,可提供高性能和可靠的寫入。
其e.MMC 嵌入式快閃記憶體檔基於e.MMC 5.1 標准,採用2D或3D NAND技術。具體產品有EM122已經獲得許多汽車設計的認證並投入生產,EM132在汽車市場中容量達到了256GB。
在PCIe SSD方面,有CL SN720和CL SN520等產品,採用了PCIe Gen3 NVMe介面,容量高達2TB,耐久性高達1600 TBW。
與合作夥伴的成功案例
在本次Auto Tech 2021展會上,西部數據不僅展示了自己家的汽車存儲解決方案,也帶來了合作夥伴的一些成功案例。
有為信息展示的“主動安全智能防控車載視頻終端K5-P”解決方案。
在車載監控方面,其合作夥伴有為信息展示了“主動安全只能防控車載視頻終端K5-P”解決方案,該解決方案支持ADAS、DSM只能監控,採用了記錄儀、視頻功能、主動安全功能一體化設計。同時支持硬碟(2.5” HDD)+ SD卡(西部數據WD Purple micro SD存儲卡),雙重存儲保證數據安全;且具有硬碟防震保護機制;此外,有為信息的專利的存儲介質保護裝置,可防止任意拆卸硬碟及插拔存儲卡。加上其獨特流媒體文件系統存儲方式,保證了數據安全不被篡改。
車載信息娛樂系統方面,其合作夥伴掌銳展示了“前裝車規模組”解決方案------CS199 MT8666AV模組,該模組基於聯發科 MT8666AV晶元封裝的前裝車規級帶4G通信模組,具有功能豐富,集成度高、尺寸小、低功耗、性能優、品質穩定的特點,可滿足汽車智能化、連網化的前裝需求,幫助客戶縮短項目開發周期,減少研發投入並降低品控風險。存儲方面,採用的是西部數據iNAND AT EM132產品,是汽車市場首個基於3D TLC NAND e.MMC介面產品,採用了標准BGA封裝,容量涵蓋了從32GB到256GB,具有快速啟動、自動刷新、增強型運行健康狀態監測,支持固件在線升級和100%預燒錄,有AEC-Q100溫度2級(-40°C 至105°C)和3級(-40°C至85°C)兩種選擇。
銥斯電子展示的智能駕駛輔助系統解決方案。
此外,西部數據現場還展示了採用iNAND AT EM122的智能駕艙、智能駕駛、以及車聯網等豐富的解決方案。
西部數據公司中國區嵌入式產品銷售部門銷售總監文芳女士
西部數據公司中國區嵌入式產品銷售部門銷售總監文芳表示:“車聯網、自動駕駛等新技術的商業化落地,對汽車新四化的發展起到了巨大的推動作用,同時也對車載存儲解決方案的安全性、可靠性、大容量、高性能以及復雜的場景應用提出了更嚴苛的要求。西部數據作為數據基礎架構的領導者,提供覆蓋8GB-18TB容量,包括e.MMC/UFS/micro SD/SSD/HDD等不同規格的車規級及企業級存儲產品,支持端-邊-雲新型數據架構在汽車領域的應用,滿足當前和未來單車智能及車路協同的多樣化需求。”
未來,西部數據將不斷突破創新,以卓越的產品及解決方案賦能汽車領域的改革與發展,為人們帶來更安全、優質的駕駛體驗。
結語
近年來,汽車行業正在經歷前所未有的變革,自動駕駛不斷發展,高清3D地圖、高級輔助駕駛系統(ADAS)、自主計算機、AI、大數據、增強型信息娛樂系統、無線更新、以及V2X技術等等逐步在汽車上得到普及,而這些功能都需要板載數據存儲,未來汽車的存儲需求將會越來越大,如何滿足汽車市場的特殊需求,是存儲企業必須要考慮的,抓住汽車市場,就意味著抓住了未來。
轉載自電子發燒友 @2019
『貳』 海量數據存儲有哪些方式與方法
1、容量可線性擴展,單名字空間達EB級,2、海量小文件存儲,百億級文件高效訪問,3、中心靈活部署,容災匯聚分發更便捷,4、支持大數據和AI,統一數據存儲和分析,你可以問下瑞馳信息技術,做數據存儲很專 業,技術很牛的。希望我的回答能解決到你的問題
『叄』 海量數據存儲與管理
正如上述,在國土資源遙感綜合調查信息中,既包含有多源、多時相、多尺度、多解析度、多類型的遙感圖像數據和基礎地理數據,也包括在項目開展過程中衍生的許多觀測和分析資料,數據量十分龐大。因此,根據數據共享的要求,在數據生產、管理、應用服務以及更新和維護過程中,如何組織和管理好這些海量數據,如何快速、全面有效地訪問和獲得所需數據,成為面臨的突出問題。在這里,採用何種方式利用現有的大型商業化關系資料庫系統高效地存儲與管理這些數據,成為能否發揮系統最大性能的關鍵所在。
傳統的GIS系統對空間數據(與空間位置、空間關系有關的數據)的存儲與管理大多採用這些商業軟體特定的文件方式,如:ArcInfo的Coverage、MapInfo的Tab、MAPGIS的WL等。如果數據量越多,這些文件就會越大,數據的處理就會越復雜,其存儲、檢索、管理也就越困難,而且其最大的缺點還在於不能進行多用戶並發操作。由此可見,用以往傳統的存儲機制去管理像遙感綜合調查這樣的海量數據,顯然難以滿足要求。而近年來發展起來的空間資料庫引擎技術則是解決海量數據存儲管理的途徑之一。
本系統建設過程中,採用了空間資料庫引擎ArcSDE+大型關系資料庫Oracle組合技術,較理想地實現了遙感綜合調查海量數據的存儲、檢索、查詢、處理。眾所周知,Oracle提供了大型資料庫環境,能夠很好地處理海量數據,而ArcSDE可將具有地理特徵的空間數據和非空間數據統一載入到Oracle中去,因此,通過ArcSDE空間資料庫引擎,可將Oracle海量數據管理功能載入到GIS系統中,並可利用Oracle的強大管理機制進行高效率的事務處理、記錄鎖定、並發控制等服務操作。
『肆』 海量數據存儲
存儲技術經歷了單個磁碟、磁帶、RAID到網路存儲系統的發展歷程。網路存儲技術就是將網路技術和I/O技術集成起來,利用網路的定址能力、即插即用的連接性、靈活性,存儲的高性能和高效率,提供基於網路的數據存儲和共享服務。在超大數據量的存儲管理、擴展性方面具有明顯的優勢。
典型的網路存儲技術有網路附加存儲NAS(Network Attached Storage)和存儲區域網SAN(Storage Area Networks)兩種。
1)NAS技術是網路技術在存儲領域的延伸和發展。它直接將存儲設備掛在網上,有良好的共享性、開放性。缺點是與LAN共同用物理網路,易形成擁塞,而影響性能。特別是在數據備份時,性能較低,影響在企業存儲應用中的地位。
2)SAN技術是以數據存儲為中心,使用光纖通道連接高速網路存儲的體系結構。即將數據存儲作為網路上的一個區域獨立出來。在高度的設備和數據共享基礎上,減輕網路和伺服器的負擔。因光纖通道的存儲網和LAN分開,使性能得到很大的提高,而且還提供了很高的可靠性和強大的連續業務處理能力。在SAN中系統的擴展、數據遷移、數據本地備份、遠程數據容災數據備份和數據管理等都比較方便,整個SAN成為一個統一管理的存儲池(Storage Pool)。SAN存儲設備之間通過專用通道進行通信,不佔用伺服器的資源。因此非常適合超大量數據的存儲,成為網路存儲的主流。
3)存儲虛擬化技術是將系統中各種異構的存儲設備映射為一個單一的存儲資源,對用戶完全透明,達到互操作性的目的和利用已有的硬體資源,把SAN內部的各種異構的存儲資源統一成一個單一視圖的存儲池,可根據用戶的需要方便地切割、分配。從而保持已有的投資,減少總體成本,提高存儲效率。
存儲虛擬化包括3個層次結構:基於伺服器的虛擬化存儲、基於存儲設備的虛擬化存儲和基於網路的虛擬化存儲。
1)基於伺服器的虛擬化存儲由邏輯管理軟體在主機/伺服器上完成。經過虛擬化的存儲空間可跨越多個異構的磁碟陣列,具有高度的穩定性和開放性,實現容易、簡便。但對異構環境和分散管理不太適應。
2)基於存儲設備的虛擬化存儲,因一些高端磁碟陣列本身具有智能化管理,可以實現同一陣列,供不同主機分享。其結構性能可達到最優。但實現起來價格昂貴,可操作性差。
3)基於網路的虛擬化存儲,通過使用專用的存儲管理伺服器和相應的虛擬化軟體,實現多個主機/伺服器對多個異構存儲設備之間進行訪問,達到不同主機和存儲之間真正的互連和共享,成為虛擬存儲的主要形式。根據不同結構可分為基於專用伺服器和基於存儲路由器兩種方式。①基於專用伺服器的虛擬化,是用一台伺服器專用於提供系統的虛擬化功能。根據網路拓撲結構和專用伺服器的具體功能,其虛擬化結構有對稱和非對稱兩種方式。在對稱結構中數據的傳輸與元數據訪問使用同一通路。實現簡單,對伺服器和存儲設備的影響小,對異構環境的適應性強。缺點是專用伺服器可能成為系統性能的瓶頸,影響SAN的擴展。在非對稱結構中,數據的傳輸與元數據訪問使用不同通路。應用伺服器的I/O命令先通過命令通路傳送到專用伺服器,獲取元數據和傳輸數據視圖後,再通過數據通路得到所需的數據。與對稱結構相比,提高了存儲系統的性能,增加了擴展能力。②基於存儲路由器的SAN虛擬化,存儲路由器是一種智能化設備,既具有路由器的功能,又針對I/O進行專門優化。它部署在存儲路由器上,多個存儲路由器保存著整個存儲系統中的元數據多個副本,並通過一定的更新策略保持一致性。這種結構中,因存儲路由器具有強大的協議功能,所以具有更多的優勢。能充分利用存儲資源,保護投資。能實現軟硬體隔離,並輔有大量的自動化工具,提高了虛擬伺服器的安全性,降低對技術人員的需求和成本。