當前位置:首頁 » 存儲配置 » 遙感數據存儲

遙感數據存儲

發布時間: 2023-03-18 12:47:04

1. 什麼是遙感數據源

數據源(Data Source)顧名思義,數據的來源,是提供某種所需要數據的器件或原始媒體。在數據源中存儲了所有建立資料庫連接的信息。因此一切遙感數據獲取的感測器,其採集到的數據都叫遙感數據源。

遙感是指非接觸的,遠距離的探測技術。一般指運用感測器/遙感器對物體的電磁波的輻射、反射特性的探測,遙感影像我們可通過遙感集市雲服務平台免費下載或訂購的方式獲取。

2. 一文了解遙感衛星影像處理及其發展趨勢

當空中的遙感衛星獲取了地球數字影像,並傳回地面,是否工作就結束了?答案顯然是否定的,相反, 這正是遙感數字圖像處理工作的開始

遙感數字圖像 (Digital image,後簡稱「遙感影像」)是數字形式的遙感圖像,地球表面不同區域和地物能夠反射或輻射不同波長的電磁波,利用這種特性,遙感系統可以產生不同的遙感數字圖像。

讓其與一般的數字圖像,也就是我們平時拍攝的電子照片拉開距離的,是遙感影像的 成像范圍與精細度 。遙感衛星的攝影區域是地球級的宏觀維度,影像中的每個像素都對應著三維真實世界中的某幾個、某個或某部分地物實體,根據衛星成像解析度的不同,其中一個像素就有可能是一棵樹、一輛車或是一幢大樓的某個窗戶。

所以,圖像每個像素點的亮度值(DN值,Digital Number)都有著重要的信息意義,要獲取其中的准確信息,用戶需要根據自身應用目標,對衛星影像中的像素進行管理、轉換、校正、增強、提取一系列的「神操作」,便於後續深入挖掘與業務融合應用。

DN值(Digital Number ):遙感影像像元亮度值,記錄地物的灰度值。無單位,是一個整數值,值大小與感測器的輻射解析度、地物發射率、大氣透過率和散射率等相關,反映地物的輻射率(Radiance)。

我們可以回到「P圖界」進行比喻,為了讓自己的社交媒體形象更加完美,我們打開某圖秀秀軟體,美白、瘦身、磨皮、祛痘....當然,遙感影像的數據處理復雜專業多了,到什麼地步呢?它可以被寫成 一本教科書 ——

今天,我們就來了解一下,這其中到底有哪些「神操作」,又如何應用?以及在遙感產業飛速發展的今天,高頻的數據產出、演算法和人工智慧的沖擊,會否讓這些「神操作」的傳統模式和底層邏輯,發生變革?

01、 什麼是遙感影像處理?

遙感影像處理,是利用 計算機圖像處理系統 遙感圖像中的像素 進行系列操作的過程。

遙感影像中包含著很多信息,通過數字化(成像系統的采樣和量化、數字存儲)後,才能有效地進行信息分析和內容提取。在此基礎上,對影像數據進行處理「再加工」,如校正圖形對齊坐標、增強地物輪廓,能夠極大地 提升圖像處理的精度和信息提取的效率, 這個過程都可以稱為「遙感數字圖像處理」。

作為「對地觀測」過程的一個基本而重要的組成部分,在衛星應用產業鏈中,遙感影像處理環節處於中下游、承前啟後的重要位置,前端承接衛星地面設施,後端面向農林、氣象、自然資源等行業具體的業務應用,提供「就緒」的數據服務或工具。

02、 為什麼遙感影像處理是應用的「必經之路」?

在我們看到整齊美觀的谷歌地球這類數字地球產品,或是遙感衛星應用在自然資源管理、環保、農業、氣象等領域的專題圖或解譯圖,都需要經過影像處理的中間「洗禮」。

因為遙感衛星在高空「作業」,其成像環境復雜程度遠遠超越我們日常地面的拍照環境,會遇到感測器不穩定,地球曲率、大氣條件、光照變化、地形變化等系統與非系統因素造成的圖形幾何變形、失真、模糊、噪點等。遙感數據中心對圖像進行去除條帶、幾何粗校正等初步處理,數據到達各終端用戶手中時,還需要對數據做進一步的精細處理,使其更加接近真實世界的實體空間環境與坐標,並根據其自身業務分析目標,進行專業處理,為接下來的遙感影像分析、解譯、業務應用做好准備。

總的來說,遙感影像處理的主要目標為以下三點:

圖像校正 :恢復、復原圖像。在進行信息提取前,必須對遙感圖像進行校正處理,以使影像能夠正確地反映實際地物信息或物理過程。

圖像增強 :壓抑或去除圖像雜訊。為使遙感圖像所包含的地物信息可讀性更強,感興趣目標更突出、容易理解和判讀,需要對整體圖像或特定地物信息進行增強處理。

信息提取 :根據地物光譜特徵和幾何特徵,確定不同地物信息的提取規則,在此基礎上,利用該規則從校正後的遙感數據中提取各種有用的地物信息。

03、 遙感數據處理有哪些功能?

完整的遙感數字圖像處理包含了硬體系統和軟體系統兩大部分,遙感數據存儲量龐大,需要大容量數字存儲設備與軟體共同配合存儲處理,這里主要介紹軟體處理部分。下面展示的是一個專業的圖像處理軟體界面,與常用的辦公軟體相比,圖像處理系統的各個功能顯得比較分散,各個菜單之間的聯系不緊密。

從某種意義上看,圖像處理系統更像一個圖像處理綜合 工具箱 ,由於圖像處理目標不同,用戶可以調用某個功能、某幾項功能的組合,並非所有流程都選用。這里將一些典型的處理功能進行歸納,並對基礎步驟進行介紹。

數字存儲與管理

遙感影像本身內存較大,1景7波段的landsat遙感影像至少有200MB,而高光譜影像可能達到1GB;而進入時間與空間雙重高分時代以來,數據高頻產出與累積,也促使遙感進入大數據時代,讓遙感雲服務、存儲管理、快速分發共享趨勢愈加明顯。基於私有雲、混合雲的遙感影像數字存儲、在線更新、管理檢索、發布瀏覽,已經逐步成為與遙感數據處理不可分割的重要基礎,並將大幅度提升後續遙感影像專業處理與業務應用效率。

影像預處理

輻射校正(Radiometric Correction)

指對由於外界因素,數據獲取和傳輸系統產生的系統的、隨機的輻射失真或畸變進行的校正,消除或改正因輻射誤差而引起影像畸變的過程。

簡單概括,就是 去除感測器或大氣「雜訊」 ,更准確地表示地面條件, 提高圖像的「保真度」 ,主要是恢復數據缺失、去除薄霧,或為鑲嵌和變化監測做好准備。

輻射校正在動態監測中的作用 :在多時相遙感圖像中,除了地物的變化會引起圖像中輻射值的變化外,不變的地物在不同時相圖像中的輻射值也會有差異。如果需要利用多時相遙感圖像的光譜信息對地物變化狀況進行動態監測,首要消除不變地物的輻射值差異。

通過相對輻射校正,將一圖像作為參考(或基準)圖像,調整另一圖像的DN值,使得兩時相圖像上同名的地物具有相同的DN值,這個過程也叫 多時相遙感圖像的光譜歸一化 。這樣就可以通過分析不同時相遙感圖像上的輻射值差異來實現變化監測,從而完成 地物動態變化的遙感動態監測

幾何校正(Geometric correction)

遙感成像過程中,因攝影材料變形、物鏡畸變、大氣折光、地球曲率、地球自轉、地形起伏等因素導致的綜合影響,原始圖像上地物的幾何位置、形狀、大小、尺寸、方位等特徵與其對應的地面地物的特徵往往是不一致的,這種不一致為幾何變形,也稱幾何畸變。幾何校正就是通過一系列的數學模型來改正和消除這種幾何畸變,使其定位準確。

幾何校正原理示意:真實世界的地形是立體而凹凸不平的,但遙感衛星感測器只能獲取平面二維像素,這就帶來了地形扭曲 | 圖源:網路;重製圖:超擎時空


圖像增強

圖像對比度增強 (Image Contrast Enhancement)

統計每幅圖像的各亮度的像元數而得到的隨機分布圖,即為該幅圖像的直方圖。 一般來說,包含大量像元的圖像,像元的亮度隨機分布應是正態分布。直方圖為非正態分布,說明圖像的亮度分布偏亮、偏暗或亮度過於集中,圖像的對比度小,需要調整該直方圖到正態分布,以改善圖像的質量,並便於分辨地物輪廓並提取信息。

彩色合成

為了充分利用色彩在遙感圖像判讀和信息提取中的優勢,常利用彩色合成的方法對多光譜圖像進行處理,以得到彩色圖像。如上圖,彩色圖像可以分為真彩色圖像和假彩色圖像。

密度分割

將灰度圖像按照像元的灰度值進行分級,再分級賦以不同的顏色,使原有灰度圖像變成偽彩色圖像,達到圖像增強的目的。

圖像運算

兩幅或多幅單波段圖像,空間配准後可進行算術運算,實現圖像的增強。根據地物在不同波段的灰度差異,通過不同波段的代數運算產生新的「波段」,常見的有加法運算、減法運算、比值運算和綜合運算,如:

減法運算:可突現出兩波段差值大的地物,如紅外-紅,可突現植被信息。
比值運算:常用於計算植被指數、消除地形陰影等。
植被指數:NDVI=(IR-R)/(IR+R)

圖像融合

遙感圖像信息融合是有效提升圖像解析度與信息量的手段,將多源遙感數據在統一的地理坐標系中,採用一定的演算法生成一組新的信息或合成圖像的過程。

不同的遙感數據具有不同的空間解析度、波譜解析度和時相解析度,將低解析度的多光譜影像與高解析度的單波段影像重采樣生成一副高解析度多光譜影像遙感的圖像處理技術,使得處理後的影像既有較高的空間解析度,又具有多光譜特徵。

圖像裁剪

在遙感實際應用中,用戶可能只對遙感影像中的一個特定的范圍內的信息感興趣,這就需要將遙感影像裁減成研究范圍的大小。常用的裁剪方式有,按ROI(興趣區域)裁剪、按文件裁剪(按照指定影像文件的范圍大小)、按地圖裁剪(根據地圖的地理坐標或經緯度的范圍)。

圖像鑲嵌

也叫圖像拼接,是將兩幅或多幅數字影像(它們有可能是在不同的攝影條件下獲取的)拼在一起,構成一幅整體圖像的技術過程。 通常是先對每幅圖像進行幾何校正,將它們規劃到統一的坐標系中,然後對它們進行裁剪,去掉重疊的部分,再將裁剪後的多幅影像裝配起來形成一幅大幅面的影像。

鑲嵌勻色

將若干幅互為鄰接的遙感影像通過拼接勻色技術合並成一幅統一的新影像。

信息提取

遙感圖像中目標地物的特徵是地物電磁波的輻射差異在遙感影像上的反映。依據遙感圖像上的地物特徵,識別地物類型、性質、空間位置、形狀、大小等屬性的過程即為遙感信息提取。

目視判讀

也叫人工解譯,即用人工肉眼與經驗判讀遙感影像,對遙感影像上目標地物的范圍進行手工勾繪,達到信息提取的目的。人工解譯為傳統常用的信息提取辦法,但在海量影像下判讀分析效率相對低。

圖像分類

是依據是地物的光譜特徵,確定判別函數和相應的判別准則,將圖像所有的像元按性質分為若干類別的過程,主要方式分為監督分類與非監督分類。

- 監督分類

監督分類是在分類前人們已對遙感影像樣本區中的類別屬性有了先驗知識,進而可利用這些樣本類別的特徵作為依據建立和訓練分類器(亦即建立判別函數),進而完成整幅影像的類型劃分,將每個像元歸並到相對應的一個類別中去。

監督分類也是目前遙感AI最為常見的應用方式,即通過樣本庫,用機器學習對特定地物進行分類、標注或識別。

- 非監督分類

非監督分類也稱聚類分析,是指人們事先對分類過程不施加任何的先驗知識,而僅憑數據(遙感影像地物的光譜特徵的分布規律)、即自然聚類的特性進行「盲目」的分類;是以集群為理論基礎,通過計算機對圖像進行集聚統計分析的方法,是模式識別的一種方法。一般演算法有:回歸分析、趨勢分析、等混合距離法、集群分析、主成分分析和圖形識別等。

監督分類和非監督分類的區別 :有監督必須有訓練集與測試樣本。在訓練集中找規律,而對測試樣本使用這種規律;非監督沒有訓練集,只有一組數據,在該組數據集內尋找規律。

04、 遙感數據處理正在發生怎樣的改變?

遙感數據處理更像是生產製造中的「原材料粗加工」環節,也是遙感影像數據智能應用和業務融合的前序手段,從前文的介紹來看,其過程也是較為復雜和專業的。

作為對地觀測和遙感產業化的重要組成部分,位於產業中下游的遙感數據處理,也受到了大數據時代的沖擊,正在響應這一趨勢並發生變革,走向 實時化、標准化、規模化、自動化

在企業數字化轉型中,人們常說的一句話是,所有傳統產業都值得用數字化再做一遍,在傳統的數據生產、信息服務產業也是如此,其模式和流程都值得用演算法和AI再做一遍。

當演算法與人工智慧逐步滲透遙感數據處理這個環節,能夠解決遙感產業數據生產服務中的很多難題,例如數據分發周期與鏈路長,處理環節多,海量數據處理的精準、一致性等問題,這我們可以將其視為「自動化批量處理」。

當中游演算法引擎解決了數據服務和數據計算效率和自動化流程的問題後,下游也將出現更多適用於各種垂直細分場景的精細化應用數據產品,而在以上介紹的遙感影像信息提取環節,有了AI和演算法的參與,也出現很多高效的自動化功能,如目標識別、地物提取、地物分類、變化檢測等,逐步幫助人類提高解譯的效率,形成遙感產業下游的「智能化信息挖掘」機制。

我們可以看到,從遙感數據獲取源頭,到數據處理,到終端應用,其效率與底層數據模式密不可分,在衛星互聯網和對地觀測 星座 逐步構建成型的趨勢下,只有將數據的獲取、處理和共享流程標准化,大規模、自動化、流水化的遙感產業才能更好地地為政企數字化轉型發揮動能,也真正地迎來時空大數據時代。

參考資料

《遙感數字影像處理教程》韋玉春 湯國安 楊昕 編著

3. BSPBILBIP如何進行多波段遙感影像的存儲

多波段數據的存儲方式主要有3種。
分別是:逐波段存儲BSQ、逐行存儲BIL、逐像元存儲BIP。
逐波段存儲就是將一個波段的數據存儲在一起,這樣的話對於要一次性讀取一個波段的操作較好,可是要是每次操作都涉及到幾個波段的數據,這樣的存儲方法就對內存的佔用比較大。也就是說逐波段存儲對處理空間信息有利。逐像元存儲將一個像元的數據先存儲起來,然後再存儲其他像元的數據,也就是說同一個像元的光譜信息被存在了一個連續的地址,這樣對於操作像元光譜信息頻繁的操作來說十分方便快捷。逐行存儲是一種介於逐波段存儲和逐像元存儲的方法,它將各通道的每一行存儲在一起,具體來說,就是存好了1通道的第1行,接著2通道的第1行,然後3通道的第1行,等等,當第1行都存儲完畢就去存儲第2行的數據。

4. 遙感影像的三種主要格式定義

遙感圖像包括多個波段,有多種存儲格式,但基本的通用格式有三種,即BSQ、BIL和BIP格式。

1、BSQ(band sequential)是像素按波段順序依次排列的數據格式。即先按照波段順序分塊排列,在每個波段塊內,再按照行列順序排列。同一波段的像素保存在一個塊中,這保證了像素空間位置的連續性。

2、BIL(band interleaved by line)格式中,像素先以行為單位分塊,在每個塊內,按照波段順序排列像素。同一行不同波段的數據保存在一個數據塊中。像素的空間位置在列的方向上是連續的。

3、BIP(band interleaved by Pixel)格式中,以像素為核心,像素的各個波段數據保存在一起,打破了像素空間位置的連續性。保持行的順序不變,在列的方向上按列分塊,每個塊內為當前像素不同波段的像素值。

(4)遙感數據存儲擴展閱讀

各類遙感圖像都存在在幾何校正的問題。由於人們已習慣使用正射投影的地形圖,因此對各類遙感影像的畸變都必須以地形圖為基準進行幾何校正。幾何校正大致如下:

①選擇控制點:在遙感圖像和地形圖上分別選擇同名控制點,以建立圖像與地圖之間的投影關系,這些控制點應該選在能明顯定位的地方,如河流交叉點等。

②建立整體映射函數:根據圖像的幾何畸變性質及地面控制點的多少來確定校正數學模型,建立起圖像與地圖之間的空間變換關系,如多項式方法、仿射變換方法等。

③重采樣內插:為了使校正後的輸出圖像像元與輸入的未校正圖像相對應,根據確定的校正公式,對輸入圖像的數據重新排列。在重采樣中,由於所計算的對應位置的坐標不是整數值,必須通過對周圍的像元值進行內插來求出新的像元值。

5. 數字圖像的存儲格式

遙感數據以磁帶、光碟等為存儲介質,由一個或多個文件組成,每個文件又以若干個記錄組成。記錄是作為一個單位來處理的一組相連的數據,分為物理記錄和邏輯記錄; 文件是由若干個邏輯記錄構成的在目的、形式和內容上彼此相似的信息項的集合。邏輯記錄的排列方式決定了文件的結構方式,加之不同的輔助說明信息而構成了不同的遙感數據格式。對於遙感數字圖像而言,它必須以一定的格式存儲,才能有效地進行分發和利用。

多波段圖像具有空間的位置和光譜的信息。多波段圖像的數據格式根據在二維空間的像元配置中如何存儲各種波段的信息可分為四類。

1. BSQ,BIL,BIP 格式

BSQ ( Band Sequential) 格式,又稱為波段序貫格式,在一個遙感數據文件內各像元DN 值相當於以 「波段」 為主要關鍵字、以 「行」 為次要關鍵字、以 「列」 ( 像元號) 為第三關鍵字對像元 DN 值進行排序存放。

BIL ( Band Interleaved by Line) 格式,又稱為波段行交叉格式,在一個遙感數據文件內各像元 DN 值相當於以 「行」為主要關鍵字、以 「波段」為次要關鍵字、以 「列」( 像元號) 為第三關鍵字對像元 DN 值進行排序存放。

BIP ( Band Interleaved by Pixels) 格式,又稱為波段像元交叉格式,在一個遙感數據文件內各像元 DN 值相當於以 「行」為主要關鍵字、以 「列」 ( 像元號) 為次要關鍵字、以 「波段」為第三關鍵字對像元 DN 值進行排序存放。

上述遙感數據基本格式具有不同的特點和適用范圍。BSQ 格式最適合於對單個波段的整個或部分圖像空間區域進行存儲和讀取等處理操作,如圖像對比度增強、平滑、銳化等; BIP 格式為圖像數據單個像元波譜特性的存儲與讀取提供最佳性能,如在最大似然比分類法、波段之間的加減乘除代數運算等亦宜採用該格式; BIL 方式具有以上兩種方式的中間特徵,提供了圖像空間和像元波譜處理之間的一種折中的方式,適用於以行 ( 圖像掃描行) 為單位的處理操作,如水平方向的線性影像特徵增強處理等。

2. Fast - L7A 格式

該格式是美國 EDC 在沿用了以往 Landsat 數據產品快速格式的基礎上而選用的記錄Landsat-7 / ETM + 數據的格式之一。Fast - L7A 格式的數據由 3 個頭文件及 8 個數據文件組成,3 個頭文件對應 Landsat-7 數據的三個波段組: 全色波段組、可見光及近紅外波段組、熱紅外波段組; 8 個數據文件對應 Landsat-7 數據的 8 個波段。

3 個頭文件中,每個頭文件包含 3 個 1536 位元組的記錄,分別是管理記錄、輻射記錄和幾何記錄,它們記錄了產品標識信息、圖像標識信息、輻射校正系數、地圖投影、地球模型、太陽高度角和方位角等圖像數據輔助信息。8 個數據文件中,每個文件僅含一個波段的數據而不含頭尾記錄,圖像數據按行順序排列,並以 8 bit 無符號整數表示。

3. GeoTIFF 格式

GeoTIFF 是包含地理信息的一種 TIFF 格式的文件。GeoTIFF 格式的數據由 1 個頭文件及相應的數據文件組成。其頭文件與 Fast - L7A 頭文件相似,8 個數據文件分別對應於Landsat-7 數據的 8 個波段數據。

4. HDF 格式

HDF ( Hierarchical Data Format,層次數據格式) 是由美國伊利諾伊大學 ( the Univer-sity of Illinois) 的國家超級計算應用中心 ( The National Center for Supercomputing Applica-tions,NCSA) 於 1987 年研製開發的一種軟體和函數庫,它使用 C 語言和 Fortran 語言編寫,是一種超文本文件格式,能夠存儲不同種類的科學數據,包括圖像、多維數組、指針及文本數據。HDF 格式還提供命令方式,分析現存 HDF 文件的結構,並即時顯示圖像內容。科學家可以用這種標准數據格式快速熟悉文件結構,擺脫不同數據格式之間相互轉換的繁瑣,而將更多的時間和精力用於數據管理和分析。目前,在國外各種衛星感測器上,已經廣泛使用了這種標准數據格式,如 Landsat-7,EOS - TERRA,EOS - AQUA 等。

在物理存儲結構上,一個 HDF 文件包括一個文件頭 ( File Header) ,一個或多個描述塊 ( Data Descriptor Block) ,若干個數據對象 ( Data Object) 。文件頭位於 HDF 文件的頭四個位元組,其內容為四個控制字元的 ASCII 碼值,四個控制字元為 N,C,S,A,可用於判斷一個文件是否為 HDF 文件格式。數據對象是 HDF 文件最基本的存儲元素,包括一個描述符和一個對應的數據元素。描述符長度為 12 個位元組,主要用來描述這個數據元素的數據類型、位置偏移量、數據元素位元組數。在實際的 HDF 文件中,描述符並不是和它對應的數據元素連在一起,而是把相關的許多描述符放在一起而構成一個描述塊,在這個塊的後面順序存儲了各個描述符所對應的數據元素。數據元素是數據對象中的裸數據部分,也就是數據本身,可以是字元、整數、浮點數、數組等。

1993 年美國航空航天局 ( NASA) 把 HDF 格式作為存儲和發布 EOS ( Earth Observa-tion System,對地觀測系統) 數據的標准格式,此後又在 HDF 標準的基礎上共同開發了一種專門化的 HDF 格式———HDF - EOS,專門用於處理各種 EOS 產品。HDF - EOS 使用標準的 HDF 數據類型定義了點、條帶、網格這三種特殊數據類型,並且引入了元數據( Metadata) ,簡化了空間數據的訪問過程,提高了科學研究和用戶對 EOS 數據的訪問速度。

遙感技術被應用以來,遙感數據採用過很多格式,以 Landsat-7 衛星的數據產品為例,該數據產品由美國地球觀測系統數據中心 ( EDC) 提供,按照產品處理級別可分為 三類,即 Level 0R,Level 1R 和 Level 1G。三種產品的定義如下 :

Level 0R: 未經輻射校正和系統級幾何校正的數據產品。

Level 1R: 經過輻射校正但未經系統級幾何校正的數據產品。

Level 1G: 經過輻射校正和系統級幾何校正的數據產品。

EDC 的各類產品所採用的數據格式共有三種,分別是 HDF,Fast - L7A 和 GeoTIFF,產品類型和數據格式之間的對應關系見表 4-1。

表 4-1 Landsat-7 數據產品類型及數據格式

在遙感數據中,除圖像信息以外還附帶有各種注記信息。這是提供數據結構在進行數據分發時,對存儲方式用注記信息的形式來說明所提供的格式。以往曾使用多種格式,但從 1982 年起逐漸以世界標准格式的形式進行分發。因為這種格式是由 Landsat TechnicalWorking Group 確定的,所以也稱 LTWG 格式。世界標准格式具有超結構 ( Super Struc-ture) 的構造,在它的描述符、文件指針、文件說明符的三種記錄中記有數據的記錄方法。其圖像數據部分為 BSQ 方式或 BIL 方式。

6. 基礎資料庫

(一)數據內容

基礎資料庫包括系統運行前所採集到的所有支撐數據,數據的具體內容在數據分類與數據源章節中已描述,概括可分為以下幾類。

(1)遙感影像數據:包括歷史圖像數據,以及按照一定監測周期更新的遙感圖像數據。

(2)數字線劃圖數據:矢量數據(現狀專題圖和歷史專題圖數據)、柵格數據、元數據等。入庫前數據以ArcInfoCoverage格式分幅或整體存儲,採用地理坐標系統。

(3)數字柵格圖數據:包括1∶5萬和1∶10萬基礎地理圖形數據的掃描柵格數據。

(4)數字高程模型數據:塔里木河幹流河道1∶1萬和「四源一干」區域1∶10萬數字高程模型。

(5)多媒體數據:考察照片、錄像、錄音和虛擬演示成果等多媒體資料。

(6)屬性數據:社會經濟與水資源數據、水利工程數據、生態環境數據等。

(二)數據存儲結構

1.柵格數據

柵格數據包括遙感影像、數字柵格圖、數字正射影像圖、數字高程模型等,這些數據的存儲結構基本類似,因此可進行統一設計。遙感圖像資料庫與普通的圖像資料庫在存儲上有些差別,遙感圖像作為感測器對地理、空間環境在不同條件下的測量結果(如光譜輻射特性、微波輻射特性),必須結合同時得到的幾個圖像才可以認為是對環境在一定的時間條件下的完整的描述,也即是說,可能需要一個圖像集合才能構成一個圖像的完整的概念,並使之與語義信息產生聯系(羅睿等,2000)。因此,遙感圖像數據存儲結構模型必須能夠描述幾個圖像(波段)之間的邏輯關系。利用ArcSDE進行數據入庫時,系統可自動建立各圖像(波段)之間的關系,並按一定規則存儲在資料庫系統中。

對柵格數據在後台將採用Oracle資料庫管理系統進行存儲。Oracle系統可直接存儲影像信息,並具有較強的數據管理能力,可以實現柵格數據信息的快速檢索和提取。數據引擎採用ArcSDE,實現各類影像數據的入庫。數據存儲的關鍵是建立圖幅索引,本系統數據的存儲按圖幅號、圖名、採集時間等內容建立索引。

柵格數據依據圖形屬性一體化的存儲思想,採用大二進制格式直接存儲數據,這種方式的存儲可實現內容的快速檢索查詢,按索引表檢索出相關項後可直接打開柵格數據,提高柵格數據的管理效率。

2.矢量數據

本系統採用圖屬一體化思想即將空間數據和屬性數據合二為一,全部存在一個記錄集中的思想存儲空間數據,是目前GIS數據非常流行的存儲方法。考慮到數據的具體情況,決定採用資料庫存儲空間數據和屬性數據,部分具有少量、定型幾何信息的地理要素如水文測站、河流、湖泊等,採用圖屬一體化思想存儲其信息,而與其有關聯關系的大量、多邊化的屬性信息如水文信息,則存儲在屬性數據表中,利用唯一標識符信息建立兩表的關聯。

針對本系統空間數據的特點,系統按照「資料庫—子庫—專題(基礎數據)—層—要素—屬性」的層次框架來構築空間資料庫,按照統一的地理坐標系統來存儲空間數據,以實現對地理實體/專題要素進行分層疊加顯示。

3.多媒體數據

Oracle系統可直接存儲圖片和視頻信息,並具有較強的數據管理能力,可以實現多媒體信息的快速檢索和提取。多媒體數據存儲的關鍵是建立索引表,本系統多媒體數據的存儲按類型、時間、內容等項目建立索引,直接存儲於Oracle資料庫中。

多媒體數據存儲時,可以將多媒體內容與索引表結構合為一體,採用大二進制格式直接存儲,這種存儲方式可實現內容的快速檢索和查詢,按索引表檢索出相關項後可直接打開多媒體內容,而且多媒體資料庫也便於維護管理。

(三)空間索引設計

1.矢量空間索引

確定合適的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度就低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率低。每一個數據層可採用不同大小、不同級別的空間索引格網單元,但每層級數最多不能超過三級。索引方式設置遵循以下基本原則:

(1)對於簡單要素的數據層,盡可能選擇單級索引格網,減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程;

(2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網;

(3)如果用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查詢范圍的1.5倍;

(4)格網的大小不能小於要素封裝邊界的平均大小。為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取要素封裝邊界平均大小的3倍;

(5)格網單元的大小不是一個確定性的問題,需要多次嘗試和努力才會得到好的結果。有一些確定格網初始值的原則,用它們可以進一步確定最佳的格網大小。

SDE(Spatial Data Engine,即空間數據引擎),從空間管理的角度看,是一個連續的空間數據模型,可將地理特徵的空間數據和屬性數據統一集成在關系型資料庫管理系統中。關系型資料庫系統支持對海量數據的存儲,從而也可實現對空間數據的海量存儲。空間數據可通過層來進行數據的劃分,將具有共同屬性的一類要素放到一層中,每個資料庫記錄對應一層中一個實際要素,這樣避免了檢索整個數據表,減少了檢索的數據記錄數量,從而減少磁碟輸入/輸出的操作,加快了對空間數據查詢的速度。

ArcSDE採用格網索引方式,將空間區域劃分成合適大小的正方形格網,記錄每一個格網內所包含的空間實體(對象),以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網號,就可以快速檢索到所需的空間實體。因此確定合適的格網級數、單元大小是建立空間格網索引的關鍵,太大或太小均不合適,這就需要進行多次嘗試,確定合適的網格大小,以保證各單元能均勻落在網格內。利用ArcSDE的索引表創建功能,記錄每一網格單元的實體分布情況,形成圖層空間索引表。根據空間索引表,ArcSDE實現了對空間數據的快速查詢。

2.柵格數據空間索引

柵格數據的空間索引通過建立多級金字塔結構來實現。以高解析度柵格數據為底層,逐級抽取數據,建立不同解析度的數據金字塔結構,逐級形成較低解析度的柵格數據。該方法通常會增加20%左右的存儲空間,但卻可以提高柵格數據的顯示速度。在資料庫查詢檢索時,調用合適級別的柵格數據,可提高瀏覽和顯示速度。

(四)入庫數據校驗

入庫數據的質量關繫到系統評價分析結果的准確性。數據在生產中就需要嚴格進行質量控制。依據數據生產流程,將數據質量控制分成生產過程式控制制和結果控制。生產過程式控制制包括數據生產前期的質量控制、數據生產過程中的實時質量控制,結果質量控制為數據生產完成後的質量控制(裴亞波等,2003)。對入庫數據的校驗主要是進行數據生產完成後的質量控制和檢查。

1.規范化檢查

(1)代碼規范化:所有地理代碼盡量採用國家標准和行業標准,例如,行政代碼採用中華人民共和國行政區劃代碼國標。

(2)數據格式規范化:所有數據採用標准交換數據格式,例如,矢量數據採用標准輸出Coverage格式和E00格式。

(3)屬性數據和關系數據欄位規范化:所有屬性數據和關系數據提前分門別類地設計欄位的內容、長短和格式,操作過程中嚴格執行。

(4)坐標系統規范化:本系統所有與空間有關的數據採用統一的空間坐標系統,即地理坐標系統。

(5)精度規范化:所有數據按照數據精度與質量控制中所要求的精度進行採集和處理。

(6)命名規范化:所有數據按照命名要求統一命名,便於系統的查詢。

(7)元數據規范化:依照元數據標准要求,進行元數據檢查。

2.質量控制

數據質量是GIS成敗的關鍵。對於關系型資料庫設計,只要能保證表的實體完整性和參照完整性,並使之符合關系資料庫的三個範式即可。對於空間資料庫設計,則不僅要考慮數據采樣、數據處理流程、空間配准、投影變換等問題,還應對數據質量做出定量分析。

數據質量一般可以通過以下幾個方面來描述(吳芳華等,2001):

(1)准確度(Accuracy):即測量值與真值之間的接近程度,可用誤差來衡量;

(2)精度(Precision):即對現象描述得詳細程度;

(3)不確定性(Uncertainty):指某現象不能精確測得,當真值不可測或無法知道時,就無法確定誤差,因而用不確定性取代誤差;

(4)相容性(Compatibility):指兩個來源不同的數據在同一個應用中使用的難易程度;

(5)一致性(Consistency):指對同一現象或同類現象表達的一致程度;

(6)完整性(Completeness):指具有同一準確度和精度的數據在類型上和特定空間范圍內完整的程度;

(7)可得性(Accessibility):指獲取或使用數據的容易程度;

(8)現勢性(Timeliness):指數據反映客觀現象目前狀況的程度。

塔里木河流域生態環境動態監測系統的所有數據在數據質量評價後,還需要從數據格式、坐標一致性等方面進行入庫質量檢驗,只有通過質量檢驗的數據才可以入庫。

3.數據檢驗

空間數據質量檢驗包括以下步驟:

(1)數據命名是否規范,是否按設計要求命名;

(2)數據是否能夠正常打開;

(3)投影方式是否正確;

(4)坐標系統是否正確;

(5)改錯是否完成,拓撲關系是否建立;

(6)屬性數據是否正確,包括欄位設置是否依據設計進行、是否有空屬性記錄、是否有屬性錯誤記錄等。

關系數據質量檢驗包括以下步驟:

(1)數據命名是否規范,是否按設計要求命名;

(2)數據是否能夠正常打開;

(3)數據欄位是否按設計要求設置;

(4)是否有空屬性記錄;

(5)是否有屬性錯誤記錄。

屬性數據的校驗,主要採用以下三種方式:

(1)兩次錄入校驗:對一些相互之間毫無關聯的數據,進行兩次的錄入,編寫程序對兩次錄入的結果進行比較,找出兩次錄入結果不一樣的數據,查看正確值,進行改正。

(2)折線圖檢驗:對一些相互之間有關聯的序列數據,如人口統計數據,對這一類數據,編寫程序把數據以折線圖的形式顯示在顯示器上,數據的序列一般都有一定規律,如果出現較大的波動,則需對此點的數據進行檢查修改。

(3)計算校驗:對一些按一定公式計算後所得結果與其他數據有關聯的數據,如某些數據的合計等於另一數據,編寫程序對這類數據進行計算,計算結果與有關聯的數據進行比較,找出結果不一樣的數據,查看正確值,進行改正。

圖形數據的校驗,主要包括以下步驟(陳俊傑等,2005):

(1)圖層校驗:圖形要素的放置圖層是唯一的。對於入庫的Coverage數據,系統將根據圖層代碼進行檢查,確保圖形要素對層入座。

(2)代碼檢查:圖形要素的代碼是唯一的。對於入庫的Coverage數據,系統將根據入庫要素代碼與特徵表中的代碼進行比較,確保入庫數據代碼存在,杜絕非法代碼入庫。

(3)類型檢查:對入庫的數據,檢查該要素的類型與特徵表中的類型是否一致,確保圖形要素對表入座。如點要素、線要素、面要素僅能賦相應的點、線、面代碼,且該代碼必須與特徵表中的數據類型代碼相同。

(4)范圍檢查:根據入庫的數據,確定該類要素的大體范圍(如X、Y坐標等),在數據入庫前,比較入庫數據與范圍數據的大小,若入庫數據在該范圍內,則入庫,否則給出提示檢查信息。

(五)數據入庫

1.遙感影像數據

利用空間數據引擎———ArcSDE可實現遙感影像數據在Oracle資料庫中的存儲和管理,在影像數據進行入庫時,應加入相應的索引和影像描述欄位。

遙感影像入庫步驟:

(1)影像數據預處理:要將塔里木河遙感影像資料庫建成一個多解析度無縫影像資料庫系統,客觀上要求資料庫中的影像數據在幾何空間、灰度空間連續一致。因此,在數據採集階段就需要對影像數據進行預處理,包括圖像幾何校正、灰度拼接(無縫鑲嵌)、正射處理、投影變換等。

幾何校正的目的是使校正後的圖像重新定位到某種地圖投影方式,以適用於各種定位、量測、多源影像的復合及與矢量地圖、DTM等的套合顯示與處理。幾何校正多採用二次多項式演算法和圖像雙線性內插重采樣法進行圖像校正。將糾正後具有規定地理編碼的圖像按多邊形圈定需要拼接的子區,逐一鑲嵌到指定模版,同時進行必要的色彩匹配,使整體圖像色調一致,完成圖像的幾何拼接,再採用金字塔影像數據結構和「從粗到精」的分層控制策略實現逐級拼接。

數字正射影像具有統一的大地坐標系、豐富的信息量和真實的景觀表達,易於製作具有「獨立於比例尺」的多級金字塔結構影像。可以採用DTM和外方位元素經過數字微分糾正方法,獲得數字正射影像,它的基本參數包括原始影像與正射影像的比例尺、采樣解析度等(方濤等,1997)。

投影變換需根據資料庫系統定義的標准轉換到統一的投影體系下。

(2)影像數據壓縮:隨著感測器空間解析度的提高和對遙感信息需求的日益增長,獲取的影像數據量成幾何級數增大,如此龐大的數據將佔用較大的存儲空間,給影像的存儲和傳輸帶來不便(葛詠等,2000)。目前,系統處理的遙感影像數據已達數百千兆,單個文件的影像數據最大達到了2G,這樣的數據量在調用顯示時速度很慢,對影像數據進行壓縮存儲,將大大提高影像訪問效率。本系統採用ArcSDE軟體提供的無損壓縮模式對入庫影像進行壓縮。

(3)影像導入:遙感影像的入庫可通過ArcSDE或入庫程序進行導入,並填寫相關的索引信息,在入庫時對大型的遙感影像數據進行自動分割,分為若乾的塊(tiles)進行存儲。

(4)圖像金字塔構建:採用ArcSDE提供的金字塔構建工具在入庫時自動生成圖像金字塔,用戶只需要選擇相應的參數設置即可。圖像金字塔及其層級圖像按解析度分級存儲與管理。最底層的解析度最高,並且數據量最大,解析度越低,其數據量越小,這樣,不同的解析度遙感圖像形成了塔式結構。採用這種圖像金字塔結構建立的遙感影像資料庫,便於組織、存儲與管理多尺度、多數據源遙感影像數據,實現了跨解析度的索引與瀏覽,極大地提高了影像數據的瀏覽顯示速度。

2.數字線劃圖

對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和拼接存儲的數字矢量圖,就可以進行圖形數據入庫。

(1)分幅矢量圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。

(2)拼接矢量圖形數據:按圖形比例尺、製作時間、圖層等方式,通過入庫程序導入到資料庫中,同時導入與該地理信息相對應的屬性信息,建立空間信息與屬性信息的關聯。

3.柵格數據

對紙圖數字化、配准、校正、分層及拼接等處理後,生成標准分幅和整體存儲的數字柵格圖,然後進行圖形數據入庫。

(1)分幅柵格圖形數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。

(2)整幅柵格圖形數據:按比例尺、製作時間等方式,通過入庫程序導入到資料庫中。

4.數字高程模型

(1)分幅數字高程模型數據、圖幅接合表:按圖形比例尺、圖幅號、製作時間等方式,通過入庫程序導入到資料庫中。

(2)拼接數字高程模型數據:按比例尺、製作時間等方式通過入庫程序導入到資料庫中。

5.多媒體數據

多媒體數據入庫可根據多媒體資料庫內容的需要對入庫數據進行預處理,包括音頻、視頻信息錄制剪接、文字編輯、色彩選配等。對多媒體信息的加工處理需要使用特定的工具軟體進行編輯。由於音頻信息和視頻信息數據量巨大,因此,對多媒體數據存儲時需採用數據壓縮技術,現在的許多商用軟體已能夠直接存儲或播放壓縮後的多媒體數據文件,這里主要考慮根據數據顯示質量要求選擇採用不同的存儲格式。圖4-2為各類多媒體數據的加工處理流程。

圖4-2 多媒體數據加工處理流程圖

6.屬性數據

將收集的社會經濟、水利工程、生態環境等屬性資料,進行分析整理,輸入計算機,最後經過程序的計算處理,存儲到資料庫中,具體流程如圖4-3所示。

圖4-3 屬性數據入庫流程圖

熱點內容
內置存儲卡可以拆嗎 發布:2025-05-18 04:16:35 瀏覽:336
編譯原理課時設置 發布:2025-05-18 04:13:28 瀏覽:378
linux中進入ip地址伺服器 發布:2025-05-18 04:11:21 瀏覽:612
java用什麼軟體寫 發布:2025-05-18 03:56:19 瀏覽:32
linux配置vim編譯c 發布:2025-05-18 03:55:07 瀏覽:107
砸百鬼腳本 發布:2025-05-18 03:53:34 瀏覽:944
安卓手機如何拍視頻和蘋果一樣 發布:2025-05-18 03:40:47 瀏覽:741
為什麼安卓手機連不上蘋果7熱點 發布:2025-05-18 03:40:13 瀏覽:803
網卡訪問 發布:2025-05-18 03:35:04 瀏覽:511
接收和發送伺服器地址 發布:2025-05-18 03:33:48 瀏覽:372