[GIS教程] 6.1空間資料採集與處理具體步驟
資料採集
空間資料採集的方法
野外資料採集
- 平板測量:獲取的是非數字化資料 雖然現在已不是GIS野外資料獲取的主要手段,但由於它的成本低、技術容易掌握,少數部門和單位仍然在使用
- 全野外數字測圖 全野外空間資料採集與成圖分為三個階段:資料採集、資料處理、地圖資料輸出。
- 空間定位測量
地圖數字化
- 手扶跟蹤數字化
- 掃描向量化
攝影測量方法
【垂直攝影】航測上規定當主軸線與鉛垂線方向的夾角小於3°時
【立體攝影測量方法】攝影測量通常採用立體攝影測量方法採集某一地區空間資料
- 對同一地區同時攝取兩張或多張重疊的像片
- 在室內的光學儀器上或計算機內恢復它們的攝影方位,重構地形表面,即把野外的地形表面搬到室內進行觀測
- 航測上對立體覆蓋的要求是當飛機沿一條航線飛行時相機拍攝的任意相鄰兩張像片的重疊度(航向重疊)不少於55%-65%,在相鄰航線上的兩張相鄰像片的旁向重疊應保持在30%。
遙感影象處理方法
屬性資料採集的方法
- 從相關部門的觀測、測量資料
- 各類統計資料
- 專題調查資料
- 文獻資料資料
- 遙感影象解譯
資料來源
國家資源與環境資訊系統規範在“專業資料分類和資料專案建議總表”中,將資料分為社會環境、自然環境和資源與能源三大類共14小項,並規定了每項資料的內容及基本資料來源
- 社會環境資料
- 城市與人口
- 交通網
- 行政區劃
- 地名
- 文化和通訊設施
- 自然環境
- 地形資料
- 海岸及海域資料
- 水系及流域資料
- 基礎地質資料
- 資源與能源
- 土地資源相關資料
- 氣候和水熱資源相關資料
- 生物資源相關資料
- 礦產資源相關資料
- 海洋資源相關資料
屬性資料的分類
我國《國土基礎地理資訊資料分類與程式碼》(GB/T 13923-1992)
- 將地球表面的自然和社會基礎資訊分為9個大類 分別為測量控制點、水系、居民地、交通、管線與垣柵、境界、地形與土質、植被和其他類
- 在每個大類下又依次細分為小類、一級和二級類
資料編碼方案的制定
- 層次分類編碼法:按照分類物件的從屬和層次關係為排列順序的一種程式碼 【優點】能明確表示出分類物件的類別,程式碼結構有嚴格的隸屬關係
- 多源分類編碼法(獨立分類編碼法)指對於一個特定的分類目標,根據諸多不同的分類依據分別進行編碼,各位數字程式碼之間並沒有隸屬關係
資料編輯
圖形資料編輯
空間資料採集過程中,人為因素是造成圖形資料錯誤的主要原因
【錯誤型別】
- 偽節點(Pseudo Node)
- 懸掛節點(Dangling Node)
- 碎屑多邊形(Sliver Polygon)
- 不正規的多邊形(Weird Polygon)
- 規則的人為物件(柵格、立方體元)
- 其他錯誤:遺漏某些實體、重複錄入某些實體、圖形定位錯誤
【檢查方法】
- 疊合比較法
- 目視檢查法
- 邏輯檢查法
屬性資料編輯
【屬性資料校核】
- 屬性資料與空間資料是否正確關聯,標識碼是否唯一,不含空值
- 屬性資料是否準確,屬性資料的值是否超過其取值範圍等
【檢查方法】
- 首先可以利用邏輯檢查,檢查屬性資料的值是否超過其取值範圍,屬性資料之間或屬性資料與地理實體之間是否有荒謬的組合
- 把屬性資料打印出來進行人工校對,這和用校核圖來檢查空間資料準確性相似
資料處理
數學基礎變換
幾何糾正
【原因】由於如下原因,使掃描得到的地形圖資料和遙感資料存在變形,必須加以糾正
- 地形圖的實際尺寸發生變形
- 在掃描過程中,工作人員的操作會產生一定的誤差,如掃描時地形圖或遙感影像沒被壓緊、產生斜置或掃描引數的設定不恰當等
- 遙感影像本身就存在著幾何變形
- 地圖圖幅的投影與其它資料的投影不同,或需將遙感影像的中心投影或多中心投影轉換為正射投影等
- 掃描時受掃描器幅面大小的影響,有時需將一幅地形圖或遙感影像分成幾塊掃描
地形圖的糾正方法
- 四點糾正法:一般是根據選定的數學變換函式,輸入需糾正地形圖的圖幅行、列號、地形圖的比例尺、圖幅名稱等,生成標準圖廓,分別採集四個圖廓控制點座標來完成
- 逐網格糾正法:是在四點糾正法不能滿足精度要求的情況下采用的。這種方法和四點糾正法的不同點就在於取樣點數目的不同,它是逐方里網進行的,也就是說,對每一個方里網,都要採點
遙感影像的糾正
一般選用和遙感影像比例尺相近的地形圖或正射影像圖作為變換標準,選用合適的變換函式,分別在要糾正的遙感影像和標準地形圖或正射影像圖上採集同名地物點。
座標變換
【座標變換的實質】是建立兩個空間參考系之間點的一一對應關係
投影變換
投影變換必須已知變換前後的兩個空間參考的投影引數,然後利用投影公式的正解和反解演算法,推算變化前後兩個空間參考系之間點的一一對應函式關係
【評價】投影變換是座標變換中精度最高的變換方法
仿射投影
【仿射變換】是在不同的方向上進行不同的壓縮和擴張,可以將球變為橢球,將正方形變為平行四邊形,如下圖圖所示
相似變換
【相似變換】是由一個圖形變換為另一個圖形,在改變的過程中保持形狀不變(大小可以改變)。在二維座標變換過程中
- 平移:是將圖形的一部分或者整體移動到笛卡爾座標系中另外的位置
- 旋轉
- 縮放:縮放操作可用於輸出大小不同的圖形
橡皮拉伸
【橡皮拉伸縮】通過座標幾何糾正來修正缺陷 主要針對幾何變形,通常發生在原圖上 它們可能由於在地圖編繪中的配準缺陷、缺乏大地控制或其它各種原因產生
柵格資料重取樣
【重取樣】是柵格資料空間分析中處理柵格解析度匹配問題的常用資料處理方法 【問題背景】進行空間分析時,用來分析的資料資料由於來源不同,經常要對柵格資料進行何糾正、旋轉、投影變換等處理,在這些處理過程中都會產生重取樣問題
最鄰近像元法
直接取與P(x,y)點位置最近像元N的值作為該點的取樣值,即:I(P)=I(N)
N為最近點,其座標值為:
xN = INT(x + 0.5)
yN = INT(y + 0.5)
INT表示取整
雙線性插值法
雙三次卷積法
當推廣到雙三次多項式時,採用分塊方式,每一分塊可以定義出一個不同的多項式曲面,當n次多項式與其相鄰分塊的邊界上所有n-1次導數都連續時,稱之為【樣條函式】
資料重構
【資料重構】
- 資料結構的轉換 通用的空間資料結構有柵格和向量兩種,在地理資訊系統中,它們之間的相互轉換是經常性的
- 資料格式轉換 GIS在其發展過程中,出現了很多研究機構和企業,它們所使用的資料格式往往不盡相同。為了實現相互之間的資料和資源共享,需要對資料格式進行轉換。
資料結構的轉換
向量資料 轉 柵格資料
柵格資料 轉 向量資料
- 從圖幅西北角開始,按順時針或逆時針方向,從起始點開始,根據八個鄰域進行搜尋,依次跟蹤相鄰點,找出線段經過的柵格
- 將柵格(i,j)座標變成直角座標(X,Y)
- 生成拓撲關係,對於矢量表示的邊界弧段,判斷其與原圖上各多邊形的空間關係,形成完整的拓撲結構,並建立與屬性資料的聯絡
- 去除多餘點及曲線圓滑:常用的演算法有線性疊代法、分段三次多項式插值法、正軸拋物線平均加權法、斜軸拋物線平均加權法、樣條函式插值法等
資料格式轉換
【資料交換的模式大致有四種】
- 外部資料交換模式
- 直接資料訪問模式
- 資料互操作模式
- 空間資料共享平臺模式
【資料轉換分為三類】
- 分層和編碼原則都不同的資料轉換
- 分層不同,編碼原則相同的資料轉換
- 分層不同,編碼方案完全一致的資料轉換
【空間資料格式轉換的途徑有】
- 外部檔案交換方式 GIS產商轉成自己軟體的外部檔案,再進行轉換
- 標準空間資料交換方式 不同的GIS產商轉成中間的交換格式,再進行轉換
- 空間資料互操作方式 Open GIS的思想是實現不同GIS軟體系統之間空間資料的互操作 不同的GIS廠商提供轉換成自己的標準API函式
- 基於語義資料轉換方式 基於語義層次上的空間資料轉換,除了資料結構的轉換外,更重要的是對語義資料模型的轉換和操作,更注重資料所蘊含的知識背景。語義轉換模型與傳統資料轉換有很大的不同
圖幅拼接
幾何接邊
【幾何裂縫】指由資料檔案邊界分開的一個地物的兩部分不能精確地銜接 --> 幾何接邊
邏輯接邊
【問題】邏輯裂縫:同一地物地物編碼不同或具有不同的屬性資訊,如公路的寬度,等高線高程等 --> 邏輯接邊
【邏輯接邊】
- 檢查同一地物在相鄰圖幅的地物編碼和屬性值是否一致,不一致,進行人工編輯。
- 將同一地物在相鄰圖幅的空間資料在邏輯上連在一起。
拓撲生成
點線拓撲關係的建立
- 在圖形採集和編輯中實時建立,此時有兩個檔案表,一個記錄結點所關聯的弧段,一個記錄弧段兩端點的結點
- 在圖形採集與編輯之後,系統自動建立拓撲關係。在執行過程中逐漸建立弧段與起終結點和結點關聯的弧段表。
多邊形拓撲關係的建立
【多邊形的三種情況】
- 獨立多邊形:它與其他多邊形沒有共同邊界,如獨立房屋,這種多邊形可以在數字化過程中直接生成,因為它僅涉及一條封閉的弧段
- 具有公共邊界的簡單多邊形,在資料採集時,僅輸入了邊界弧段資料,然後用一種演算法自動將多邊形的邊界聚合起來,建立多邊形檔案
- 巢狀的多邊形,除了要按第二種方法自動建立多邊形外,還要考慮多邊形內的多邊形
網路拓撲關係的建立
確定結點與弧段之間的拓撲關係,其方法與建立多邊形拓撲關係時相似,只是不需要建立多邊形。但在一些特殊情況下,兩條相互交叉的弧段在交點處不一定需要結點,如道路交通中的立交橋,在平面上相交,但實際上不連通,這時需要手工修改,將在交叉處連通的節點刪除。
空間資料的簡化處理
【資料簡化】是從資料集合S中抽出一個子集A,這個子集作為一個新的資訊源,在規定的精度範圍內最好地逼近原集合,同時取得儘可能大的壓縮比。
柵格資料壓縮
遊程編碼、四叉樹法
向量資料簡化
實際上是對原向量座標串中的多個向量點根據曲線形態,減少資料點
實體線物件的簡化
-
間隔取點法 比較相鄰兩特徵點的距離與閾值的大小,確定 是否保留或捨棄?
-
垂距和偏角法 利用曲線上順序的3點Pn-1,Pn,Pn+1,將Pn-1與Pn+1相連,計算Pn到Pn+1的垂直距離(垂距法)或Pn-1Pn 與PnPn+1直線的夾角(偏角),並規定限差,決定點的取捨。
【舉例】Douglas Peucker演算法:
雙線中心線生成
【舉例】根據道路邊線抽取道路中心
多邊形消融
消除具有相同屬性相鄰多邊形的公共邊界
空間資料質量評價與控制
【空間資料質量】是指資料對特定用途的分析和操作的適用程度,與空間解析度或製圖比例尺有關
相關概念
- 【準確性(Accuracy)】 一個記錄值(測量或觀察值)與它的真實值之間的接近程度
- 【資料的精密度(Precision)】對某一量的多次觀測,各觀測值的離散程度
- 【解析度(Resolution)】兩個可測量數值之間最小的可辨識的差異
- 【比例尺(Scale)】地圖上兩個點間圖面距離和它所表現的真實世界的距離之間的一個比值
- 【誤差(Error)】表示資料與其真值之間的差異
- 【不確定性(Uncertainty)】關於空間事物、現象的特徵和過程不能被準確地確定的程度
空間資料質量的指標
- 資料情況說明(source /lineage)
- 位置精度(metric accuracy)
- 屬性精度(attribute accuracy)
- 時間精度(temporal accuracy)
- 邏輯一致性(logical consistency)
- 資料完整性(completeness)
- 資料相容性(compatibility)
- 資料可得性(accessibility)
- 表達形式的合理性(reasonability)
空間資料的誤差源及誤差傳播
空間資料質量問題的原因
- 空間現象自身存在的複雜性、不穩定性和模糊性 ;
- 空間資料的獲取和表達所產生的質量問題;
- 空間資料處理過程中產生的空間資料質量問題;
- 空間資料應用中產生的空間資料質量問題。
誤差型別分析
【空間資料誤差】包括幾何誤差、屬性誤差、時間誤差和邏輯誤差四大類
空間資料的質量控制
空間資料質量控制方法
- 傳統的手工方法
- 元資料方法
- 地理相關法
資料質量控制應體現在資料生產和處理的各個環節
- 資料來源的選擇 ;
- 數字化過程的資料質量控制:
- 資料預處理;
- 數字化裝置的選用;
- 數字化對點精度(準確性) ;
- 數字化限差 ;
- 資料的精度檢查
資料入庫
資料的入庫流程
元資料
元資料與元資料的作用
- 幫助使用者瞭解和分析資料
- 空間資料質量控制
- 在資料整合中的應用
- 資料存貯和功能實現