<圖像理解> 2-空間推理和基於模型的圖像理解
1 - 關於空間實體和空間關系的知識表示和推理:
在AI領域
- 主要是拓撲關系
- formal 邏輯 meretopology
- 推理
在圖像解釋方面欠發達
- 需要不精確的只是表示
- 半量化框架->數值評估
- 例如 在非清晰圖像中的結構識別
主要成分
- 知識表示 包含空間關系
- 不精確的表示與管理
- 異構信息的融合
- 推理和決策
2 - 語言學:
不同語言描述實體的空間位置是不同的,同一個單詞表達的意思是不一樣的,例如德語中path
根據上下文,根據reference得到物體實體的功能特性
不精確,若有很多非常復雜的信息,過於精確的陳述會變的不太現實
3- 人類感知:關於距離的例子:
- 純粹的空間measure:在幾何意義上即度量距離,與物體的固有屬性有關
- 實踐性的measure:用旅行時間表示的距離,是外在類型,和前一類純粹空間是相反的
- 經濟measure:是指投資成本,外在類型
- 感知性measureL導致指示類型的距離,和外部觀點有關,即心理,可能受到環境的影響,通過主管考慮,導致距離並不一定是對稱的
- 其他物體的影響
4 - 認識:
對空間環境的認識理解來自兩種類型的過程
- 路線知識獲取:兒童發展時期習得,意味著訪問過的地標之間的順序信息
- 調查知識獲取:例如從地圖上,看到全球的視圖,與地表之間的順序無關
5 - 空間推理形式:
- 定量
- 定性
- 模糊fuzzy表示和推理:半定量半定性
- 空間實體
- 空間關系
- 真實世界的問題:解決不精確性和不確定性
6 - 空間實體:
- 區域region,和模糊的區域fuzzy region
- key points 關鍵點
- 簡化區域:例如質心:centroide,bounding box 關於邊界框 詳見:http://blog.csdn.net/zijin0802034/article/details/77685438
- 抽象表示 例如mereotopology 分體拓撲學
7 - 空間關系
- 結構穩定性 比形狀 大小絕對位置穩定
- 不同的類型:binary n ary 等等
8 - 定量表示:quantitative
- 更精確的定義對象
- 計算已經定義好的關系
- 有許多限制:物體,關系,表示的類型
- 並不總是和通常的推理方式相匹配
9 - 定性:符號表示
主要的特征:
- 形式邏輯:命題,一階……
- 對一類情況的完整性和復雜性之間的妥協 compromise
- 推理:可滿足性 etc
小問題:
對於復雜的形狀我們如何處理?只需要很少的部分可以被準確的確定。
我們可以使用bounding box 和 centroide
定性的幾種方法
1 艾倫區間 allen‘s interval
allen‘s intervals :是時空推理計算。該代數定義了時間間隔之間的可能關系並提出了組合表。 它可以作為推理關於事件的時間描述的基礎。
上面的表說明的是一維的情況,復雜度為13
若是二維,即是表格lattice的形式,復雜度為13的平方
若是三維,復雜度為13的三次方
所以這個方法的復雜度非常高,用於固定了形狀的物體
2 RCC Region Connection calculs 區域連接演算
-用定性的方式,定義空間實體
- 沒有參考點 reference points
- 連接謂詞C
- 分段謂詞P
公式:
一些關系的表示
3 定性軌跡驗算:
用RCC和艾倫的方法一起
例如:
meet是指 I1時間段後面就能遇到I2,對I2 I3同理,那麽I1在I3前面
P 是指X是Y的部分
PO X和Y相交一部分
DR X和Y完全分離開
9 - 空間的模態邏輯
□A 是指本地為真,即 如果A在x的鄰域內是真的,那麽A在點x上即為真 ◇A = no □ no A :是指如果A在x的鄰域內的某一點為真,那麽A在x上為真□表示everywhere □A everywhere close to A
◇表示somewhere ◇A somewhere close to A 一些推理規則: 10 - 半定量空間推理:模糊方法 - 純定性推理的局限性
- 對於純定性加入半定量擴展,可以活的更有用的結論
- 在不精確的陳述中使用純量化表示限制,用語言表達的知識etc
- 使用模糊集的半定量或半定型解釋來整合定量和定性的知識
- 模糊集合提供計算表示,不精確的空間約束的解釋,用語言的方式表達,可能包括定量的知識
- 粒度
- 物體或空間實體和他們的描述 - 類型和空間關系及query的表達 - 預期或潛在的結果的類型 11 - 基於模型的識別和空間推理 - 不精確的表示
- 空間關系作為結構信息:拓撲關系,距離,相對方向關系relative directional relations,etc
- 兩類關系
- 在清晰的情況下 crisp case,很好的定義 例如 鄰接,距離 - 即使在清晰的情況下,各種 也是模糊vague的 - 多種異質知識和信息的片段的組合 --> 模糊集理論,數學形態學 12 - 不精確和模糊 - 物體:邊界不清晰,粗分割 coarse segmentation
- 關系:很接近 quite close之類
- 可用知識的類型不清晰etc
- 問題回答的不清晰
13 - 模糊集定義 - 模糊集:給定一個空間S,從S到單位區間[0,1]的映射μA(x):S→[0,1],叫做S在U上的一個模糊集或者模糊子集 - μA(x)是隸屬函數,表示元素對模糊集A的隸屬程度
14 - 一些運算
冪等idempotent:在編程中一個米等操作的特點是其任意多次執行所產生的影響均與一次執行的影響相同
15 - 語義
- 相似度:距離的概念
- 合理度 plausibility:一個不精確描述的對象實際上
- 偏好程度 接近效用函數的概念
16 - 不同類型的imperfection
17 - 模糊互補
- 函數c從[0,1]到[0,1],使得:c(0) = 1, c(1) = 0
- c是對合的,即對於所有x在 [0,1],c(c(x))= x
- c是單調遞減的
連續補充的一般形式:c(x) = φ^-1[1-φ(x)]
φ: [0,1]→[0,1], φ(0) = 0, φ(1) = 1, φ是單調遞增的
φ(x) = x^n => c(x) = x^-n [1-x^n] = x^-n- 1 = (1-x^-n)^(1/n)
18 - 三角規範
三角規範 triangular norm (模糊相交 fuzzy interaction)
t-norm t : [0,1] * [0,1] -> [0,1]
三角余範 Triangular conorms fuzzy union = t-conorm->disjunction
[0,1] * [0,1] -> [0,1]
<圖像理解> 2-空間推理和基於模型的圖像理解