1. 程式人生 > >資料視覺化之"Research on visualization techniques in data mining"

資料視覺化之"Research on visualization techniques in data mining"

Research on visualization techniques in data mining

Jin, Hailiang (Key Laboratory of Mine Spatial Information Technologies of State Bureau of Surveying and Mapping, Henan Polytechnic University, Jiaozuo, China); Liu, Huijie Source: Proceedings - 2009 International Conference on Computational Intelligence and Software Engineering, CiSE 2009, 2009, Proceedings - 2009 International Conference on Computational Intelligence and Software Engineering, CiSE 2009

新型視覺化技術

(1)基於幾何投影技術的視覺化方法

基於幾何投影技術的視覺化方法的目標是建立多維資料集的有趣投影,從而將多維資料分析轉換為分析少量興趣維資料分析,包括散射矩陣技術,框架地圖,測量地圖,安德魯斯曲線技術,平行座標視覺化技術,放射性視覺化技術和偵探統計,如主成分分析、縮放尺寸。

(2)基於影象的視覺化方法

基於影象的視覺化技術將每個多維資料對映到影象,例如線圖,圖示和顏色圖。 線圖將兩個維度對映到顯示維度,其餘維度對映到角度和元件長度。 該技術限制了視覺化的維度數量。 圖示是一些非常小的地圖; 其不同特徵的大小由特定變數的值決定,如針形圖示,星形圖示。 在星形圖示中,相對於原點的不同方向對應於不同的變數; 在這些方向上投影的半徑長度對應於變數的值。

(3)面向畫素的視覺化方法

面向畫素的視覺化方法將每個資料值對映到彩色畫素,並在單獨的視窗中表示屬於每個屬性的資料值。 這種方法的優點是可以一次性描述海量資訊
並且不會有重疊。 不僅可以有效地保留一小部分使用者感興趣,還可以概述資料。 如果畫素表示資料值,則此方法可以顯示最大資料(最多1,000,000個數據值)。 諸如遞迴模式技術,無線電技術劃分,螺旋技術和Z次序技術的視覺化方法屬於這種技術。

視覺化技術新進展

(1)失真技術

失真技術顯示高階細節中的部分資料以及低細節和許多細節級別的其他資料。 該技術提供了一種集中的方法,同時保持對資料的概述,這有利於互動式探索的過程。

(2)互動技術和協作技術



互動式視覺化技術允許根據檢測物件視覺化動態變化,並且可以實現各種獨立視覺化的組合,例如互動式對映,投影和過濾,縮放,互動式連結和刷牙。 使用者可以比較多個模型,充分利用不同視覺化方法的優勢和不同模型的描述方式。 在強調模型的某些部分時,不同關聯模型的描述方式將同時在多個獨立視窗中自動顯示。 這些技術的一般使用可以獲得比獨立考慮這些可視元件更多的資訊。 協同技術允許生成原始資料的描述和相應模型的許多不同描述方式,這有利於模型的比較分析。

(3)鑽取技術

鑽取技術意味著我們可以看到模型的一部分是從原始資料中提取出來的,並且在選擇模型的一部分時可以訪問它們。 例如,決策樹視覺化方法允許選擇和鑽取決策樹的分支,以便使用者可以訪問與分支結構相關的資料,同時忽略其他資料描述。

(4)虛擬技術

虛擬技術可以將模型結果輸出到虛擬裝置或虛擬視覺化環境,從而使使用者能夠留下來。 使用者可以通過導航搜尋有趣的資訊,並獲得對資料和分析的更直觀的理解。 該技術可以結合人們的認知能力,使人們充分融入資料探勘的過程。 已經提出的虛擬技術是資料立方體[7]和頭盔顯示器。

總結

(1)視覺技術的應用還很有限,方法也單一,主要集中在初始檢視的視覺化和結果(模型)。

(2)目前的資料探勘視覺化方法大致可分為以下幾類。第一類由傳統的視覺化方法或獨立於資料探勘的演算法組成。第二類描述了通過資料探勘演算法提取的模式,從而有助於更好地理解模型。第三類與各種視覺化方法緊密相連在資料探勘演算法的執行過程中。演算法允許使用者在演算法執行中引導和操縱視覺化。幾乎所有提出的視覺化資料探勘方法都屬於第一類或第二類。因此,未來的工作包括兩個方面,第一,為半結構化和非結構化資料(如Web資料和文字)的複雜資訊結構開發適當的視覺化挖掘方法;第二,將各種視覺化方法與統計學,機器學習,運籌學,模擬技術,融入資料探勘過程等傳統方法緊密結合,結合快速自動資料探勘演算法和人腦認知能力和判斷能力,提高資料探勘視覺化過程的質量和速度。最終目標是使基於計算機的視覺化資料探勘系統具有簡單性,可見性,使用者自治性,可靠性,可重用性和安全性,具有更好,更快,更直觀的大資料資源探索能力。