1. 程式人生 > >大資料知識體系_探索資料_資料彙總_視覺化_多維資料分析

大資料知識體系_探索資料_資料彙總_視覺化_多維資料分析

探索資料
	彙總統計
		頻率和眾數
			分類屬性的眾數是具有最高頻率的值
		百分位數
		位置度量:均值和中位數
			截斷均值
		散佈度量: 極差和方差
			標準差
			絕對平均偏差  ADD
			中位數絕對偏差   MAD
			四分位數極差   IQR
		多元彙總統計
		其他方法
	視覺化
		動機
		一般概念
			表示:將資料對映到圖形元素
			安排
			選擇
		技術
			少量屬性的視覺化
				莖葉圖
				直方圖
				二維直方圖
				盒狀圖
				餅圖
				百分位數力和經驗累計分佈函式
				散佈圖
			視覺化時間空間資料
				等高線圖
				曲面圖
				向量場圖
				低維切片
				動畫
		視覺化高維資料
			矩陣
			平行座標系
			星形座標和chernoff臉
		注意事項
	OLAP和多維資料分析
		用多維陣列表示
		多維資料:一般情況
		分析多維資料
			資料立方體:計算聚集量
			維歸約和轉軸
			切片和切塊
			上卷和下鑽
		關於多維資料分析的最後評述