1. 程式人生 > >【每週一本書】之《資料視覺化與資料探勘》:基於Tableau和SPSS Modeler圖形介面

【每週一本書】之《資料視覺化與資料探勘》:基於Tableau和SPSS Modeler圖形介面

?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

資料猿導讀】 大資料時代正在改變著我們的生活、工作和思維,要讓大資料發揮出最大價值,最重要的手段就是進行資料視覺化挖掘。利用視覺化資料探勘工具和技術,分析人員能夠從全新的角度快速、輕鬆地挖掘資訊。

編輯 | abby

官網 | www.datayuan.cn

微信公眾號ID | datayuancn

當前,經典的資料探勘演算法日趨成熟,相關標準和技術已經在各行各業得到廣泛應用。為了使資料探勘技術滿足不同層次使用者的需要,視覺化資料探勘技術被提出,通過視覺化的手段將資料探勘過程的各個階段展示給使用者,使使用者能更好地理解過程,目前該技術已經成為資料探勘領域的研究熱點。

今天小編為大家推薦的《資料視覺化與資料探勘——基於Tableau和SPSS Modeler圖形介面》

就旨在為讀者介紹最新的視覺化資料探勘技術。本書內容主要基於 Tableau 10.3和 IBM SPSS Modeler 18.0 編寫,詳細介紹了 Tableau 的資料連線、圖形編輯、建立地圖、表計算和聚合計算等功能,以及 IBM SPSS Modeler 的資料連線、CRISP-DM(跨行業資料探勘標準流程)等功能。通過實際案例,重點介紹了視覺化資料探勘技術在電信、電力、醫藥、銀行、電商和房地產等行業中的應用,可以作為網際網路、銀行證券、電商等行業的從業者,以及高等院校相關專業學生參考使用。

?wx_fmt=jpeg

大資料時代正在改變著我們的生活、工作和思維,要讓大資料發揮出最大價值,最重要的手段就是進行資料視覺化挖掘。利用視覺化資料探勘工具和技術,分析人員能夠從全新的角度快速、輕鬆地挖掘資訊。視覺化資料探勘使資料探勘變得更簡單,建模過程不需要編寫程式碼,非技術出身的業務人員等也可以利用資料做出決策。

本書從內容方面主要分為15個章節:

第1章:介紹資料視覺化和視覺化資料探勘的基本理論及主要軟體,前者包括Tableau、QlikView和Power BI,後者包括IBM SPSS Modeler、Intelligent Miner和SAS Enterprise Miner。

第2章:介紹Tableau Desktop 10.3軟體簡介、資料型別、運算子及優先順序、軟體的安裝與啟用和Tableau的檔案型別等。

第3章:介紹Tableau Desktop可以連線的資料來源,包括Excel檔案、文字檔案、Access檔案、JSON檔案、PDF檔案、空間檔案和統計檔案等,還介紹瞭如何連線各類資料庫,如Tableau Server、SQL Server、MySQL和Oracle等。

第4章:首先介紹Tableau Desktop的維度和度量、連續和離散的概念和操作,然後介紹工作區和工作表的基礎操作,最後詳細介紹表計算、建立欄位、建立引數和聚合計算等高階操作。

第5章:介紹如何使用Tableau生成一些統計圖形,如條形圖、餅圖、直方圖、折線圖、散點圖、並排圖、甘特圖等。

第6章:介紹IBM SPSS Modeler的發展歷史、軟體特點、軟體演算法、軟體功能、安裝過程和授權許可等。

第7章:介紹使用IBM SPSS Modeler進行資料探勘的6個基本步驟:業務理解、資料理解、資料準備、建立模型、評估模型和應用模型。

第8章:介紹IBM SPSS Modeler的基本操作,包括連線到檔案和連線到資料庫,前者包括Excel檔案、SAS檔案、SPSS Statistics檔案、變數檔案和固定檔案等,後者包括Oracle、SQL Server、DB2、MySQL等資料庫。

第9章:介紹IBM SPSS Modeler的資料流操作,包括生成資料流、新增和刪除節點、連線資料流、修改連線節點和執行資料流等。

第10章:介紹視覺化資料探勘在電信行業中的應用,根據客戶流失資料,運用Logistic迴歸演算法,建立了基於客戶屬性、服務屬性和客戶消費資訊的客戶流失預警模型。

第11章:介紹視覺化資料探勘在電力行業中的應用,由於用電負荷具有季節性和週期性的特點,因此運用時間序列模型,同時選擇時間序列中的專家建模器進行建模。

第12章:介紹視覺化資料探勘在醫藥行業中的應用,根據患者的用藥資料,應用K-Means聚類演算法,建立基於藥物在人體的類膽固醇TC、Na、Ka等因素的藥物效果聚類模型。

第13章:介紹視覺化資料探勘在銀行業中的應用,根據銀行客戶的登記記錄資料,運用判別分析演算法,建立基於客戶的屬性資料、信用等級和資產狀況等因素的客戶型別判別模型。

第14章:介紹視覺化資料探勘在電商行業中的應用,根據促銷的費用、促銷前的銷售額和促銷後的銷售額等資料,運用神經網路模型,建立基於促銷費用、促銷前的銷售額和促銷後的銷售額等因素的促銷效果評價模型。

第15章:介紹視覺化資料探勘在房地產行業中的應用,根據購房者的個人資訊資料等,運用CHAID決策樹演算法,建立基於年齡、性別、學歷、月薪和家庭人數等因素的購房決策樹模型。

適度人群

本書的內容和案例適用於網際網路、銀行證券、電商、醫藥等行業資料分析使用者進行視覺化資料探勘,可供高等院校相關專業學生及從事視覺化資料探勘的研究人員參考使用,也可作為Tableau和IBM SPSS Modeler軟體培訓和自學的教材。

推薦閱讀:

本書由 資料猿聯合電子工業出版社 共同推薦

【本欄目合作伙伴】:清華大學出版社、電子工業出版社、北京師範大學出版社、中國人民大學出版社。

歡迎更多合作伙伴加入!也歡迎勾搭小編,微信:wmh4178,備註“書”

?wx_fmt=jpeg

金猿榜往期的獲獎名單,將會在峰會現場隆重發布,期待我們的見面?

?wx_fmt=gif?wx_fmt=jpeg