1. 程式人生 > >初步學習大資料進入這一領域,這十本書是你必讀的

初步學習大資料進入這一領域,這十本書是你必讀的

據可靠資料顯示,截止到2018年,全國的大資料人才只有46萬,未來3-5年人才缺口高達150萬之多。市面招聘網站上都在爭搶大資料人才,有3-5年工作經驗的資料分析師年薪直接高達80萬元,但是能找到的確是寥寥。高校培養大資料人才仍是初步階段,短期內無法快速輸出人才。

相信身邊有很多應屆畢業生以及想轉行大資料的,狀態大多都是:萬臉懵逼。

老司機教你:看書、寫程式碼、多交流。

你看了幾本書呢?小編為大家精心挑選了大資料領域裡十本有價值的書,先幹掉這幾本書,再和老司機談大資料!不過,像《大資料時代》、《資料之巔》等這些經典到“爛大街”的書我就不一一推薦了,很多人都看過,沒看過的也都聽說過。

一、《Presto技術內幕》

 

Presto是Facebook開發的資料查詢引擎,基於Java語言開發的,專門為大資料實時查詢計算而設計和開發的產品,更是大資料實時查詢計算產品的佼佼者,比Spark、Impala更加簡單、高效。

 

很多初學者,對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,想學習的同學歡迎加入大資料學習qq群:199427210,有大量乾貨(零基礎以及進階的經典實戰)分享給大家,並且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國內最完整的大資料高階實戰實用學習流程體系

《Presto技術內幕》由淺入深地詳細介紹了Presto的安裝過程、內部執行原理機制、功能特性、效能優化方法,以及在應用過程中常見的問題及解決方案等,可用於多種資料來源混合進行實時大資料分析計算,使一些使用其他大資料技術不能解決的業務場景有了一個全新有效的解決方案。

在最後的附錄部分不僅對 Presto 使用過程中出現的各種問題給出了明確的解決方案,還對 Presto中的各個配置引數的含義和作用進行了詳細的說明並給出了推薦配置值

適讀人群: Presto技術狂熱者&攻城獅、對京東技術內幕好奇的小夥伴

亮點:

市面上第一本詳細介紹Presto技術的書籍,可單點突破。

濃縮了京東在開源領域深耕多年的實戰經驗

京東CTO張晨、京東首席技術顧問翁志等技術大牛重磅推薦

Presto 使用過程中的各種問題都給出明確的解決方案

對Presto中各個配置引數的含義和作用進行詳細的說明並給推薦配置值

二、《為資料而生》

 

讀完《為資料而生》,你會清楚的看到中國在大資料道路上所留下的軌跡,主要包括在智慧城市、科技、醫療、教育、商業、金融等領域的實踐。書中分別闡述在大資料1.0、大資料2.0和大資料3.0時代下,相對應的資料分析需要做到分析、外化、整合:

分析,這裡作者提供了一套基本的大資料分析框架:確定問題和指標, 清洗資料, 特徵提取和選擇, 模型訓練, 模型融合。

外化,藉助外部資料,將兩個看起來毫不相干的事物通過資料探勘建立聯絡。

整合,主要講企業、政府如何收集資料、標準化資料,以及最後如何商業化。

未來中國的大資料發展提供一條清晰且可行性的路徑指南!

簡言之,看了這本書,不管是企業或者政府,都可以看到大資料比較清晰且可實現的一條路徑。

作者:周濤,天才少年,電子科技大學最年輕教授,中國大資料領域的傳奇人物,創辦數之聯、數聯銘品、國信優易、DataCastle等20多家公司,公司總市值高達百億。

適讀人群:大資料愛好者、政府人員及苦於轉型中的企業管理者

亮點:

手把手教企業如何蛻變成一個真正的大資料企業

大資料3.0時代究竟要如何應對

為數不多的把實操、理論都講明白的書

三、《智慧時代》

 

《智慧時代》回顧了科學研究發展的四個正規化,用例項證明了資料在科學發現中的位置。這本書作者分七章從不同角度對大資料進行介紹,分別以技術和思維方式的改變為主線,從工業革命這個角度嵌入,順理成章的延伸出大資料與智慧化,但是沒有將過多筆墨放在技術的深究上,而是選擇從應用層面體現大資料的理念。大資料應用則會滲透到各行各業,這正是作者的用心之處。

作者:吳軍,原騰訊副總裁。吳軍博士是當前Google中日韓文搜尋演算法的主要設計者。除了《智慧時代》,還著有《數學之美》、《浪潮之巔》和《文明之光》。

適讀人群:研究大資料應用的一線實踐者、人工智慧愛好者

亮點:

深入淺出,用吃瓜群眾都能看懂的語言講生澀難懂的大資料和人工智慧

邏輯性強,你能想到問題,作者都備好了答案

雷軍、羅振宇、塗子沛、李善友、鄔賀銓院士聯袂推薦

四、《R語言預測實戰》

 

R語言橫跨了金融、生物、醫學、網際網路等多個領域,主要用於統計、建模及視覺化。由於上手快、效率高,備受技術人員青睞。預測是大資料探勘的主要作用之一,藉助R語言來做大資料預測,可以兼具效率與價值於一身。

《R語言預測實戰》主要分為預測基礎、預測演算法、預測案例三大部分。從入門級的闡述逐漸過度到深入分析,抽絲剝繭般的講明白了用R語言預測的諸多問題。

作者:遊皓麟,知名高階資料分析師

適讀人群:R語言資料分析師、R語言研究大資料預測的入門者

亮點:

市面上為數不多的系統講解R語言預測專題的書籍

可以get到做R語言預測時的基本步驟和方法思路,還有更多技術細節

五、《醫療革命》

 

在醫學大資料時代,資料技術帶來了臨床醫學科研的革命性進步。《醫療革命》通過對醫療資料探勘的基本理論的闡述,將現代統計學與資料探勘技術有機結合,講述了大量的醫學資料探勘的案例,提供了大量的醫學資料探勘的實操方法。本書以資料探勘與模式識別的七大原理在臨床醫學中的運用案例為切入點,系統而全面地介紹了醫學資料探勘的基本方法與原理,對資料分析的常用演算法進行了通俗易懂的講解。

作者:邵學傑,中國醫學大資料概念提出的實踐者與先行者,醫學資料探勘的先行者

適讀人群:醫療資料探勘愛好者、臨床研究者、 醫療大資料初學者

亮點:

將統計學與醫學深度結合,首次提出醫學資料模式識別的七大原理

實操技術與案例分析相結合,起到很好的技術示範作用

六、《大資料處理之道》

 

市面上流行的大資料處理技術已經有數十種了,從最初的Hadoop到Spark,再到Storm,到底哪個戰鬥力更強?《大資料處理之道》分析比較了當下流行的大資料處理技術的優劣及適用場景,包括Hadoop、Spark、Storm、Dremel、Drill等,詳細分析了各種技術的應用場景和優缺點;同時闡述了大資料下的日誌分析系統,重點講解了ELK日誌處理方案;最後分析了大資料處理技術的發展趨勢,重點從各種技術的起源、設計思想、架構等方面闡述大資料處理之道。

在日誌分析方案遍地開花的大資料時代,這本書能夠幫助你更理性的做出決策。

作者:何金池, IBM高階軟體工程師,熟悉大資料領域內的各項熱門技術,具有多年的一線軟體研發測試經驗

適讀人群:軟體開發、大資料測試人員

亮點:

全。幾乎涵蓋所有的大資料處理熱門技術

易懂。語言詼諧,大資料處理技術與應用場景並在,初學者好上手,專業人士可系統的擴充套件知識

預測。對未來新的大資料處理技術發展趨勢進行了預測

七、《大資料基礎與應用》

 

資料本身沒有絲毫意義,通過統計、分類、萃取、特徵抽取等一系列技術手段才能實現其價值。大資料技術是實踐性比較強的技術,需要重視工具和應用方法的選擇與研究。《大資料基礎與應用》作為大資料技術入門的參考書,為小白讀者提供了一次系統學習大資料理論知識的機會。

作者:陳明,中國計算機學會理事、中國人工智慧學會理事。

適讀人群:大資料技術小白

亮點:

基礎≠不重要,大資料初級必須要掌握的理論知識都在這裡

各章獨立闡述,讀者可根據自己的需求,有側重的加強學習

八、《超越大資料》

 

把社交資料、移動資料、位置資料與主資料結合起來, 可以實現與現有客戶建立更加密切的關係、採用合適的產品, 改進尋找的定位新客戶的方法、更加深入地瞭解客戶的想法以及對產品的看法等,而《超越大資料》將教你如何通過社交主資料管理深入瞭解客戶。

作者:馬丁·奧博歐佛,企業資訊架構領域,面向全球大客戶的執行架構師

適讀人群:企業決策者、大資料架構師

亮點:顛覆了傳統的業務資料處理

九、《爆發》

 

《爆發:大資料時代預見未來的新思維》揭開了人類行為背後隱藏的模式“爆發”,大膽的提出人類有93%的行為都是可預測的,是一本超越《黑天鵝》驚世之作。爆發模式的揭示,其影響力將與20世紀初期的物理學或者基因革命的影響力不相上下。你可以把它當成一本歷史小說來看,也可以當成科技讀物,社會是一個巨大的資料庫,這裡所有的資料、科學以及技術都聯合起來共同對抗那個很大的謎題——我們的未來。

作者:巴拉巴西,全球複雜網路研究,無尺度網路的創立者。世界著名科技雜誌《popularscience》雜誌稱,“他可以控制世界”。

適讀人群:大資料愛好者、樂於探索歷史與未來的人

亮點:

神祕色彩十足

觀點極具顛覆性

十、《大資料技術概論》

 

《大資料技術概論》全書共分成11章分別介紹了大資料概論、大資料採集及預處理、大資料分析、大資料資料視覺化、Hadoop概論、HDFS和Common概論、MapReduce概論、NoSQL技術介紹、Spark概論、雲端計算與大資料、大資料解決方案相關案例等內容。每一章中均附有相關術語的註釋,方便讀者查閱和自學。

作者:婁巖,海歸三年,中國醫科大學教授,IT專家,作家。

適讀人群:大資料小白、培訓機構、企劃管理人員

亮點:適合自學

其實,上面的書整體都是偏入門的,希望大家認真讀完,但這對於大資料來說僅僅是杯水車薪。大資料需要的是複合型的人才,只有不斷學習新技術,不斷拓展自己,方能跟上技術的腳步,不被時代變革所淘汰!別放棄.