1. 程式人生 > >8本入門級大資料經典圖書,開啟你的“深度學習” | 世界讀書日

8本入門級大資料經典圖書,開啟你的“深度學習” | 世界讀書日

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

導讀:明天就是“世界讀書日”了,各位小哥哥小姐姐們最近有沒有讀書啊?今天給大家推送一個書單,其中的書都是小編最近讀過或是被安利過的。有些也許是你讀過的,或者是正要讀的。

大資料、雲端計算、人工智慧等領域正在飛速發展,幾乎每天都會誕生新的理念和技術、出現新鮮的應用例項。要跟上時代的步伐,我們需要把每天都當做“世界讀書日”,在把資料餵給機器的同時,也把知識餵給自己,開啟我們自己的“深度學習”,不斷地迭代更新。

下面這8本書,就給你充電、賦能吧!

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

1640?wx_fmt=png640?wx_fmt=jpeg

《利用Python進行資料分析》

作者:Wes McKinney

ISBN:978-7-111-43673-7

《利用Python進行資料分析》講的是利用Python進行資料控制、處理、整理、分析等方面的具體細節和基本要點。同時,它也是利用Python進行科學計算的實用指南(專門針對資料密集型應用),重點介紹了用於高效解決各種資料分析問題的Python語言和庫。

作者Wes McKinney是資深資料分析專家,對各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,並在大量的實踐中積累了豐富的經驗。

2640?wx_fmt=png640?wx_fmt=jpeg

《R語言經典例項》

作者:Paul Teetor

ISBN:978-7-111-42021-7

《R語言經典例項》涵蓋200多個R語言實用方法 ,可以幫助讀者快速而有效地使用R進行資料分析。R語言給我們提供了統計分析酣一切工具,但是R本身的結構可能有些難於掌握。本書提供的這些面向任務、簡明的R語言方法包含了從基本的分析任務到輸入 和輸出、常用統計分析、繪圖、線性迴歸等內容,它們可以讓你馬上應用R高效地工作。

每一個R語言方法都專注於一個特定的問題,隨後的討論則對問題的解決方案給出解釋,並闡釋該方 法的工作機理。對於R的初級使用者,《R語言經典例項》將幫助你步入R的天堂;對於R的資深使用者,本書將加深你對R的理解並拓展你的視野。通過本書,你可以使你的分析工作順利完成並學習更多R語言知識。

3640?wx_fmt=png640?wx_fmt=jpeg

《循序漸進學Spark》

作者:楊磊

ISBN:978-7-111-56332-7

這是一本引導讀者深度學習Spark的技術指南。它由國內具實力的大資料線上教育機構小象學院組織撰寫,旨在用合理的結構和精煉的內容讓讀者用短的時間掌握Spark技術的核心內容。

第1章和第2章分別講解了Spark的開發環境和程式設計模型;第3章分析了Spark的工作機制和原理;第4章則結合原始碼分析了Spark的核心架構和實現原理;第5章講解了Spark與YARN的結合應用;第6章介紹了Spark生態中其他模組的功能和使用;第7章總結了Spark效能調優方面的技巧和方法;第8章描述了Spark2.0釋出後,其模組API的變化以及新增的功能特性。


4640?wx_fmt=png640?wx_fmt=jpeg

《機器學習》

作者:周志華

ISBN:978-7-302-42328-7

內容全面;結構合理;敘述清楚;深入淺出。人工智慧領域中文的開山之作!

機器學習是電腦科學與人工智慧的重要分支領域,本書可作為高等院校計算機、自動化及相關專業的本科生或研究生教材,也可供對機器學習感興趣的研究人員和工程技術人員閱讀參考。

5640?wx_fmt=png640?wx_fmt=jpeg

《統計學》

作者:賈俊平 編著

ISBN:978-7-300-20635-6

統計學作為研究資料的一門科學,為使用者提供了一套獲取資料、分析資料並從資料中得出結論的原則和方法。掌握統計技術可以讓你在競爭激烈的就業市場中佔據優勢。

《統計學》第六版是在第五版的基礎上修改而成的。在廣泛吸取讀者意見的基礎上,對第五版中的部分內容進行了修訂。第六版在結構上與第五版基本相同,但對部分章節上進行了重新寫和修訂。其中,第13章進行了重新編寫,更新了全部資料,並將季節型序列的預測一節合併到複合型序列的分解預測中。第5章對部分內容作了簡化。第9章增加了SPSS的應用。

以上是從業者修煉技術必備,而下面幾本書帶你走向應用例項。冰冷的技術之外,這幾本書中的暖心故事一定會讓你期待並不遙遠的未來。

6640?wx_fmt=png640?wx_fmt=jpeg

《當人工智慧照進生活》

作者:日經BP社資訊科技媒體部

ISBN:978-7-111-57288-6

用故事的形式講述在人工智慧化了的2020年,人們是如何工作、如何生活的,以及工作方式和生活與現在相比有何變化。

本書針對汽車、社會基建設施、製造業、農業、物流和倉庫、安全保障、零售、安全防範、辦公室工作、住宅、醫療、教育、金融13個領域,這些領域運用了人工智慧之後將變身為“新職業”,本書講述的即是這些新職業登場之後的日常情況。

7640?wx_fmt=png640?wx_fmt=jpeg

《物聯網商業時代》

作者:日經計算機 編

ISBN:978-7-111-57676-1

物聯網的英文名為“the Internet of things”,簡稱IoT。它是將各種資訊感測裝置與網際網路結合起來而形成的巨大網路,也是繼計算機、網際網路與行動通訊網之後的又一次資訊產業浪潮。

本書涵蓋日本物聯網的系統架構、核心技術、關鍵領域等各個方面,更通過世界各國的最新案例,勾勒出未來世界物聯網城市的美好藍圖。在公共事務管理方面,我們可以看到各國在政務公開、交通管理、防恐防災、節能環保等領域的積極舉措;在公眾社會服務方面,我們可以切身感受到包括醫療健康、智慧家居、金融保險在內的物聯網應用;在經濟發展建設方面,我們可以瞭解物聯網在日本能源電力、物流零售、智慧工農業等行業日趨增長的應用趨勢。當然,這其中也不乏日本對於物聯網安全及“小島進化”現象的認真思考。


8640?wx_fmt=png
640?wx_fmt=jpeg

《21世紀機器人》

作者:布萊恩·戴維·約翰遜

ISBN:978-7-111-56949-7

機器人是推動新工業革命的關鍵,人類即將進入萬物皆智慧的新智慧時代,機器智慧將越來越多地融入未來生活,引發智慧革命或是智慧爆炸,而把握未來的好方式就是更加了解機器,以及創造更具智慧的計算機和機器人。

本書呈現了大量科幻原型故事,集中探討了個人機器人,洞察機器人發展的技術和未來趨勢。

推薦閱讀

Q: 你都有哪些好書要推薦?

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:[email protected]

更多精彩文章,請在公眾號後臺點選“歷史文章”檢視

640?wx_fmt=jpeg

相關推薦

什麼是飛天?全球資料計算平臺自主研發!

又一個註定載入史冊的日子!7月25日。 又一個註定讓人更有底氣的核心科技!阿里雲飛天大資料平臺! 這是目前國內規模最大的計算平

資料下基於Tensorflow框架的深度學習示例教程

近幾年,資訊時代的快速發展產生了海量資料,誕生了無數前沿的大資料技術與應用。在當今大資料時代的產業界,商業決策日益基於資料的分析作出。當資料膨脹到一定規模時,基於機器學習對海量複雜資料的分析更能產生較好的價值,而深度學習在大資料場景下更能揭示資料內部的邏輯關係。本文就以大資料作為場景,通過自底向上的

國內雲數倉排行獨佔一檔揭祕阿里雲EB資料計算引擎MaxCompute

日前,全球權威諮詢與服務機構Forrester釋出了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》報告。這是Forrester Wave首次釋出關於雲數倉解決方案(Cloud Data Warehouse,簡稱CDW)的測評。報告對雲數倉的當前產品功

揭祕阿里雲EB資料計算引擎MaxCompute

日前,全球權威諮詢與服務機構Forrester釋出了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》報告。這是Forrester Wave首次釋出關於雲數倉解決方案(Cloud Data Warehouse,簡稱CDW)的測評。報告對雲數倉的當前產品功

首次公開!單日600PB的計算力--阿里巴巴EB資料平臺的進擊

摘要: 每年的雙11之前,也是MaxCompute各種乾坤大挪移落定的時候,因為雙11就是各種大折騰專案的自然deadline。在今年雙11之前,一路向北遷移和在離線混部專案,將杭州叢集除螞蟻外整體遷移到張北,涉及了絕大部分的業務project、資料儲存和計算任務,為今年雙十一大資料計算服務的保障帶來了挑戰。

mysql千萬資料SQL查詢優化

1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:select id from t where num

資料工程師分享的資料經典學習路線(及供參考)

1.Linux基礎和分散式叢集技術   學完此階段可掌握的核心能力:   熟練使用Linux,熟練安裝Linux上的軟體,瞭解熟悉負載均衡、高可靠等叢集相關概念,搭建網際網路高併發、高可靠的服務架構;   學完此階段可解決的現實問題:

基於Vue與Element的千萬資料分頁

                        &nbs

Scala入門資料

這裡我們使用spark作為資料引擎,在此基礎上實現我們的大資料應用。 一、spark的安裝 首先需要安裝的就是java環境,安裝特定的spark版本需要特定的java版本,可從spark原始碼中的pom檔案中檢視java版本要求,安裝好java環境之後進入spark官

Scala入門資料

第一步:scala環境安裝 根據自己jdk的版本下載對應版本的scala,2.12對應是jdk1.8。下載安裝之後設定環境變數。 第二步:scala外掛安裝 通過intellij IDEA軟體下載Scala外掛總是失敗,所以只能手動下載,但是手動下載過程中要注意: s

2018年新春報喜!熱烈祝賀王家林資料經典傳奇著作《SPARK資料商業實戰三部曲》 暢銷書籍 清華大學出版社發行上市!

2018年新春報喜!熱烈祝賀王家林大咖大資料經典傳奇著作《SPARK大資料商業實戰三部曲》暢銷書籍 清華大學出版社發行上市!本書基於Spark 2.2.0最新版本(2017年7月11日釋出),以Spark商業案例實戰和Spark在生產環境下幾乎所有型別的效能調優為核心,以Sp

資料經典學習路線(轉載)

1.Linux基礎和分散式叢集技術 學完此階段可掌握的核心能力: 熟練使用Linux,熟練安裝Linux上的軟體,瞭解熟悉負載均衡、高可靠等叢集相關概念,搭建網際網路高併發、高可靠的服務架構; 學完此階段可解決的現實問題: 搭建負載均衡、高可靠的伺服器叢集,可以增大網站的併發訪問量,保證服務不

提高mysql千萬資料SQL查詢優化

1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is

敏捷轉型:從搭建TB資料應用說起

作者介紹 朱志,建設銀行廈門開發中心技術管理處負責人,目前主要負責大資料技術平臺規劃和技術資產管理。在銀行IT專案管理、資料分析、資料治理以及架構設計領域工作了十五年,曾領導過建總行人力資源專案、ERP報表專案、分行資料分析平臺ODSB專案、管理會計專案以及新一代資訊系統資料分析平臺的建設。 現在各

資料經典學習路線(學習中)

1.Linux基礎和分散式叢集技術 學完此階段可掌握的核心能力: 熟練使用Linux,熟練安裝Linux上的軟體,瞭解熟悉負載均衡、高可靠等叢集相關概念,搭建網際網路高併發、高可靠的服務架構; 學完此階段可解決的現實問題: 搭建負載均衡、高可靠的

資料經典演算法——bit-map與bloom filter

明白了雜湊的原理,bit-map就好說了。 bit-map的核心思想是:所謂的Bit-map就是用一個bit位來標記某個元素對應的Value, 而Key即是該元素。每一個bit空間都是儲存單元,而不像

MySql 快速插入千萬資料

在資料分析領域,資料庫是我們的好幫手。不僅可以接受我們的查詢時間,還可以在這基礎上做進一步分析。所以,我們必然要在資料庫插入資料。在實際應用中,我們經常遇到千萬級,甚至更大的資料量。如果沒有一個快速的插入方法,則會事倍功半,花費大量的時間。 在參加阿里的天池大資料演算法競

2017年十必讀的資料&人工智慧領域書籍都讀過嗎?

【資料猿導讀】年關將至,回顧2017,小編記得自己曾在年初的時候給自己定下一個小目標——就是讀3

詳解億資料表的幾種建立分割槽表的方式

自5.1開始對分割槽(Partition)有支援,一張表最多1024個分割槽 查詢分割槽資料: SELECT * from table PARTITION(p0) 水平分割槽(根據列屬性按行分) 舉個簡單例子:一個包含十年發票記錄的表可以被分割槽為十個不同的分割槽,每個分割槽包含的是其中一年的記錄。