1. 程式人生 > >TensorFlow 學習指南:深度學習系統構建詳解

TensorFlow 學習指南:深度學習系統構建詳解

內容簡介

面向廣泛的技術受眾(從資料科學家、工程師到學生和研究人員),本書介紹了 TensorFlow 的基本原理和實踐方法。從 TensorFlow 中的一些基本示例開始,深入探討諸如神經網路體系結構、TensorBoard 視覺化、TensorFlow 抽象庫和多執行緒輸入管道等主題。閱讀本書,你將學會如何使用 TensorFlow 構建和部署工業級深度學習系統。

通過閱讀本書,你將:

  • 輕鬆愉快地安裝並執行 TensorFlow。
  • 學習如何使用 TensorFlow 從頭開始構建深度學習模型。
  • 訓練流行的計算機視覺和 NLP 深度學習模型。
  • 使用抽象庫來使開發更容易和更快速。
  • 學習如何擴充套件 TensorFlow 並使用叢集分散式訓練模型。
  • 在生產環境中部署 TensorFlow。

作者簡介

Tom Hope 是一位應用機器學習研究者和資料科學家,在學術界和工業界擁有廣泛的背景。他領導了跨領域的資料科學和深度學習的研發團隊。

Yehezkel S. Resheff 是機器學習和資料探勘領域的應用研究人員。在讀博士期間,他的工作主要圍繞開發機器學習和深度學習方法來分析可穿戴裝置和物聯網的資料。他在英特爾和 Microsoft 公司領導了深度學習的研發工作。

Itay Lieder 是機器學習和計算神經科學領域的應用研究人員。在研究生學習期間,他開發了用於模擬低階知覺的計算方法。他曾在大型跨國公司工作,在文字分析、Web 挖掘領域從事深度學習研發。

本書內容

譯者序

深度學習是目前人工智慧、機器學習領域非常火熱的研究方向,而作為深度學習的工具之一的 TensorFlow 上線不到兩年便成為 Github 最受歡迎的深度學習專案之一。在過去的日子裡,TensorFlow 幫助了許許多多的研究人員、工程師、藝術家、在校學生等改善自己的工作與生活,從語言翻譯、面板癌早期診斷到預防糖尿病眼病引發的失明等方方面面都有它的身影。

在現在的深度學習大潮之下,本書是一本不可或缺的入門級參考書,本書作者都是機器學習領域的資深工程師,在深度學習應用方面有著深厚的積累。原書設計結構合理,從 TensorFlow 基礎開始,逐步展開,清晰地給出瞭如何使用 TensorFlow 的指導。全書共10章,內容涉及卷積神經網路、迴圈神經網路等核心的深度學習模型,以及分散式場景下 TensorFlow 的使用方法。在書中不僅有一些原理性的講解,還包含大量實踐訓練內容,相信讀者在閱讀本書之後能夠掌握一定的實踐技巧和方法,為使用深度學習(基於 TensorFlow 框架)解決未來在學習和工作中遇到的相關問題打下良好的基礎。

我一直有將學習和工作的過程用某種方式記錄下來的習慣,這些內容釋出在一些部落格上。此前有翻譯深度學習的入門教程書籍和部分重要的研究論文。除此之外,還花費一定的時間精力來組織學習社群,創辦了深度學習國際群和 Deep Learning Meet-up。早在2014年,這樣專注於深度學習和前沿人工智慧技術的社群及相應活動在國內幾乎沒有。彼時,以每週一次的頻率進行學習交流,發展成每月一次的社群活動。後來,在社群的基礎之上,我和幾位有著共同志趣的深度學習社群成員共同創立了 University AI,專注於培養優秀的人工智慧人才,其網址為 http://universityai.com,微信公眾號:UAI 人工智慧。University AI 致力於推進中國人工智慧化程序,現在已經給多家985高校講授前沿人工智慧課程,並給多家500強企業提供人工智慧內訓。

由於深度學習和 TensorFlow 都處在快速發展、不斷迭代的過程之中,歡迎感興趣的讀者和我進一步交流。如果讀者對於書中的某些翻譯持有疑義,也歡迎同我探討。

朱小虎

2018年1月30日寫於 UAI Unknown Lab 玄武閣

譯者簡介

朱小虎:University AI 創始人和首席科學家,UniversityAI-AI-Unconference Meetup 組織者,致力於推進世界人工智慧化程序。制定並實施 UAI 中長期增長戰略和目標,帶領團隊快速成長為人工智慧領域最專業的力量。

作為行業領導者,他在2014年建立了 TASA(中國最早的深度學習社團)、DL Center(深度學習知識中心全球價值網路)、AI growth(行業智庫培訓)等,為中國的人工智慧人才建設輸送了大量的血液和養分。此外,他還參與或者舉辦過各類國際性的人工智慧峰會和活動,產生了巨大的影響力,書寫了60萬字的人工智慧精品技術內容,翻譯了深度學習入門書《神經網路與深度學習》,他的文章被大量的專業垂直公眾號和媒體轉載與連載。曾經受邀為國內頂尖大學制定人工智慧學習規劃和教授人工智慧前沿課程,均受學生和老師的好評。

李紫輝:美國耶魯大學計算機在讀博士生,現工作於耶魯大學 LILY 實驗室,研究興趣為自然語言處理與遷移學習。University AI 研究員。於2014年畢業於武漢輕工大學,擁有管理學和文學雙學士學位;於2015年畢業於愛爾蘭國立都柏林大學,取得電腦科學碩士學位。先後於 IBM 愛爾蘭研究院、埃森哲愛爾蘭 AI 實驗室等多家研究機構實習與工作,研究重點為將深度學習技術應用於健康、航空等領域。

前言

深度學習在過去的若干年中已經成為構建可以從資料中學習的智慧系統的首要技術。深度神經網路最開始在一定程度上受到人類大腦學習方式的啟發,是用大量資料進行訓練從而能夠以足夠高的準確度解決複雜任務的技術。由於開源框架的廣泛存在,這項技術也被廣泛使用,目前已經成為任何想要從事大資料和機器學習工作的人的必備知識。

TensorFlow 是當前深度學習領域領先的開源軟體,使用它從事計算機視覺、自然語言處理(NLP)、語音識別和一般性預測分析工作的技術實踐者(工程師)的數目仍在飛速增長。

本書是專為資料科學家、工程師、學生和科研工作者設計的 TensorFlow“端對端”指導。書中採取適合廣大技術讀者的實戰觀點,不僅讓初學者能夠接受,也會深入探討一些高階話題並展示如何構建產品級的系統。

通過本書,你可以習得:

  1. 快速順暢地安裝和執行 TensorFlow。

  2. 使用 TensorFlow 從零構建模型。

  3. 訓練和理解流行的用於計算機視覺和 NLP 的深度學習模型。

  4. 使用多種抽象庫讓開發更加簡單和迅速。

  5. 使用佇列和多執行緒擴充套件 TensorFlow,在叢集上訓練,在產品級應用上部署輸出結果。

  6. 還有更多其他內容!

本書由同時在工業界和學術界擁有大量研發經驗的資料科學家撰寫。作者採用實戰觀點,結合實際且直觀的案例、解釋及供實踐者們探索構建產品級系統的洞察,滿足想要學會理解和構建靈活強大模型的讀者的需求。

預備知識

本書假定讀者有基本的 Python 程式設計知識,包括熟悉科學計算庫 Numpy。

機器學習的概念在本書中會被討論,並且貫穿全書進行直觀解說。對於想深入學習的讀者,建議你掌握一定程度的機器學習、線性代數、微積分、概率論和統計學方面的知識。

本書約定

下面給出本書所採用字型的約定:

斜體字(Italic)

表示新的術語、連結、電子郵箱地址、檔名和副檔名。

等寬字型(Constant width)

用於程式清單,也用於在段落中引用程式元素,例如變數名、函式名、資料庫、資料型別、環境變數、程式語句和關鍵詞。

加粗等寬字型(Constant width bold)

表示應該由使用者輸入的命令或者其他文字資訊。

斜體的等寬字型(Constant width italic)

表示此處應該替換為由使用者提供的數值,或者根據上下文確定的數值。

如何使用示例程式碼

補充材料(示例程式碼、練習等)可以在 https://github.com/Hezi-Resheff/Oreilly-Learning-TensorFlow 上下載。

本書的目的是幫助你完成自己的任務。一般來說,如果程式碼是和本書一起提供的,那麼你可以在你的程式和文件中使用它們。你不需要聯絡我們獲取許可,除非你想大量複製這些程式碼。例如,在自己的程式中使用到本書中的幾段程式碼,並不需要獲得許可,但把 O’Reilly 書籍裡的示例程式碼刻錄成光碟就必須獲得許可。回答問題時引用本書內容和示例程式碼,不需要獲得許可,但是將大量的示例程式碼用於你的產品文件則必須獲得許可。

我們期望但不強求大家引用時註明出處。一般來說,出處通常包括標題、作者、出版商和國際標準書號(ISBN)。例如,《Learning TensorFlow》(《TensorFlow 學習指南》),作者 Tom Hope、Yehezkel S.Resheff 和 Itay Lieder(O'Reilly 出版),書號978-1-491-97851-1。

如果你覺得自己使用的示例程式碼超出了限定的許可範圍之列,歡迎通過郵件聯絡我們確認([email protected])。

Safari 線上圖書

Safari Books Online 針對企業、政府、教育機構和個人提供了不同的購買計劃,你可根據實際需求進行選購。

使用者可以訪問上千種圖書、培訓視訊、學習路徑、互動教材和專業的播放列表,這些內容來自超過250個出版商,包括 O’Reilly Media、哈佛商業評論、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Adobe、Focal Press、Cisco Press、John Wiley&Sons、Syngress、Morgan Kaufmann、IBM Redbooks、Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones&Bartlett 和 Course Technology 等。關於 Safari 線上圖書的更多資訊,請訪問 http://oreilly.com/safari

聯絡方式

美國:

O'Reilly Media,Inc.

1005 Gravenstein Highway North

Sebastopol,CA 95472

中國:

北京市西城區西直門南大街2號成銘大廈 C 座807室(100035)

奧萊利技術諮詢(北京)有限公司

我們建立了關於本書的網頁,上面有勘誤表、示例和所有的附加資訊。可以通過連結 http://bit.ly/learning-tensorflow 訪問。

關於本書的評論和技術問題,請發郵件給 [email protected]

關於本書的更多資訊,如教程、會議、新聞,請參見網站:

http://www.oreilly.com

http://www.oreilly.com.cn

致謝

作者要感謝為本書提供反饋的審校人員:Chris Fregly、Marvin Bertin、Oren Sar Shalom 和 Yoni Lavi。還要感謝 Nicole Tache 和 O’Reilly 團隊讓寫作本書成為一件令人高興的事情。

當然,要感謝 TensorFlow 的所有開發人員—沒有他們就不會有 TensorFlow。

第1章 引言
第2章 隨之“流”動:啟動與執行 TensorFlow
第3章 理解 TensorFlow 基礎知識
第4章 卷積神經網路
第5章 文字 I:文字及序列的處理,以及 TensorBoard 視覺化 (上)
第5章 文字 I:文字及序列的處理,以及 TensorBoard 視覺化 (下)
第6章 文字 II:詞向量、高階 RNN 和詞嵌入視覺化
第7章 TensorFlow 抽象與簡化(上)
第7章 TensorFlow 抽象與簡化(下)
第8章 佇列、執行緒和資料讀取
第9章 分散式 TensorFlow
第10章 用 TensorFlow 匯出和提供服務模型
附錄 A 模型構建和使用 TensorFlow Serving 的建議

閱讀全文: http://gitbook.cn/gitchat/geekbook/5c19b8461e59245d4d2ad512