1. 程式人生 > >《NLTK基礎教程》譯者序

《NLTK基礎教程》譯者序

說來也湊巧,在我簽下這本書的翻譯合同時,這個世界好像還不知道AlphaGo的存在。而在我完成這本書的翻譯之時,Master已經對人類頂級高手連勝60局了。至少從媒體的熱度來看,的確在近幾年,人工智慧似乎是越來越火了。其原因是Google在汽車駕駛和圍棋這兩個領域的專案得到了很好的進展和宣傳,而這兩個領域在過去被很多人想當然地認為是人類的專屬領域。因此在專屬領域接連被突破情況下,一些人得了“機器恐懼症”。例如高曉鬆先生的這段微博:

作為自幼學棋,崇拜國手的業餘棋手,看了Master50 : 0橫掃中日韓頂尖高手的對局,難過極了。為所有的大國手傷心,路已經走完了。多少代大師上下求索,求道求術,全被破解。未來一個八歲少年只要一部手機就可以戰勝九段,榮譽信仰灰飛煙滅。等有一天,機器做出了所有的音樂和詩歌,我們的路也會走完。

其實之所以會有這樣恐懼,大部分是因為人們在討論人工智慧的時候容易將機器“人格化”,很多科幻作品就是這麼幹的,這看起來很合理,但問題是機器無論如何都不是人。對於機器來說,圍棋說穿了不過是一種基於統計學概率的決策模型,屬於數學領域的問題,它本來就是機器的強項。用圍棋對於人類的難度來推導機器智慧的進步,其實是很沒有邏輯的事情。而且事實上,今天所流行的這些人工智慧方法都是在20世紀70年代前後提出的理論,今天的輝煌主要是由於硬體的進步為實現提供了基礎,但在智慧上並沒有多大的實質突破。要知道,人們對於鑑定人工智慧的主要標準早有定論,那就是圖靈測試。

圖靈測試關注的是人機對話能力,換句話說,什麼時候機器能通過對話騙到你的一百塊錢,也比它下棋下贏世界冠軍更智慧點。而想要增強人機對話能力,自然語言處理就是首當其衝的一個領域了。正如我們所說,機器的專長是數學領域,所以自然語言處理問題的目的就是要把我們人類的文字、音訊轉換成可被分析的數學模型,這對於機器來說是比圍棋困難得多的事情。這也 是人類和機器的根本區別,對於這兩種智慧來說,困難的定義是截然不同的。

說實話,剛開始譯這本書的時候,我對它的翻譯難度有些估計不足,很多專業詞彙國內還似乎還沒有標準譯法。有些甚至根本找不到對應的中文翻譯。雖然對於每個小節我都期望查閱大量的資料,儘量保證翻譯的質量,但實在有點太累人了,太費時了,妥協、遺憾在所難免。在這裡向讀者們致歉,還希望你們多多包涵。同時也感謝人民郵電出版社的陳冀康編輯對於我拖稿行為的容忍,其實我還想再拖上半年的。

相關推薦

NLTK基礎教程譯者

說來也湊巧,在我簽下這本書的翻譯合同時,這個世界好像還不知道AlphaGo的存在。而在我完成這本書的翻譯之時,Master已經對人類頂級高手連勝60局了。至少從媒體的熱度來看,的確在近幾年,人工智慧似乎是越來越火了。其原因是Google在汽車駕駛和圍棋這兩個領域的專案得到了很好的進展和宣傳,而這兩個領域在過

NLTK01 《NLTK基礎教程--用NLTK和Python庫構建機器學習應用》

01 關於NLTK的認知 很多介紹NLP的,都會提到NLTK庫。還以為NLTK是多牛逼的必需品。看了之後,感覺NLTK對實際專案,作用不大。很多內容都是從語義、語法方面解決NLP問題的。感覺不太靠譜。而且本身中文語料庫不多。很多介紹NLTK的書籍和blog都

《Python演算法教程譯者

在計算機的世界中,演算法本質上是我們對某一個問題或者某一類問題的解決方案。也就是說,如果我們想用計算機來解決問題的話,就必須將問題的解決思路準確而完整地描述出來,同時計算機也要能理解這個描述。這需要我們這些程式設計師將整個描述轉化成一系列清晰的指令,這些指令要能接收滿足一定規範的輸入,並在有限的時間內產生出相

最完整的Elasticsearch 基礎教程

epo -o 小寫 名稱 搜索結果 博客 需要 必須 搜索api 基礎概念 Elasticsearch有幾個核心概念。從一開始理解這些概念會對整個學習過程有莫大的幫助。 接近實時(NRT) Elasticsearch是一個接近實時的搜索平臺。這意

【solr基礎教程之中的一個】Solr相關知識點串講

struct 詞匯 ont types 映射 details 必備 功能 提交 Solr是Apache Lucene的一個子項目。Lucene為全文搜索功能提供了完備的API。但它僅僅作為一個API庫存在。而不能直接用於搜索。因此,Solr基

Thrift 基礎教程(一)安裝篇

div 更新 g++ pat 定義 init 環境 1.7 進行 1、Thrift簡單介紹 Thrift是一款由Fackbook開發的可伸縮、跨語言的服務開發框架,該框架已經開源而且增加的Apache項目。Thrift主要功能是:通過自己定義的Interface Def

<<Python基礎教程>>學習筆記 | 第12章 | 圖形用戶界面

lena text 平臺 post ack 由於 contents exp 一個 Python支持的工具包非常多。但沒有一個被覺得標準的工具包。用戶選擇的自由度大些.本章主要介紹最成熟的跨平臺工具包wxPython.官方文檔: http://wxpython.org/

Python基礎教程之第5章 條件, 循環和其它語句

like eba cti python基礎 word 沒有 positive while循環 pytho Python 2.7.5 (default, May 15 2013, 22:43:36) [MSC v.1500 32 bit (Intel)] on win32

SiteMesh基礎教程

導航條 web頁面 att blank symphony 創建 筆記 整合 web SiteMesh是由一個基於Web頁面布局、裝飾以及與現存Web應用整合的框架。它能幫助我們在由大量頁面構成的項目中創建一致的頁面布局和外觀,如一致的導航條,一致的banner,一致的版權,

ATOM基礎教程一使用前端插件emmet(16)

自減 styles 工程 expand string 元素符號 asc value adding emmet簡介 http://blog.csdn.net/zsl10/article/details/51956791 emmet的前身是Zen coding,從事Web前

Solr基礎教程之solrconfig.xml(三)

配置文件 multi listener 了無 files content esc lte 存儲 前面介紹過schema.xml的一些配置信息,本章介紹solrconfig.xml的配置,以及怎樣安裝smartcn分詞器和IK分詞器,並介紹主要的查詢語法。

Nginx基礎教程

ref doc lena root mic htm cati 路徑 filename 極速教程 原文鏈接 1.靜態服務器 server { listen 80; # 端口號 location / { root /usr/share/ngin

Tinyshop前後臺操作基礎教程講解

類型 ext https part 商品管理 數據庫管理 tle 商品 品牌 Tinyshop前後臺操作基礎教程講解 01 tinyshop v3框架的安裝 【錄播】tinyshop v3框架的安裝(8分鐘) 02 tinyshop v3框架的後臺基本參數

[學習筆記—Objective-C]《Objective-C-基礎教程 第2版》第十一章 屬性

變量名 erl .text nonatomic syn split view 不能 -name 11.1 使用屬性值 @property float rainHandling; //表明此類具有float類型的屬性,其名稱為rainHandling

【Nutch基礎教程之七】Nutch的2種執行模式:local及deploy

mapred nap ont nal servlet miss mos ant issue 在對nutch源碼執行ant runtime後,會創建一個runtime的文件夾。在runtime文件夾下有deploy和local 2個文件夾。 [[email 

數據分析基礎教程Numpy指南筆記

rgs sign font 功能 hang ptime indices import ges Numpy指南筆記 第2章:Numpy基礎 創建多維數組# coding:utf-8import numpy as npm=np.array([np.arange(2),np.ar

【Unity3D基礎教程】給初學者看的Unity教程(零):如何學習Unity3D

cos 詳解 component lock index unity3d遊戲 design 技術棧 log 【Unity3D基礎教程】給初學者看的Unity教程(零):如何學習Unity3D http://www.cnblogs.com/neverdie/p/How_To_

ucos-III基礎教程匯總

html -s ont 基礎教程 ucos-ii htm itl .html post 目錄:  1.ucos-III前言 ucos-III基礎教程匯總

linux基礎教程---設置文件的主人、組別

post 基礎 -s dsm track pos data- chmod pre 我們在操作linux的是要告訴文件是屬於哪個主人的,哪個組別的。這樣我們就須要知道該怎樣設置“: 設置文件的主人、組別 chown: change owner >cho

linux基礎教程---內容操作

article linu 單位 src 輸出內容 lin ont name con 一、尋找文件裏的指定內容 尋找文件裏的指定內容,輸出內容所在行的所有信息 grep 被搜索內容 文件路徑名 >grep var