1. 程式人生 > >【知識圖譜】知識圖譜火了,但你知道它的發展歷史嗎?

【知識圖譜】知識圖譜火了,但你知道它的發展歷史嗎?

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

作者|尼克編輯|EmilyAI 前線導讀:知識圖譜火了,但你知道它的發展歷史嗎?本文節選自《人工智慧簡史》第 3 章,從第一個專家系統 DENDRAL 到語義網再到谷歌的開源知識圖譜,對知識圖譜的發展歷程進行了全面回顧和深度點評。

The test of all knowledge is experiment.

實驗是知識的試金石。

—— Feynman Lectures on Physics(《費曼物理學講義》)

1. 費根鮑姆和 DENDRAL

費根鮑姆進入卡內基理工學院(卡內基梅隆的前身)攻讀電氣工程(簡稱 EE)本科時才 16 歲。大三時一門“社會科學的數學模型”的課設定了他的人生軌跡,那門課的老師是司馬賀。本科畢業後他留校,在司馬賀任院長的工業管理研究生院讀博士。博士畢業後他來到加州大學伯克利分校的工商管理學院任教。他曾和師弟菲爾德曼(Julian Feldman)合編過一本論文集《計算機與思維》,這本文集的版稅後來被用來在國際人工智慧聯合會(IJCAI)資助“計算機與思維”獎,這成為人工智慧界給 40 歲以下青年學者最重要的獎項,初衷有點像數學界的菲爾茨獎。排在一長串獲獎人第一位的是維諾格拉德(Terry Winograd),其中還有雷納特(Douglas Lenat)、英年早逝的馬爾以及吳恩達,最新的一位(2016 年度)是斯坦福大學做自然語言處理的新秀 Percy Liang。1962 年麥卡錫從東岸的麻省理工學院搬到美麗的舊金山灣區,組建了斯坦福大學計算機系。1964 年費根鮑姆響應麥卡錫的召喚,離開伯克利,到不遠處的斯坦福大學協助麥卡錫。

640?wx_fmt=jpeg

費根鮑姆(1936— )

1958 年李德伯格(Joshua Lederberger)獲得諾貝爾生理獎時才 33 歲,得獎的第二年,他就離開當時任教的威斯康星大學前往加州,受邀重建斯坦福大學的醫學院並擔任遺傳學系主任。那時,斯坦福大學的醫學院還在舊金山,和公立的加州大學舊金山分校一起。加州大學其他各分校沒有醫學院,舊金山分校就是整個加州大學的醫學院,直到 20 世紀 90 年代末期,斯坦福醫學院和加州大學舊金山分校分久必合,尋求合併但最終未果。話說回來,李德伯格在哥倫比亞大學讀本科時就受到“萊布尼茨之夢”的影響,企圖尋找人類知識的普遍規則。1962 年夏,李德伯格還在斯坦福計算中心聽程式設計的課,他上手的第一門語言是 BALGOL 。他很快就結識了剛從麻省理工學院加入斯坦福大學的麥卡錫,他們還企圖把明斯基也吸引到斯坦福醫學院。

640?wx_fmt=jpeg

李德伯格(1925—2008)

費根鮑姆 1964 年在斯坦福大學高等行為科學研究中心的一次會上見到了李德伯格,對科學哲學的共同愛好促成了他們漫長而富有成效的合作。那時李德伯格的研究方向是太空生命探測,更具體地說就是用質譜儀分析火星上採集來的資料,看火星上有無可能存在生命。費根鮑姆的興趣則是機器歸納法,用現在的話說就是機器學習。他們倆,一個有資料,一個搞工具,一拍即合。從科學史的角度看,這是個跨學科的合作,李德伯格的影響力和領導力起了核心作用。按照布坎南的說法,以費根鮑姆為首的計算機團隊的任務就是把李德伯格的思路演算法化。李德伯格完成哲學構思後就興趣遷移了,他最初的想法花了費根鮑姆們 5 年的時間才得以實現,李德伯格責怪他們太慢了。

費根鮑姆很快就發現李德伯格是遺傳學家,對化學其實也是一竅不通,於是他們找到同校的化學家兼作家兼口服避孕藥發明人翟若適(Carl Djerassi)幫忙。翟若適沒得過諾貝爾獎,但他得過美國國家科學獎(得獎人包括維納、哥德爾、夏農、丘成桐)和美國國家技術與創新獎(得獎人包括杜邦公司和 HP 創始人帕卡德、Intel 創始人諾伊斯、微軟創始人蓋茨),這是非常獨特的。另一位兩個獎都得過的是發明了計算機 RISC 架構的寇克(John Cocke)。翟若適那時剛從韋恩州立大學轉到自由的斯坦福大學,李德伯格是他在加州結識的第一個朋友。三人合作的結果就是第一個專家系統 DENDRAL。DENDRAL 輸入的是質譜儀的資料,輸出是給定物質的化學結構。費根鮑姆和他的學生捕捉翟若適和他的學生的化學分析知識,把知識提煉成規則。這個專家系統有時做得比翟若適的學生還準。在翟若適的大部頭自傳中,只有一小段提到 DENDRAL,這個專案在他成果輝煌的學術生涯和多姿多彩的生活中,實在算不上什麼。翟自傳中說費根鮑姆一直把 DENDRAL 的核心稱為“翟演算法”,而布坎南則記得大家都認為專業知識的提供者是李德伯格,也許是費根鮑姆圓滑,也許是計算機團隊更多地接觸李德伯格。

費根鮑姆是學術活動家,剛到斯坦福大學就擔任計算中心主任,當時這個職位比計算機系主任恐怕還更有影響力。20 世紀 60 年代初期和中期,費根鮑姆曾兩次訪問蘇聯,對蘇聯的電腦科學和控制論研究印象深刻,他早就觀察到蘇聯的研究偏理論而輕實踐。但蘇聯下棋程式的勝利確實讓世界吃驚。蘇聯控制論的定義太寬泛,無所不包,其結果也沒有重點,難有突破性成果,而當時中國的自動化學科就是仿效蘇聯的。美國不存在自動化學科,無所不包的 EE 和自動化有很大交集。費根鮑姆意識到他的蘇聯同行企圖利用他的名望來為蘇聯同行背書並爭取資助。而在美國,動態規劃的發明人貝爾曼則通過軍方智庫蘭德公司給空軍建議美國應該提防蘇聯的電腦科學研究。費根鮑姆不爽貝爾曼的報告,認為這是他利用蘇聯威脅論來為自己爭取科研紅利。而若干年後,費根鮑姆卻利用日本的五代機專案宣揚日本威脅論,這不得不讓人懷疑他的動機。費根鮑姆創辦的數家公司因各種原因,都沒有大的成功。其中 Teknowledge 公司沒成,倒是副產品、知識庫專案 SUMO 留了下來,現在開源了,成為幾大基礎的常識知識圖譜之一。

MYCIN

MYCIN 的牽頭人布坎南也是 DENDRAL 的核心成員。布坎南是哲學出身,興趣廣泛。1964 年,在密執安州立大學學哲學的布坎南想在系統開發公司(SDC)找份夏季實習的工作,沒曾想 SDC 居然把他的簡歷發給了蘭德公司,敢情國防口的簡歷也共享。當時在蘭德做夏季工作的費根鮑姆給布坎南打了個電話,於是布坎南到蘭德公司實習並和費根鮑姆結緣。布坎南的研究方向是科學發現,他走的是邏輯路數而不是心理路數,沒曾想費根鮑姆也對科學哲學興趣濃厚。事實上,費根鮑姆和李德伯格最早關於 DENDRAL 的文章中提到了“機械化科學推理”(mechanizing scientific inference)的概念。布坎南博士畢業後想去教哲學,請費根鮑姆寫推薦信,但費說服布坎南到斯坦福大學和他一起搞真正的科學發現。布坎南的哲學背景幫助了他,在 DENDRAL 專案的開頭,李德伯格和費根鮑姆都沒想到假設生成和理論生成的區別,同時布坎南也意識到他在哲學課堂裡學到的卡爾納普理論在計算上行不通。整個 DENDRAL 團隊中沒有一個人對其中涉及的化學知識有全部的瞭解,每個人都假設其他人知道。布坎南早期的演講開頭都得講點化學背景知識,聽眾聽不懂也不耐煩,他記得有一次是麥卡錫站出來對聽眾大喊:“你們就不能好好聽著嗎?”(Just listen,will you?)麥卡錫的威望為他解了圍。

DENDRAL 獲得成功後,布坎南開始尋找新的方向。實驗科學與理論科學比較,是相對原始的,原始經驗也相對容易轉換成規則。除了化學和生物學,醫學是另一個可以馬上利用專家系統的領域。此時的斯坦福醫學院來了一位從哈佛大學本科數學畢業的高才生肖特萊福(Edward Shortliffe),他 1976 年在斯坦福醫學院拿到醫學學位 M.D.,但一年前在布坎南的指導下,他已經獲得了電腦科學的博士,論文就是專家系統 MYCIN,一個針對細菌感染的診斷系統。MYCIN 的處方準確率是 69%,當時專科醫生的準確率是 80%,但 MYCIN 的成績已經優於非本專業的醫生。肖特萊福因此獲得 1976 年 ACM 為青年電腦科學家設立的霍普(Grace Murray Hopper)獎。肖特萊福隨後去麻省總醫院做了三年內科住院醫生,1979 年回到斯坦福大學兼任醫學院和計算機系的教授。

MYCIN 團隊認為 DENDRAL 是專家系統的始祖,這一方面考慮了 DENDRAL 的時間點確實更早,另一方面布坎南本身就出自 DENDRAL。但紐厄爾,作為外人,卻認為 MYCIN 才是專家系統的鼻祖,因為 MYCIN 首創了後來作為專家系統要素的產生式規則:不精確推理。DENDRAL 的初衷則是從專家採集來的資料做機器歸納,或者說機器學習。雖然 MYCIN 從來沒被臨床使用過,但 MYCIN 的開發原理後來逐步被提煉成為專家系統核心 EMYCIN 的基礎。EMYCIN 的動機是兩方面的,除了通用化外,政府資助也是一個原因。20 世紀 70 年代初,DARPA 削減對人工智慧的資助,原來的長期資助改為每年評審。每次向 DARPA 彙報時,費根鮑姆團隊都得事先對詞,他們不敢說研究經費被用來做醫學相關的研究。直到後來他們拿到美國國家健康研究院(NIH)和美國國家醫學圖書館(NLM)的資助,情況才有所好轉。

專家系統的成熟

一個領域成熟與否的主要測度之一是賺不賺錢。人工智慧沒有商業應用一直是被批評的原因之一。專家系統時代最成功的案例是 DEC 的專家配置系統 XCON。DEC 是 PC 時代來臨之前的寵兒,他們用小型機衝擊 IBM。當客戶訂購 DEC 的 VAX 系列計算機時,XCON 可以按照需求自動配置零部件。從 1980 年投入使用到 1986 年,XCON 一共處理了八萬個訂單。

XCON 到底為 DEC 省了多少錢一直是個謎,最高的說法是一年省四千萬美元,還有的說法是兩千五百萬,最低的說法是頂多幾百萬。無論如何,DEC 是把 XCON 當作商業成功來宣傳的。XCON 確實體現了技術的進步,其起源是卡內基梅隆的 R1。說來也有意思,最早的 XCON 居然是用 Fortran 語言寫的,失敗後居然令人髮指地改用 BASIC 語言。紐厄爾的博士生 Charles Forgy 發明了 Rete 演算法和 OPS 語言,極大地提高了專家系統的效率,XCON 迅速採用 OPS 和隨後的 OPS5。

20 世紀 80 年代初到 20 世紀 90 年代初,專家系統經歷了十年的黃金期,隨著日本五代機的幻滅,“專家系統”變成了一個不僅不時髦,反而有負面含義的詞。網際網路催生的電子商務,有很多和 XCON 類似的應用場景,於是新瓶裝舊酒,專家系統搖身一變,改名規則引擎,成為中介軟體的標配。徵信、反欺詐和風險控制一直是規則系統擅長的領域,徵信公司 FICO 收購了一系列一直苟延殘喘的專家系統公司,包括 Forgy 的 RulesPower。目前已經很少有獨立的專家系統公司了。

知識表示

知識表示一直是人工智慧不溫不火的一個領域,催生者是專家系統和自然語言理解。KRL(Knowledge Representation Language)是最早的知識表示語言之一,有影響但不成功。參加過施樂實驗室(XEROXParc)KRL 專案的維諾格拉德在多年後總結教訓時說,KRL 要同時解決兩個問題:第一,知識工程師的可用性,也就是說人可讀可寫;第二,得有底層的麥卡錫風格的邏輯來支撐語義。要同時解決這兩個互相矛盾的問題,必然導致結果太複雜,四不像,知識工程師和邏輯學家都不買賬。

 邏輯

邏輯是最方便的知識表示語言,從亞里士多德開始人們就熟悉,邏輯同時具有各種數學性質。任何一本邏輯入門書都會有那個著名的蘇格拉底的例子:人必有一死,蘇格拉底是人,所以蘇格拉底必死。這個三段論表示成現代的數理邏輯就成了如下形式。

大前提和小前提:(∀x) Man(x) ⊃ Mortal(x) & Man(Socrates)

結論:Mortal(Socrates)

一階邏輯也稱謂詞邏輯,是希爾伯特簡化羅素的《數學原理》中邏輯的結果。謂詞邏輯沒有本體,也就是沒有關於特定世界的公理。也正因此,哲學家、邏輯學家蒯因把邏輯等同於一階邏輯。一階邏輯只是語法,沒有本體,沒有語義;而高階邏輯,在蒯因的眼裡,其實是“披著偽裝的集合論”(set theory in disguise)。費根鮑姆所謂的知識就是本體。當然,費根堡姆不是從邏輯的角度而是從心理的角度看問題,這顯然受到他的老師紐厄爾和司馬賀的影響。

可計算性和計算複雜性理論與邏輯密不可分。一階邏輯是不可判定的,命題邏輯的可滿足性問題是 NP 完全的。知識表示的一個核心問題是找到一個一階邏輯的子集,它是可判定的,並且儘可能地有效。描述邏輯應運而生。描述邏輯可以表達實體和類以及類和類之間的關係。描述邏輯中的實體就是一階邏輯中的常量。實體的表示在描述邏輯中也稱 Abox,例如“牛頓是物理學家”可以表示為:

Physicist(Newton)

描述邏輯中不需要變數,描述邏輯的術語更像是集合論,類和類之間的關係也稱 TBox。例如,在一個本體中,律師事務所(Lawfirm)是公司(Company)的子集,公司是組織(Organization)的子集,組織是 Agent 的子集,Agent 是 Thing 的子集,這樣一系列關係可以表示為:

律師事務所 ⊑公司 ⊑組織⊑Agent ⊑Thing

其對應的一階邏輯表示式為:    Lawfirm(x) → Company(x), Company(x) → Agent(x) ,    Agent(x) → Thing(x)

一階邏輯的定理證明的 Term Index 技術中有 Subsumption 的概念,表示 Term 之間的集合從屬關係。Tbox 表達了一種簡化的 Subsumption。除了 ABox 和 TBox,還有 RBox 表示關係或者角色,關係之間可以有集合論中常有的子集、交集、並集等操作,例如“父親的父親是祖父”可表示為:has Father ◦ has Father ⊑ has GrandFather其對應的一階邏輯表示式為:

has Father(x, y ) ∧ has Father(y, z) → has GrandFather(y, z)

 心理學與語言學

知識表示的另一個來源是心理學和語言學,例如概念的上下位繼承關係最方便的表示方式是樹而不是一階邏輯。心理學實驗表明人在回答“金絲雀會飛嗎?”要比回答“鳥會飛嗎?”花的時間長,要回答第一個問題,人要再做一次“金絲雀是鳥”的推理。因為人在儲存知識時只儲存抽象的,這是空間經濟的考慮。心理學家米勒和喬姆斯基等一起開拓了認知科學,他最出名的論文大概就是那篇“魔力數字七”(The Magic Number Seven)。他除了理論的貢獻,晚年帶領普林斯頓大學的認知科學實驗室同仁做了“詞網”(WordNet)。WordNet 不單是一個同義詞辭典,還定義了詞的上下位關係,例如,car 的一種上位是 motor,可以再上位到 wheeled vehicle,直到 entity。WordNet 成為自然語言處理的基本工具。

Sense 1
car, auto, automobile, machine, motorcar
       => motor vehicle, automotive vehicle
           => self-propelled vehicle
               => wheeled vehicle
                   => vehicle
                       => conveyance, transport
                           => instrumentality, instrumentation
                               => artifact, artefact
                                   => whole, unit
                                       => object, physical object
                                           => physical entity
                                               => entity
                   => container
                       => instrumentality, instrumentation
                           => artifact, artefact
                               => whole, unit
                                   => object, physical object
                                       => physical entity
                                           => entity

圖WordNet

 明斯基的框架

框架(Frame)就是型別。金絲雀是鳥,所有鳥的性質自動流傳給金絲雀,鳥能飛,金絲雀也能飛。蘋果手機是手機,手機能打電話,蘋果手機也能打電話。框架導致了面向物件(OO,Object-Oriented)的設計哲學,相關的程式設計語言都受此影響。從這個意義上還真驗證了:當一個概念有了成熟的實現時,就自動脫離了人工智慧。差不多同時出現的語義網路(Semantic Net,注意這個和後面講到的 Semantic Web 相關但不同)是與框架等價的表示方式。語義網路中的每個節點就是一個框架,每個節點上的邊可以看作一個 slot。

 Sowa 的概念圖

IBM 的索瓦(John Sowa)在 20 世紀 80 年代初提出“概念圖”(Conceptual Graph),企圖把知識表示奠定在更加堅實的數學和邏輯基礎上。大約同時或稍早,德國數學家威勒(Rudolf Wille)提出基於代數的“形式化概念分析”(Formal Concept Analysis)。程式設計語言理論也變得越發嚴謹。在概念圖中,多重繼承的型別層次(Muliple Inheritance)可以用代數的偏序關係“格”(Lattice)來表示。“全序”關係(total-order)是“偏序”的一個特例。一個全序集中的成員要麼是 a<=b,要麼是 b<=a。偏序關係容許一個成員可以有多個上級,也可以有多個下級。而全序集中,每個成員只能有一個上級和一個下級,所以,全序關係有時也被稱為線性關係。當用“格”做知識表示時,每個概念就是“格”中的一員,概念之間服從偏序關係。多重繼承的 OO 都是偏序關係。

雷納特和大知識系統

在日本五代機專案帶來的狂潮中,美國政府決定聯合多家高技術企業在得克薩斯大學奧斯汀分校所在地建立微電子與計算機技術公司(MCC,Micro electronics and Computer Technology Corporation)以抗衡日本,海軍上將英曼(Inman)被任命為 CEO,當時在奧斯汀分校從事機器定理證明的資深教授布萊索(Woody Bledsoe)全職加入 MCC 負責研發。這讓人想起二戰時曼哈頓工程中格里菲斯將軍和奧本海默的分工。費根鮑姆提議建立美國的國家知識技術中心(National Center for Knowledge Technology),像狄德羅建立百科全書一樣,把人類有史以來的知識建庫,這自然對 MCC 的計劃也有很大影響。布萊索向英曼推薦了費根鮑姆的學生雷納特(Douglas Lenat)。

雷納特此時 30 出頭,是人工智慧領域的一顆新星。他在賓夕法尼亞大學得了數學和物理雙學位後又拿了個數學碩士,畢業後他對數學和物理的學術工作都失去了興趣,但他畢業馬上就面臨徵兵,只得又跑到加州理工學院接著讀博士。期間他對人工智慧產生了強烈興趣,遂轉學到斯坦福大學想跟隨麥卡錫,但正趕上麥卡錫的學術休假年,於是他變成了費根鮑姆和布坎南的學生。他的博士論文實現了一個稱作 AM 的程式,為此,IJCAI 在他博士畢業第二年就給了他一個“計算機與思維”大獎。AM 就是自動數學家(Automated Mathematician)的簡稱,它可以自動“發現”定理。雷納特沒有用“發明”這個詞,從某種意義上體現了他的哲學立場。在經受了一連串關於 AM 不嚴謹的批評之後,雷納特推出了 AM 的後繼 Eurisko。Eurisko 的應用領域更加廣泛,包括博弈。

640?wx_fmt=jpeg

雷納特(1950— )

當雷納特來到 MCC 時,他已經有了一個新的想法:把人類的常識編碼,建成知識庫。這個新專案叫 Cyc,這三個字母取自英文單詞“百科全書”(encyclopedia)。這其實就是最早的知識圖譜。雷納特堅定地支援他老師費根鮑姆的知識原則(Knowledge Principle):一個系統之所以能展示高階的智慧理解和行為,主要是因為在所從事的領域所表現出來的特定知識:概念、事實、表示、方法、比喻以及啟發。雷納特甚至說:“智慧就是一千萬條規則。”

索瓦提出“知識湯”(knowledge soup)的說法:我們腦子裡的知識不是一坨知識,而是好幾坨知識,每一坨內部是一致的,但坨和坨之間可能不一致,坨和坨之間是鬆散耦合的。古哈(Guha)在斯坦福大學的博士論文導師是麥卡錫和費根鮑姆,他的論文講的是如何將一個大理論分解為多個“微理論”(microtheory),如何利用 Cyc 作為多個不同資料來源的前端而不是全部,這恰是索瓦的“知識湯”的實現。Cyc 由此可成為資料或資訊整合的工具。雷納特對此有點不爽,但他還是把古哈招到了門下。

雷納特對 Cyc 自視甚高。他 1984 年時曾預言 15 年後,也就是 1999 年,每臺馬路上賣的電腦裡都得預裝 Cyc。1986 年,雷納特再度預言:Cyc 如果可用的話,至少要有 25 萬條規則,這至少要花 350 個人年,也就是 35 個人幹十年。Cyc 專案開始時有 30 個左右的知識工程師,他們每天的工作就是利用 Cyc 的語言 CycL 把日常生活的常識編碼,這包括教育、購物、娛樂、體育等。到了 1995 年,日本的五代機專案煙消雲散,美國政府也削減了對 MCC 的支援。雷納特帶著 Cyc 離開 MCC,成立 Cycorp 公司,開始了漫長的創業路程。核心骨幹古哈離開 MCC,先後加入了蘋果、網景和谷歌三家公司。

倒是 WordNet 在各種版本的 Linux 配置的 App Center 裡很容易找到。WordNet 比 Cyc 更基本也更好用,當然 WordNet 沒有 Cyc 那麼多的推理功能。再過 50 年,人們對一階邏輯也不會像對莎士比亞那麼熟。也許 WordNet 並不是一個好的例子。Cyc 的原始目標更像是當今的維基百科,不過維基百科的受眾是人,Cyc 的使用者是機器。Cyc 在 20 世紀 90 年代初期就被批評說沒有成功案例,而當時的其他專家系統都有或多或少的應用。雷納特辯解道,Cyc 只有在知識量突破臨界點(critical mass)之後才能帶來收益。現在離開那時的批評,已經又過去了 20 多年。我們還是看不到可觀的應用。

Cyc 現在有兩個版本:企業版和研究版。企業版收費,研究版對研究人員開放。曾經有一個開源的 OpenCyc,是一個簡版,但試用中發現 OpenCyc 引發的問題太多,被停掉了,Cyc 正在準備用一個雲版代替 OpenCyc。雷納特曾說:“學習只在已知事物的邊緣發生,所以人們只可能學到與自己已知相似的新東西。如果你試圖學習的東西與你已知的東西距離不遠,那麼你就能學會。這個邊緣的範圍越大(你已知的東西越多),就越有可能發現新的東西。”這不僅是他早期研究機器學習的感悟,也可以看作他對後來 Cyc 專案的體會。1984 年雷納特開始 Cyc 專案時,才 30 歲出頭,現在 30 多年過去了,他已經年近 70 歲,仍然擔任 Cycorp 的 CEO。

語義網

由專家系統一脈相傳的這一派自身的邏輯功力不夠,他們一直在和定理證明派掐架;另一方面,他們的工程實踐又略顯欠缺。專家系統風過了後,他們變成了暗流,直到歪打正著的全球資訊網支持者之一伯納斯李(Tim Berners-Lee)提出“語義網”(Semantic Web,見 Berners-Lee 2001),他們認為機會來了。伯納斯李因為草根且便捷的 HTTP 協議和超文字連結標準 HTML 出了名,被各種媒體稱為全球資訊網的發明人。第一波網際網路熱之後,他馬上離開歐洲粒子中心,到麻省理工學院新創辦的全球資訊網協會(W3C)擔任理事長。麻省理工學院給他在當時的電腦科學實驗室(現已合併為 CSAIL 電腦科學與人工智慧實驗室)謀了個位置,顯然目的是提高學院在網際網路大潮中的影響力。網際網路熱拉大了美國科技創新之都矽谷和麻省理工學院所在波士頓 128 公路之間的距離。20 年後,伯納斯李不負所望,得了 2016 年圖靈獎,這大概是圖靈獎有史以來含金量最低的一個。

其實全球資訊網更大的功勞應該算在天才程式設計師安德森(Marc Andreessen)的頭上,是革命性的 Mosaic 瀏覽器帶來了網際網路革命。年輕的安德森志在改變世界,而不是徒得虛名。在克拉克(Jim Clark)的指點和幫助下創辦了網際網路標誌性企業“網景”後,他又經歷了幾次艱難但不是特別成功的創業。在第二次網際網路高峰來臨時,安德森與時俱進地創辦了新一代風險投資公司安德森霍洛維茨 ,成果和影響力直追老牌風投 KPCB 和紅杉資本。

話說回來,得益於 20 世紀 80 年代就已成熟的 SGML 標準,超文字連結標準 HTML 是 SGML 的某種不夠深謀遠慮的簡化版。而 HTTP 頂多算掛在瀏覽器偉岸身軀上的一個可有可無的小玩具,直到網際網路標準化組織 IETF 對 HTTP 做了幾次修改之後,HTTP 才更像是個專業的東西。全球資訊網協會(W3C)的目的是為全球資訊網設立標準。伯納斯李身邊一下子聚集了一幫多年不得志的非主流 IT 從業者。他們在 W3C 中提出的幾個亂七八糟的標準確實體現出他們的理論功底之缺乏。在 W3C 的各種會中經常會見到各大技術公司中游離於邊緣的資深從業者,有些人換了工作還是代表不同的公司參加各種標準化組織的工作組會議,他們的職業生涯不是為了做出技術貢獻,而是不斷為自己的存在找各種高尚的理由並脫離公司的管理體制。2006 年美國人工智慧年會(AAAI)上,在伯納斯 - 李的主題發言之後,時任谷歌研發總監的諾維格(Peter Norvig)尖銳地發問,被人認為是毫不留情地批評了語義網。

W3C 語義網的工作後來在一些準邏輯學家加入後引入了描述邏輯,變得貌似嚴格起來,經過幾次迭代後演化成大雜燴,理論上不嚴謹,實踐中不可用。所謂“萬事開頭難”,但開了一個壞頭,則是災難,為後人修正製造了人為障礙。我們可以把語義網的工作與早期的 DENDRAL 和 MYCIN 做個對比,很明顯,無論理論、實踐還是人文社會政治環境,都不可同日而語。幾乎每個“語義網”的專案都能看到古哈的影子,2013 年他還在谷歌時曾有個演講“隧道深處見到光”(Light at the End of the Tunnel),與其說是誇耀成功,倒不如說是總結教訓。

 谷歌和知識圖譜

在維基百科的同時,還有個 Freebase。維基百科的受眾是人,而 Freebase 則強調機器可讀。2016 年維基百科達到 1000 萬篇文章,其中英文版達到 500 萬篇文章,而 Freebase 有 4000 萬個實體表示。Freebase 的背後是一家名叫 Metaweb 的創業公司,創始人之一是希利斯(Danny Hillis)。2010 年 Metaweb 被谷歌收購,谷歌給它起了個響亮的名字“知識圖譜”。2016 年穀歌對 Freebase 停止更新,把所有資料捐給維基資料(Wikidata)。維基資料是維基百科的母公司 Wikimedia 的德國分部的專案,得到了微軟創始人艾倫出資創辦的艾倫人工智慧研究所的支援。

除了維基資料之外,另外還有幾個開源的知識圖譜,如 DBpedia、Yago、SUMO 等。值得一提的是,SUMO 是費根鮑姆創辦的一家失敗的公司 Teknowledge 的遺產。所有開源的知識圖譜的基礎資料的重要來源之一都是維基百科。以維基百科中居里夫人的詞條為例,在“居里夫人”頁面的右邊,有個被稱為 infobox 的框,裡面包含了居里夫人的資料,例如她的生日、卒日、出生地、母校、老師、學生等,這些資料已經接近結構化的質量。

640?wx_fmt=png

維基百科中“居里夫人”詞條

IBM 沃森的底層就整合了兩個開源知識圖譜 Yago 和 DBpedia。在常識圖譜的上面還可以構建垂直領域(例如生物、健康、金融、電商、交通等)的專業圖譜。

紐厄爾和司馬賀在人工智慧中是符號派。其實,符號派中也派中有派,比司馬賀一支更加“符號”的是機器定理證明,紐厄爾和司馬賀的早期生涯曾和一幫邏輯學家結下樑子,而費根鮑姆繼承了老師的基因,對定理證明的第二代代表人物阿蘭•羅賓遜極盡攻擊之能事。明尼蘇達大學巴貝奇研究所做口述歷史的諾伯格在採訪各位人工智慧前輩時,總想把符號派歸結到麻省理工學院和卡內基梅隆大學之爭,而在斯坦福大學的麥卡錫和 SRI 的尼爾森偏麻省理工學院,同在斯坦福大學的費根鮑姆則偏自己的母校卡內基梅隆大學。當然我們還可以溯源到更早的達特茅斯會議上麥卡錫和司馬賀結下的樑子。但歸根結底,專家系統的理論基礎依然是機器定理證明。儘管費根鮑姆從某種意義上人造了“知識與推理”的對立話題,並強調知識對於邏輯推理的重要性,但知識和推理是不可分割的一對,強調知識並不能讓你脫離符號派。如果從純粹的定理證明的角度簡單地看專家系統,所謂知識其實就是公理,公理越多,推理的步驟自然就會越少。所謂知識和推理的對立,其實是狹義(特殊目的)和廣義(通用)的區別。知識是狹義的,推理是廣義的,因為不需要過多的公理。狹義對機器的短期實現高效,但人的學習門檻較高;而廣義對機器的實現自然低效,但人學習的門檻較低。一階邏輯的學習門檻最低,但當知識庫變大,推理引擎也得變得更加專用才能高效。

作者介紹

尼克,早年曾任職哈佛和惠普;後創業投資,往返於大陸和矽谷。無論忙閒不忘讀書寫字,作品多發表於《上海書評》,並有著作《UNIX系統 V核心剖析》和《哲學評書》。

 640?wx_fmt=png

人工智慧賽博物理作業系統

AI-CPS OS

人工智慧賽博物理作業系統新一代技術+商業作業系統“AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧)分支用來的今天,企業領導者必須瞭解如何將“技術”全面滲入整個公司、產品等“商業”場景中,利用AI-CPS OS形成數字化+智慧化力量,實現行業的重新佈局、企業的重新構建和自我的煥然新生。

AI-CPS OS的真正價值並不來自構成技術或功能,而是要以一種傳遞獨特競爭優勢的方式將自動化+資訊化、智造+產品+服務資料+分析一體化,這種整合方式能夠釋放新的業務和運營模式。如果不能實現跨功能的更大規模融合,沒有顛覆現狀的意願,這些將不可能實現。

領導者無法依靠某種單一戰略方法來應對多維度的數字化變革。面對新一代技術+商業作業系統AI-CPS OS顛覆性的數字化+智慧化力量,領導者必須在行業、企業與個人這三個層面都保持領先地位:

  1. 重新行業佈局:你的世界觀要怎樣改變才算足夠?你必須對行業典範進行怎樣的反思?

  2. 重新構建企業:你的企業需要做出什麼樣的變化?你準備如何重新定義你的公司?

  3. 重新打造自己:你需要成為怎樣的人?要重塑自己並在數字化+智慧化時代保有領先地位,你必須如何去做?

AI-CPS OS是數字化智慧化創新平臺,設計思路是將大資料、物聯網、區塊鏈和人工智慧等無縫整合在雲端,可以幫助企業將創新成果融入自身業務體系,實現各個前沿技術在雲端的優勢協同。AI-CPS OS形成的字化+智慧化力量與行業、企業及個人三個層面的交叉,形成了領導力模式,使數字化融入到領導者所在企業與領導方式的核心位置:

  1. 精細種力量能夠使人在更加真實、細緻的層面觀察與感知現實世界和數字化世界正在發生的一切,進而理解和更加精細地進行產品個性化控制、微觀業務場景事件和結果控制。

  2. 智慧:模型隨著時間(資料)的變化而變化,整個系統就具備了智慧(自學習)的能力。

  3. 高效:企業需要建立實時或者準實時的資料採集傳輸、模型預測和響應決策能力,這樣智慧就從批量性、階段性的行為變成一個可以實時觸達的行為。

  4. 不確定性:數字化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗,其結果就是形成了複合不確定性這種顛覆性力量。主要的不確定性蘊含於三個領域:技術、文化、制度。

  5. 邊界模糊:數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業的核心產品、經濟學定理和可能性都產生了變化,還模糊了不同行業間的界限。這種效應正在向生態系統、企業、客戶、產品快速蔓延。

AI-CPS OS形成的數字化+智慧化力量通過三個方式激發經濟增長:

  1. 創造虛擬勞動力,承擔需要適應性和敏捷性的複雜任務,即“智慧自動化”,以區別於傳統的自動化解決方案;

  2. 對現有勞動力和實物資產進行有利的補充和提升,提高資本效率

  3. 人工智慧的普及,將推動多行業的相關創新,開闢嶄新的經濟增長空間

給決策制定者和商業領袖的建議:

  1. 超越自動化,開啟新創新模式:利用具有自主學習和自我控制能力的動態機器智慧,為企業創造新商機;

  2. 迎接新一代資訊科技,迎接人工智慧:無縫整合人類智慧與機器智慧,重新

    評估未來的知識和技能型別;

  3. 制定道德規範:切實為人工智慧生態系統制定道德準則,並在智慧機器的開

    發過程中確定更加明晰的標準和最佳實踐;

  4. 重視再分配效應:對人工智慧可能帶來的衝擊做好準備,制定戰略幫助面臨

    較高失業風險的人群;

  5. 開發數字化+智慧化企業所需新能力:員工團隊需要積極掌握判斷、溝通及想象力和創造力等人類所特有的重要能力。對於中國企業來說,創造兼具包容性和多樣性的文化也非常重要。

子曰:“君子和而不同,小人同而不和。”  《論語·子路》雲端計算、大資料、物聯網、區塊鏈和 人工智慧,像君子一般融合,一起體現科技就是生產力。

如果說上一次哥倫布地理大發現,拓展的是人類的物理空間。那麼這一次地理大發現,拓展的就是人們的數字空間。在數學空間,建立新的商業文明,從而發現新的創富模式,為人類社會帶來新的財富空間。雲端計算,大資料、物聯網和區塊鏈,是進入這個數字空間的船,而人工智慧就是那船上的帆,哥倫布之帆!

新一代技術+商業的人工智慧賽博物理作業系統AI-CPS OS作為新一輪產業變革的核心驅動力,將進一步釋放歷次科技革命和產業變革積蓄的巨大能量,並創造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環節,形成從巨集觀到微觀各領域的智慧化新需求,催生新技術、新產品、新產業、新業態、新模式。引發經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。

產業智慧官  AI-CPS

用“人工智慧賽博物理作業系統新一代技術+商業作業系統“AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧)在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧;實現產業轉型升級、DT驅動業務、價值創新創造的產業互聯生態鏈


640?wx_fmt=png

640?wx_fmt=png

長按上方二維碼關注微信公眾號: AI-CPS,更多資訊回覆:

新技術“雲端計算”、“大資料”、“物聯網”、“區塊鏈”、“人工智慧新產業:智慧製造”、“智慧農業”、“智慧金融”、“智慧零售”、“智慧城市、“智慧駕駛”新模式:“財富空間、“資料科學家”、“賽博物理”、“供應鏈金融”

官方網站:AI-CPS.NET

本文系“產業智慧官”(公眾號ID:AI-CPS)收集整理,轉載請註明出處!

產業智慧官(公眾號ID:AI-CPS推薦的文章,除非確實無法確認,我們都會註明作者和來源。部分文章推送時未能與原作者取得聯絡。若涉及版權問題,煩請原作者聯絡我們,與您共同協商解決。聯絡、投稿郵箱:[email protected]

相關推薦

知識圖譜知識圖譜知道發展歷史

作者|尼克編輯|EmilyAI 前線導讀:知識圖譜火了,但你知道它的發展歷史嗎?本文節選自《人工

知識圖譜知道發展歷史?|贈書5本

作者:尼克   編輯|Emily版式由AI前線整理知識圖譜火了,但你知道它的發展歷史嗎?本文節選

知識圖譜已成 AI 下一風口知道進展到哪

知識圖譜最初是由谷歌提出用來優化搜尋引擎的技術,在不斷髮展中外延也一度擴大。盤點目前知識圖譜的發展,其已經助力了很多熱門的人工智慧場景的應用,例如語音助手、聊天機器人、智慧問答等。當前的人工智慧其實可以簡單劃分為感知智慧(主要集中在對於圖片、視訊以及語音的能力的探究)和認知智慧(涉及知識推理、因果分析等),知

解×××知道×××是什麽

讀書 環境 興趣 聯網 一點 微信公眾 .com 永遠 互聯 各位讀書人好,在當今社會互聯網+ 的 大環境下 ,給了我們這些 很年輕 有能力 有抱負,但就是沒有經濟能力的社會菜鳥們一次翻身,實現自己財富自由的機會!但是要在互聯網上,要實現財富自由需要具備幾方面! 1.你要有

這麼多次 I/O知道的原理麼

### IO 軟體目標 #### 裝置獨立性 現在讓我們轉向對 I/O 軟體的研究,I/O 軟體設計一個很重要的目標就是`裝置獨立性(device independence)`。啥意思呢?這意味著**我們能夠編寫訪問任何裝置的應用程式,而不用事先指定特定的裝置**。比如你編寫了一個能夠從裝置讀入檔案的應用

抖音MCN卻在毀掉整個行業

他口中說的他們,其實並不是微視,而是和微視合作的MCN機構!MCN類似於網紅和視訊博主的公會和經紀公司,原本是視訊達人和平臺、廣告主之間的紐帶和橋樑,而現在卻在毀掉整個行業。 正在瘋長的視訊MCN 從2017是中國網紅和短視訊的大年,由於短視訊專案越來越火,相關的MCN發展也越來越迅猛

機器學習機器學習Top10演算法選擇最合適的那一個!一文讀懂ML中的解析解與數值解...

在機器學習領域裡,不存在一種萬能的演算法可以完美解決所有問題,尤其是像預測建模的監督學習裡。比方

聽說的資源被盜用知道 Nginx 怎麼防盜鏈

上一篇文章講了 [Nginx 中的變數和執行原理](https://iziyang.github.io/2020/06/09/7-nginx/),下面就來說一個主要提供變數並修改變數的值的模組,也就是我們要講的防盜鏈模組:referer 模組。 ## 簡單有效的防盜鏈手段 ### 場景 如果做過個人站

知識圖譜知識圖譜實體連結無監督學習框架

雷鋒網 AI 科技評論按:阿里巴巴有 11 篇論文被 AAAI 2018錄用,分別來自機器智慧技

知識圖譜知識圖譜從0級到10級簡化版

作者:鮑捷  來源:文因學堂 授權 產業智慧官 轉載。  以前寫過幾個進階指南,可能都太難,不接地氣。這裡重新寫一個更實事求是、更便於工程落地的版本 0級:掌握正則表示式、SQL、JSON和一門支援if-then-else的高階語言  —— 是的,這些不是知識圖譜技術,但是這些可以解決問題。我們要的是

免費直播3.12-3.158場公開課大“惠”聚——知識幹貨、專屬優惠一晚搞定!

人工智能 網絡技術 軟考 數據庫 課程安排一覽: 3月12號晚20:00-21:30如何一次通過軟考【小任老師】(系統集成項目管理師/高級信息系統項目管理師) 3月13號晚20:00-21:00如何成為高端IT運維人才【韓立剛老師】 3月13號晚20:00-21:30【楊哥】權威解析紅帽

Hibernate緩存知識要點

常用 以及 provide 懶加載 更改 pub 語句 com 效率 對象狀態 Hibernate中對象的狀態: 臨時/瞬時狀態 持久化狀態 遊離狀態 學習Hibernate的對象狀態是為了更清晰地知道Hibernate的設計思想,以及是一級緩存的基礎...當然啦,也就

Struts2開發Action知識要點

自定義轉換器 分享 article com AC 組件 word pro username 前言 前面Struts博文基本把Struts的配置信息講解完了.....本博文主要講解Struts對數據的處理 Action開發的三種方式 在第一次我們寫開發步驟的時候,我們寫的Ac

JAVA基礎知識學習Java中的StringStringBuilderStringBuffer三者的區別

  最近在學習Java的時候,遇到了這樣一個問題,就是String,StringBuilder以及StringBuffer這三個類之間有什麼區別呢,自己從網上搜索了一些資料,有所瞭解了之後在這裡整理一下,便於大家觀看,也便於加深自己學習過程中對這些知識點的記憶,如果哪

SQL Serversql server更改數據表的字段/新增數據表的字段 無法保存

ima png src 無法 取消 解決方法 更改 designers 字段 sql server更改了數據表的字段/新增數據表的字段 無法保存 解決方法:進入 工具-->選項-->Designers-->表設計器和數據庫設計器-->取消勾

鹹魚·心聲CTF比賽看到自己的不堪一擊

林大計算機鹹魚一枚,愛好計算機,今日是第一次寫計算機方面的部落格。雖然可能內容簡單甚至還有錯誤,但是希望能夠通過此記錄自己的成長軌跡。或許這就是我走向成熟的足跡。 ——《淺談氣泡排序》 以上文字摘錄自我的第一篇部落格,對於氣泡排序的一些理解,嘗試寫了一下部落格。 內容,可能

特別推薦小夥伴們驚呆!8個超炫的 Web 效果

  CodePen 是一個線上的 HTML、CSS 和 JavaScript 程式碼編輯器,能夠編寫程式碼並即時預覽效果。你在上面可以線上展示自己的作品,也可以看到其他人在網頁中實現的各種令人驚奇的效果。   今天這篇文章就為大家挑選出8個超炫的 Web 效果演示,這些 Demo 可以說都是藝術品,讓小夥伴

且行且珍惜一個人久了,害怕孤獨卻又一個人享受著孤獨的滋味總愛在一個人的時候把自己搞得很悲情然後放聲大哭像個小孩子一樣在獨自欣賞著一種叫做殘酷的美。心情瞬息萬變發洩著心裡所有的不滿。

且行且珍惜 一個人久了,害怕孤獨卻又一個人享受著孤獨的滋味,總愛在一個人的時候把自己搞得很悲情,然後放聲大哭,像個小孩子一樣,在獨自欣賞著一種叫做殘酷的美。心情瞬息萬變,發洩著心裡所有的不滿。 ...

專案分析到底哪裡出現問題

故事發生在8月11日的某個上午,上午的9:00-11:00會有公司組織的全國的線上的考試,當時出現了問題,問題表現:當時使用者登陸之後,請求反映一直很慢,登陸可以成功,登陸的過程很慢,頁面反映就直接卡住了。 當時的反應是,使用者服務在Nginx上直接faild,然後ngin

轉載古詩背串可是會出大事的喲

  上學的時候不知道大家是否為了背誦詩詞而焦頭爛腦,從中也有很多笑話,那就是背串啦!今天就盤點一下容易背串的詩詞,有些細細讀來居然還是有些道理的。 書山有路勤為徑,長使英雄淚滿襟。(原來是學渣啊。) 不識廬山真面目,只識彎弓射大雕。(英雄受我一拜!)