1. 程式人生 > >說明:最新"谷歌AI智商不超過6歲"研究來自中國科學院而非美國康內爾大學

說明:最新"谷歌AI智商不超過6歲"研究來自中國科學院而非美國康內爾大學

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

最近cnBeta等多家網站報道:

“據HotHardware報道稱,來自美國康奈爾大學一組研究人員對各大科技公司的人工智慧型語音助手進行了橫向比較。研究人員發現,谷歌助手擁有目前語音助手類中最高的平均智商,IQ值約為47.28,水準接近於人類六歲兒童。而蘋果的Siri語音助手的平均智商則較低,約為23.9,考慮到Siri助手的誕生早於谷歌助手,谷歌近年來在AI研究領域的發展是非常令人印象深刻的,研究同時也提到了中國百度團隊的AI也取得了長足的進步。”

這項研究的真實出處是中國科學院虛擬經濟與資料科學研究中心,由計算機博士,網際網路進化論作者劉鋒,中國科學院虛擬經濟與資料科學研究中心主任石勇教授,中國科學院經濟管理學院劉穎副教授組成的研究團隊完成,題目是“人工智慧的智商評測與智慧等級研究”(Intelligence Quotient and Intelligence Grade of Artificial Intelligence),研究論文發表在2017年Annals of Data Science期刊上。

10月初,這項研究成果受到包括CNBC,ZDNET,YAhoo等美國,德國,日本媒體的報道。如CNBC的報道內容如下:

0?wx_fmt=png

美國科技媒體HotHardware網站把研究成果的出處從“中國科學院虛擬經濟與資料科學研究中心“ 錯誤的寫成"美國康內爾大學”.作為頗有影響力的美國科技媒體,HotHardware出現這種錯誤實屬不該。

0?wx_fmt=png

關於論文“人工智慧智商和智慧等級研究”的簡要介紹

1.AI智商研究的背景和麵臨的問題

這篇論文的研究開始於2012,起源是解決2010年以來不斷日益高漲的人工智慧威脅論,當時的思路是能否通過對比研究人工智慧系統的智商發展水平並與人類智商,為解決人工智慧威脅論問題尋找定量的分析方法。研究者為中國科學院虛擬經濟與資料科學研究中心劉鋒,石勇和劉穎。

這個問題的解決面臨的最大問題是"第一,人工智慧系統目前沒有形成統一的模型;第二,人工智慧系統與以人類為代表的生命體之間目前沒有形成統一的模型。",原有的人類智商測試也沒有相應的理論基礎可以直接使用到AI的智商評測上,這就需要我們首先解決人類和AI系統的模型統一問題。

2.建立標準智慧模型

在參考了馮·諾伊曼結構、戴維·韋克斯勒人類智力模型、知識管理領域DIKW(Data, Information, Knowledge, Wisdom)模型體系等。分別在2014年和2015年發表論文提出建立“標準智慧模型”,統一描述人工智慧系統和人類的特徵和屬性。

這個模型把任何一個智慧體看做一個具有“知識的獲取,掌握,創新和反饋”的系統,區別在於每個智慧體在這四個領域裡能力不同,從而導致智商評價的不同。如下圖所示。

3.2014年和2016年兩次AI和人類智商測試

0?wx_fmt=png

為了更好的分析AI,人類等智慧體的智慧水平,我們把“知識的獲取,掌握,創新和反饋”又分成15個小分類,從更多維度評測AI,人類的智慧。這15個小分類是“影象、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等,”。根據這些分類在2014年對世界50個AI系統和3個不同年齡段人類進了測試。

0?wx_fmt=png

2016年2月,研究團隊開展了“2016年人工智慧系統的智商測試”,目前已對谷歌、百度、搜狗等人工智慧系統以及蘋果Siri、微軟小冰等進行了測試,工作還在進行中。不過從已完成的工作看,谷歌、百度等人工智慧系統的效能比兩年前已有大幅提高,但仍與6歲兒童有一定差距。

0?wx_fmt=png

雖然人工智慧系統,這兩年得分增長很快。但在創造性這個大分類上,得分一直進展不大。而且這個分類的權重又比較高。從兩次測試看,人工智慧系統在知識的掌握方面得分比較高。在知識的獲取和反饋方面有很大提高,但還有很多不足。到2018年我們做第三次測試時,大家基本上可以看到一個曲線。

4。標準智慧系統數學模型和智慧等級劃分

2017年發表的論文也根據“標準智慧模型”建立了數學模型,描述智慧系統的特徵。

0?wx_fmt=png

基於這個模型也對人類,AI等智慧系統進行了等級分類。

(I 知識資訊接收,O知識資訊輸出,S,知識資訊掌握或儲存,C 知識資訊創新創造)

0?wx_fmt=png

1.對於人工智慧系統的第0級系統,其基本特徵在理論上存在,但現實中並不存在這樣的人工智慧系統。在擴充套件的馮·諾伊曼架構延伸出來的分級規則中,可以做一些組合,例如可以資訊輸入,但不能資訊輸出;或者可以資訊輸出,但不能資訊輸入;或者可以創新創造,但知識庫不能增長。對於這些在現實中不能或無法找到對應系統範例的案例,我們將其統一劃歸到“人工智慧系統的第0級系統”,也可以叫“人工智慧系統的特異類系統”。

2.對於人工智慧系統的第1級系統,其基本特徵是無法與人類測試者進行資訊互動。例如有一種被稱為泛靈論的思想認為天下萬物皆有靈魂或自然精神,一棵樹和一塊石頭都和人類一樣,具有同樣的價值與權利。當然,這種觀點從科學的角度看,只能算作猜想或哲學思考。從“能不能和測試者(人類)進行資訊互動”的分級規則看,因為石頭等物體不能與人類進行資訊互動,也許它內部有知識庫,能夠創新知識,或者能夠與其他石頭進行資訊互動,但對人類測試者來說則是黑箱,不能讓人瞭解。因此不能與測試者(人類)進行資訊互動的物體和系統可以定義為“人工智慧系統的第1級系統”,符合第1級分類的範例有石頭、木棍、鐵塊以及水滴等等不能與人類進行資訊互動的物體或系統。

3.對於人工智慧系統的第2級系統,其基本特徵是能夠與人類測試者進行互動,存在控制器和儲存器,但系統內部知識庫不能增長。因此很多家用電器被稱作智慧家電,如智慧冰箱、智慧電視、智慧微波爐和智慧掃地機。這些系統大多有一個特點,即雖然它們內部或多或少有控制程式資訊,但一旦出廠,就無法再更新它們的控制程式,不能進行升級,更不會自動地學習或產生新的知識。譬如智慧洗衣機,人們按什麼鍵,洗衣機就啟動什麼功能。從購買到損壞,其功能都不會發生變化(故障除外)。這種系統能夠與人類測試者和使用者進行資訊互動,符合馮·諾伊曼架構描述的特徵,而且它的控制程式或知識庫從誕生時起就不再發生變化,這種系統可以定義為“人工智慧系統的第2級系統”,範例包括日常見到的掃地機器人、老式的家用電冰箱、空調、洗衣機等等。

4.對於人工智慧系統的第3級系統,其基本特徵是除具備2級系統的特徵外,其控制器、儲存器中包含的程式或資料可不聯網進行升級或增加。例如家用電腦和手機是我們常用的智慧裝置,它們的作業系統往往可以定期升級。例如,電腦的作業系統可從Windows1.0升級到Windows10.0,手機的作業系統可從Android1.0升級到Android5.0,這些裝置的內部應用程式也可以根據不同的需要不斷更新升級。這樣,家用電腦、手機等裝置的功能會變得越來越強大,可以應對的場景也越來越多。這一類系統明顯比第2級智慧系統適應性更強。這種系統能夠與人類測試者、使用者進行資訊互動,但不能與其他系統通過“雲端”進行資訊互動,其控制程式或知識庫只能接受USB、光碟等外接裝置進行程式或資訊升級的系統,可以定義為“人工智慧系統的第3級系統”,範例包括智慧手機、家用電腦、單機版的辦公軟體等。

5.對於人工智慧系統的第4級系統,其基本特徵除了包含3級系統的特徵外,最重要的是可以通過網路與其他智慧系統共享資訊和知識。2011年歐盟資助了一個叫作RoboEarth的專案,該專案旨在讓機器人可以通過網際網路分享知識。幫助機器人相互學習、共享知識,不僅能夠降低成本,還會幫助機器人提高自學能力、適應能力,推動其更快、更大規模地普及。雲機器人的這些能力提高了其對複雜環境的適應性。這類系統除了具備3級系統的功能,還多了一個重要的功能,即資訊可以通過雲端進行共享,因此這種系統能夠與人類測試者、使用者進行資訊互動,可以通過“雲端”進行資訊互動,進行程式或資訊升級。但這類系統所有的資訊都是直接從外部獲得,其內部無法自主地、創新創造性地產生新的知識。這種系統可以定義為“人工智慧系統的第4級系統”,範例包括谷歌大腦、百度大腦、RoboEarth雲機器人、B/S(Browser/Server,瀏覽器/伺服器)架構的網站等。

6.對於人工智慧系統的第5級系統,最基本的特徵就是能夠創新創造,識別和鑑定創新創造對人類的價值,以及將創新創造產生的成果應用在人類的發展過程中。我們在擴充套件的馮·諾伊曼架構時,對原來的馮·諾伊曼架構增加了創新知識模組,就是試圖把人納入到擴充套件的人工智慧系統概念中,人類可以看作是大自然構建的特殊“人工智慧系統”。與前四個等級不同,人類等生命體最大的特徵就是可以不斷地創新創造,如發現萬有引力、元素週期表,撰寫出新小說,創造新的音樂、畫作等等,然後通過文章、信件、電報,甚至網際網路進行傳播和分享。不斷地進行創新創造,並能夠識別創新創造對自身的用處,這讓人類佔據了地球生態環境下的智力制高點。因此,這種系統能夠與人類測試者使用者進行資訊互動,可以創新創造出新的知識,並可以通過文章、信件、電報甚至網際網路這樣的“雲端”進行資訊互動,這種系統可以定義為“人工智慧系統的第5級系統”。人類是第5級人工智慧系統最突出的範例。

7.對於人工智慧系統的第6級系統,最基本的特徵就是隨著時間的向前推進,並趨向於無窮點時,不斷創新創造產生新知識的智慧系統其輸入輸出能力,知識的掌握和運用能力也將趨近於無窮大,按照基督教對於上帝的定義“全知和全能”,可以看出智慧系統在不斷創新創造和不斷積累知識的情況下,在足夠的時間裡以人類為代表的智慧系統將最終實現“全知全能”的狀態,從這個角度看,無論是東方文化的”神“,或西方文化中的“上帝”概念,從智慧系統發展的角度看,可以看作是智慧系統(包括人類)在未來時間點的進化狀態。

5.論文對谷歌AlphaGo屬於智慧的第幾等級進行的探討

因為AlphaGo可以與棋手進行比賽,具有龐大的運算系統和資料儲存系統,因此具備第2級系統的條件。在谷歌的研發過程中,AlphaGo的策略訓練模型版本通過不斷進行大量資料訓練而不斷升級,從2016年1月與歐洲冠軍對戰,到2016年3月與韓國圍棋世界冠軍李世石比賽,AlphaGo的軟硬體系統也獲得很大提升,因此AlphaGo具備了第3級系統的條件。

從公開的資料看,AlphaGo雖然可以通過網路實現大量CPU和GPU協同工作,但由於保密性或階段性問題,谷歌目前還沒有在網際網路上開放AlphaGo程式接受使用者的線上挑戰,因此AlphaGo不具備第4級智慧系統條件。

關於AlphaGo是否具備創新創造性問題,我們認為它依然是依託人工支援的大資料訓練形成的策略模型,同時在比賽中結合比賽對手的落點資料,根據其內部的運算規則,來不斷形成自己的落點資料,這些落點資料最終形成比賽資料集合。AlphaGo根據圍棋規則與對手的比賽資料集合進行計算和比較,判斷輸贏,整個過程完全在人類設定的規則下執行,無法體現其自身的創造性,如圖4所示。

0?wx_fmt=png

即使AlphaGo形成的落點資料集合很可能是人類歷史上沒有出現過的,也不能說明AlphaGo具備了獨立的創新創造功能。例如,我們用計算機程式實現下述過程:從1萬到100萬的自然數中隨機選取兩個數進行相乘,記錄相乘結果,重複此過程361次,即使得出的自然數集合很大,並且可能是人類歷史上沒有出現過的,我們也不能認定該計算機程式具有創新創造性。

如果AlphaGo在沒有人類提供資料的情況下,能夠主動獲取棋譜,自動設計程式進行模擬對戰,學習經驗,並用於改變自己的訓練模型,用於實戰比賽,戰勝對手,那麼在這種情況下,我們才可能認為AlphaGo具備創新性。但從人工智慧的發展過程看,AlphaGo還完全無法實現這一點。因此,綜合來看,AlphaGo的智慧等級被評定為3級,與人類相差兩個級別。

6,論文提到的該項研究的工作意義和後續工作

 對人工智慧系統進行智商測試和智慧等級分級,有助於我們更好地對這些智慧系統進行分類和評判,同時為低等級智慧系統的發展方向提供支援。

根據上述研究我們可以每年利用人工智慧智商測試方法對相關智慧系統進行測試,以此為基礎分析不同測試物件的人工智慧智商的發展狀況,從而發現這些同類產品在人工智慧領域的發展差異,測試資料對於這些產品研究競爭對手發展趨勢將具有實用價值。另一方面,每年根據測試結果,選取智商最高的人工智慧系統和人類測試者智商作為代表,標註在圖6.1上。以此作為判斷人工智慧與人類智慧未來發展關係的基礎,從而作為判斷前文提到的兩條人工智慧發展曲線究竟那一條更符合客觀事實。

0?wx_fmt=png

第三次AI系統智商測試將在2018年開始,測試檢驗2018年

人工智慧發展水平,並繪製曲線。本次論文的線上釋出地址在DOI: 10.1007/s40745-017-0109-0

相關推薦

說明最新"AI智商超過6"研究來自中國科學院美國大學

最近cnBeta等多家網站報道: “據HotHardware報道稱,來自美國康奈爾大學一組研究人員對各大科技公司的人工智慧型語音助手進行了橫向比較。研究人員發現,谷歌助手擁有目前語音助手類中最高的平均智商,IQ值約為47.28,水準接近於人類六歲兒童。而蘋果的Siri語音助手的平均智商則較低,約為23

AI論文BERT雙向編碼器表徵模型機器閱讀理解NLP基準11種最優(公號回覆“BERT論文”下載彩標PDF論文)

谷歌AI論文BERT雙向編碼器表徵模型:機器閱讀理解NLP基準11種最優(公號回覆“谷歌BERT論文”下載彩標PDF論文) 原創: 秦隴紀 資料簡化DataSimp 今天 資料簡化DataSimp導讀:谷歌AI語言組論文《BERT:語言理解的深度雙向變換器預訓練》,介紹一種新的語言表

AI的七個“正經”玩法,個個能玩一整天

郭一璞 問耕 發自 凹非寺 量子位 報道 | 公眾號 QbitAI誰說AI只能搞一些一本正經的工

任正非:谷歌學習,殺出一條血路(谷歌軍團的編制不大,戰鬥力極強。任何產品都是架構第一。算法團隊直接殺入到項目中去,一線既有算法又有數據,就容易突破,抽象的平臺一定要有實踐東西檢驗。藍軍一定是有學歷的。我們幫助他們在工作中完成學歷教育)

工程 研究院 就是 激活 敢於 所在 邊緣計算 老師 約束 IT之家1月22日消息 日前,華為心聲社區公布了任正非在1月9日在杭州研究所業務匯報會上的講話。在本次講話中,任正非表示在軟件工程能力提升上,我們最缺乏的是對宏觀架構有清醒認識的人才。建立公司是一個架構;建立公司的

AI主管個人反對使用機器學習來實現自主武器研發

本文由人工智慧觀察編譯譯者:Sandy一個月前,谷歌進行了重組,大神Jeff Dean成了新晉掌

偷師HTC U11Pixel 2支持邊框按壓功能

谷歌此前谷歌已經確認,將在10月4日正式發布Pixel 2手機,一同發布的還可能有Pixel XL 2。臨近發布,這款手機的配置特性也被網友們挖了出來。  昨晚有報道稱,Pixel 2將會加入人像拍照功能,但由於Pixel 2采用單攝像頭,因此應該是通過軟件算法使背景進行虛化,另外,手機UI界面將進行重做,還

身為手機系統霸主,安卓對於來說算算成功?

身為手機系統霸主安卓對於谷歌來說算不算先來說一下,在當前的智能手機操作系統中安卓和iOS可謂獨大,占據了九成多的市場份額。但因為iOS只在蘋果設備上使用,安卓系統卻因開放性而遍地開花,相對而言安卓系統更加強勢。根據statista統計,從2009年第一季度到2017年第二季度,安卓系統的全球用戶占有率從1.6

【Postman】接口測試工具瀏覽器安裝插件方法以及使用說明

all tle sin .html 接口 .cn 使用 ecif 離線 安裝插件方法: 《如何在谷歌瀏覽器chrome中離線安裝.crx擴展程序的三種方法?》 《postman chrome插件的安裝與使用》 下載地址:http://www.cnplugins.com

確認,AI中國中心總裁李佳離職

剛剛,AI科技大本營向谷歌中國求證,確認谷歌 AI 中國中心總裁李佳已經離職。 李佳本科畢業與中國科學技術大學,2011年獲得斯坦福大學博士學位,是李飛飛的愛徒之一。 2016 年 11 月,李佳從 Snapchat 離職,與李飛飛一同加入谷歌,共同領導谷歌雲的機器學習部門。

兄弟公司暫停隱形眼鏡測血糖研究技術無法實現

@央廣軍事11月10日訊息,2018中國航展上首次公開展出的“瞭望者Ⅱ”察打一體導彈無人艇,是剛剛成功進行首發導彈飛行試驗命中靶心的實艇,試驗成功後隨即吊裝到展位與公眾見面。據媒體此前報道,該艇是中國第一艘導彈無人艇,也是繼以色列拉斐爾海上騎士後全球第二個成功發射導彈的無人艇,填補了國內導彈無人艇這一技術空白

【轉】漫畫經典面試題“扔雞蛋”,看看你會做嗎?

 第二天 題目:扔雞蛋問題 有2個雞蛋,從100層樓上往下扔,以此來測試雞蛋的硬度。比如雞蛋在第9層沒有摔碎,在第10層摔碎了,那

李飛飛在開發者大會宣佈AI中國中心正式成立

在今天上海開幕的谷歌開發者大會上,谷歌雲人工智慧與機器學習首席科學家李飛飛宣佈谷歌 AI 中國中心正式成立,該中心由李飛飛和 Google Cloud 研發負責人李佳博士共同領導。李飛飛將會負責中心的研究工作,也會統籌 Google Cloud AI、Google B

你真的懂KPI和OKR麼?(附為何、英特、領英均放棄KPI,轉向OKR?)

  德魯克曾經嚴厲警告過管理者的一句話:只要我們的經理人一天不放棄將績效評估用於控制員工,績效管理註定就不會成功。對此,我一直沒有想太明白績效管理離開KPI考核外,到底還能如何做。   在細緻瞭解KOR原理之後,我發現這個困惑確實得到了有效的解決。我個人感受:OKR並非徹底否認KPI,而是對工具的昇華。

AI中國中心正式成立!他們還要招這些人……

在今天上午的谷歌開發者大會上,Google Cloud人工智慧和機器學習團隊的首席科學家李飛飛宣

實踐三使用物體檢測API訓練自己的資料集

一.環境安裝: ubuntu 1:TensorFlow環境二選一: 親測用使用公開資料CPU需要在i5下跑一晚上,GPU只要30分鐘,建議安裝TensorFlow 1.00 pip install tensorflow # For CPU pip in

瀏覽器為什麼能自動儲存賬戶密碼?

一般瀏覽器都會提供自動儲存賬戶以及密碼的功能,方便我們下次的登入。 但今天筆者在使用谷歌瀏覽器進行網站測試時,每次都得自己輸入賬戶密碼,瀏覽器並沒有提醒是否儲存此密碼。 這給我的除錯工作帶來了極大的不便。 一般這種問題,都屬於設定的問題。 樓主在設定終於找到了問題所在。如圖

html5 canvas影象在瀏覽器下顯示問題

使用drawImage方法在canvas下繪圖,在谷歌瀏覽器下需要加onload事件 同時,注意定義canvas畫布大小不能使用CSS設定,它會導致畫布按比例縮放你設定的值。(原因:在Canvas元素的內部存在一個名為2d渲染環境(2d redering context)

Visual Studio 2017 開啟瀏覽器除錯成功,其它瀏覽器除錯成功!出現能連線到執行時程序,求解答!

Cannot connect to runtime process,timeout after 10000 ms-(reason:Cannot connect to the target: connect ECONNREFUSED 127.0.0.1:55236). 不能連

人工機器NDC-機器翻譯破世界紀錄,僅用Attention模型,無需CNN和RNN

評價:         NTM的成熟體DNC竟然達到了這種能力,不知道進化成完全體會是什麼樣子。竟然在機器翻譯的準確率上超過了已經公佈的所有模型,不愧是最接近現階段最接近圖靈機的有限圖靈機。         在數碼寶貝中,我最喜歡的是阿和的加布獸進化的究極體數碼寶貝——

whatsApp Facebook 用了?正常? 速度慢? 一招讓你永久解決煩惱!

是不是從今年年中開始,whatsApp 谷歌 Facebook  Twitter 等  用不了?不正常? 速度慢? 聯絡不到客戶, 也收不到客戶資訊, 或者網速 慢, 看不到圖片等等 ! 是不是很急??? 還有另一班 使用谷歌推廣的也登陸不了,沒有了推廣,流量刷刷地往下