1. 程式人生 > >2018年AI智商將達到多少?未來智慧實驗室啟動第三次世界AI智商評測

2018年AI智商將達到多少?未來智慧實驗室啟動第三次世界AI智商評測

640?wx_fmt=png&wxfrom=5&wx_lazy=1

.人工智慧能否超越人類智慧的爭議

21世紀以來,人工智慧領域陸續爆發很多重要事件。其中最吸引人們眼球的,當屬2016年戰勝了人類圍棋冠軍並開始能夠從0自我學習的AlphaGo

101日,美國CBNC,麻省理工科技評論等媒體報道根據中國研究團隊的研究,谷歌、Siri、百度、Bing等人工智慧系統智商仍然大幅度低於人類6歲兒童。

而與之形成鮮明對比的是,1026日,軟銀CEO孫正義在沙烏地阿拉伯舉行的未來投資計劃大會上稱,未來30年內AI的智商(IQ)將達到10000。這次大會上機器人公民索菲亞(Sophia)被宣佈成為沙烏地阿拉伯的機器公民,

這些事件讓人工智慧與人類關係的討論變得更熱烈,更多人擔心機器人最終會使得人類變成無用的生物,甚至會導致人類的滅絕。

包括著名的物理學家霍金,微軟創始人比爾蓋茨,特斯拉CEO馬斯克,軟銀集團創始人孫正義等。發表觀點指出人工智慧將超越人類並對人類產生威脅。

另一方面,人工智慧領域科學家對人工智慧威脅論也提出了反駁或不同意見。這其中就包括Facebook人工智慧實驗室主任YannLeCun,前谷歌大腦創始人吳恩達等。

.AI智商評測的發展與困難

面對AI的突然爆發,人工智慧威脅論的廣泛傳播,那麼AI究竟能不能超越人類,AI智慧水平究竟達到什麼水平,各種智慧產品究竟有多少智慧,各種爆炸性的AI和機器人突破事件究竟是否真實?

這些問題需要在科學上有一套方法,能夠對包括AI系統,人類和其他智慧體進行統一的智慧水平測試,以判斷它們的發展水平。

目前人工智慧定量評測面臨兩個重要挑戰:第一,人工智慧系統目前沒有形成統一的模型;第二,人工智慧系統與以人類為代表的生命體之間的比較目前沒有統一的模型。

這兩個挑戰都指向了同一個問題,即對於所有的人工智慧系統和所有生命體(特別是以人類為代表的生命體)需要有一個統一的模型進行描述,只有這樣才能在這個模型上建立智力測量方法並進行測試。

1950年圖靈測試提出以來,科學家已經為人工智慧發展的評價體系做了很多工作。

1950年,圖靈提出了著名的圖靈實驗,採用提問和人類裁判的方法,判斷一臺計算機是否具有同人相當的智力。作為最被廣泛應用的人工智慧測試方法,但圖靈測試並不檢驗Ai的智慧發展水平,只是判斷智慧系統能否與人類智慧相同,而且受人為因素干擾太多,嚴重依賴於裁判者和被測試者的主觀判斷,因此往往有人在沒有得到嚴格驗證的情況下宣稱其程式通過圖靈測試,

2015324美國科學院院刊(PNAS)發表一篇論文,提出一種新的圖靈測試方法“Visual Turing test” ,這種測試方法用來對計算機的影象認知能力進行更為深入的評估。

2014年美國佐治亞技術學院的瑞德教授(Mark O. Riedl)認為,智慧的本質在於創造力。他設計了一個叫做Lovelace 2.0 版本的測試。Lovelace 2.0 的測試範圍包括:創作有虛擬故事的小說、詩歌創作、油畫和音樂等。

在解決人工智慧定量測試的問題上,包括圖靈測試在內的各種方案還存在兩個問題:第一,這些測試方法沒有形成統一的智慧模型,並以此為基礎進行分析,區分智慧的多個分類。導致無法將不同的智慧系統包括人類進行統一的測試;第二是這些測試方法無法定量分析人工智慧,或者只定量分析智慧的某個方面,但這個系統究竟達到人類智慧的百分之多少,發展速度與人類智慧發展速度比率如何,這些問題在上述研究中沒有涉及。

.標準智慧模型的建立與AI智商測試

針對這一問題,科學院虛擬經濟與資料科學研究中心劉鋒、石勇、劉穎團隊參考馮·諾伊曼結構、戴維·韋克斯勒人類智力模型、知識管理領域DIKW模型體系等。從2014年開始發表論文建立標準智慧模型,統一描述人工智慧系統和人類的特徵和屬性。

這其中馮諾伊曼結構給予我們的啟發是:標準智慧系統模型應包含輸入輸出系統,能夠從外界獲取資訊,能夠將內部產生的結果反饋給外部世界,只有這樣,標準智慧系統才能成為的系統。

0?wx_fmt=png

戴維.韋克斯勒關於人類智慧的定義給予我們最大的啟示是:智力能力是由多個要素組成,而非圖靈測試或視覺圖靈測試那樣只關注智力能力的一個方面。

DIKW模型體系給予我們的啟發是:智慧是一種解決問題,積累知識的能力;知識是人類不斷與外界互動後沉澱下來結構化的資料和資訊,這提醒我們,一個智慧系統不僅僅體現出知識的掌握,更重要的還有關於解決問題的創新能力。

0?wx_fmt=png

這種關於知識的掌握能力,知識的創新能力與戴維.韋克斯勒理論、馮.諾依曼架構結合,就可以形成智慧系統智力能力的多層次結構。

這種關於知識的掌握能力,知識的創新能力與戴維.韋克斯勒理論、馮.諾依曼架構結合,就可以形成智慧系統智力能力的多層次結構。綜上所述,我們得出智慧系統的標準模型應該具備一下特點:

第一、具有輸入輸出的功能,即可以與外界通過資料、資訊和知識進行互動的能力。

第二.具有儲存資料、資訊、知識的能力,即將外界資料、資訊和知識化為自身資源的能力。

第三.具有生成新資料、資訊和知識的能力,即基於自身擁有的知識,在新資料或資訊的啟發下,對資料、資訊和知識進行創新從而產生新的資料、資訊和知識的能力,如圖1.4所示(為了簡化,本圖中資料、資訊、知識統一用知識描述)。

0?wx_fmt=png

為了更好的分析AI,人類等智慧體的智慧水平,研究團隊把知識的獲取,掌握,創新和反饋又分成15個小分類,從更多維度評測AI,人類的智慧。這15個小分類是:影象、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等。研究人員根據這些分類的維度,在2014年,對世界50AI系統和3個不同年齡段人類進了測試。

0?wx_fmt=png

20162月,研究團隊開展了“2016年人工智慧系統的智商測試,對包括谷歌、百度、搜狗、蘋果Siri、微軟小冰在內的人工智慧系統進行了測試,從測試結果看,谷歌、百度等人工智慧系統的效能比兩年前已有大幅提高,但仍與6歲兒童有一定差距。

0?wx_fmt=png

相關研究方法和測試結論發表在IJIT & DMAnnals of Data Science、中國計算機學報等SCIEI,中國核心期刊上,這一研究成果受到了美國著名財經媒體CNBC,麻省理工科技評論,ZDNETYAhoo等美國,德國、日本、義大利、英國、法國、俄羅斯、新加坡、臺灣地區和中國大陸媒體的報道。

從近4年的持續研究看,雖然人工智慧系統這兩年得分增長很快。在知識的掌握方面得分比較高,在知識的獲取和反饋方面有很大提高,但還有很多不足。在創造性這個大分類上,得分一直進展不大。而且由於這個分類的權重又比較高,因此目前為止依然無法超越6歲的兒童。

.未來智慧實驗室:開展第三次世界人工智慧智商測試

201711月,研究團隊成立未來智慧實驗室,基於實驗室標準智慧系統“AI智商測試量表智慧系統7個等級劃分網際網路(城市)雲腦架構等研究成果,建設世界第一個智慧系統智商評測與趨勢研究機構,致力於評測智慧系統智商發展水平,研究智慧系統未來發展趨勢。目標是成為世界領先的智慧系統評測和發展趨勢研究機構。

未來智慧實驗室根據人工智慧的最新發展,在人工智慧學家,中國科學院虛擬經濟與資料科學研究中心的支援下啟動2018年世界AI智商評測活動(WorldAI IQ Test 2018),對世界範圍人工智慧系統智慧發展水平進行新的評測。以觀察世界範圍內人工智慧最新發展水平以及與人類的差距。本次活動,實驗室將開展多種形成的研究和評測工作,除了測試2018年人工智慧的發展水平,還將第一次對網際網路群體智慧的智商進行測試。

2018年世界AI智商評測(WorldAI IQ Test 2018)的主要工作包括:

1.評測主流人工智慧系統。選擇世界範圍具有代表性的人工智慧系統,包括但不僅限於谷歌、蘋果、百度、微軟、搜狗、騰訊、亞馬遜、IBM、科大訊飛、圖靈機器人,機器人索菲亞等科技企業的產品按照新的世界AI智商評測量表進行評測,並與人類測試者進行對比。2018年的評測還將第一次測試網際網路群體智慧的智商,與AI系統,單個人類的智商進行對比研究

2.AI智商測試擴充套件到整個智慧行業。根據研究團隊標準智慧模型,智慧分級方法,構建更為立體的智慧系統智商評測體系,研究團隊發現根據測量物件的角色定位不同,會存在相互關聯但又有重大區別的AI 智商評測體系。WorldAI IQ Test 2018的工作將就此展開深入研究,並開展垂直領域智慧系統的AI智商量表建立和測試工作,測試物件包括但不僅限於聊天機器人,智慧音箱,智慧手機,服務機器人,智慧汽車,智慧家電,智慧城市,網際網路雲腦等。

3.形成第二版的世界AI智商評測量表。目前標準智慧模型的測試分類包括影象、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等,根據人工智慧的發展狀況和我們對智慧系統的進一步瞭解,2018年世界AI智商評測活動將對分類和權重進行新的調整,形成第二版的世界AI智商評測量表。

.實驗室相關研究論文

.論文題目:《TheSearch Engine IQ Test based on the Internet IQ Evaluation Algorithm》;作者:劉鋒,石勇;

發表刊物:Proceedings of the Second InternationalConference on Information Technology and Quantitative Management[J] .ProcediaComputer Science
發表日期:2014425

.論文題目:《WorldSearch Engine IQ Test Based on the Internet IQ Evaluation Algorithms》;作者:劉鋒,石勇;汪波發表刊物:International Journal of InformationTechnology & Decision Making
發表日期:2015311

.論文題目:從機器人到谷歌大腦人工智慧的6個智慧等級;作者:劉鋒發表刊物:《中國計算機學會通訊》;

發表日期:2016410

.論文題目:《IntelligenceQuotient and Intelligence Grade of Artificial Intelligence》;作者:劉鋒,石勇;劉穎發表刊物:Annals of Data Sciencehttps://arxiv.org/abs/1709.10242
發表日期:2017615

未來智慧實驗室致力於評測智慧系統智商發展水平,研究網際網路與人工智慧未來發展趨勢,由中國科學院虛擬經濟與資料科學研究中心劉鋒、石勇、和劉穎建立。主要研究成果包括:建立標準智慧模型,形成世界第一個人工智慧智商評測和智慧等級劃分體系;研究網際網路、腦科學和人工智慧的關係,建立世界第一個網際網路雲腦架構和城市雲腦體系。

未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測,對AI智慧系統發展水平進行研究;對網際網路雲腦,城市雲腦等智慧系統的未來發展進行研究並與產業進行結合。

  如果您對實驗室的研究感興趣,歡迎支援和加入我們。掃描以下二維碼或點選本文左下角“閱讀原文”

0?wx_fmt=png

相關推薦

2018AI智商達到多少?未來智慧實驗室啟動世界AI智商評測

一.人工智慧能否超越人類智慧的爭議 21世紀以來,人工智慧領域陸續爆發很多重要事件。其中最吸引人們眼球的,當屬2016年戰勝了人類圍棋冠軍並開始能夠從0自我學習的AlphaGo, 10月1日,

2018計科五班秋季C語言基礎課1作業

學習效率 span https 一個 ref 又一 logs 寫博客 效率 ---恢復內容開始--- 1、翻閱鄒欣老師博客關於師生關系博客,並回答下列問題: (1)大學和高中最大的不同是沒有人天天看著你,請看大學理想的師生關系是?有何感想? 答:我認為是鄒欣老師說的健身教練

2017-2018-2 20179215《密碼與安全新技術》 作業

code 視頻監控 存在 模態 進入 有效 保護 總結 跨平臺 2017-2018-2 20179215 《密碼與安全新技術》 第三次作業 課程:《密碼與安全新技術》 班級: 201792 姓名: 袁琳 學號:20179215 上課教師:謝四江 上課日期:2018年3月29

20172306 2018-2019《程序設計與數據結構》總結

tex book 而在 整體 table 圖片 多個 繼續 info 20172306 2018-2019《Java程序設計與數據結構》第三周學習總結 教材學習內容總結 概述 隊列元素是先進先出,從隊列刪除元素的順序,與往隊列放置元素的次序是一樣的 在棧中,其處理過程只在

2018-9-9-03關於ajax(這好像是總結了)

什麼是ajax(前後端分離和不分離的優勢弊端)   ajax基礎知識 什麼是ajax? async javascript and xml ,非同步的js和xml xml:可擴充套件的標

2018高交會於11月14日在深圳開幕,期間通過“時空長廊”回望其20的發展歷程

中國深圳--(美國商業資訊)--2018年中國高新技術成果交易會(高交會)將於2018年11月14日至18日在深圳會展中心舉辦,本屆展會的主題為“堅持新發展理念、推動高質量發展”。   自1999年首次亮相以來,高交會已經成為中國高科技領域的重要視窗,也是最有效的高科技交易平臺

2018超融合走向何方?“應用感知”的超融合2.0新時代到來你更好哪家廠商?

2016年初,聯想攜手中國主流超融合廠商,成立中國超融合產業聯盟,旨在推動產品的和諧發展,共同推動中國企業的數字化轉型,為中國企業創造更大價值。在過去的兩年中超融合產業取得了快速成長,使用者接受度獲得了大幅度提升,超融合架構已經被業界公認為“虛擬化的經典架構,私有云的最佳實踐

2018 ,去百度面試 Java 後端的一面試經歷

https 請求 遇到 net 簡歷 共享內存 targe 應對 部門 一,百度一面:### 1、給一個函數,返回 0 和 1,概率為 p 和 1-p,請你實現一個函數,使得返回 01 概率一樣。2、10 億個 url,每個 url 大小小於 56B,要求去重,內存 4G。

[20185月30號]C++ primer 課後練習 十六章 模版與泛型程式設計

16.17當class和typename同在模版引數列表中時,兩者並無不同(P580),但是當函式返回型別是模版內定義的型別成員時,必須使用typename,.用來區分是否是static成員16.18a.template <typename T, typename U,

2018 ,去騰訊面試 Java 後端的一面試經歷

一,騰訊一面: 1、給一個函式,返回 0 和 1,概率為 p 和 1-p,請你實現一個函式,使得返回 01 概率一樣。 2、10 億個 url,每個 url 大小小於 56B,要求去重,記憶體 4G。 3、把一個 bst 轉化成一個雙向連結串列。 4

2018藍橋杯B組國賽和河南省十一屆ACM省賽比賽心得

*******今年不禁要問一句,這比賽都是咋了,日期老撞在一塊,藍橋杯省賽和天梯賽相差一天,藍橋杯國賽和河南省第十一屆ACM程式設計競賽相差一天,逼的大家行程很緊。*******藍橋杯省賽比賽完後感覺不是很好,結果發現自己在省一等獎的中間,很開心還能參加個國賽,去北京玩兩天。

中國汽車流通協會:20189月1日-9月7日36期車市掃描

1.9月零售銷售起步偏低 9月第一週的資料仍不完整,月初時間較短,有些資料容易失真,因此對偏低銷量不必過於糾結。乘用車零售走勢相對低迷,第一週的日均零售達到3.72萬臺的日均水平,同比增速是-29%。走勢不強的原因估計是8月末的市場走勢較努力,廠家和經銷商也是努力實現8月的銷量表現稍好,因此8月最後一週的

2017軟件工程作業-3功能測試

查看 wid 閃退 技術分享 完成 == pull image 找到 one 準備工作: 用git bash pull同學的代碼,如下截圖: two 找其他同學的bug: 一.被檢測的同學:賈雅傑同學 1.(1)標題:按回車系統報錯 (2)內容:測試環境:win

2017軟件工程作業-2效能分析

大於 閃退 font rcp 工作 接下來 原因 char 效果 要求0 以 戰爭與和平 作為輸入文件,重讀向由文件系統讀入。連續三次運行,給出每次消耗時間、CPU參數 首先,我下載ptime.exe,不知道什麽原因我下載下來以後運行老出現閃退現象。一直沒法使用

20172305 2017-2018-2 《程序設計與數據結構》周學習總結

href soci ref 由於 代碼執行 math類 art 對象 string類型 20172305 2017-2018-2 《程序設計與數據結構》第三周學習總結 教材學習內容總結 本周內容主要為書的3.1-3.8的內容: 1.String類、Random類、Math類

20172327 2017-2018-2 《程序設計與數據結構》周學習總結

tps 序列 計算 lar 類庫 下使用 理解 返回 發現 20172327 2017-2018-2 《程序設計與數據結構》第三周學習總結 教材學習內容總結 討論對象的創建和使用對象引用變量。 探索String類提供的服務。 描述如何組織成Java標準類庫包。 探索隨機和

軟件工程(2018作業

orm OS mar edt n) hub rri mine 最大值 最大子段和 令f[i]為從莫一點開始到a[i]為止最大的子段和,則有以下轉移方程: \[f_i = \max(f_{i-1} + a[i], a[i])\] 因為只需遍歷一次數組就可求出,所以復雜度為\(

2018.3.28 二周

文件和目錄權限chmod 更改所有者和所屬組chown umask默認權限 隱藏權限chattr 隱藏權限lsattr 文件或目錄權限chmod 概念:linux目錄或者文件,都會有一個所有者和所屬組;所有者是指文件的擁有者;所屬組指是這個文件屬於哪一個用戶組;linux這樣設置文件屬性

軟件工程(2018個人作業

邏輯 靜態方法 equals sys bubuko 增加 body break 直接 軟件工程(2018)第三次個人作業 前方高能:本次作業中含有大量基礎知識,請不要嘲笑我QAQ 第三次作業來了。選擇看似相比有難度的(1)(其實是看不懂(2)在幹什麽) 題目要求:題目(1