專訪“訊飛”胡郁:想和美國比創新,中國還需要多談談哲學

分類:創投 時間:2016-10-25

10月18日,錘子新機發布會上的語音識別技術效果實在驚人,以至于羅永浩的一段即興發揮被準確轉化成文字后,現場直接的歡呼聲不亞于爆炸場面。甚至當天 新浪 科技發布的另一篇科大訊飛董事長劉慶峰的演講,被錘粉們刷了評論區。

在那場演講里,劉慶峰談及了人工智能技術在未來有多么廣闊的場景,它將會和水電一樣,成為未來的基礎設施。但實際上,劉慶峰當天出席的“世界人工智能大會”,科大訊飛的輪值總裁胡郁也在, 新浪 科技對他進行了專訪。

相比百度、 阿里巴巴 等公司,胡郁認為科大訊飛的“互聯網”味道要稍微淡一些。他說中國的產業和媒體對人工智能的關注還是太實用,太娛樂。真正的創新是從理論出發,從哲學角度發展出來的,我們對科技的本質關注太少。

胡郁有此結論,和他另一個身份:科大訊飛研究院院長離不開。而從技術的理論出發,再循序漸進地回歸到記者的問題上,也是他于其他采訪對象截然不同的特點。在他的規劃里,科大訊飛的戰略核心是用語音解決即將到來的物聯網時代里的人機交互,如此才能用人工智能發揮出更大的價值,其中“臟活累活”也必不可少。在他看來,而無論時代如何變化,中國需要更多“能爬山的公司”。

想和美國比創新,中國還需要多談談哲學

可以透露一下語音市場或者智能家居市場,科大訊飛的市場份額嗎?

胡郁:在手機市場,問題不在市場份額。問題是這些東西沒人用,它的比例很低。iPhone里面,Siri的使用比例不會超過10%。這才是限制了我們大小的因素。

其實在實際情況下,我們離真正的物聯網時代里,語音交互的大爆發,還差得很遠。因為在物聯網時代,使用頻度會增高,使用的場景也非常多。家里面不可能只有手機能語音交互,任何地方都可以用自然便捷的方式來交互,想想看,這個使用次數。

主要是它在生活中所占的時間和比例會大大增加,這樣就會帶來很大的機會。所以我認為我們現在看到的只是未來的百分之一到千分之一。

我相信再過五年左右的時間,語音交互的次數會從現在的幾十億次,變成幾千億次,甚至更多。這樣語音市場會更大,而我們人通過語音方式和機器進行交流和接觸的時間,會大大增加。這也意味著它的商業價值會大大增加。

中國在人工智能領域的情況怎么樣?

胡郁:相比于傳統的高新技術,中國是有優勢的。

第一個是經過這么多年核心技術的發展,特別是中國863計劃以后,大家會注意到,在這一次的人工智能浪潮中,國內的企業和國外企業相比一點沒有落后。如果說,在5、60年代和7、80年代那兩次(人工智能發展期),中國企業還沒有辦法和外國企業在技術上相比的話,那在這次(發展浪潮里),我們完全走在了前面。

第二個方面是在于,任何機器的交互離不開產業環境和商業生態。這個產業環境和商業生態,在7、80年代之前是什么?是電子產品。

大家都知道,中國的電子產品在7、80年代才剛剛起步,完全不具備在全球市場競爭的能力。但是在現在,我們的依賴的是什么產品?是智能手機,是互聯網產品和移動互聯網產品。而在這方面,整個中國不僅是從事語音技術的公司對此有依賴,相關的商業公司也是,比如網上購票,還有各種的O2O。

作為一種連接型的技術,把人和機器連接在一起之后,語音技術如果想在物聯網里面占領很多市場,就必須和這些后臺的服務連接起來。所以說從整個商業和技術環境上來講,中國現在應該說也是很好,因為我們的互聯網公司和美國方面來講,已經是一個同臺競技,甚至均分天下的態勢。

在這點上,我覺得這為我們在將來,在物聯網時代用語音交互作為人機交互的主要手段,并引發相應的商業模式,提供了很好的基礎。

而第三點,大家會注意到,無論是什么操作系統,PC的也好,手機的也好,雖然這些操作系統可能是美國的公司做的,比如說 微軟谷歌 ,但是要注意到,輸入法這個部分,都是中國公司占主導地位。

為什么?因為它和語言有關。一個簡單的鍵盤輸入法,就因為語言之間的差異導致這么大的差異。那么大家可以想象一下,一個包括了語音識別、語音合成、自然語言理解的語音系統,語言之間的壁壘會有多高。中國公司在這方面會完全具有優勢。

所以說從這三個方面來講,我們在將來的物聯網時代里面,無論是從技術本身,還是從語言的差異化本身,還是從商業的生態和環境本身,我們現在都和國外公司完全處于同一個水平。所以在這一波浪潮中,我們有信心中國會成長出一批國際水準的公司出來。

除去這些優勢,仍然有很多聲音認為中國在創新型研究方面落后于美國,您怎么看待這個問題?

胡郁:不可否認,我們對人工智能的了解,不要說產業界,就是媒體,其實對人工智能更多的認識是落在應用特性和娛樂特性上。而美國的很多人,是真正從理論的角度,進行非常深入的探討。

如果我們只談論應用和娛樂層面上的東西的話,我們是得不了圖靈獎的,也得不了諾貝爾獎,也不能創造信息論這些東西。美國所謂原創性的研究,是從理論的根基出發,建立一套完整的思維方式。而有許多理論研究的東西是不會產業化的,沒有產業化價值的。它只是一種哲學化的思考,而這些東西我們沒有關心。

哲學會產生真正的創新。創新有很多種,有一種是在最原始的技術上創新。而我們講的很多其實是在應用層面上創新,或者在技術層面上創新,但不是在科學的層面上去發現和創新。

所以在這個層面上來講,我覺得國內應該從兩個方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應該更加著重于在理論方面的深入。而我們的產業界,不應該僅僅去應用它,而且應該在技術方面去做大規模的整合和創新。

因為人工智能就像航空發動機一樣,里面有非常非常多的零件,有視覺的,有聽覺的。你要把它們綜合在一起,而且每一個都要做到世界上最好。我覺得現在學術界可能因為要和產業界對接,做了很多技術層面上,和應用相關的創新。而產業界還沒有能力,來做整體性、系統性創新的工作,比較少。所以我覺得這就是我們和美國相比有差異的所在。

我覺得我們在學術上,理論的深度,和愿意去花長時間研究本質的工作還是太少,還應該增強。

因為人工智能,電信詐騙損失減少了5個億

科大訊飛目前的主要優勢是語音識別領域,公司未來還有沒有其他人工智能領域的計劃?

胡郁:智能語音是訊飛整個人工智能戰略中的一部分。而訊飛人工智能戰略的核心,是基于語音和語言的認知智能。

什么是認知智能?比如在醫療的過程中,我們需要通過病例幫助醫生分析病人可能會得什么病,吃什么藥,這就是一種認知智能。包括在教育里面,我們通過手寫的試卷來判斷學生的得分,并給出改進的意見。這些都是和語言,和人的概念和推理有關的。除了交互之外,它們能給我們的生活帶來更多改進。

我再舉一個例子,和我們的安全有關。在7、8月份,電話詐騙非常猖獗,特別是臨開學的那段時間。有很多上學的同學不是因為詐騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發生次數下降了60%,而同期全國其他地區增長了58%。為什么能做到這點?因為我們在安徽省所有的電話里面做了一個監控系統,它可以對通話內容進行分析,對那些詐騙性質行為自動作出提醒,而這個過程是完全自動化的。這樣就為安徽省避免了5個億以上的可能的損失。

我相信大家也注意到了,我們演講的時候會有一個同步的實時顯示文字的技術。就是說我在上面講話的同時,文字出來了,對你們(記者)來說是最有用的。這個產品馬上就要開發出來了,最理想的狀態就是我在這邊說話,你們的屏幕上就能實時顯示出來我講的內容。

在去年的發布會上,我們發布了這個功能以后。大家可以看到,今年阿里和 搜狗 都展示了同樣的技術。這也代表了一個發展方向。這個方向可能和語音交互是沒有關系的,但和語音(技術)有關系。

我們談到iPhone和Android的時候,它們的語音識別系統都是封閉系統,都是系統級別的。科大訊飛怎么解決這個問題?

胡郁:首先iPhone我們是搞不定的,除非破解它。iPhone本身就是一個垂直的生態。而且這個問題不僅僅是在中國,美國也是。但是iPhone自己的語音技術很差,導致它的用戶體驗相對于其他公司、產品會有劣勢。

但對Android來講,情況是不一樣的。因為 谷歌 也知道Android有全球不通用的地方。比如說審美、風格,比如說語言相關的部分:輸入法、交互。這就造成了Android系統在設計的時候就是一個比較開放的系統。

這就造成了第三方UI其實接管了中間層的一些功能,也導致了這些領域是可以進入的。而且現在很多的智能硬件,其實用的都是Android的操作系統。

我相信在將來的發展中,世界上會存在兩種公司。一種公司是垂直產品型公司,比如說做手機,就一直做手機,手機技術不可能給別人用。世界上看起來,最多有8到9家這樣的手機公司,加起來產量可能到全球的90%-到95%以上。

另外還有些公司,像 谷歌 這樣,就是平臺型的公司。我提供一些基礎性的工作,給各個廠商都能用。但是做了平臺之后就要面臨控制權大小的問題。有可能控制權不在自己手上,而在手機廠商手上。

所以在未來的發展過程里,訊飛要做的不僅僅是手機,而是我剛才說的各個領域。這些領域里,有的是幾家大公司聯合壟斷了市場,有的領域會是成千上萬個公司來分享市場。比如說玩具、機器人,就是后面的這種。而且我相信現在這么多機器人公司,到最后也不會合并成大的公司,因為用戶需要多樣性的個性化產品。而手機這種產品,雖然有差異,但還是個工具性質的產品。

所以訊飛會成為一個平臺型的公司,不僅幫平臺上的公司提供核心技術,甚至可以幫它們整合各種各樣的資源。我覺得我們是用這樣一個思路來發展的。

成為平臺型的公司,需要在不同的場景下提供基礎性的通用解決方案,但是不同場景的使用特性是不一樣的,科大訊飛準備怎么解決這個問題?

胡郁:場景的問題其實和剛才的問題,就是內容方面是非常有關系的。我們人在處理一件事的時候,你可以想象下你在訂一張票,你所要和別人交談的內容,嘴里面發出的指令,其實相對來講不是開放的集合,是封閉的集合。

這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場景)。我們現在的做法就是一個點一個點去做。每做完一個點就拿到實際里去用。越來越多的人用了之后,語言的覆蓋性就會越來越好,這個場景的問題就解決了。

那在這個過程里怎么加速這個問題呢?我們怎么在做一些場景的時候,其他場景也能變快呢?這就是我們為什么要做那些高考答題機器人的原因。它能學會系統學習的方法,當我們做了一兩個場景之后,就能轉移到其他很多場景上。這樣能使我們的覆蓋快速增加。我們通過這樣的方式來解決這樣的問題。

擔心人工智能過熱沒有用,還不如肯“干活”

今年人工智能的概念快速火熱了起來,您怎么看待這種現象?有沒有擔心過這種火熱對人工智能技術的發展帶來負面效果?

胡郁:當然擔心,但擔心了也沒用。

任何一個新技術出來的時候都會魚龍混雜。人類有夸大預期的本性在里面,是人類的社會特性決定的。認識到這個規律之后就不會覺得這事是什么壞事。我們能做的就是在局部上防止過熱。

所以我們應該考慮的是如何利用這種周期性的狂熱來合理布局。從投資人角度來說,投資人很容易找到錢,但投資人可以利用這種環境去找最有價值的公司來投資。所以只能說改變你能改變的,接受你不能改變的。

我覺得在人工智能領域里有兩個領域是有價值的。一個是人工智能核心技術研究,他們不一定有經驗去進行商業化,我們可以投資他,提供經驗。另外是如何利用人工智能技術來解決現實問題,這通常在大的公司里面,他們都有很大的產業基礎,只要把新技術嫁接進來。

大部分的公司并不會因為人工智能出現而進行重組和重構。比如農業,人工智能只是一個改進的工具,所以在這些領域里,原有的大公司依然占有優勢。所以更有價值的是去尋找哪些懂得怎么利用人工智能的人來投資。

百度這樣的互聯網公司也在做人工智能研究,而且和科大訊飛的領域有重合,您怎么看待這種競爭?科大訊飛有哪些優勢?

胡郁:比較公司要看戰略,我不是特別了解百度的戰略,因為每年百度的重點不一樣。但是過去三年里面我們一直在做運算智能、感知智能和認知智能,而且會定期公布進展,有清晰的商業模式。這是我們和互聯網公司的不同,是專注科技創新的公司。科技創新公司更像是爬山的公司,一步一步去爬到頂峰。

但互聯網有很多機會,所以很多公司都是沖浪型的,需要不停地抓住下一個浪潮,如果不是,就換了。

我們還是堅持來做人工智能,堅信交互革命那天會到來。所以一個公司要有清晰地戰略,而且要把戰略傳達給別人。我們戰略十分清晰:我們是一個技術創新性公司,解決人機交互這個問題。

在行業里面,我們用我們的人工智能技術幫助醫院、學校、司法、金融機構去改善他們的問題。這里面有很多“臟活累活”,要做很多結合型的工作。互聯網公司追求收益,毛利要非常高。而且有很多“臟活”不一定愿意去干。但在產業互聯網階段,和傳統領域結合,是少不了這一步的。

當然不是說一味去做基礎性的工作。上面要有頂天立地的東西,但是不能因為有這個就不能彎腰了,絕對不是這個概念。

所以我覺得中國需要更多爬山型的公司,無論外面怎么變化。外面無論是互聯網時代也好,移動互聯網時代也好,物聯網時代也好,這都是外圍環境的變化。但是公司征服一個領域,具有爬山的本質是必不可少的。


Tags: 人工智能 移動應用 創業

文章來源:http://www.chinaventure.com.cn/cmsmodel/news/detai


ads
ads

相關文章
ads

相關文章

ad