我們為什麼要做CGUI :什麼是CGUI
隨著人機互動概念帶來的多模態互動的探索和自然語言理解技術的成熟,CGUI(CUI+GUI,對話圖形使用者介面)逐漸成為未來的互動趨勢,也成為智慧助手的發展方向。CGUI是一種高階多模態的互動方式。在CGUI的互動模式中,CUI互動和GUI互動的優點將被混合疊加,使用者可以自由使用自然語言或影象輸出命令,機器則根據命令的不同,給出語音、圖形或選單形式的反饋。
由奇點機智獨立研發的智慧對話平臺【對話流】,是一個典型的CGUI產品,採用了高階多模態互動方式。企業和開發者可以不借助程式碼在該平臺上定義智慧對話,用文字、語音、卡片、wap頁等形式為使用者提供服務。
這一系列的文章,我們將會闡釋,圖形使用者介面和單純的語音互動大行其道的現在,我們為什麼要打造一款CGUI產品。
CUI、GUI、CGUI都是什麼
GUI(Graphical User Interface,圖形化互動介面)
CUI(Conversational User Interface,對話使用者介面)
CGUI(Conversational Graphical User Interface,對話圖形使用者介面)
“對話流”產品本質上是基於NLU(自然語言理解)技術,為企業建造CGUI(對話式圖形互動介面)互動平臺的工具。CUI、GUI、CGUI聽起來都是玄而又玄的技術概念,但它們所代表的互動形式早已滲透在日常生活中。在下文中,我們將會為您闡釋,這些概念都意味著什麼,以及對話流採用CGUI互動形式的原因。
GUI(Graphical User Interface,圖形化互動介面)是60年代“人機互動”的奇才道格·恩格爾巴特提出的概念,它使計算機更容易被使用者接受,自從80年代蘋果推出第一款搭載GUI的電腦後,至今為止GUI一直是人機互動的代表。目前市面上的網際網路產品,基本採用了GUI的互動形式,行業經歷了多年的發展,基於GUI的使用者體驗已經有了相對成熟的方法論與規範。如手機淘寶app,就是一個典型的層層巢狀的GUI互動範本:
手機淘寶店鋪介面,典型的GUI互動
與GUI不同的是,CUI(Conversational User Interface,對話使用者介面)指的是人通過自然語言而非特定的指令(如點選滑鼠,操作鍵盤,觸控式螢幕幕等),與機器進行互動。這並不是一個新概念,CUI互動產品已經在廣泛應用在智慧助手中了,比如谷歌的Google Assistant,蘋果的Siri,亞馬遜的Echo等。使用者通過自然語言對智慧助手下達命令,智慧助手則通過語音給使用者進行反饋。
語音助手Siri,採用的是對話式互動
以上兩種互動方式都各有優缺點。隨著人機互動概念帶來的多模態互動的探索和自然語言理解技術的成熟,CGUI(CUI+GUI,對話圖形使用者介面)逐漸成為未來的互動趨勢,也成為智慧助手的發展方向。CGUI是一種高階多模態在CGUI的互動模式中,CUI互動和GUI互動的優點將被混合疊加,使用者可以自由使用自然語言或影象輸出命令,機器則根據命令的不同,給出語音、圖形或選單形式的反饋。
CGUI是不是有聲版的GUI
目前的智慧助手總體給人一種雞肋感:很多場景下,如果使用者想要得到某種服務,往往用自然語言表達出來是行不通的,而是需要把“操作”用語言表達出來,還不如直接通過圖形介面點選。賀寬,很大機率下,機器並不能準確明白使用者的意圖。
這是因為在類似“搜一搜”產品的語音模組中,只應用了原有互動模式的“有聲版本”,這種簡單粗暴的轉換不會使使用者體驗得到提升,稱不上是真正的CGUI產品。
微信搜一搜的語音功能,只能把語音功能轉化為文字進行簡單搜尋
真正的CGUI產品中,有一項重要的特質,便是“能夠深度理解使用者意圖”,當接收到使用者指令時,CGUI互動的產品會對使用者意圖進行推理。從企業的角度來說,CGUI互動模型會對現有的意圖進行泛化,無論使用者用哪種方式提出指令,機器都能夠通過意圖推理,為使用者提供服務。
也就是說,CGUI比起有聲版的GUI,更有用,更智慧,更懂使用者。而這種智慧,帶來的是使用者體驗的飛躍。