搜狗ai合成主播,它將會改變了些什麼?
伴隨著各項關鍵技術取得突破,人工智慧風潮早已席捲各行各業。推動技術落地實踐的願景固然很美好,涉及如果提供更加人性化的應用體驗,一定程度上成為了落地探索中必須考量的因素。
在看過了全球首位AI合成主播的驚豔表現之後,我們會不禁對前沿技術與感官體驗達到融合共洽的前景充滿信心。這位AI合成主播的初次亮相是在2018年的世界網際網路大會上,是由搜狗與新華社共同釋出的。
從名稱就可以看出,這款產品深度集成了搜狗的多項人工智慧技術,包括語音合成、脣語合成、表情合成、情感遷移、以及深度學習等,這些關鍵技術也構成了搜狗分身技術的核心框架。
更為重要的是,在這位合成主播的背後,還承載著多模態互動技術,即讓聲音與影象實現協調匹配,並實時進行視訊輸出,在視覺與聽覺等多重維度上提供無縫順滑的體驗。
得益於前沿技術的有力加持,這位合成主播的表現也是可圈可點:前期只需少量的資料訓練,即可呈現與真人相差無幾的播報狀態,同時支援個性化定製;不僅可以將新聞稿快速的轉變為播報視訊,而且還能妥善處理聲調起伏、語言風格、情感韻律等;能夠提供全天候不間斷的播報服務。具備了這些優勢,合成主播無疑將極大的提升廣電行業的傳播效率,切實讓人工智慧技術得到普惠式的應用。
之所以合成主播在剛一亮相就能夠收穫廣泛好評,其中一個很重要的原因是搜狗始終秉持的「自然互動+知識計算」的理念。
從這款產品的功能定位不難看出,對於人工智慧技術的應用探索,搜狗還是致力於讓機器成為輔助表達與資訊獲取的分身以及助理,這同時也是搜狗給技術落地提出的戰略目標。
回顧過去,我們可以看到這種技術演進的路線正在逐漸清晰:在搜狗搜尋中,可以做到輸入中文一鍵連線全球網頁;釋出拳頭產品翻譯寶Pro,助力中英文的無縫轉換;在輸入法上,推出AI制音坊,為自然互動的願景代言。以上種種舉措,都無不傳遞出搜狗正在全方位的釋放人工智慧技術的實力,在讓溝通與表達變得更加簡單和高效的理念指引下,切實為廣大使用者提供更加貼近生活並貼近人性的產品。
根據公開資料,2018年搜狗輸入法日均語音功能呼叫量已經達到了5.34億次,這一方面凸顯了搜狗輸入法的頭部地位,另一方面彰顯了人工智慧技術在搜狗的各條產品線存在著廣闊的應用場景與發展潛力。
由文字輸入為基點,不斷在語音、搜尋、翻譯等相關領域取得進展與突破的搜狗,基因當中蘊含著做資訊橋樑的使命與初衷,這些基於使命與初衷進行的探索與嘗試也為搜狗決勝人工智慧時代積累了豐富的應用場景。
不可否認,兼具應用場景與技術實力將為搜狗發力人工智慧提供原動力,我們有理由相信在未來搜狗將帶給我們比AI合成主播更大的驚豔。