“搜狗分身”技術正式亮相烏鎮 攜手新華社釋出全球首個AI合成主播
11月7日,第五屆世界網際網路大會在浙江烏鎮拉開帷幕,在開幕當天,搜狗公司CEO王小川、新華社副社長劉思揚、搜狗公司智慧語音事業部總經理王硯峰和著名主持人邱浩聯合帶來了一場跨界產品釋出會:搜狗與新華社合作開發、全球第一個“AI合成主播”正式亮相。而隨著“AI合成主播”的釋出,搜狗人工智慧的核心技術“搜狗分身”也終於浮出水面,成為大會開幕日的最大亮點之一。
據瞭解,“搜狗分身”技術可以讓機器以更逼真自然的形象呈現在使用者面前,而不是冷冰冰的“機器人”。 該技術能通過人臉關鍵點檢測、人臉特徵提取、人臉重構、脣語識別、情感遷移等多項前沿技術,並結合語音、影象等多模態資訊進行聯合建模訓練後,生成與真人無異的AI分身模型。這項技術讓機器首次做到逼真的模擬人類說話時的聲音、嘴脣動作和表情,並且將三者自然匹配,與真人幾乎一致。以“AI合成主播”為例,使用者只需要輸入新聞文字,AI合成主播就能用和真人一樣的聲音進行播報,而在播報的過程中脣形、面部表情等也能與真人主播完全吻合,效果惟妙惟肖。除此之外,“搜狗分身”技術還能僅靠少量使用者真實音視訊資料,即可快速定製出高逼真度的分身模型,顯著降低了個性化定製成本,進而幫助人類提高資訊表達和傳遞的效率。
據搜狗公司智慧語音事業部總經理王硯峰介紹,“搜狗分身”技術是搜狗人工智慧的核心技術之一,誕生於搜狗“自然互動+知識計算”這一人工智慧理念之下。依託“搜狗分身”技術創新的資訊傳播形式,能夠幫助媒體在融媒體轉型、新聞時效性和跨語種傳播能力等方面再上臺階,增強中國傳媒業的國際影響力和全球競爭力。
未來,“搜狗分身”技術將在娛樂、醫療、健康、教育、法律等多個領域提供個性化的內容,顯著提高社會生產和服務效率。在解放行業生產力的同時,“搜狗分身”技術給予使用者更好的個性化音視訊效果,用AI科技來切實的提高人們的生活體驗。