AI替人跳舞,打破的可不止短視訊最後那幾道屏障
前不久,商湯科技在北京正式釋出短視訊美顏工具——SenseAR,包括:全身塑型、頭部、肩部、腰部、臀部、腿部塑型以及增高功能,不僅功能多而且整體效果逼真自然。在此之前,包括陌陌,LIKE短視訊,微視等APP已經提早上線了這一功能。視訊裡的小姐姐跳著舞,跳著跳著就瘦了,很讓人羨慕。但智慧相對論(aixdlun)分析師雷宇很快就發現,我缺的不是讓人變瘦的短視訊軟體,我缺的是跳舞的技能。
商湯科技(GIF)
微視(GIF)
好在天無絕人之路,不久前伯克利分校的研究人員釋出了一篇名為《Everybody Dance Now》的論文,研究顯示,任何人都可以被包裝成一個舞者,最後“偽造”出真人動作的畫面。你沒看錯,AI會使四肢不協調的你在視訊中變身“舞林高手”。
(GIF)
從AI美顏到逐漸興起的AI動態瘦身再到AI替人跳舞,AI正在不斷突破我們本以為牢固的屏障。未來抖音快手等短視訊APP上的小哥哥小姐姐,不僅顏值身材存疑,連業務能力都不能得到有效保障,短視訊網紅從“老天賞飯吃”過度到了”AI賞飯吃“的階段。這不由得令人發問,AI為何在不斷的突破屏障?未來,AI還能在短視訊時代做什麼?
所謂屏障,就是需要打破然後重建
從靜態美顏到動態跳舞,AI一步兩步三步四步向前走,它正在不斷重新整理我們的認知。
1、深度學習的發展,讓AI從事藝術創造有了可能
在說AI跳舞前,我們不妨先看看換臉。2017年12月,一個名為“DeepFakes”的使用者在Reddit上釋出了一個“假視訊”,但視訊中的人臉是後期替換過的。其中的原理很簡單,通過訓練深度神經網路,使他們分別在機器上還原出兩個人的臉,然後便可直接輸入資料替換。
而在《Everybody Dance Now》的論文中,研究人員需要讓機器學習兩個視訊:一個是源物件視訊,另一種是目標人物的隨機動作視訊,通過尋找關鍵點姿勢,最後實現源視訊集和目標視訊集中找到影象的轉換。
僅僅是替換還不足以顯示深度學習的強大,實際上,深度學習在藝術領域早已根基穩固。通過學習不同風格畫家的作品,機器還可以作畫。去年谷歌的AI製作了一幅畫,最後以8500美元賣出,而能寫詩能唱歌的微軟小冰更為我們所知,而在未來, AI不僅從事藝術,還可以讓毫不相關的素人從事藝術。
2、從顯性的儀表到隱性的技能,人們想躺贏
人們對技術進步帶來的喜悅感的閾值越來越高。剛開始,能拍照留念就好,比如我們小時候常見的比耶騎馬遊客照。隨後,美顏成了剛需,你已經很難在社交平臺上看到未美顏的照片了,網紅美顏前後對比差異明顯的照片也一度被人津津樂道,但是這還遠遠不夠。
正如開頭智慧相對論(aixdlun)分析師雷宇所說的,短視訊瘦身已經逐漸過度成標配。但僅僅只是顯性儀態還是遠遠不夠,隱形的技能勢必會成為人們新的需求。人們想要的只會更多,但說多也不是很多,只是躺贏。
去年12月20日,微視和抖音於同一天推出了兩款相似的功能——線上跳舞機,其中抖音更是憑藉“尬舞機“獲得了巨大流量。緊接著,美拍就上線了國內首款可以邊看邊學的舞蹈模仿學習功能——舞蹈跟拍器,而嗅到舞蹈商機的不僅僅這是短視訊領域,愛奇藝、優酷也紛紛推出自制舞蹈綜藝。
舞蹈煥發出了強大的生命力,一項技術創新如果不能與市場需求有效對接,便無法形成具有說服力的價值主張。而AI替人跳舞這一招,無疑是在順應人們的需求。
3、AI外形塑造已成紅海,AI企業亟需探索藍海
人工智慧技術有一個不成文的規定,未實現的才叫智慧,而實現了的人們往往不會這樣認為,比如智慧手機。而實際上,AI美顏技術的紅海已經夠“紅”了,市面上的主流手機也少有不打AI美顏牌的,而AI動態瘦身也越來越普遍,企業亟需探索更深的藍海。
智慧相對論(aixdlun)分析師雷宇的一位大學同學是活躍在某直播軟體和某短視訊網站上的網紅,身長條順的她起初毫無關注,最後靠著極具特色的舞蹈火了一把。唱歌實現了真正的大眾化,但舞蹈沒有,誰都能吼兩嗓子倒不一定誰都能舞兩下,AI替代跳舞無疑是一塊好乳酪。
從臉萌、魔漫相機等APP曇花一現,我們會發現產品功能如果過於單一很容易,很容易被使用者拋棄,維持平臺生命力無疑需要不斷開啟更多更好玩更有趣的新功能,比如抖音就陸續上線了尬舞機、實時染髮、搶拍等功能。那麼,短視訊還能開發點啥功能呢?
短視訊想崛起,AI能做什麼?
今年5月末,“網際網路女皇”瑪麗-米克爾(Mary Meeker)釋出了《2018年網際網路趨勢報告》,報告顯示中國短視訊訪問量急速增長,即將趕超長視訊。
資料來源:《2018年網際網路趨勢報告》
當然,各巨頭爭搶短視訊高地的決心群眾也是有目共睹。2017年拿了騰訊融資的快手,原本還有騰訊的“流量扶持”,但隨著抖音的走紅,騰訊開始扶持起親兒子微視,“快手”都快守不住了,因為騰訊停掉了除應用寶以外所有的流量入口。今年6月份,QQ在客戶端頂欄開放了微視入口,而最近,微信朋友圈在拍攝選單中開設了“用微視拍攝”的限時推廣入口。一邊是月活超7億的QQ,一邊是超過10億使用者量的微信,騰訊之心,路人皆知。
此前的頭騰大戰更是將短視訊大戰的演繹延續到了明面,我們不談底層技術,比如演算法推薦分發等等,僅從技能性的角度,AI還可以做什麼?
1、AI美聲。 調音師往往是演唱者和觀眾之間的橋樑,沒有好的調音師,再好的聲音也難以被呈現出來。很多人都知道網紅現實生活中不見得好看,但隨著網路直播和短視訊的興起,調音師又開啟了第二春。文章《被網紅“包養”的調音師》中提到:
早期只有部分秀場主播試圖轉戰短視訊平臺圈粉時,才需要進行歌曲和聲音的優化。然而現在,遊戲主播、網紅博主、數碼達人......只要想利用翻唱的短視訊引流,就需要相應的調音優化服務。沒有經過修正過的翻唱視訊,就如同沒有了濾鏡的直播片段一樣,難以拿得出手。
調音師已經廣泛運用於人民群眾喜聞樂見的網紅。不要忘了,在美圖秀秀還沒有風靡大江南北的時候,你我的自拍也不是這美顏磨皮兔耳朵的畫風。翻翻QQ空間加密的相簿,我們臉上的痘痘和黝黑的面板,跨越多年還在散發質樸的清香,這與我媽發在親戚群和朋友圈未修音的音樂作品又有什麼區別?
未來,若是AI修音能像美顏一樣普及,上可發到朋友圈多得幾個贊,下可發到某軟體去吸點粉。當然,如果能像美顏似的一鍵實現還免費,就更好了。
2、AI特效。 好萊塢大片雖然劇情簡單,但是其特效我還是妥妥的服氣,而在未來我們甚至可以藉助AI技術實現電影般的特效。但這需要底層技術的支援,值得一提的是AI晶片。中興事件後,引發了晶片潮,抖音和快手先後加入了華為的HiAI生態聯盟,隨後美圖宣佈將進軍AI晶片領域,自主研發MT-AI影象處理晶片,並大批量運用於美圖手機之中,提升手機攝影的質感。
前不久,Google 最新推出小規模試用計劃,可以讓 YouTuber 可以透過機器學習技術,把影片背景更換過程簡化得有如應用 Instagram 濾鏡一樣,使作品快能快速呈現專業製作級的效果,雖然應用效果依然有待進步,但這無疑是一種進步。
結論
我們常常討論AI對我們生活的影響,彷彿因為它我們產生了巨大的變革似的。其實不然,人類始終處在進化的過程中,而且這個趨勢不可避免,AI頂多只是助推器。在全民美顏的今天,我們開啟前置攝像頭就能看到美化過的自己,甚至會覺得美顏鏡頭下才是自己,現實生活中不是。而修圖技術,更是讓我們強化了“想象中的自己“,甚至多數人對自身的認知建立在美顏之上,那麼美顏其他又有何不可?
你更美了更瘦了,更多才多藝了。光是能從別人嘴裡聽到這句話,很多人就會忍不住笑出聲音來,AI不止是賞飯吃,還是皇帝的新衣啊。
文|雷宇