1. 程式人生 > >短視頻的產業謎題,快手用AI解答

短視頻的產業謎題,快手用AI解答

快手 AI 解答

短視頻產業雖然紅火了幾年,卻一直被看做一個“沒有壁壘”的行業——依靠頭部用戶出產內容,流量隨著MCN機構的遷移而遷移,短視頻平臺自身缺乏主動權。

實際隨著短視頻行業競爭越來越激烈,以往短視頻巨頭的流量正在被“分配”給其他平臺,今年年初,Digiday在報道中指出,Facebook上的很多短視頻流量已經呈現出腰斬的趨勢,而NowThis開始大力制作和推廣長視頻節目,以暫時避開短視頻行業的激烈競爭。

目前在中國,短視頻的勢頭仍然一片大好。根據艾瑞咨詢調研報告顯示在去年一年中,短視頻市場規模達到了57.3億,到2020年將達到300億。


技術分享圖片


可最近騰訊大力推進微視入局,快手、抖音、微視展開“三國殺”戰局,同時在2012到2017年間,短視頻行業有44.8%的融資都投向平臺方。巨頭和新貴站上同一起跑線,競爭業態只會愈演愈烈。中國短視頻平臺能否跳出怪圈,找到自己的壁壘?

我們或許可以在最近圖靈大會上,快手展示出的AI技術中尋找答案。

治愈沈屙:用技術緩解短視頻平臺的流量焦慮

首先我們可以來看看短視頻平臺最嚴重的沈屙——流量焦慮,上文提到,短視頻平臺的流量往往依靠頭部用戶生產的內容,而這些頭部內容又會被各個平臺所爭奪。實際上海外老牌短視頻平臺Vine就是因為網紅集體遷移到Instagram上,最終導致流量枯竭,最終被關停。

這也是短視頻平臺、直播平臺都著急打出“社交牌”的原因——在平臺為用戶提供關系價值,從而更好的維系住流量。

不過從以映客為代表的移動直播平臺看來,脫離社交產品本身談社交,本身就是一件非常困難的事。


技術分享圖片


但在這次圖靈大會快手CEO宿華的演講中,我們或許可以找到社交元素的新靈感。

山崎正和在《社交的人》裏面寫到,人的交往對象不僅僅是個人,也包括了自己所在的整個文化世界。也就是說短視頻平臺與其想方設法讓用戶與用戶之間產生溝通與關系,不如加強用戶與文化世界的聯系。

而能夠創造這一價值的,就是AI技術。

我們可以先反向理解一下,為什麽那麽多短視頻、直播等等平臺需要頭部用戶、需要MCN?最直接的原因是,這些用戶和機構可以保證內容的優質性。那麽,難道普通用戶出產的內容就一定是劣質的、一定是別人不感興趣的嗎?

當然不是這樣。只是平臺的運營能力有限,無法從數量巨大的普通用戶中尋找他們出產的優質內容,維系住少數高產、優產的頭部用戶,是一種性價比更高的做法。

但通過AI對於用戶和內容的雙向理解,就可以彌補這方面的不足。

在快手上,大量用戶的評論、點贊、關註、轉發、播放時長等等行為就是在不斷的進行數據標註。建立在用戶行為數據之上,結合強大的視頻多模態分類、高層語義分割等等技術,就可以細致發掘用戶所發布的內容:拍攝的是人物還是美食?展示出的情感傾向是快樂、悲傷或是搞笑。


技術分享圖片


所以在快手平臺上50億海量視頻內容,都能夠通過獨有的多媒體內容理解算法及平臺被AI“看懂”,從而通過內容與用戶的匹配度進行分發,並非一味以熱度、粉絲數為參照。

通過上述這些註意力分配技術,我們會發現快手相比其他短視頻平臺,最大的特點就是“沒有網紅”,更準確的說是,普通用戶和網紅同樣都能獲得關註,擁有同樣表達自我的權力,利用技術照顧到99%的長尾內容,也就能給予大多數用戶被看到的“幸福感”。

這樣一來,短視頻平臺就向用戶提供了與整個文化世界交往的價值。這樣獨特的社交模式可以把用戶牢牢吸引在平臺上,讓他們不會隨著頭部用戶去留,也就緩解了短視頻平臺的流量焦慮癥。

繭房陷阱高燒不退,AI為短視頻平臺對癥下藥

除了流量焦慮癥之外,短視頻平臺目前還面臨的一大“癥狀”就是信息繭房。

在推薦算法幾乎已經成為一切內容平臺標配的今天,發掘用戶的喜好再為他們推薦相應的內容已經成為了一件容易的事。但這樣很可能出現兩個問題:

1、平臺只顧吸引流量為用戶推薦吸引眼球的內容(很可能是不當內容),導致用戶行為在平臺圈定的範圍內不斷進行反饋,使得信息繭房越來越牢。

2、平臺對於用戶的理解過於片面和被動,無法獲知用戶喜好的變化。也許一位用戶剛進入平臺時喜歡看搞笑內容,可慢慢開始關註烹飪,如果平臺沒能及時捕捉這一變化,用戶自然就會分流到能提供相應內容的平臺中去。

這樣一來,信息繭房就成為了一個巨大的陷阱,看似給予了用戶他們想要的東西,實際上對用戶需求的滿足是非常片面的。


技術分享圖片


在這兩個問題的解決上,快手首先是通過年齡、性別、地域、手機連接情況等等用戶特征來建立包括了用戶理解向量、用戶興趣和用戶關系的神經網絡,結合上文提到的內容理解,在兩者之間形成精準的匹配。

同時在內容分發時,快手已經率先實現實時的標值響定——隨著用戶每一次行為調整信息流推薦內容,這種實時在線學習推薦系統不僅更加精準,也一定程度上避開了信息繭房的現象。平臺可以捕捉用戶喜好的每一絲變化,通過更新模型來核定甚至促成變化的發生。

例如實時日誌系統發現用戶為烹飪內容點了個贊,就立刻在下一屏信息流中展示出更多烹飪內容,用戶或許就此對烹飪內容生出了興趣。這樣對瞬間想法和行為的捕捉,是傳統內容推薦、編輯推薦模式完全無法想象的。

除此之外,協同推薦算法也是一個解決信息繭房的常用方法。除了用戶自身的喜好之外,還會基於某一個內容點來研究大量的用戶具有哪些共性,找出這種共性,再來用它拓展單個用戶的興趣邊界。簡單來說,就是AI讓成千上萬的用戶和你一起來探,給予用戶一個更廣闊的世界。

壁壘的地基:AI與短視頻的無限未來

治好了流量依賴癥和信息繭房,AI技術就可以成為中國短視頻平臺的壁壘了嗎?

恐怕我們目前還不能下這個定論。AI之於短視頻,不僅僅是簡單用戶理解和內容分發。AI對於影音數據的理解和學習,創造和加工內容的能力,對於情感信號的細致分析,都與短視頻產業有著密切的聯系。而AI技術能否真正成為中國短視頻平臺的壁壘,還要看短視頻平臺能否利用AI技術的未來成長能力。

簡單看來,AI技術與短視頻未來還有以下幾種可能。


技術分享圖片


1、 圖像處理技術對短視頻制作的加持

我們拍短視頻時用到的背景摳圖、美顏濾鏡等等,都是由AI供能。但AI與短視頻制作之間絕對不僅於此。

在去年快手成立的AI技術實驗室Y-Lab裏,我們可以看到很多關於圖像語義分割、AR貼圖等等技術的全新進展。比如精準捕捉人體姿態進行進一步的圖像處理,通過視覺慣性裏程計讓AR貼圖效果更真實等等。同時Y-Lab還研發出一套可以在不同硬件能力手機上運行的深度學習推理引擎,支持CPU和GPU兩種模式,和硬件架構進行了深度優化。

加上移動AI芯片、陀螺儀等等手機硬件能力的不斷,未來用手機結合AI拍出電影特效般的短視頻並不是幻想。就看誰能將算法和硬件完美結合了。

2、 多模態信息融合帶來的強理解能力

今天我們仍然在通過圖像識別和標簽來識別視頻中的信息,等隨著多模態信息融合能力的加強,我們可以分別通過圖像、標簽、音頻和其他傳感器信號來共同識別一個視頻中的內容。

宿華在演講時也提到,多模態信息融合是快手正在關註的一個新興技術。更強大的感知能力自然可以實現更好的內容理解和分發。比如現在很多配音視頻是把悲情畫面配上搞笑的對話,以往單純依靠機器視覺對視頻畫面進行分析,往往可能產生錯誤的理解。但如果把NLP對於語音的分析和機器視覺的分析結果融合在一起,或許可以讓AI也理解到其中的反差笑點。

3、 壓縮技術的發展

還記得美劇《矽谷》裏貫穿全劇壓縮技術嗎?實際上隨著AI技術的發展,更小的內存占用和更高質量的畫面正在成為現實。2016年谷歌就曾經推出過一種用循環神經網絡壓縮圖片的技術,讓AI學習人眼對圖片的理解模式,忽略掉人眼難以發掘的數據細節。


技術分享圖片


如果這一技術進入短視頻領域,由此帶來的帶寬成本降低和用戶體驗提升,很可能成為短視頻平臺競爭中的重要籌碼。

另一方面,對於圖像處理算法模型以及計算量的壓縮也十分重要。Y-Lab就通過自主研發神經網絡架構,在這方面做了大量的工作。更快的處理視頻特效、讓視頻特效可以在所有手機上運行,對於短視頻這種下沈比率極高的產品而言至關重要。

總而言之,AI技術剛剛露出了成為短視頻平臺壁壘的潛質,打下了地基。目前我們看到的技術差距僅僅是個開始,未來在不同短視頻平臺之間是會相互追趕,或是差距拉大,才是中國短視頻平臺競爭的好戲。


短視頻的產業謎題,快手用AI解答