揭露今日頭條增長的祕密,其中有一點最值得你學習!
微信號: ofollow,noindex" target="_blank">運營研究社(ID:U_quan)
2018 年,中國移動網際網路使用者增長放緩,上半年僅增長 2 千萬。
但是有一匹黑馬,硬是在這種惡劣的情況下,逆流而上。
今日頭條系獨立 App 使用者使用時長佔比,從 3.9% 猛增到 10.1%,增長了1 .6 倍, 超過百度系、阿里系穩居總使用時長第 2 名。
更牛逼的是,頭條系產品這種突飛猛進的增長速度還在持續, 單今日頭條資訊 App 每天還在保持 100萬+ 的新增。
在頭條系如何做到這般“喪心病狂”的使用者增長的背後,其實有一些不為認知的小祕密。
頭條內部會創新(或者抄襲)孵化產品,並且為每款產品設定留存生死線(RIO),超過生死線的產品就可以頭條系站內流量扶持,快速讓它達到千萬級日活。
今日頭條涉足近60個產品
頭條內部有非常強大的資料監控系統(花大價錢買資料),任何產品的日活和增長資料都在它們的監控之下。
另外,為了幫助提升創新產品的成功率,頭條內部甚至研發出了一套增長引擎,在咱們還在糾結功能按鈕排序時,他們就在 同時進行幾十組甚至上百組的 A/B 測試, 幫助產品經理和運營們找到最優的方案。
頭條強大的生死線和資料監控系統我們模仿不來,他們的增長引擎我們也暫時研發不出來。但是幫助篩選最優方案的 A/B 測試,我們還是可以進行借鑑學習的。
雖然 A/B 測試過去更多的是在產品領域,通過它來判斷功能的價值。 其實到現在 A/B 測試已經滲入到運營 ,哪天公眾號能推出小流量開啟率測試功能,我想你會開心壞了!
什麼是 A/B 測試
A/B 測試,也叫對照實驗和隨機實驗。簡單說,就是為同一個目標設計 A 方案和 B 方案,讓一部分使用者使用 A 方案,一部分使用者使用 B 方案。記錄使用者的使用情況,根據使用者反饋,比較得出哪個方案更佳。
千萬不要以為這裡的“A/B測試”真的只會有 A 方案和 B 方案,“A/B 測試”只是習慣性叫法,你還可以有 C、D、E 多種供測試的方案。
看完定義,你可能會覺得“A/B 測試”這個概念已經爛大街了,不就是提出多種方案供選擇,然後選擇效果最好的哪一種嗎?
其實理論講起來很簡單,實際做起來還是需要很多技巧的。我們先來看一看,今日頭條是如何開展 A/B 測試的?
今日頭條的頭條號具有“雙標題”功能,這其實就是 A/B 測試的一種實踐。
也許你會說,這難道不是為了讓使用者有更廣闊的起標題空間嗎?一篇內容可以起兩個標題, 那麼一個標題廢了,還有另一個標題撐腰。 不像微信公眾號,只有一個標題,一旦標題廢了,閱讀量基本上就完蛋了。
事實上,今日頭條設定“雙標題”功能是為了 更精準地瞭解使用者對於標題的反饋 ,從而掌握使用者的行為資料。
當然,今日頭條在 A/B 測試上最牛逼的玩法不是“雙標題”功能,因為只測試標題,就會造成“標題黨”氾濫橫行。基於此,今日頭條 A/B 有一套“動態”的內容推薦機制, 這裡的”動態“指的是根據反饋結果,實時更新調整。
這套“動態”內容推薦機制是如何運轉的呢?
同樣的方案,今日頭條會先推薦給小範圍的人群:
比如 100 人,如果這 100 人對標題、內容的反饋均不錯,那就把方案推薦給更大範圍的人群,比如 500 人,如果這 500 人對標題、內容的反饋效果很好,再推薦給更大範圍的人群,比如 2000 人,以此類推。
使用者的行為動作會被蒐集,據《今日頭條推薦系統原理》介紹,基本上每小時都可以看到使用者對內容的反饋。但因為每小時都有資料上的波動, 今日頭條通常以天為時間節點,來檢視使用者的行為資料。
將使用者的行為動作進行蒐集後,今日頭條會有日誌處理、分散式統計,寫入資料庫。
今日頭條系統就可以自動生成: 實驗資料對比、實驗資料置信度、實驗結論總結以及實驗優化建議。
這樣看來,是不是覺得 A/B 測試的威力真的很強大,不僅完成了方案調研,還能通過測試掌握使用者口味,實現精細化內容推薦,從而更好地留住使用者。
A/B 測試的應用
可能你會覺得 A/B 測試只有大公司才玩得起,和我們並沒有什麼關係。可能你也會覺得這只是產品的事,和我們運營沒什麼關係。
那你誤解可就大了。不僅小玩家也能玩,而且和我們運營大大的相關。 如果你是一個會做增長的運營,那你很可能就會成為你們公司的扛把子。
舉個例子:
我們之前邀請了「深夜發媸」的主編阿芙,來給我們做微課分享。既然談到微課,那肯定是要打磨微課海報,提升宣傳效果的。
於是我們請我司首席設計師做了一版,結果一出來,編輯部的小姐姐們意見不合吵了起來。
一個人認為“如何寫出使用者喜歡的營銷文案”,這個主題沒有吸引力,應該改成 “10 招寫出讓使用者喜歡的營銷文案” 。
還有一個人表示贊同,但是應該進一步優化,改為“10 招寫出讓使用者瘋傳的轉化文案”。
這個時候,賢哥很機智的說了一句,你們就不能做 3 版海報嘛?每版海報只讓一個寶寶號,在同一個時間轉發(所有寶寶號均擁有 5000 人好友),這樣不就測出來哪版效果好了嘛?
當時我們沒有想到,其實這就是 A/B 測試的思維。
後來我們實施了賢哥的想法,測試出了 3 個海報的轉發率(轉發海報使用者/新增使用者), 分別為:30%,35%,44% ,效果最好的一張是:10 招寫出使用者瘋傳的轉化文案。
接下來,就發動所有寶寶號,公司的全體員工分享海報,最終吸引了 3000 人來聽課,這也是我們目前效果最好的一次微課分享。
除了微課的應用,還有很多地方也可以用到 A/B 測試。
比如 App 的 push 可以做 A/B 測試 。餓了麼想要測試,不同的促銷活動,對使用者的留存有多大作用,所以就發生了以下場景。
昨天,小松果興沖沖和我說,餓了麼給她發了一條推送:“你有一張 15 元大額券待領取”,結果點進去發現是“滿 40 減 15 ”。儘管這樣,她還是湊單點了很多東西。
根據以往經驗來看,餓了麼喜歡在我們吃飯前推送。所以我看了看自己的餓了麼推送:“訂單滿 45 可享七五折優惠”。一看我就沒有興趣,起點那麼高。
其實這就是餓了麼運營給我們做的 A/B 測試。
通過這次測試,他們可以通過訂單率發現,同樣都是優惠 15 元(都花 40 塊的前提下), 直接突出數字 “優惠 15 元”,就比“滿 40 減 15”效果好。
總之,通過 A/B 測試,確確實實能夠試出最佳增長方法。除了 App 的推送,微課主題,還有很多場景可以用 A/B 測試,比如付費廣告,應用商店,著陸頁,新使用者引導流程等等。
A/B 測試容易踩的坑
A/B 測試看似簡單,實則隱藏著許多溝溝坎坎,稍不注意就會導致試驗結果偏離科學軌道。
1)忽略測試環境差異
如果真的有一天公眾號開發的標題 A/B 測試的功能,你會用下列哪個方案去測試的你的標題?
a. 將上海地區使用者分成 3 個組,並在同一時間分別推送 3 個不同的標題。
b. 將上海地區使用者分成 3 個組,並在不同時間點分別推送 3 個不同的標題。
如果你的是選擇 b 方案的話,恭喜你翻車了!
舉個不太恰當的例子,b 方案的測試方法就好比在電視上投放廣告,分別選取了工作日的下午 3 點鐘和晚間黃金時段進行測試收集。
由於輪流展示時的測試環境不盡相同,所面向的受眾群體更是千差萬別,因此最終試驗結束後的資料結果必然會存在一定偏差,也就更不具有說服性了。
2)容易「以全概偏」
在測試結果沒有表現出理想狀態下的資料提升時,如果你直接放棄的話,有可能你又踩坑了。
國際短租平臺,搜尋是 Airbnb 生態系統中很基礎的一個組成部分。Airbnb 曾經做過一個關於搜尋頁優化的 A/B 測試,新的版本更加強調了列出的圖片,以及房屋所在位置(如下圖所示)。
在等待了足夠長的時間之後,試驗結果顯示新老版本的整體資料相差無幾,似乎這次優化沒有很好的效果。
如果此時,Airbnb 直接根據整體的資料表現放棄了這次優化,那麼這個花費了很多精力設計的專案就會前功盡棄。
相反,經過仔細研究,他們發現除了 IE 瀏覽器之外,新版在其他不同瀏覽器中的表現都很不錯。當意識到新的設計制約了使用老版本 IE 的操作點選後(而這個明顯為全域性的結果造成了很消極的影響),Airbnb 當即對其進行了修補。
至此以後,IE恢復了和其他瀏覽器一樣的展示結果,試驗的整體資料增長了 2% 以上。
通過 Airbnb 的例子,我們能學到正確的做法是:在整體效果不太好的時候,不要一竿子打死,而需要從多個維度細分觀察個體的情況,以避免區群謬誤帶來的決策偏差。
3)只做到了區域性最優
避開了上面的 2 個坑之後,你可能得到一個相對不錯的測試結果,在你欣喜若狂時,正準備對外宣佈戰果時, 可能已經踩入了另外一個坑——“區域性最優”
以某金融平臺提升新使用者的註冊率的 A/B 測試為例,運營通過不斷進行註冊按鈕的文案優化,發現相比於“立即註冊”、“免費註冊”等文案而言,“領取 100 元新人紅包”的註冊率是最高的。
但是,如果只是沉迷在文案上做測試,其實他可能就錯過了提升使用者註冊率的其他更效假設。
正確的做法是可以 進行使用者調研,瞭解使用者不註冊的原因在哪 ,通常情況下金融平臺讓使用者放棄註冊的原因還在於,註冊流程繁雜、信任問題、無匹配的理財產品等,所以在完成了註冊按鈕的文案測試時,我們還需要在這些方面也進行想要的實驗。
總結
我們通過分析今日頭條,向大家展示了 A/B 測試的強大功效,採用 A/B 測試不僅能夠在眾多方案中選擇出最佳方案, 其實更能對產品進行不斷的迭代優化,實現使用者留存。
如今,A/B 測試已經滲透到運營工作中,運營社也在實際工作中感覺到這個理論真的很好用。
1)當有多種方案供選擇,但又產生意見分歧時,可以通過 A/B 測試找出找出最優解。 比如文章起標題、裂變海報文案、以及 App 的 Push 等。
2)看似簡單的 A/B 測試,其實有很多坑:
① 忽略測試環境差異 ,沒有進行變數控制(只能有一個變數),造成資料偏差;
② 以偏概全 ,在測試結果沒有實現理想狀態下的資料提升時,就放棄對產品優化,會導致專案前功盡棄;
③ 只進行區域性優化就忽略對其他部分的調整更新 ,無法查找出其他方面的漏洞。