猜人心的淘寶,“刷”著“逛”的電商 | 你好AI
文 | 孫然
編輯 | 石海威
三桐可能是最懂中國女人的男人,因為他總能知道你想買點什麼,然後在恰當的時候送到你眼皮底下。甚至很多時候,他比你自己更清楚那些隱祕的慾望。
儘管他分不清豆沙色、楓葉紅這些口紅色號,也不知道這一季流行豹紋襯衣還是法式連衣裙,但他寫的演算法懂。
人們總是清楚的知道自己想要什麼嗎?從事消費者行為研究的說服心理學家凱文·霍根認為,大量的購物決策在發生時,人們是無意識的。“人們對於自己未來將如何行動,或者有無可能購買什麼產品,幾乎沒有預測能力,而且他們肯定也無法準確告訴你過去這麼做的理由。”
事實上,商家對此早有感知。消費者需要不斷被觀察,試探和刺激,才能賣給他們更多商品。
過去這是那些巧舌如簧的導購員們的絕活,現在,電商已經開始嘗試讓機器演算法和大資料充當這個角色。
三桐正在乾的就是這件事。他是阿里巴巴搜尋事業部的資深演算法專家,最近幾年在研發一系列利用搜索和推薦技術讓電商產品Feed化的演算法,也就是人們常說的“千人千面”。
今年,“三桐們”格外搶手。Boss直聘2018年二季度人力報告顯示,搜尋和推薦演算法工程師成了當下最熱門的崗位。不只新晉獨角獸拼多多,甚至一些A輪的早期電商公司,都在高價尋覓AI科學家。8月底改版後的手淘,個性化推薦欄目不僅在首頁佔了兩個板塊,還佔據了第二屏往後的全部位置。這些都意味著,“逛”和“刷”成了使用者使用電商App的新模式。
一個演算法比你更懂你的購物時代,已經悄然而至了。
“千人千面”下淘寶的應對
平均每個月有6.34億人在淘寶上購物。倚著早高峰8-9點的地鐵欄杆,或者晚上9-11點坐靠在床頭,無數男男女女端著手機,一頁一頁地刷著淘寶個性化推薦板塊“猜你喜歡”和“有好貨”,希望淘到點好東西。
這是一群很難搞定的消費者——心思多變又經常漫無目的。一個剛開啟健身生活的上班族可能盤算了一早上午餐要點份蔬菜沙拉,但只因為被隔壁同事的漢堡的氣味吸引,意志就在一瞬間潰敗。
這意味著,預測使用者需求的機器需要反應迅速又極有眼色——甚至你瀏覽商品時划動手機螢幕的速度,都能成為考量你正被吸引還是因無聊而煩躁的指標。
所有人在搜尋欄輸入關鍵詞,瀏覽著一模一樣的商品的年代已經翻篇兒了。
是什麼誘發了“千人千面”在電商行業的爆發?追溯源頭,一方面因為電商平臺的商品豐富度到了一個龐大的量級。以淘寶為例,如今平臺上有幾十億商品,幾千個子類目,涉及十幾個行業。與此同時,當人們的購物渠道從十幾英寸的電腦轉移到幾英寸的手機螢幕,展示空間卻急劇縮小,這時候Feed化的滾動展示,讓所有商品都有露臉的機會,就顯得很有必要。
另一方面,消費者的要求越來越高,相對於早年間的爆款,他們開始追求符合自己調性和偏好的商品。瀏覽大量不符合使用者偏好的產品,會浪費使用者的時間,消磨他們對電商平臺的認可度,最終商家會失去他們。
早在幾年前,淘寶就在為這個轉變做準備。2011年,淘寶內部出現了第一個推薦演算法的實驗專案。
那一年阿里資深產品專家方圓剛加入淘寶,作為專案經理牽頭做了個名叫“ 母嬰檔案”的個性化專案,主要為母嬰客戶推薦適合的產品。這個專案之所以誕生,源於淘寶希望提高搜尋效率,讓使用者能更快找到符合自己需求的商品,增加交易量。在此之前,傳統電商搜尋對於所有使用者都是以同一套演算法計算的,也就是所謂的“千人一面”。
有時候推動技術進步的往往是現實業務中的瓶頸。2013年左右,隨著平臺上的商品越來越多,對所有使用者採用同一套搜尋演算法,已經不能滿足使用者需求了。蘑菇街和美麗說這類主打“小而美”的新型競爭對手出現了,但使用者對淘寶的認知仍停留在低價爆款,這意味著人們可能只來淘寶採購低價商品,淘寶將在後續的競爭中受到很大限制。
與此同時,淘寶的UV增速開始放緩,需要用演算法創造新的使用者場景,刺激新的增長。為此,淘寶把個性化推薦和搜尋正式提上日程,迎合使用者開始走向多元化的需求。
淘寶用聚划算做了一次至關重要的個性化推薦測試——以往聚划算的商品展示的排序是遵循每個小時計算出的銷量,上了個性化排序後,商品成交量很快提升了一倍。
這給了淘寶後來全面做“個性化”的信心,到2014年All in 無線後,個性化業務的地位顯得更加重要。繼電商搜尋團隊後,阿里又成立了專門的推薦技術團隊。
“商品比人更難定義”
方圓每個月都要在淘寶上花個1、2萬,他每天起床後都習慣性地開啟淘寶,用產品負責人的視角檢驗推薦演算法的效果。
他對最近一次淘寶推薦的結果很滿意——前幾個推薦展示位分別是洗漱包、日式茶杯、幼兒早餐奶和新生兒用品,他覺得這準確契合了一個正處於連續出差中、愛喝茶的新晉二胎奶爸的使用者畫像。
“整個結果擺在我面前,就是我理解的自己的生活狀態。”他對36氪說。
所謂電商推薦,就是把使用者和商品資料化成機器能理解的語言,然後挖掘出使用者與商品、甚至商品與商品之間的關聯規律,實現精準的推送和高成交率。
“推薦也好、搜尋也好,都是一種關係的構建。對我們來講去構建這樣的關係是很重要的工作。”三桐進一步解釋。
定義一個方圓這樣的使用者,在整個阿里巴巴的生態內(包括淘寶、支付寶、UC、高德…)有幾百個維度的資料,而每個維度下面又能細分出無數屬性標籤。比如價格偏好是一個維度,它下面又可以按照高、中、低價範圍劃分出幾個屬性。算下來,定義一個人總共能有幾十億個標籤。
除卻性別、年齡這些基本資訊,你的行為會以一種隱祕的方式向機器透露你是個什麼樣的人,你的偏好又是什麼?比如購物歷史、搜尋歷史和瀏覽軌跡,都能為機器定義你提供依據。
在機器的上帝視角下,一切細碎的行為都被賦予意義:它能通過你購買前的瀏覽比對次數知道你是否是個糾結的選擇困難症患者,也能敏感的察覺到使用者是否對當前的推薦感到厭倦。
“我們可以觀察你的每次瀏覽行為中,比如10個坑位裡你看的商品是否是都是相似的,當推薦的品類過於集中,機器通過一些訊號感應到使用者(審美)疲勞了,下一步的推送就會提高探索度,推薦點其他的。”三桐告訴36氪,商品推薦最糟糕的情況就是使用者看了、商品曝光了,但一直在滾動螢幕,使用者不點進去。
不過相對來說,商品的定義或許比人更難,甚至有時候是一場演算法工程師跟商家之間的鬥智鬥勇。
淘寶的商品標籤體系有超過1萬個類目,以及包括品牌,尺寸、尺碼、款式、顏色在內的上百個屬性。就像三桐先前說的,僅顏色一個屬性,又能細分成幾千個子標籤。打這些標籤,有的依靠人工,比如品牌,有些則用深度學習技術生成。
給商品打標籤,就是將商品的資訊標準化。這是項複雜且工程龐大的工作。
坐在我對面的三桐微擰著眉頭,“你知道光是機器顏色打標籤有多難嗎?就說顏色,淘寶上一共有幾千個顏色。什麼灰白、銀白、奶白…米色到底是白色還是什麼東西?反正我不知道,除了那七種顏色,很多我們都沒見過。桃紅色、玫紅色,甚至不帶紅色的也能是個紅色,叫赤色。”
在淘寶這類平臺電商,每天無數商家會自行編輯不同的商品叫法、上傳不同的圖片,即便完全一樣的商品在兩個商戶的店鋪裡,也會有不一樣的叫法、屬性描述,更不用提還有山寨品。
“一個商品的標準屬性應該怎麼寫?如果商家隨便掛一個,我們又怎麼識別哪個對、哪個錯,”三桐見識過不少商家在宣傳詞彙上的無窮創造力,有些甚至讓他感到頭疼,“媲美耐克、金耐克、比耐克還舒服……這些都是商家創造出來的詞,但涉及到品牌侵權是非常嚴肅的事情。”
在一個每天不斷上架新品,總計幾十億商品的電商池裡,這種篩查不可能全部依賴人工,演算法需要有能力識別物品跟這些標籤之間的匹配是否真實又恰當,讓商品順利流入推薦序列,又避免消費者被誤導。
此外,每個行業在標籤上又都有各自的特殊規則。比如羊絨衫,按照國家標準,羊絨含量90%以上才可以稱為羊絨衫。保健品、醫療器械等等的名稱規範,又各有各的門道。
演算法如何猜中你的需求?
不僅使用者和商品畫像,購物行為也是需要經過標準化才能被機器理解。
演算法試圖在看上去沒有邏輯的使用者行為中揪出邏輯。這是個令人頭大的任務,三桐無數次看到使用者在淘寶上雜亂無章的行為軌跡:搜尋裙子——中途跑去家電板塊看手機——然後再回來看裙子——最後買了罐奶粉走了。
這說明兩個相繼的行為之間未必存在必然的聯絡,它們是割裂而碎片化的。相當比例的使用者開啟手淘時並沒有非常明確的目標,或者說持續有一系列明確的目標。這就像逛大街一樣,人們什麼都想去試試、看看,購買行為可能是被突然出現的眼緣激發的。
而電商們的轉化機會,就存在於準確預測眼緣並推薦。
要在一團亂麻的行為中抽離規律,淘寶的演算法工程師有兩種手法去應對:一種是實時推薦。機器要對人的心思實時感知,和我們一樣多變,這背後需要一系列複雜的模型和演算法迅速理解每次點選背後的意圖。
舉個例子,可能當你在“有好貨”的Feed流裡點開過一款皮包,當你退回Feed介面會發現原先在資訊流中排在這款產品下面的幾個推薦位已經換成了跟它風格接近的皮包。
另一種,把這團亂麻式的行為分類。可以先把牽扯到服飾、手機這些不同品類的行為區分開,然後每個品類下面再設定不同的觀察維度。比如關注手機類目下的品牌,一位連續兩天瀏覽了華為手機的使用者很可能在近期就有針對性的購買行為。又比如連衣裙品類重要的觀察維度可能是款式和價位,再比如小說書籍類目的標的可能是恐怖、歷史、軍事、言情這些內容風格。不同購物主題下對應的預測模型是差異化的。
再往深一步看,也有一些規律交叉在不同的品類之間。譬如20多年前,沃爾瑪就曾通過大資料發現那些放了聽裝啤酒的購物車裡可能也會放進嬰兒紙尿褲。這類顧客通常是受了太太囑咐下班來買東西的丈夫。沃爾瑪因此把啤酒和紙尿褲的貨架並列放在一起,結果是兩類產品的銷量都大幅增長。
淘寶的推薦邏輯在逐漸外擴,從推薦物品、到推薦品類、再到今年主要做的推薦場景。舉例來說明這種變化:機器的智力發育,從知道你想要把北歐風的餐椅,從而給你推薦一堆椅子,升級到知道你喜歡北歐風餐椅,乾脆嘗試賣給你一屋子的北歐風傢俱。又比如當你購買了一樣郊遊用的燒烤工具,機器可以基於場景推給你燒烤食材、戶外帳篷。這種轉變,意味著從賣一樣貨、到賣一個場景,甚至再高階點,一種生活氛圍或方式。
走向場景化推薦後,淘寶今年的推薦欄目使用率提升了30%。“30%其實只是我們的熱身,接下來會提升得更快,”方圓對迄今的進展頗為滿意。
到9月份,最新改版後的手機淘寶中,第二屏往下的位置已經全部屬於“猜你喜歡”,甚至直播、全球等板塊也用同樣的推薦邏輯併入了這個板塊。在以往舊版本的手淘中,佔據主導地位的是最上方的搜尋欄,以及以傳統方式運營的各個欄目板塊。
這個訊號說明Feed化的兜售模式在淘寶的地位被進一步認可了。Feed真正讓使用者在電商場景完成了從單純的搜到“逛”的轉變,其中的好處不言而喻,增加激發你購物交易的可能性,並且把你的時間留在電商的超級App裡。
更高階的猜心遊戲
不過電商推薦不準,也是經常被使用者吐槽的一點。
三桐聽了笑了笑,“推薦要做準確其實很容易。但過於準確也意味著侷限性,我知道你有需求,但不能一天到晚只給你推薦必需品,所以要進行需求的探索,探索肯定沒有那麼準,可是一旦命中,對於平臺就是很大的增量。而如果不做探索,使用者看到的品類會越來越窄,最後他覺得淘寶就是這些東西,這對我們很致命。”
他說的探索,就是讓機器會變著花樣試探、猜測你的各種喜好。猜的準確率,猜到什麼程度,甚至猜不中幾次能在你的容忍範圍內,這都是些技術活。
人們的確需要被挖掘到的驚喜感。大量的購物行為是在沒有實現規劃和意識到的情況下發生的,甚至所謂的衝動消費也是其中一種情況。
本質上,在準確和探索之間,電商推薦是一門關於“平衡”的藝術。
演算法工程師會用一系列指標去衡量推薦的效果,比如最核心的CTR(點選通過率)、使用者的瀏覽深度、看了多少頁、點選了多少商品、疲勞度……他們追求讓CTR在一定範圍內的平穩增長。即不能為了提升CTR而過度犧牲探索力度,又要在CTR下跌較多的時候及時意識到已經探索過度,回撥力度。
相對而言,女性消費者的心思讓機器難以捉摸,比如她們未必會長期侷限於一種服裝風格,而是看心情每種買幾件。但同時,她們也比男性對探索的容忍度更高,更樂於“逛”。
每個人對新事物的接納程度,對探索的容忍度,都有所不同,這意味著每個淘寶賬號背後的演算法模型,都在逐漸被對應的使用者“養成”個性化的,通過你點了什麼、沒點什麼這些訊號,越來越懂你。
什麼時候套用什麼規律?什麼規律適用於什麼群體或者品類,可能是件極複雜的事。
“也有的人抱怨為什麼電商有時候會原封不動地推薦他買過的東西。但其實在書籍和某些品類,資料證明了人們就是有大量的復購率。而經典的紙尿褲和啤酒的搭配,也未必總是對的,”一位搜尋從業者對36氪說。
電商搜尋推薦技術在不斷演進,淘寶希望做得再細一點——從分析一個群體,到分析個人。原因是消費者對推薦的要求越來越高。“過去的消費者要求如果他的孩子1歲,系統不要給他推3歲的玩具,但今天,他需要你告訴他1歲的孩子要買什麼,去挖掘他的潛在需求。更高階的,有的消費者希望機器預測出哪一天嬰兒奶粉喝完,尿不溼用完,然後提醒他去買。”方圓告訴36氪,如今用的深度學習、強化學習的演算法模型已經越來越複雜。
而在實際運營中,電商推薦還存在很多需要優化的地方。未來好的演算法,不僅需要知道人們想買什麼,需要買什麼,它還要了解人們使用商品的那些場景究竟是什麼樣子,甚至需要理解消費者所處的人生階段和生活狀態,就像一面上帝視角的鏡子。