1. 程式人生 > >python資料分析:商品資料化運營(上)——知識點

python資料分析:商品資料化運營(上)——知識點

商品資料運營指標

銷售類指標

  1. 訂單量/商品銷售量

    • 訂單量指使用者提交訂單的數量,計算邏輯去重後的訂單ID的數量。
    • 商品銷售量又稱銷售件數,指銷售商品的數量。
  2. 訂單金額/商品銷售金額

    • 訂單金額為使用者提交訂單時的金額,又稱為應付金額。訂單金額是使用者真正應該支付的金額。計算公式為:訂單金額 = 商品銷售金額 + 運費 - 優惠憑證金額 – 其他折扣(如滿減)
    • 商品銷售額是指商品銷售的金額,商品銷售額與訂單金額的區別在於沒有計算任何其他費用或優惠金額。計算公式為:商品銷售額 = 商品銷售單價 × 銷售數量

訂單金額和商品銷售金額都會作為商品總銷售收入的評估指標,前者主要側重於使用者實際付款,後者側重於總收入。

  1. 每訂單金額/客單價/件單價

    • 每訂單金額指平均每個訂單的金額,它是以訂單為單位計算。公式:每訂單金額 = 訂單金額 / 訂單量。

    • 客單價指平均每個使用者的下單金額,是以使用者為計算單位。公式:每訂單金額 = 訂單金額 / 訂單使用者量。

    • 件單價又稱每件商品價值,指平均每個商品的銷售價格。公式:件單價 = 訂單金額 / 商品銷售量。

這三個指標用來評估單位物件的價值產出,分別側重於訂單個體、使用者個體和商品個體。

  1. 訂單轉化率

訂單轉化率是電子商務網站最重要的評估指標之一,大多數網站分析工具的計算公式為:訂單轉化率 = 訂單量 / 總訪問量 或 訂單轉化率 = 訂單量 / 總UV量,這種計算方式實際上不科學,原因是它衡量的不是人的轉化比例。假如一個使用者下多個訂單或網站存在訂單拆分的情況,會使訂單量大大高於實際訂單人數,導致訂單轉化率虛高。正確的計算方法為:訂單轉化率 = 產生訂單的訪問量 / 總訪問量 或 產生訂單的UV / 總UV量。

ps:這裡沒有使用使用者ID作為分子和分母,原因是大多數使用者在到達網站時不會主動登入,只有在有訂單或必須使用者登入的條件下才能獲取使用者ID資訊,無法統計到的使用者ID便不會加入到分母后,導致資料缺失。

  1. 支付轉化率

支付轉化率是衡量使用者支付轉化的資料指標,是使用者完成購物的重要步驟,更是企業產生真實銷售價值的關鍵。計算公式為:支付轉化率 = 完成支付的客戶數 / 需要支付的客戶數

支付轉化率是針對選擇先款後貨客戶的轉化評估指標,因此它只能評估訂單使用者中的一部分。對於選擇貨到付款的使用者無需該指標評估,使用者會在配送驗證的時候支付。另外,由於每個訂單都對應真實的客戶,因此這裡客戶數計算支付轉化率。

  1. 有效訂單量/有效訂單金額/有效商品銷售量/有效商品銷售額

有效訂單:使用者提交訂單後,一部分訂單銷售公司稽核未通過導致無效,或是使用者下單後取消導致無效,剩下的能夠正常進入銷售流程的訂單為有效訂單。

  • 有效訂單量:有效訂單的總量
  • 有效訂單金額:有效訂單的金額
  • 有效商品銷售向:有效訂單中商品的銷售量
  • 有效商品銷售額:有效訂單那種商品的銷售額

根據上述指標還可以延伸後有效件單價、有效訂單狀態率、有效客單價等。

  1. 訂單有效率/廢單率
  • 訂單有效率是用來衡量訂單有效比例的重要指標,計算公式為:訂單有效率 = 有效訂單量 / 訂單量

  • 與訂單有效率相對的指標是“廢單率”,廢單率是所有訂單中作廢的訂單比例,計算公式為:廢單率 = 1 – 訂單有效率

ps: 訂單有效率從訂單發生時隨著時間推移開始下降,直到所有訂單完成妥投才處於穩定狀態。大多數電子商務企業的訂單有效率在60%以上,如果低於該資料值可能說明訂單中包含大量作弊或無效訂單。

  1. 毛利/毛利率

    • 毛利是衡量自營商品利潤最重要的指標之一,公式:毛利 = 商品妥投銷售額 – 商品批次進貨成本

    • 毛利率是考察自營商品盈利情況另外一個最重要的指標,毛利和毛利率綜合反映了商品的盈利規模和盈利能力。毛利率計算公式為:毛利率 = 毛利 / 商品妥投銷售額

ps: 這裡的毛利僅指銷售毛利,即通過商品進銷差價計算的毛利,沒有考慮商品促銷費用、配送費用、活動推廣費用及其他攤銷費用;另外,公式中使用“商品批次進貨成本”計算毛利,原因是相同的商品在不同批次下進貨成本可能不同,因此需要使用相應批次的進貨成本。

促銷活動指標

  1. 每訂單成本/每有效訂單成本

每訂單成本指完成每個訂單需要的成本。公式:每訂單成本 = 費用 / 訂單量。

對於公式中的費用,不同部門有不同的費用支出情況。比如針對廣告部門的費用通常只包含廣告費用,每訂單成本 = 廣告費用 / 訂單量;對於運營類部門的費用可能只包含促銷類費用,如優惠券費用。廣告部門中存在一種按訂單付費的合作方式CPS,這種方式基於成交訂單而支付給推廣媒介一定比例的佣金或返點。這也屬於訂單成本的一種。

每訂單成本核算的是每個“毛”訂單成本,訂單中包含了所有狀態(包含無效狀態),只適合評估部門級別業務效果或做企業的初級評估指標。

每有效訂單成本與每訂單成本計算邏輯相似,不同點在於該指標只計算所有訂單中有效訂單的部分。計算公式為:每有效訂單成本 = 費用 / 有效訂單量。該指標中僅包含有效訂單狀態的訂單成本,是針對企業級別的真實評估指標。

由於有效訂單也不一定最終妥投,其中有些是進行中的狀態,因此最終產生價值的訂單屬於妥投訂單,通過妥投訂單計算得到的成本才是最終訂單成本。

  1. 每優惠券收益/每積分兌換收益

    • 每優惠券收益指每張優惠券能帶來的收益。公式:每優惠券收益 = 優惠券帶來的訂單成交金額 / 優惠券數量。由於企業往往傳送不同的優惠券型別以及面值,通常需要在此基礎上分別計算每種型別和幣值優惠券帶來的收益水平。

    • 積分與優惠券類似,都是用來衡量優惠促銷對銷售的拉動情況。公式:積分兌換收益 = 使用積分兌換的訂單成交金額 / 積分兌換量。

ps:在實際業務中,由於使用者往往可以在同一個訂單中同時使用積分和優惠券,因此可能會出現訂單貢獻重複計算的情況。

  1. 活動直接收入/活動間接收入

    • 活動直接收入指單純通過促銷活動帶來的收入,使用者購買的訂單均屬於促銷活動商品。

    • 活動間接收入指通過促銷活動帶來的使用者購買了非活動商品的收入情況。通常計算活動間接收入的邏輯是該使用者通過促銷活動引入且訂單屬於非活動商品,通過促銷活動引入可通過定義使用者落地頁是活動頁面加以區分,訂單屬於非活動商品可通過參與活動商品列表進行拆分。

  2. 活動收入貢獻

活動收入貢獻包含活動直接收入貢獻和間接收入貢獻的總和,用活動收入貢獻總金額除以全站訂單成交金額得出活動收入貢獻佔比,公式:活動收入貢獻佔比 = (活動直接收入 + 活動間接收入)/ 全站訂單成交金額

當然,除了可以用訂單成交金額計算外,還可以使用訂單量、商品銷售量等計算活動貢獻情況,其邏輯相同。

  1. 活動拉昇比例

活動拉昇比例指活動對全站銷售的拉昇情況,可以指銷量拉昇、銷售額拉昇、訂單量拉昇等。

活動拉昇比例通常不能使用活動貢獻佔比來評估,原因是活動促銷期間本來應該通過正常流程和渠道購物的使用者反而會通過促銷渠道下單。最簡單的計算方法是用活動期間的收入與非活動期間的收入進行對比,計算公式為:活動拉昇比例 = (活動期間收入 / 非活動期間收入)- 1

注意 在通常情況下,在計算收入拉昇比例會發現收入拉昇效果不如訂單量和銷量明顯,原因是通常促銷客單價較低,影響收入提升效果。

商品資料化運營分析模型

商品價格敏感度模型

商品價格敏感度模型是指通過研究找到使用者對於價格是否敏感以及敏感程度的價格槓桿。利用價格敏感度模型可以輔助於銷售定價,促銷活動的折扣方式、參考價格、價格變動幅度等方面的參考:

  • 促銷活動時促銷哪些商品較好
  • 商品價格提升,對銷售的影響,設定合理價格
  • 在商品詳情頁的參考價格應該定為多少才能讓客戶感覺到已經降價並觸發下單動作
  • 滿減、滿返、跨品類用券等哪些方式最適合哪些產品

調查問卷法:

通過調研問卷的形式針對關注的品類或商品做調研分析是比較通用的一種方法。這種方法可以獲得品類詳細資訊,並且可以通過問卷設定不同的關注資訊點,收集到的資訊更符合實際需求。
但是,當面臨新的價格敏感度分析需求時,通常都需要重新開展調研分析工作。這種方式實施起來週期較長且反饋結果較慢,另外,當要收集的商品資訊較多時,可能很難獲得完整資料。

資料建模法:

通過資料建模的方式建立商品價格和銷售量之間的關係模型是研究價格敏感度的有效方法。這種方法實施起來相對簡單:

首先,收集不同價格下的銷售資料。價格敏感度模型需要有基於不同價格下的銷售資料產生,因此需要商品運營部門針對性的做調價。這種調價動作根據需求的不同,可能是長期的,也可能是短期的。長期的調價是一種“自然狀態”,因為在一個較長週期內商品會經歷生命週期的不同階段,並結合商品促銷、打折等運營工作產生多種價格和銷售資料;而短期的調價更多的是為了採集資料而產生。

其次,資料建模分析。商品價格敏感度模型關注的主要是價格和銷量之間的關係,可以用迴歸方法來解決。在迴歸方法中,自變數中除了價格外,還需要包含其他兩類資訊:

  • 商品資訊:商品品類、上市時間、同期競爭對手價格、是否參與促銷活動、促銷方式、折扣力度、通用屬性等。
  • 客戶資訊:客戶性別、年齡、收入、學歷、會員級別、歷史訂單量、品類偏好度、活躍度、價值度等。

之所以要將大量的商品資訊和客戶資訊加入到迴歸模型中,是因為如果只針對價格和商品銷售量做迴歸,那麼價格本身能解釋的商品銷售量變化可能會非常有限,銷量的變化還可能受到其他很多因素的影響,因此要在控制這些干擾因素的前提下做迴歸模型。

新產品市場定位模型

新產品市場定位分析用於當企業新生產或策劃一款產品時,需要根據市場上現有的競爭對手產品情況做定位分析。該分析的目的是評估新產品與哪些產品能形成競品關係,可以針對性的找到與競品的差異性和優勢,例如功能特點、使用週期、產品質量等,從而應用到產品定價、市場宣傳、渠道推廣等方面。
新產品市場定位分析可以通過基於相似度的方法實現。例如,使用非監督式的KNN(K近鄰),模型的核心是通過對新產品的資料與現有資料的比較,發現跟新產品相似的其他產品。

銷售預測模型

銷售預測模型根據歷史的銷售資料來預測未來可能產生的銷售情況。該模型常用於促銷活動前的費用申請、目標制定、活動策略等的輔助支援。

銷售預測模型通常要得到的結果為未來會產生多少銷售量、收入、訂單量等具體數值,可通過時間序列、迴歸和分類三種方法實現。

  • 基於時間序列做銷售預測。使用時間序列做銷售預測的方法常用於沒有太多可用的自變數的場景下,只能基於歷史的銷售資料做預測性分析。
  • 基於迴歸做銷售預測。基於可控的特徵變數建立迴歸模型來預測未來的銷售情況是更常用的方法。
  • 基於分類做銷售預測。分類方法是針對每個銷售客戶產生的是否購買的預測分類,然後再基於能產生購買的預測分類做客單價、訂單量和收入的分析。這是一種對於具體數值的變通實現思路。

商品關聯銷售模型

商品關聯銷售主要用來解決哪些商品可以一起售賣或不能一起打包組合的問題。關聯銷售是商品銷售的常態,也是促進單次銷售收入和拉昇復購效果的有效手段。
商品關聯銷售模型的實現方式是關聯類演算法,包括Apriori、FP-Growth、PrefixSpan、SPADE、AprioriAll、AprioriSome等,主要實現的是基於一次訂單內的交叉銷售以及基於時間序列的關聯銷售

異常訂單檢測

異常訂單檢測用來識別在訂單(尤其是促銷活動中的訂單)中的異常狀態,目標找到非普通使用者的訂單記錄,例如黃牛訂單、惡意訂單、商家刷單等。

黃牛訂單會大量削減促銷對普通使用者的吸引程度,使得促銷權益和利益被一小部分人獲取,而非給到目標會員。

惡意訂單則更加危險,很多競爭對手間會通常這種方式在促銷活動中,將大量的商品庫存通過訂單的方式鎖定,然後再活動結束後通過取消、退貨等方式釋放庫存。這種方式將使促銷活動由於無法真正賣出商品而無法實現促銷的目的,同時還會消耗公司大量的人力、物力,是各個公司都非常反感的惡意競爭方式。

商家刷單是一種常見的用於提升商家排名的方式,通常由商家來安排內部或關聯人員大量購買商品,以形成商家流量和銷售提升的目的。

異常訂單檢測主要基於兩類方法實現:

  • 一類是基於監督式的分類演算法。將歷史已經識別出來的真實異常訂單資料通過分類模型(例如SVM、隨機森林等)做訓練,然後應用新資料做分類預測,看預測結果是否屬於異常訂單。
  • 一類是基於非監督式的演算法。通過非監督式演算法(例如OneClassSVM)基於歷史的資料做訓練,然後針對新的資料做判別,找到存在異常可能性標籤的訂單列表。

商品規劃的最組合

在做商品促銷或廣告宣傳時,通常企業會面臨多種組合策略,它是在一定限制條件下考慮通過何種組合策略來實現最大或最小目標。此時,可以考慮使用線性規劃方法。

線性規劃(Linear programming,LP)是運籌學中研究比較早、方式相對成熟且實用性非常強的研究領域,主要用來輔助人們進行科學管理,目標是合理地利用有限的人力、物力、財力等資源作出的最優決策。解決簡單線性規劃問題的最直接的方法是圖解法,即藉助直線與平面區域的交點求解直線在y軸上的截距的最大值或最小值。

在做線性規劃時涉及到幾個概念:

  • 未知數:影響決策主要變數或因素。
  • 約束條件:解決線性規劃問題時已知的並須遵守的前提條件。
  • 目標函式:用來表示未知數與目標變數關係的函式,線性規劃中一般是線性函式。
  • 可行域:滿足優化問題約束條件的解叫做可行解,由所有可行解組成的集合叫做可行域。
  • 最優解:滿足目標函式最大化或最小化目標的最優的解。

如果線性規劃中有多個變數,那麼我們無法通過圖形的方式直接發現最優值的位置,此時可以藉助Python的線性規劃庫來完成線性求解工作,包括scipy.optimize.linprog、pulp等。

使用層次分析法將定量與定性結合分析

層次分析法(Analytic Hierarchy Process,AHP)是將與決策總目標相關的細分元素進行分解,在此基礎上做層次權重的方法,這是一種將定性分析和定量分析相結合的方法。

這種方法可以廣泛用於多種將定性與定量分析結合的商品運營決策場景中,例如:

  • 商品資源位的決策中,到底哪些商品應該放到最好的位置上?
  • 商品流量導航的入口,哪些品類應該放在最明顯的位置?
  • 公司在天貓上爭取到了幾個資源位,應該投放哪些商品?
  • 商品貢獻價值衡量,除了銷量、利潤等數字可衡量的因素以外,增加商品標杆、商品品牌價值的提升、企業戰略合作商品、投資者關注品類等因素,如何選出貢獻最大的商品?

層次分析法是不僅能用於不確定性和主觀資訊的整合,還可以將以往經驗和洞察應用到權重評估過程中,這種基於層次劃分的方法,可以使評估人員能有效衡量不同指標間的相對重要性。

使用BCG矩陣做商品結構分析

BCG矩陣又稱為波士頓矩陣,它是波士頓諮詢集團提出的一種分析方法。該方法常用來分析如何將企業有限的資源有效地分配到合理的產品結構中去,以保證企業利益的最大化,因此這是一種巨集觀分析方法。

BCG矩陣認為決定商品結構的基本因素有兩個:市場引力和企業實力。

  • 市場引力指的是企業銷售量、增長率、目標市場容量、競爭對手強弱等市場因素,其中最能反映市場引力的指標是銷售增長率,這是決定商品結構的外部因素。
  • 企業實力包括市場佔有率,資金、技術等方面的能力,其中市場佔有率是決定企業商品結構的內在因素。

基於銷售增長率和市場佔有率這兩個維度,BCG矩陣將商品組合分為4種類型:

  • 明星型商品(Stars):指高增長率,高市場份額的商品,這類商品可能成為企業的現金牛商品。
  • 問題型商品(Question Marks ):指高增長率,低市場份額的商品。這類商品雖然市場增長較快,但是一般利潤率較低,所需資金支援和資源投入較大。
  • 現金牛型商品(Cash Cows):指低增長率,高市場份額商品,這類商品能幫助企業回收資金並加速資金流轉,可以支援其他商品和業務的發展,是公司發展的基石和後盾。
  • 瘦狗型商品(Dogs):指低增長率,低市場份額的商品。這類商品對企業來講一般處於虧損或利潤貢獻比較差的階段,通常很難為企業帶來收益。

如何對矩陣資訊做分析?

  • 針對明星型商品品類,應當積極擴大經濟規模和市場機會,以長遠利益為目標,提高市場佔有率,加強競爭地位,例如採用事業部形式直接管理。
  • 針對問題型商品品類,應當重點考慮市場佔有的問題,包括市場營銷、客戶維繫、新產品引入等方式來擴大市場面。
  • 針對現金牛型品類,需要重點維持現狀,因此單獨的事業部以及營銷體系是重要措施。
  • 針對瘦狗型品類,需要考慮市場撤出、資源整合到其他商品業務或做結構化改革,以降低其對企業的負面效應。

BCG矩陣的優勢是能夠將不同的商品或業務放到一個平面做對比,並且基於公司的整體觸發可以考慮資源間的最優配置和調整方向。在通過矩陣做輸出表示時,其具有非常好的可理解性和應用性,是企業戰略研究的重要方法支撐。

4P模型建立商品分析結構

4P是營銷學的一種組合概念,包括產品(product)、價格(price)、渠道(place)、促銷(promotion)。

  • 產品:包括有關商品的客觀實體要素,例如質量、外觀、樣式、品牌、類別、屬性、規格等。
  • 價格:有關商品的價值要素,例如基本價格、促銷價格、付款價格、毛利、利潤率等。
  • 渠道:有關商品的分銷要素,包括分銷渠道、供應商、物流、庫存、經銷商等。
  • 促銷:有關商品的促銷類要素,包括廣告、營銷、促銷活動、宣傳、推廣等。

當然,經典4P理論都是圍繞商品環節的,在實際銷售過程中除了商品本身的要素外,還有更多跟商品運營相關的其他要素,包括:

+ 人員:人員是做商品運營(也包括所有運營)的基石,任何運營活動的結果都跟人掛鉤,因此可以從人員的角度分析對運營效果的影響。

  • 資源:資源的支援力度是導致商品運營結果差異的重要因素,不同的促銷經費、資源位、站外廣告位、活動時間、內部推介等資源支援下,運營效果差異很大。
  • 流程和機制:商品運營過程中的流程也是影響運營結果的主要因素,很多情況下甚至會成為關鍵因素,包括固定性流程(例如每月一次的**活動)、突發或異常應對機制(例如異常訂單的隔離)、臨時性流程(臨時提報活動的影響)等。

ps:跟4P概念相對應的還有4C,消費者(Consumer)、成本(Cost)、便利(Convenience)、溝通(Communication)。4C跟4P的最大不同是,4P是以商品為出發點考慮營銷基本面,而4C則是以消費者為導向的組合方法。隨著概念的發展,後來又延伸出4S、4R、4V、4I等不同營銷理論。

使用假設檢驗做促銷拉動分析

假設檢驗(Hypothesis Testing)是數理統計中常用的方法,它實現的是根據一定假設條件由樣本推斷總體。假設檢驗的基本實現思路是:根據研究課題的需要對研究總體作某種假設,記作H0;選取合適的統計樣本,其選取結果要使得在假設H0成立時,其分佈情況已知;然後由實測的樣本,計算出統計量的值,並根據預先給定的顯著性水平進行檢驗,作出拒絕或接受假設H0的判斷。常用的假設檢驗方法有卡方檢驗、T檢驗法、F檢驗法、U檢驗法、Z檢驗法、方差分析法等。

  • 卡方檢驗屬於非引數假設檢驗,適用於布林型或二項分佈資料,基於兩個概率間的比較,早期用於生產企業的產品合格率等,在網站分析中可以用於目標轉化率等有比率度量的比較分析。
  • T檢驗屬於引數假設檢驗,所以它適用的範圍是數值型的資料。T檢驗的需要總體樣本符合正態分佈特徵,主要用於樣本含量較小(例如n<30),總體標準差σ未知的資料。T檢驗廣泛應用於醫學統計等領域。
  • F檢驗又叫方差齊性檢驗。在判斷兩種樣本檢驗方差是否相等時,需要使用F檢驗做驗證。因此,它是一種基礎的檢驗方法。至於兩組資料之間是否存在系統誤差,則在進行F檢驗並確定它們的精密度沒有顯著性差異之後,再進行T檢驗。
  • U檢驗是在大樣本(n>30)的情況下,檢驗隨機變數的數學期望是否等於某一已知值的一種假設檢驗方法。U檢驗適用於樣本量n較大且符合正態分佈的情況。
  • Z檢驗一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法,比較兩個平均數的差異是否顯著。
  • 方差分析法常用來分析多個(2個以上)群體中的計量型資料,以便比較變異的意義和分析其來源。方差分析要求觀察樣本的分佈符合正態分佈或近似正態分佈,並且各組資料之間的方差具有齊性。

在做假設檢驗時,經常用到的Python庫是scipy中的stats,裡面包含了各種引數和非引數檢驗方法以及用於評估資料分佈模型的檢驗方法。

商品資料運營中的一些注意事項

  1. 企業低於進價價格銷售商品原因:擴大市場佔有、樹立商品形象、共有力的地鋪排行、新產品推廣、去庫存、薄利多銷、綜合營銷策略(爆品吸引顧客光臨)
  2. 企業促銷的真是情況:與其他公司競爭、使用者已經養成促銷購買習慣、增加使用者的活躍度增加溝通機會、企業市場聲量、促銷為單一銷售模式、彰顯企業實力提高談判地位
  3. 使用者關注的商品不一定是想要購買的,很有可能是價格高於自身想買的同類商品
  4. 提供的選擇過多並不利於銷售,使用者會花費時間精力對商品資訊進行研究,有些使用者不願意花時間研究轉而去買其他商品

參考:
《python資料分析與資料化運營》 宋天龍