讓文字化為資料,讓資料化為洞察——如何用情感分析瞭解客戶心聲?
數字技術的爆發式增長使得企業可以從資料洪流中獲得高價值的資訊,以往企業需要通過廣泛的社會調研才能獲得客戶對其產品的評價,現在只需瀏覽線上評論就能得到大致的判斷。但如果需要大規模的客戶評論分析時,人工的處理能力就變得十分有限。企業會傾向於求助情感分析工具處理使用者對自己產品及服務的評價,瞭解其使用體驗。
目前,許多科技企業,基於人工智慧演算法,開發了針對企業客服系統和電商評論的情感分析工具。以智慧客戶資料平臺(CDP)為例,其搭載的情感分析演算法,分析準確率可達到90%以上。
情感分析的基本方法
情感分析的目的是為文件或文件的一部分評出一個情感得分,典型的情感分析得分範圍從高度消極(-1)到中性(0)再到高度積極(1),這些分數能夠以各種方式用於商業決策。其實現步驟為:
1、分詞
由於中文中沒有空白格作為分詞的標誌,要實現中文分詞,必須藉助高效的分詞工具。在情感分析應用中,應對不同行業,開發者可輸入自定義的詞典增加分詞的準確性——如輸入大量金融詞彙,可提高金融領域文字的識別效果。同樣的,對特定詞彙進行詞頻調整也能增加識別準確性——如南京市長江大橋,計算機既可以分成南京市/長江大橋,也可能分成南京/市長/江大橋,而把“長江大橋”這一名詞詞頻調高,就能更容易被識別出來。
2、將詞轉化成詞向量
計算文字型的資料,必須把其轉成數字型的符號,才能方便計算機使用。創略科技使用的是通過高維空間中的向量(WordEmbedding)來表示詞語,其好處在於,用較少的資料就能實現每個詞的轉化,大大提高模型處理資料的穩定性。
3、基於TextCNN(卷積神經網路)建立情感分析模型
圖來自論文《Convolutional Neural Networks for Sentence Classification》
卷積神經網路專門用來處理矩陣輸入的任務,它能夠將矩陣形式的輸入編碼為較低維度的一維向量,而保留有用資訊。需要注意的是,該模型是監督訓練的,所以需要收集一些已經分類完畢的句子,匯入計算機進行學習。
以上圖為例,“Wait for the video and don’t rent it”這句話經過“詞向量化”、“層卷積提取特徵”、“池化層最大化輸出”、“全連線層整合資訊”這四個步驟,將輸出一個二分類的概率,經過訓練的模型,則會對這句話的積極/消極態度進行評分。
情感分析的使用場景
1、線上評論分析
以手機行業為例,其競爭激烈,產品迭代快,新品上市黃金銷售時間可能僅有兩三個月,對電商平臺和社交媒體上的手機新品評論進行情感分析,能夠快速地掌握消費者對新品的反饋,然後對負向情緒文字中進行詞頻篩選,找出文字中得關注點和側重點,及時對產品宣傳和營銷策略做出引導和調整。
比如新品上市之後,負面評論中出現詞頻較高的有“需要貨、買不到、缺貨、飢餓、搶購”等,這意味著使用者對產品非常期待,有迫切的擁有率,但其營銷服務模式、產品的供貨量等方面可能存在問題。如出現大量配置、電量、螢幕等產品屬性名詞,則意味著產品品控、質量、設計功能方面存在問題。
2、個性化推薦
傳統的個性化推薦是基於真實的使用者資料,按照產品的銷量和產品相似性進行推薦。但這種方式有其缺陷,比如電影類產品,某些製片方為了利益可能會僱人打高分,電商類網站會有類似的刷單行為,導致推薦的結果並不可信。這時客戶對產品主觀的評價內容可以更好地發揮作用,通過分析可更為準確地獲取客戶對產品的評價,實現個性化推薦。
比如電影推薦系統,可以利用主題維度拓展和情感詞頻進行評論文字特徵提取,輸入神經網路,可自動判別評論的情感極性。使用者通過評論極性分類可以更直觀地發現其對某部電影的反饋。這種方法可以將評論情感資訊引入到推薦系統的熱門推薦模型中,已經在許多推薦類網站、電商平臺中使用,並取得良好的效果。
3、市場調研輔助商業決策
情感分析還能用於對競爭對手和市場環境的調研分析,獲得準確的洞察,比如在研究競爭對手時,情感分析通過了解利益相關者——顧客、潛在顧客——如何討論你的產品服務和你對手的產品服務,來改善產品開發和定位,提高市場競爭力;通過社交媒體、新聞、部落格的資訊分析股票的市場情感,預測其短期市場波動情況等。