孫陶然

詞嵌入的那些事兒(一)

1. 詞向量介紹 在討論詞嵌入之前,先要理解詞向量的表達形式,注意,這裡的詞向量不是指 Word2Vec 。關於詞向量的表達,現階段採用的主要有 One hot representation 和 Dist

自然語言處理之 LDA 主題模型

話題模型 話題模型是為發現文件集合中的 話題 而開發出來的一種統計方法。常見的話題模型有LSA、PLSA、LDA,其中LDA(Latent Dirichlet Allocation)是表現最

商品標題這麼長長長長長,阿里工程師如何解決?

阿里妹導讀:商品標題是賣家和買家在電商平臺溝通的重要媒介。在淘寶這樣的電商app中,使用者與推薦、搜尋等系統的互動時所接受到的資訊,主要由商品標題、圖片、價格、銷量以及店鋪名等資訊組成。這些資訊直接影

Recurrent AI:呼叫系統的「變廢為寶」

因此,自然語言處理領域的玩家們,除了要思考模型的效果、產品的架構,更要思考一個最為本質的問題:要處理什麼資料?為什麼要處理這類資料? Recurrent AI 選擇了「呼叫系統」。 「電話錄音可追溯而不

1746060652.678