1. 程式人生 > >文本情感分析的基礎在於自然語言處理、情感詞典、機器學習方法等內容。以下是我總結的一些資源。

文本情感分析的基礎在於自然語言處理、情感詞典、機器學習方法等內容。以下是我總結的一些資源。

建議 中心 這場 分詞 自然語言處理 目前 能力開放 計算 推薦算法


文本情感分析的基礎在於自然語言處理、情感詞典、機器學習方法等內容。以下是我總結的一些資源。

詞典資源:
SentiWordNet
《知網》中文版
中文情感極性詞典 NTUSD
情感詞匯本體下載

自然語言處理工具和平臺:
哈爾濱工業大學社會計算與信息檢索研究中心
isnowfy/snownlp · GitHub

漢語分詞:
自然語言處理與信息檢索共享平臺 NLPIR.org
fxsjy/jieba · GitHub

語料資源:
信息分類與情感發現

課程:
斯坦福大學自然語言處理第七課“情感分析(Sentiment Analysis)”

網站和博客:
Text Classification for Sentiment Analysis
Second Try: Sentiment Analysis in Python : Andy Bromberg
Basic Sentiment Analysis with Python

論文:

工具:
建議使用Python. 集成上述所有功能,簡單易學。

自己寫過一個博客,基本有簡單實現上述步驟,厚臉皮貼出。
Explore in Data

目前的狀況下從題目上體現的三塊應用來講近場語音和面部識別差不多可以工業化了,目前比較大的幾家都有成熟的技術應用,基本可以滿足應用需求了,當然這兩塊技術還涉及到一些特殊場景目前技術覆蓋不夠,舉個例子語音這塊的遠場方案還很差,另外面部識別這塊如果時間跨度長的場景,效果還很差。(譬如童年照和現照對比這種的)但不可否認在在一些基礎應用場景上已經達到了工業應用水準了。從目前公開api的兩家來看,基本還是拿這場技術發展當大平臺發展機遇來看的,不過目前應用層面還沒有好的產品跟進,這一塊會是一個不錯的機會點。未完,待贊過10了再續。感謝大家點贊,回來再續一波重新審了一下題,先答題主的問題。如果題主要問這兩個平臺是否靠譜的話,我的建議的可以工業化應用的兩塊(語音識別和圖像識別部分)都可以盡管嘗試,另外語音合成模塊也基本保障可用。其他的包括用戶畫像、推薦算法部分目前對用戶本身數據依賴很大,考慮到平臺的數據安全性,目前這塊如非必要,需要考慮在保障數據安全的前提下應用。NLP等模塊目前從算法能力上,包括具體應用上都還有很多問題,建議先觀察一段時間。目前百度大腦對外應用上語音識別部分功能是一個十足亮點。如果題主想問的是微軟和百度在算法能力上會有什麽差別,目前公開API能力基本相近,而這些平臺資源下能保障服務相對穩定,並可以容納一定的吞吐量,如果題主希望在國內應用,推薦優先嘗試百度大腦這邊提供的能力。最後來是針對這類能力平臺額外的一些廢話目前企業內做算法主要有算法研究方向和應用導向兩個方向,研究方向一般以企業內部研究院形式存在:如百度的IDL,另一塊以應用導向性,譬如一線企業的算法團隊或直接以人工智能為基礎包裝的新組織,這類結構一般是以針對某些場景的人工智能應用入手,進行算法積累和應用,創新和研究方向要弱於研究院。而基礎能力開放平臺一般都是由研究院這類組織推廣,功能上目前可以應用的主要是針對現有產品的能力拓展,其他應用如機器學習、圖譜建設、推薦等由於涉及到數據安全以及應用場景的限制,單純的算法能力開放形式還需要市場驗證。另外這類算法+資源的開放平臺誕生本身說明了接下來階段在應用層面算法、計算資源已經越來越不會在成為應用人工智能技術的瓶頸,針對行業的第一波應用創新的平臺機遇近在眼前,之後新的機遇會隨著算法攻關逐步攻克,在人工智能領域每一個技術的突破性進展都意味著在某幾個領域會有突破性的產品變革。目前金融、硬件方向布局的企業有很多,智能技術應用事實上在後端已經有很多應用,但是在前端包裝的產品特別在娛樂、社交、遊戲等方向上有很多很多機會。

文本情感分析的基礎在於自然語言處理、情感詞典、機器學習方法等內容。以下是我總結的一些資源。