1. 程式人生 > >關於我的自然語言處理學習

關於我的自然語言處理學習

自然語言處理學習

自然語言處理是電腦科學領域與人工智慧領域的中的一個重要方向。它研究實現人與計算機之間用自然語言進行有效通訊的各種理論和方法,涉及所有用計算機對自然語言進行的操作

基於《python自然語言處理》一書的學習過程分享,我想更精簡的提取出書中有用的東西,使其能快速上手使用。特此放到GitHub上不斷更新。

按照書中的順序

1. 語言處理的基礎

2. 結構化程式設計

3. 語言處理的基本原理(標註,分類,提取)

4. 句子解析,句法結構識別,句意表達方法

所謂“自然語言”,是指人們日常交流使用的語言。相對於程式語言和數學符號這樣的人工語言自然語言隨著一代代的傳遞而不斷演化因而很難用明確的規則來確定。從廣義上講,“自然語言處理( Natural Language Processing,NLP)包含所有用計算機對自然語言進行的操作,從最簡單的通過計詞彙出現的頻率來比較不同的寫作風格到最複雜的完全“理解”人所說的話,或至少達到能對人的話語作出有效反應的程度,NLP的技術應用日益廣泛。例如:手機和手持電腦對輸入法聯想提示和手寫識別的支援:網路搜尋引擎能搜尋到非結構化文字中的資訊:機器翻譯能把中文文字翻譯成西班牙文。在應用領域,包括從事人機互動、商業資訊分析、Web軟體開發。

教程基於 Python程式語言及名為自然語言工具包( Natural Language ToolkitNLTK)的開源庫。

關於我對自然語言瞭解,其實以前不清楚這個方向,是在找了學校的導師後才知道有這樣一個方向,和大多數人一樣一開始不清楚自然語言代指什麼,如何處理,它的運用場景在哪裡,後來在百度雲裡看到自然語言處理介面,包括基礎寫的情感分析,文章分類,到中文詞向量,CNN模型建立,更感受到這門學科的龐大。後來一直在和老師做蒙古文的自然語言處理,接觸一些皮毛,並未深入的學習。最近看到《python自然語言處理》這本書有了興趣,想看一遍,對其能有所瞭解,會簡單的運用一些。