Forth 詞典和詞彙

詞典是 FORTH 系統的主幹，他是系統中全部詞以一定的方式連結而成。 FORTH 系統，詞典本身也是被當做一個堆疊來對待。由一個稱為詞典指標的變數 DP 指著詞典上方（高階地址）空白區域的第一個位元組，也既下一個可被使用的位元組。詞 HERE 則把 DP 的值送到引數堆疊的棧頂。

VARIABLE DP 使用者變數，其值為詞典上部第一個可被使用的記憶體地址。

: HERE ( - addr ) DP @ ; 返回詞典上方的地址，它告訴編譯程式待用的自由存貯區域始於何處

: ALLOT ( n - ) DP +! ; 使 DP 之值增加 n，也即為了某種目的給詞典的區域增加 n 個位元組。

: , ( n - ) HERE ! 2 ALLOT ；把引數堆疊頂上的數 n 送入到詞典上部的下一個可用單元，使 DP 之值增加 2 。（把 n 編入詞典）

: C, ( byte - ) HERE C! 1 ALLOT ;

詞典是由一些在邏輯上獨立的詞表所構成。把一組在邏輯上密切相關的詞所連結形成的詞表稱為是一個詞彙。 CONTEXT ( - addr ) 是一個數組，由它決定首先搜尋哪一個詞彙，接著搜尋哪幾個詞彙（如果沒找到的話）。 CURRENT ( - addr ) 是一個變數，由它決定新新增到詞典中的定義屬於哪一個詞彙。在 Fig-Forth 中它還決定繼 CONTEXT 詞彙之後所要搜尋的詞彙，如果指定詞在 CONTEXT 詞彙中沒有找到。

Fig-Forth 中詞典搜尋

INTERPRET -> -FIND -> (FIND)
: INTERPRET ( - ) 逐個順序處理從輸入流中分離出來的字串；或是執行或是編譯由當時系統的狀態決定。
BEGIN 開始解釋程式迴圈
-FIND ( - pfa b tf , or ff ) 把從輸入流中檢測到的下一個字串送到 HERE 處。首先搜尋 context 詞彙，繼之搜尋 current 詞彙，核實在詞典中是否有與在 HERE 處的字元串同名的定義。若有，被找到之詞的引數域地址 pfa，長度位元組 b 及為真標誌 tf 留在堆疊上；若沒有，堆疊上僅留下為假標誌 ff 。
AGAIN ;

: -FIND ( - pfa b tf , or ff )
BL WORD 把以空格為終止符的下一個字串從輸入流中分離出來，並將它送到詞典的頂部（HERE 處）
HERE 有待去詞典中發現的字串的地址
CONTEXT @ @ 取出在 context 詞彙中最後一個（最新）一個被定義詞的名字域地址 nfa ,詞典搜尋行將開始。
(FIND) （addr1 addr2 - pfa b tf , or ff） CODE 詞，承擔具體搜尋工作。addr1是有待被搜尋的字串的地址，addr2是被搜尋區的起始地址。(FIND) 從堆疊頂上給出的地址出發搜尋詞典，以求發現和堆疊上的第二個地址(addr1)處的字串相符合的名字。若找到，返回相符定義的 pfa , 長度位元組以及為真標誌。若未找到則僅返回一個假標誌。
DUP 0= 檢查棧頂標誌。
IF 在 context 詞彙中未找到同名的定義
DROP 丟棄假標誌
HERE 重新取得字串的地址。
CURRENT @ @ 取出在 current 詞彙中最後一個被定義的詞的 nfa。
(FIND) 搜尋 current 詞彙。
ENDIF ;

// Fig-Forth 中首先搜尋 context 詞彙，以求發現一個同名定義，若沒有則在搜尋 current 詞彙。一個詞彙是由定義詞 VOCABULARY 創立的，故一個詞彙的詞彙名本身也是詞典中的一個條目。在一個詞彙名的引數域中儲存有該詞彙中最後一個被定義的詞的名字域地址 nfa ，而儲存該最後一個詞的 nfa 的單元是被 CONTEXT 或 CURRENT 所指著，如果該詞彙是 context 詞彙或 current 詞彙的話。所以在 -FIND 中，CONTEXT @ @ 以及 CURRENT @ @ 提供將被搜尋的詞彙中的第一個詞。

Forth 詞典和詞彙

在Hanlp詞典和jieba詞典中手動新增未登入詞

《introduction to information retrieval》資訊檢索學習筆記3 詞典和容錯式檢索

python 之計算詞典和詞頻矩陣

【NLP】Python NLTK獲取文字語料和詞彙資源

獲得文字語料和詞彙資源(一)

奮戰聊天機器人（二）語料和詞彙資源

python呼叫jieba(結巴)分詞加入自定義詞典和去停用詞功能

Linux命令應用大詞典-第8章日期和時間

Linux命令應用大詞典-第 15章文件、目錄權限和屬性

Linux命令應用大詞典-第43章iptables和arptables防火墻

Linux命令應用大詞典-第36章密碼和證書管理

Linux命令應用大詞典-第21章 LVM和RAID管理

720. 詞典中最長的單詞（any()和all()的用法）

製作英文學習詞典。編寫程式製作英文學習詞典，詞典有3個基本功能：新增、查詢和退出。程式讀取原始檔路徑下的txt格式詞典檔案，若沒有就建立一個（Python）

第五章分類和標註詞彙 ----5.1、5.2節

Python自然語言處理 5 分類和標註詞彙

敏捷和DevOps詞彙表

基於python的自然語言處理分類和標註詞彙之5.5N-gram標註

Python自然語言處理------分類和標註詞彙

Forth 詞典和詞彙

相關推薦