1. 程式人生 > >序列標註模型中的兩種標記模式

序列標註模型中的兩種標記模式

SBME標記法: S 表示 表示單個字的詞(single word) , B表示詞的開始(begin)即首字,M表示詞的中間(Middle)即詞的中間字,E表示詞的結尾(end),即尾字
一般在用數字這樣表示:
# -1, unknown
    # 0-> 'S'
    # 1-> 'B'
    # 2-> 'M'
    # 3-> 'E'

 

樣例:

   我愛使用小米手機玩王者榮耀   -> 我<S>愛<S>使<B>用<E>小<B>米<M>手<M>機<E>玩<S>王<B>者<M>榮<M>耀<E>

CS標記法:C 表示 當前的字char和後面字char是連續的,它們共同表示一個詞,S 表示 當前字char和後面字char是兩個不同的詞 。
一般用數字這樣表示:
  #-1,unkonwn
  # 0  ,  -> 'C'
  #  1 ,  -> 'S'

樣例:

  我愛使用小米手機玩王者榮耀  -> 我<S>愛<S>使<C>用<S>小<C>米<C>手<C>機<S>玩<S>王<C>者<C>榮<C>耀<S>