1. 程式人生 > >字串與正則表示式

字串與正則表示式

es6新增

  • 字元編碼:雙位元組處理;字串正則化;Unicode的u標誌處理
  • 識別字串方法:includes() startsWith() endsWith()
  • 其他方法: repeat()
  • 正則表示式:y標示、複製正則表示式(正則識別符號可覆蓋)、flages (re.flages 獲取標誌符)

1、字串編碼--Unicode

JavaScript允許採用\uxxxx形式表示一個字元,其中xxxx表示字元的Unicode碼點。這種表示法只限於碼點在\u0000~\uFFFF之間的字元。超出這個範圍的字元,必須用兩個雙位元組的形式表示。

JavaScript內部,字元以UTF-16的格式儲存,每個字元固定為2個位元組。對於那些需要4個位元組儲存的字元(Unicode碼點大於0xFFFF的字元),JavaScript會認為它們是兩個字元,也就是4個位元組,對於這種4個位元組的字元,JavaScript不能正確處理,字串長度會誤判為2,而且charAt方法無法讀取整個字元,charCodeAt方法只能分別返回前兩個位元組和後兩個位元組的值。Es6對此提出新的方法,能夠正確處理4個位元組儲存的字元。

  • codePointAt()
  • fromCodePoint()

(1)codePointAt()--------得到字串用編碼表示後的字元碼點

var s = '