1. 程式人生 > >js 正則表示式匹配中文

js 正則表示式匹配中文

簡單匹配中文方法: /[^\u0000-\u00FF]/ (匹配非單位元組字元 )
另錯誤方法:/[^\u00-\uFF]/ (匹配 非單位元組字元、還包括一些全半形符號如,.(){}'"!等、還有vwxyz字元)
說明: //u0000-u00ff.包含unicode單位元組編碼( 0-255編碼)包含基本控制字元和拉丁文字母。 採用該否定表示式,粗略判斷是否含有中文。


具體的匹配中文及字元方法:/[\u4E00-\u9FA5\uF900-\uFA2D]/
說明: u4e00-u9fbf :  unicode CJK(中日韓)統一表意字元。u9fa5後至u9fbf為空
uF900-uFAFF :  為unicode  CJK 相容象形文字  。uFA2D後至uFAFF為空
具體可參考unicode編碼表:http://www.nengcha.com/code/unicode/class/


//是否含有中文(也包含日文和韓文)
function isChineseChar(str){   
   var reg = /[\u4E00-\u9FA5\uF900-\uFA2D]/;
   return reg.test(str);
}
//同理,是否含有全形符號的函式
function isFullwidthChar(str){
   var reg = /[\uFF00-\uFFEF]/;
   return reg.test(str);

相關推薦

js 表示式匹配中文

簡單匹配中文方法: /[^\u0000-\u00FF]/ (匹配非單位元組字元 ) 另錯誤方法:/[^\u00-\uFF]/ (匹配 非單位元組字元、還包括一些全半形符號如,.(){}'"!等、還有vwxyz字元) 說明: //u0000-u00ff.包含unicode單位

Js 表示式匹配字串中是否含有中文

通常在特定的情景裡,有的字串是不允許存在中文字元的,因此我們可以通過正則表示式來匹配。廢話不多說,上程式碼。 JS: function checkChinese(obj_val){ var reg = new RegExp("[\\u4E

Python 表示式匹配中文

在python2.x中,匹配中文,首先要宣告utf8的編碼方式。 # coding:utf-8  其次,被匹配的字串一定要是utf8編碼: string = u'我是個好人。'  最後,正則表示式一定要是utf8編碼: pat = u'\u6211.

js表示式匹配並替換特定字串

var reg=/name="(.*?)\"/gi; // var arr=str.match(reg); // console.log(arr.length) var newStr=str.replace(reg,'name=

用python3.x表示式匹配中文字串

re.match('^[\u4e00-\u9fa5|,。;?]+\?$','你好哈人日你,媽我。我?;們我為啥說在張志這?') 這演示了簡體,繁體,中文標點符號等等。可以看出python3.x對於中文字串匹配是可以執行得很好滴<pre name="code" cla

js表示式匹配小數點後兩位

function isDouble(value) { if (value == ”){ return true } return /^(([1-9][0-9])|(([0].\d{0,2}|[1-9][0-9].\

表示式 匹配中文,英文字母和數字及_長度詳解

http://www.juapk.com/thread-2472-1-1.html 匹配中文:[\u4e00-\u9fa5]  英文字母:[a-zA-Z] 數字:[0-9] 匹配中文,英文字母和數字及_: ^[\u4e00-\u9fa5_a-zA-Z0-9]+

js表示式 匹配兩個特定字元間的內容

1、js擷取兩個字串之間的內容: var str = "aaabbbcccdddeeefff";   str = str.match(/aaa(\S*)fff/)[1];   alert(str);//結果bbbcccdddeee   2、js擷取某個字串前面的內容: var str = 

python入門—2常見問題_1_表示式匹配中文

python2.7 在使用正則表示式來匹配中文字元時,經常會出現意想不到的問題,比如下面這個匹配問題: 1、問題 字串:      飛利浦(PHILIPS)      飛利浦(PHILIPS)      飛利浦(PHILIPS)      飛利浦(PHILIPS) 從字串中

表示式-匹配:中文,英文,數字,下劃線

1、一個正則表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:^(?!_)(?!.*?_$)[a-zA-Z0-9_/u4e00-/u9fa5]+$  其中:^  與字串開始的地方匹配(?

php 表示式匹配中文字元

<?php $str = 'i love you, 中國'; // $str = 'i love you, '; // if(preg_match('/[\x7f-\xff]/i',$str))

如何用表示式匹配中文

前幾天因為在做學校教務處的爬蟲,用php抓取的成績和課程表竟然返回的是html格式的資料,也是很醉。沒辦法,乾脆用正則匹配吧。因為之前並沒有學過正則表示式,只好惡補了一下。在匹配的過程中遇到了一些問題,特別是在匹配中文的時候,很是蛋疼。下面說一下我的學習成果。 使用php

如何利用selenium+python獲取click()方法後 請求返回的結果 包含: javascript 陣列操作表示式匹配返回陣列,js兩個陣列取差集,再去重 by qiweb 2018

技術交流q and v信:908701702  ,熊貓燒香 qiweb2018 python程式碼思路【開啟網頁--定位元素--點選請求--獲取請求後伺服器返回的資訊】: # coding=utf-8 from selenium import webdriver from

js表示式之人民幣匹配

   人民幣格式匹配   小寫格式:¥ 符號 和 整數值 與小數3部分組成。   (0)程式碼與執行結果   { // 匹配人民幣 let [reg, info, rmb, result] = [ /^(¥)

js表示式 URL格式匹配詳解

0、URL格式 protocol :// hostname[:port] / path / [;parameters][?query]#fragment [;parameters]沒見過 這裡就不做相關匹配了   1、程式碼及執行結

Python網路爬蟲中的網頁中文表示式匹配小心得

這是第一篇部落格,關於在正則表示式的情況下通過python的re模組對爬蟲爬下的網頁資料進行正則表示式,匹配得出所有中文字元 #!/usr/bin/python # -*- coding: utf-8 -*- import re def matchURL_info(

Python 3 表示式中文匹配

import re s='中文匹配7.14 3000 '.encode('utf-8') s=s.decode('utf8') m =re.findall(u"[\u4e00-\u9fa5]+",s) print(m)搜了半天網上的都是Python2的程式碼,根本不能執行

Python中使用中文表示式匹配指定的中文字串

業務場景: 從中文字句中匹配出指定的中文子字串 .這樣的情況我在工作中遇到非常多, 特梳理總結如下. 難點: 處理GBK和utf8之類的字元編碼, 同時正則匹配Pattern中包含漢字,要漢字正常發揮作用,必須非常謹慎.推薦最好統一為utf8編碼,如果不是這種最優情況,也有

根據表示式匹配頁面中js和css檔案

          // 匹配           List<string> srcList = new List<string>();           List<string> linkList = new List<string>();   

中文表示式匹配-中文匹配

原文連結:http://caibaojian.com/zhongwen-regexp.html這篇文章主要講如何使用正則匹配中文字元,中文正則表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正則表示式是怎麼樣的。\w匹配的僅僅是中文,數字,字母,對於國人來講