1. 程式人生 > >python 正則匹配中文字元

python 正則匹配中文字元

  正則匹配中文,固定形式:\u4E00-\u9FA5 

# -*- coding:utf-8 -*-

import re

'''
python 3.5版本
'''

words = 'study in 山海大學'
regex_str = ".*?([\u4E00-\u9FA5]+大學)"
match_obj = re.match(regex_str, words)
if match_obj:
    print(match_obj.group(1))


結果:山海大學