python如何匹配中文

933次阅读
没有评论

python如何匹配中文

中文字符的编码范围是:

\u4e00-\u9fa5

使用正则匹配中文

# -*- coding:utf-8 -*-

import re

'''
python 3.5版本
正则匹配中文,固定形式:\u4E00-\u9FA5
'''

words = 'study in 山海大学'
regex_str = ".*?([\u4E00-\u9FA5]+大学)"
match_obj = re.match(regex_str, words)
if match_obj:
    print(match_obj.group(1))


结果:山海大学
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2019-11-20发表,共计293字。
新手QQ群:570568346,欢迎进群讨论 Python51学习
评论(没有评论)