unicode 或 utf8 中文编码范围

首页 > 代码库 > unicode 或 utf8 中文编码范围

unicode 或 utf8 中文编码范围

2024-10-03 11:48:02 211人阅读

常被提起中文编码范围[/u4E00-/u9FA5]但随便复制了个韩文下来，或者‘お‘，都不行。
然后把范围扩大到^[/u2E80-/u9FFF]+$，这样倒是都通过了，应该就是匹配中日韩文字的正则表达式了，包括臺灣使用的繁體字。
而关于中文的正则表达式，应该是^[/u4E00-/u9FFF]+$，和常被提起的^[/u4E00-/u9FA5]+$很接近。
需要注意的是^[/u4E00-/u9FA5]+$专门用于匹配简体中文的正则表达式，实际上繁体字也在里面，测试了下‘中華人民共和國‘，也通过了，
当然, ^[/u4E00-/u9FFF]+$也是一样的结果。

emoji字符过滤用(char & 0xF8) == 0xF0)可以过滤大部分。

unicode 或 utf8 中文编码范围

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > unicode 或 utf8 中文编码范围

unicode 或 utf8 中文编码范围

看完仍有疑问？有类似问题直接问程序猿