Java判断中英文符号、标点的实现
Java判断中英文符号、标点的实现 Java判断中英文符号、标点的实现是Java开发中一个重要的知识点,本篇文章主要介绍了Java中判断中英文符号、标点的实现方法。 在Java中,判断中英文符号、标点可以使用UnicodeBlock和UnicodeScript来实现。UnicodeBlock是Unicode标准协会组织unicode码的一个基本单位,实际上一个UnicodeBlock代表一片连续的Unicode号码段,UnicodeBlock之间不重叠。例如,通常我们利用Unicode编码是否在0x4E00–0x9FCC来判断某字符是否为汉字,就是因为,有个UnicodeBlock专门划分为存储汉字(准确的说是CJK统一汉字),这个UnicodeBlock叫做CJK Unified Ideographs,总共定义了74,617个汉字。 UnicodeScript是从语言书写规则层次对Unicode字符的分类,这是用使用角度划分,而UnicodeBlock是从硬的编码角度划分。因此,UnicodeBlock和UnicodeScript是两个不同的概念,它们之间存在着一定的关系。判别中文标点符号可以根据UnicodeBlock来判断,因为中文的标点符号主要存在于以下5个UnicodeBlock中:U2000-General Punctuation(百分号,千分号,单引号,双引号等)、U3000-CJK Symbols and Punctuation(顿号,句号,书名号,〸,〹,〺等)、UFF00-Halfwidth and Fullwidth Forms(大于,小于,等于,括号,感叹号,加,减,冒号,分号等等)、UFE30-CJK Compatibility Forms(主要是给竖写方式使用的括号,以及间断线﹉,波浪线﹌等)、UFE10-Vertical Forms(主要是一些竖着写的标点符号, 等等)。 根据UnicodeBlock方法判断中文标点符号可以使用以下代码: ```java public boolean isChinesePunctuation(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS || ub == Character.UnicodeBlock.VERTICAL_FORMS) { return true; } else { return false; } } ``` 此外,还可以使用字符范围判断方法来判断中英文符号、标点,例如: ```java static boolean isSymbol(char ch) { if(isCnSymbol(ch)) return true; if(isEnSymbol(ch)) return true; if(0x2010 <= ch && ch <= 0x2017) return true; if(0x2020 <= ch && ch <= 0x2027) return true; if(0x2B00 <= ch && ch <= 0x2BFF) return true; if(0xFF03 <= ch && ch <= 0xFF06) return true; ... } ``` Java判断中英文符号、标点的实现可以使用UnicodeBlock和UnicodeScript来实现,也可以使用字符范围判断方法来实现。
- 粉丝: 9
- 资源: 894
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 微信小程序毕业设计-基于微信小程序的电影交流小程序PPT.ppt
- ubuntu24.04.1 LTS iso 共3个压缩包,ubuntu官网下载,此为卷3
- c语言之tlv实现,方便移植
- 路绍虎+20220405306+第一次作业.rp
- 我国各省份水系图(shp格式)
- ubuntu24.04.1 LTS iso 共3个压缩包,ubuntu官网下载,此为卷2
- QT PID控制,曲线仿真
- Google Chrome浏览器ChromeDriver驱动下载(Chrome版本:122.0.6261.128)
- winform简易版端口扫描工具 如果要直接使用,请下载压缩直接使用.zip文件,解压完成后,点击.exe
- 真实和 AI 生成的人脸图像数据集(每个约 5k)JPG