![](https://csdnimg.cn/release/download_crawler_static/1041165/bg1.jpg)
都是些很简单的技巧,不过是自己摸索出来,记录一下。我用的版本是 UltraEdit-32
13.00a 简体中文版。
1、去重
如果文本中的数据是一行一行的,有重复的内容,去重的方法是:文件——排序——
高级排序/选项,选中“删除重复”。
2、查找后乱码
将文件另存为“UTF-16”格式的文本。代码页要设置成:
高级——设置代码页/本地,“系统中已安装的代码页”,选择“936(ANSI/OEM-简体中
文 GBK)”;
“系统已安装的地区”选择"中文(中国)中国人们共和国"。
3、查找任意汉字
选择 Unix 风格的正则表达式,查找 “[^一-龥]”。代码页设置如上。
4、使用正则表达式,去除空行、行尾空格
UltraEdit 有两种传统形式的正则表达式:UltraEdit 风格、Unix 风格。设置在:高级
——配置——搜索——正则表达式引擎。
UltraEdit 风格正则表达式:
去除空行: %[ ^t]++^p 替换为 空白(就是什么也不输入)
去除行尾空格: [ ^t]+$ 替换为 空白
Unix 风格正则表达式:
去除空行: ^[ ]* 替换为 空白
- 1
- 2
前往页