正则模板演化项目
——目标说明
目标
此正则模板演化项目旨在为交通信息短文本分类提供一种可动态演化的正则表达式匹
配模板。
方法
使用演化算法,例如,遗传算法,对问题进行求解。
1. 编码:依据样本中的高频词和正则表达式的限制进行编码。
2. 适应度计算:给定的正则模板对各类样本进行分类,以对应类的准确率和误分类比
例之差作为适应度。
3. 演化算子:依据所选择的演化算法设计相应的演化算子。
数据
数据包含 4 类样本,分别标记为 1,2,3,4 类,其中 1 类为交通事故,2 类为设施故
障,3 类为路况信息,4 类为交通热点。
各类数据的数量如下表所示。
评论0