中文分词和命名实体识别经常被视为2个独立的任务。该文提出一种基于最大间隔Markov网络模型 (M3N)的中文分词和命名实体识别一体化方法,将二者统一在一个字序列标注框架下,进行联合训练和测试。在 SIGHAN 2005分词数据集上的实验结果显示,与基于条件随机场模型的分词器相比,基于M3N的分词器加权综合值提高0. 3%-2.0%。在SIGHAN 2005分词数据集和 SIGHAN 2006命名实体数据集上进行测试的结果显示,与分步方法相比,一体化方法能够同时提高中文分词和命名实体识别的性能,加权综合值