爱博汉语分词系统Web服务器支持标准的HTTP协议,可以跨平台调用,支持分布式运算;
爱博汉语分词系统COM组件提供COM和DLL接口(Windows环境) 以及共享库.so(Linux)形式,可支持所有支持COM接口调用的编程语言及脚本语言。
如:PHP、JSP、ASP、ASP.net、C/C++ 、VC6.0 、VC.net、BC、C#、VB6.0 、VB.net、Delphi、Java等。
爱博汉语分词系统支持自定义词语的功能,用户可根据自己需要定义添加汉语词组。
可根据需要自行定义影响检索结果的不必要的特殊字符,如:“%,*,&,的,啊,http,www”等。
爱博汉语分词系统同时具有英文单词的分词识别功能。
爱博汉语分词系统具有强大的词性标注的词性查询功能。可以将一句话中每个词语在这句话中的意思标注出来;可以通过词语查询接口,查询一个词语的所有可能出现的词性
软件系统采用ANSI标准C++开发,可广泛应用于Linux和Win32等操作系统平台。
爱博汉语分词系统采用高效特殊的算法引擎结构,每秒钟拆分可达数万字中文文本(具体根据计算机性能而定。),在对搜索关键词进行拆分情况下,其响应时问均在数毫秒之内,为搜索提供强劲动力。
采用特殊的词组拆分识别算法,可有效消除汉语词组中汉语歧义,并可识别各个行业内的特殊用语、专用词汇、公司名、地名等,并具有汉语成语、汉语短语识别功能。
ACWPS含盖了IT、化工、金融、贸易、纺织、电子、制造、冶金等各行各业以及日常生活用语中的汉语词组。
可自行定义干扰字、无意义字、敏感词过滤列表。如:啊、唉、个、了等无意义的以及煸动、反动、黄色和侵害他人的汉字、词组及英文。
本人已经测试可用。
注意两点:
1、没有注册的版本只支持25个字以内的分词。
2、必须安装在C盘默认的路径下才能使用
- 1
- 2
前往页