在此感谢03级蒋竞同学以及中科院计算所的张华平和刘群!
//////////////////////////////////////////////////
//////////////////Analyzer切词包//////////////////
//////////////////////////////////////////////////
1.功能描述:
主要功能是切词:输入一个字符串或一个文件名,输出一个结果字符串,这个字符串中每个中文词之间用空格分隔。
2.接口描述:
所在文件:./Analyzer/Analyzer.h
//*****************************************************************************
//类名称:Analyzer
//定义该类的目的:完成中文分词功能
//类属性:功能类
//*****************************************************************************
class Analyzer{
public:
//return true if the analyzer is ready, should be invoked first.
bool init();
//the input is a std::string to be processed, sSource;
//the output is saved in sResult
bool processString(const std::string &sSource, std::string &sResult);
//the input is the path of the file to be processed, sFilePath;
//the output is saved in sResult
bool processFile(const std::string &sFilePath, std::string &sResult);
};
3.用法
使用前请将以下目录拷贝到自己的源代码目录
//对分词核心的包装,供方便使用
Analyzer
//以下是中科院提供的分词核心的源代码
Data
Result
Segment
Tag
Unknown
Utility
接口使用前请包含如下文件
#include "./Analyzer/Analyzer.h"
#include "./Analyzer/Analyzer.cpp"
调用例子详见testAnalyzer.cpp
没有合适的资源?快使用搜索试试~ 我知道了~
daopaisuoyin.rar_4-20MA_关联词
共65个文件
cpp:18个
h:18个
txt:14个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 87 浏览量
2022-09-21
04:26:32
上传
评论
收藏 2.11MB RAR 举报
温馨提示
1、 词查询 实现基本的词查询功能,在输入词条后,输出一切包含该词条的文档的文档名,其中输出方式上输出关键字的上下文。 2、 简单布尔查询 查询同时含有两个词的文档,再输入词条后,如同词查询一样,输出的方式也同词查询的输出方式相同。 3、 短语查询 即查询同时包含两个词的文档同时这两个词在文档之中是相邻的。输出方式同之前的二者相同。 4、 Ranked查询 按照所要查询词在文档中的出现次数对与该词相关联的文档进行排序,这样一来返回的结果就是我们所要的按照重要性排序的文档。
资源推荐
资源详情
资源评论
收起资源包目录
daopaisuoyin.rar (65个子文件)
proj3
testAnalyzer.cpp 1KB
proj3.ncb 81KB
in.txt 3KB
Utility
Utility.cpp 18KB
ContextStat.h 3KB
Dictionary.h 5KB
Utility.h 7KB
此部分代码版权有所.txt 313B
ContextStat.cpp 8KB
Dictionary.cpp 34KB
Analyzer
Analyzer.cpp 3KB
Analyzer.H 1KB
losertree.h 8KB
File.cpp 2KB
invert.cpp 3KB
proj3.dsw 535B
Result
Result.h 2KB
此部分代码版权有所.txt 313B
Result.cpp 18KB
proj3.dsp 5KB
result.txt 15KB
2.txt 6KB
menu.cpp 2KB
Tag
Span.h 4KB
此部分代码版权有所.txt 313B
Span.cpp 27KB
test.txt 1KB
File.h 651B
Analyzer.H 1KB
invert.h 2KB
invertfile.h 2KB
project3实习报告.doc 144KB
1.txt 9KB
Unknown
UnknowWord.h 3KB
UnknowWord.cpp 6KB
此部分代码版权有所.txt 313B
losertree.cpp 4KB
proj3.opt 50KB
proj3.plg 2KB
invertname.txt 15KB
Segment
Segment.h 3KB
NShortPath.h 1KB
Segment.cpp 16KB
Queue.cpp 3KB
DynamicArray.cpp 9KB
Queue.h 2KB
DynamicArray.h 2KB
此部分代码版权有所.txt 313B
SegGraph.cpp 7KB
SegGraph.h 2KB
NShortPath.cpp 7KB
Debug
declear.h 0B
buildInvertFile.cpp 9KB
ReadMe.txt 1KB
Data
BigramDict.dct 5.74MB
tr.dct 126KB
Readme.TXT 370B
ns.ctx 408B
nr.ctx 1KB
ns.dct 125KB
nr.dct 227KB
tr.ctx 408B
lexical.ctx 10KB
coreDict.dct 1.51MB
www.pudn.com.txt 218B
共 65 条
- 1
资源评论
周楷雯
- 粉丝: 80
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功