没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Ansj中文分词 使用帮助 开发文档:, 摘要 这是一个基于n-Gram+CRF+HMM的中文分词的java实现。 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。 目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。 maven <dependency> <groupId>org.ansj</groupId> <artifactId>ansj_seg</artifactId> <version>5.1.1</version> </dependency> 调用demo 如果你第一次下载只想测试测试效果可以调用这个简易接口
资源推荐
资源详情
资源评论
收起资源包目录
ansj_seg:ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典 (245个子文件)
bigramdict.dic 6.19MB
default.dic 5.63MB
core.dic 4.53MB
synonyms.dic 421KB
numberLibrary.dic 335B
ambiguity.dic 147B
stop.dic 35B
regex.dic 0B
.gitignore 640B
.gitignore 9B
.gitignore 9B
.gitignore 9B
.gitignore 9B
.gitignore 9B
.gitignore 9B
.gitignore 9B
TagContentTest.java 49KB
PhraseExtractor.java 16KB
PersonRecognition.java 16KB
TestError.java 15KB
IndexTest.java 12KB
IndexTest.java 12KB
IndexTest.java 12KB
PorterStemmer.java 12KB
PorterStemmer.java 12KB
Counter.java 10KB
MyStaticValue.java 10KB
HeightLightTest2.java 10KB
HeightLightTest2.java 10KB
Analysis.java 8KB
TimeRecognition.java 8KB
WapitiCRFModel.java 8KB
NatureRecognition.java 8KB
CRFppTxtModel.java 8KB
AnsjAnalysisTest.java 8KB
SummaryComputer.java 8KB
Graph.java 8KB
IndexTest.java 7KB
DicLibrary.java 7KB
NlpAnalysis.java 7KB
SynonymsLibrary.java 7KB
Config.java 7KB
DATDictionary.java 6KB
CRFppTxtModelTest.java 6KB
StopLibrary.java 6KB
Term.java 6KB
IndexAndTest.java 5KB
Extracting.java 5KB
AnsjAnalyzer.java 5KB
AmbiguityLibrary.java 5KB
WapitiCRFModelTest.java 5KB
NlpDemo.java 5KB
AnsjAnalyzer.java 5KB
AnsjAnalyzer.java 5KB
NumRecognition.java 4KB
PersonRecognitionTest.java 4KB
TagWordByQueryDemo.java 4KB
SummaryDemo.java 4KB
LearnTool.java 4KB
Model.java 4KB
HeightLightTest.java 4KB
ExtractingTest.java 4KB
HeightLightTest.java 4KB
HeightLightTest.java 4KB
IndexAndTest.java 4KB
IndexAndTest.java 4KB
ExtractingTask.java 4KB
TermUtil.java 4KB
UserDefineRecognition.java 4KB
KeyWordComputer.java 4KB
AnsjReader.java 4KB
ExtractingRecognition.java 4KB
AnsjTokenizer.java 3KB
SplitWord.java 3KB
DicAnalysis.java 3KB
NatureLibrary.java 3KB
TermNatures.java 3KB
AnsjTokenizer.java 3KB
AnsjTokenizer.java 3KB
IndexAnalysis.java 3KB
CRFModelTest.java 3KB
ConfigTest.java 3KB
DicAnalysisTest.java 3KB
Test.java 3KB
CrfLibrary.java 3KB
Jdbc2Stream.java 3KB
NearTest.java 3KB
GetWordsImpl.java 3KB
Lexical.java 3KB
NewWordRecognition.java 3KB
StopRecognition.java 3KB
MathUtil.java 2KB
NumRecognitionTest.java 2KB
LearnToolDemo.java 2KB
FilterRecognitionTest.java 2KB
PersonNatureAttr.java 2KB
DicLibraryTest.java 2KB
AnsjTokenizer.java 2KB
File2Stream.java 2KB
Token.java 2KB
共 245 条
- 1
- 2
- 3
资源评论
我是卖报的小砖家
- 粉丝: 20
- 资源: 4617
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功