没有合适的资源?快使用搜索试试~ 我知道了~
txtproc_js:用 JavaScript 为 NodeJS 编写的简单文本处理器服务
共25个文件
xml:16个
java:4个
iml:2个
需积分: 5 0 下载量 124 浏览量
2021-07-23
11:28:34
上传
评论
收藏 18KB ZIP 举报
温馨提示
目的 这是用于处理文本(标记化、停用词提取、词干提取和距离测量)的服务器的简单实现。 服务器是使用 NodeJS 实现的,它的模块自然( ) 词干算法 当前实现仅支持 Porter 和 Lancaster 词干算法。 停用词提取 现在服务器只能提取英语中的停用词。 服务器 服务器从标题参数doc 中提取要处理的文本。 服务器输出采用 JSON 格式。 可以使用以下参数配置服务器实例: "include_original_doc" : 如果指定为 'true' 服务器将输出输入文本 "include_tokens" : 如果指定为 'true' 输出将包含令牌列表 "exclude_stops" : 如果指定为 'true' 停用词将从输出中排除 "include_non_stops" : 如果指定为 'true' 非停用词将被添加到输出中 "run_porter" : 如果指定为 '
资源推荐
资源详情
资源评论
收起资源包目录
txtproc_js-master.zip (25个子文件)
txtproc_js-master
.gitignore 189B
src
srv
srv.js 4KB
API
Java
lib
src
org
ssc
txtproc
Options.java 1KB
Result.java 3KB
TextProcessor.java 6KB
jtxtproc.iml 610B
.idea
misc.xml 463B
encodings.xml 164B
libraries
com_google_code_gson_gson_2_2_3.xml 311B
net_sf_json_lib_json_lib_2_3.xml 307B
org_apache_httpcomponents_httpclient_4_4.xml 537B
org_apache_commons_com_springsource_org_apache_commons_httpclient_3_1_0.xml 633B
org_apache_httpcomponents_com_springsource_org_apache_httpcomponents_httpclient_4_1_1.xml 1003B
vcs.xml 164B
scopes
scope_settings.xml 139B
artifacts
jtxtproc_jar.xml 750B
jtxtproc.xml 335B
compiler.xml 709B
modules.xml 256B
test
src
org
ssc
txtproc
Main.java 1KB
test.iml 489B
.idea
encodings.xml 164B
libraries
jtxtproc.xml 213B
modules.xml 248B
README.md 2KB
共 25 条
- 1
资源评论
CharlesXiao
- 粉丝: 15
- 资源: 4489
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 最新版HCIA HCIP HCIE-Cloud云计算课件软件资源 超过251G
- 2023年黑龙江省逐月均温数据,适合做分析研究
- 利用网页设计语言制作的一款简易打地鼠小游戏
- PromptSource: 自然语言提示的集成开发环境与公共资源库
- PCAN UDS VI,用于UDS诊断
- BD网盘不限速补丁+最新进程修改脚本亲测有效
- 利用网页设计语言制作的一款简易的时钟网页,可供初学者借鉴,学习 语言:html+css+script
- 学习threejs,通过设置纹理属性来修改纹理贴图的位置和大小,贴图
- _root_license_license_8e0ac649-0626-408f-881c-6603da48ce72.lrf
- 基于 SpringBoot 的 JavaWeb 宠物猫认养系统:功能设计与领养体验优化
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功