没有合适的资源?快使用搜索试试~ 我知道了~
Tr-topicter:TrTopicter是一种机器学习解决方案,可从给定的土耳其语文本中检测主题
共17个文件
py:9个
lite:1个
tr_stop_words:1个
需积分: 5 0 下载量 11 浏览量
2021-03-13
13:01:36
上传
评论
收藏 5.81MB ZIP 举报
温馨提示
TrTopicter :Turkey: TrTopicter是一种现成的快速文本机器学习模型,用于检测给定土耳其文本的主题。 语言检测被堆叠在模型之前,以避免分析可能会为错误响应铺平道路的非土耳其语文本。 部署的模型接受了将近30K土耳其语注释的句子/段落的训练,平均F-1测度为94.37%。 具有300个字符以上的给定文本的执行时间少于1毫秒,并且资源使用量仅为6 MB。 安装 可以安装Pypi。 在Windows 8/10,Ubuntu 18.04 / 20.04和OSX Catalina 10.15.7上进行了测试 $ pip install trtopicter 支持的主题 政治-经济-健康-体育-技术-文化-宗教-正义 预处理 大小写折叠成小写 标点,数字和空格删除 停用词删除(来源: : ) 配置 { " LANGUAGE_IDENTIFICATION " : { "
资源推荐
资源详情
资源评论
收起资源包目录
Tr-topicter-master.zip (17个子文件)
Tr-topicter-master
MANIFEST.in 500B
trtopicter
exceptions.py 2KB
tokenizer.py 1KB
detectors
domain_detector.py 4KB
__init__.py 125B
language_detector.py 3KB
models
domain_detector
tr_domain_data.lite 6.15MB
language
lid.176.ftz 916KB
__init__.py 108B
stop_words
tr_stop_words 15KB
configuration.json 223B
tr_topicter.py 3KB
LICENSE.txt 1KB
setup.cfg 68B
setup.py 927B
README.md 4KB
example.py 2KB
共 17 条
- 1
资源评论
weixin_42097189
- 粉丝: 38
- 资源: 4567
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功