没有合适的资源?快使用搜索试试~ 我知道了~
maleo:包装程序库,用于NLP中的文本清理和预处理
共27个文件
py:16个
md:2个
txt:2个
需积分: 10 0 下载量 88 浏览量
2021-05-01
02:25:02
上传
评论
收藏 96KB ZIP 举报
温馨提示
马莱诺 包装程序库,用于NLP中的文本清洗,预处理和POS标记 文件 功能概述 - Scanner : get insight about your text dataset (ex: number of chars, words, emojis, etc) - Remove hyperlink, punctuation, stopword, emoticon, etc - Extract hashtags, price from text - Convert email, phone number, date to <TAG> - Convert Indonesian slang to formal word - Convert emoji to word or <TAG> - Convert word to number - Predict Part-of-Speech (POS) t
资源推荐
资源详情
资源评论
收起资源包目录
maleo-master.zip (27个子文件)
maleo-master
.gitignore 47B
setup.cfg 39B
README.md 1KB
logo.png 23KB
LICENSE 1KB
maleo
scanner
__init__.py 46B
_scanner.py 2KB
stopword_remover
Remover.py 392B
indo_stopwords.txt 7KB
RemoverFactory.py 786B
__init__.py 0B
ArrayDictionary.py 588B
pos_tag
_pos.py 2KB
__init__.py 38B
wizard
_wizard.py 1KB
__init__.py 49B
__init__.py 124B
cleansing
Emoticon_Dict.p 3KB
__init__.py 159B
_cleansing.py 4KB
documentation.md 867B
preprocessing
Emoji_Dict.p 88KB
_preprocessing.py 6KB
slang_dict.json 110KB
__init__.py 214B
requirements.txt 139B
setup.py 1KB
共 27 条
- 1
资源评论
DaleDai
- 粉丝: 18
- 资源: 4724
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功