没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
该项目主要train一个模型(判断短文本是否为色情文本),主要有三个model:textcnn/textrnn+attention/textrcnn 最开始打算使用textcnn和textrnn进行融合,但是textcnn模型效果较差,故只使用了textrnn+attention模型 流程如下: 1、data目录下的import_porn.txt色情短文本;import_unporn.txt正常短文本。通过corpus_helper.py中的insert_data方法可以将语料导入到mysql中 2、执行python train.py可以将mysql中语料获取、训练textrnn+attention模型;最后保存模型并固化 ※note: data目录下有actress.txt(女优演员)和fh.txt(番号);可以通过这两个字典对日影片进行过滤
资源推荐
资源详情
资源评论
收起资源包目录
porn_text_model-master.zip (44个子文件)
porn_text_model-master
train.py 802B
models
textrcnn
.svn
all-wcprops 414B
entries 591B
text-base
__init__.py.svn-base 25B
model.py.svn-base 12KB
model.py 12KB
__init__.py 25B
__init__.py 25B
textrnn
.svn
all-wcprops 419B
entries 593B
text-base
__init__.py.svn-base 25B
attention.py.svn-base 4KB
__init__.py 25B
attention.py 4KB
textcnn
.svn
all-wcprops 411B
entries 607B
text-base
__init__.py.svn-base 25B
model.py.svn-base 2KB
model.py 2KB
__init__.py 25B
__pycache__
.svn
all-wcprops 497B
entries 644B
prop-base
model.cpython-36.pyc.svn-base 53B
__init__.cpython-36.pyc.svn-base 53B
text-base
model.cpython-36.pyc.svn-base 2KB
__init__.cpython-36.pyc.svn-base 166B
model.cpython-36.pyc 2KB
__init__.cpython-36.pyc 166B
preprocessing.py 3KB
import_fh.py 1KB
vocab_to_int.pkl 183KB
vocab.pkl 154KB
stopwords.txt 11KB
MysqlHelper.py 1KB
README.md 692B
train_textrnn.py 8KB
corpus_helper.py 2KB
data
import_unporn.txt 2KB
actress.txt 507KB
fh.txt 2.44MB
fh_prefix.txt 58KB
import_porn.txt 689B
import_actress.py 729B
freeze.py 2KB
共 44 条
- 1
资源评论
不爱说话的我
- 粉丝: 17
- 资源: 4616
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功