没有合适的资源?快使用搜索试试~ 我知道了~
Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码
共27个文件
txt:25个
py:1个
md:1个
需积分: 38 10 下载量 199 浏览量
2021-05-18
23:46:43
上传
评论 1
收藏 37KB ZIP 举报
温馨提示
文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin
资源推荐
资源详情
资源评论
收起资源包目录
Text-Mining-master.zip (27个子文件)
Text-Mining-master
listOfStopWords.txt 2KB
documentDatabase
doc25.txt 2KB
doc13.txt 2KB
doc8.txt 4KB
doc14.txt 5KB
doc21.txt 2KB
doc18.txt 3KB
doc5.txt 1KB
doc12.txt 2KB
doc22.txt 1KB
doc16.txt 3KB
doc4.txt 561B
doc9.txt 549B
doc11.txt 1KB
doc1.txt 3KB
doc10.txt 1KB
doc19.txt 3KB
doc7.txt 3KB
doc3.txt 1KB
doc15.txt 3KB
doc17.txt 5KB
doc20.txt 3KB
doc6.txt 620B
doc2.txt 3KB
aprioriInput.txt 4KB
TextMining.py 13KB
README.md 2KB
共 27 条
- 1
资源评论
清木一阳
- 粉丝: 23
- 资源: 4656
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功