代码运行时的路径为D://i/xxx,将i文件夹放入D盘即可运行python文件。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
1.项目通过使用 TF-IDF 算法,对新文件内词频与已构筑各学科语料库的词频进行对比,使用余弦相似度计算高频词的相关系数,匹配到最相近的学科,实现将新下载的课件自动分类整理。 2.项目运行环境:需要 Python 3.8 及以上配置。安装jieba库、openpyxl库 3.项目包括 3 个模块:数据预处理、词频计算与数据处理、数据计算与对比验证。首先语料库从已经分好类的文件夹中采集,提取所有文件的内容汇总至一个文件并转化为txt,便于词频统计操作;接着将各语料库与新文件的内容进行分词并计算,数据写入 excel 文档进行数据处理,词频部分使用 jieba 库进行分词,数据处理部分对 xlsx 文件进行操作openpyxl 库。最后将分词的结果,即高频词词名和频数分别写入 excel,使用 openpyxl 库。在得到新文档与各语料库词频数据后,使用 excel 中的函数,将数据进行再加工后,新文档词与每一个语料库对比,计算相关系数,并得到属于新文件的正确类别。 4.准确率评估:
资源推荐
资源详情
资源评论
收起资源包目录
基于TF-IDF算法个人文件管理系统(附Python源码)机器学习+人工智能+神经网络.zip (11个子文件)
基于TF-IDF算法个人文件管理系统(附Python源码)机器学习+人工智能+神经网络
i
样例之第二学科(通信网理论)
北邮通信网第二章信源模型和MM1排队系统习题答案.docx 133KB
期中考试-苏驷希-2017210665-杨子江.docx 17KB
样例之第一学科(通原实验)
北邮通信原理软件实验报告.docx 2.36MB
04杨子江.docx 450KB
new.txt 1KB
局部代码
1_combine .py 1022B
4_calculate.py 1KB
2_docx_txt.py 931B
3_test_jieba_xlsx.py 1KB
all.py 5KB
readme.txt 89B
共 11 条
- 1
资源评论
小胡说人工智能
- 粉丝: 1w+
- 资源: 52
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 目标跟踪-基于目标中心点同时进行目标检测+目标跟踪算法实现-项目源码-优质项目实战.zip
- Python《文本特征分析-全唐诗数据挖掘及分析 》+源代码
- Netron-Setup-4.5.0
- 可编辑的地图图形3-世界、各洲、美国地图.xls
- NineAi 新版ChatGPT AI系统网站源码
- Anaconda3-2022.10windows版本
- 基于Servlet的URL访问安全控制.doc
- 可编辑的地图图形-2-中国到省、到市、到县地图.xls
- 快慢指针法判断链表是否有环-go语言实现
- Python《金融新闻数据挖掘分析 (数据抓取、NLP算法分析、量化策略、回测框架等)》+源代码+项目说明
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功