# UCAS-AI
UCAS 人工智能基础课程大作业,冬奥会领域问答机器人
该问答机器人属于检索式问答系统,采用 gensim 库和 TF-IDF 模型+余弦相似度算法。关于该问答机器人的原理,可以参考 doc 目录下的实验报告。
仅作思路参考,请不要直接照抄。
## 目录结构
1. data
该目录下是实验使用的数据,train_set.json是训练集,test_set.json是测试集。目录“原始数据”下是老师提供的.xlsx、.csv、.ttl等格式的数据。output.json是此测试集的测试结果。
2. doc
该目录下是实验报告和汇报使用的实验展示PPT。
3. src
该目录下是问答机器人的源代码。
## 运行方法
1. 确认data目录下有训练集train_set.json和测试集test_set.json。
2. 在src目录下运行main.py,初次运行会在data下保存多个文件。
3. 根据output.json中的结果统计正确率。
| 文件 | 说明 |
| :--- | :--- |
| dictionary | gensim字典 |
| splitdata.json | 分词结果 |
| tfidf.index | 相似度序列 |
| tfidf.index.0 | 相似度序列缓存文件 |
| tfidf.model | TF-IDF模型 |
| output.json | 测试结果输出 |
## 注意事项
1. 实验使用的python版本为3.9.1 64-bit;gensim库版本为3.8.3;jieba库版本为0.42.1。
2. 第二次运行起会直接使用data目录下的文件构建模型,如果改变了训练集,请删除上方表格中的文件。
3. 输入、输出文件的格式均为json。
## 参考资料
1. [检索式问答机器人](https://github.com/vba34520/Retrieval-Bot)
2. [【gensim中文教程】开始使用gensim](https://blog.csdn.net/duinodu/article/details/76618638)
3. [TF-IDF算法原理及其使用详解](https://zhuanlan.zhihu.com/p/94446764)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
UCAS 人工智能基础课程大作业,冬奥会领域问答机器人 该问答机器人属于检索式问答系统,采用 gensim 库和 TF-IDF 模型+余弦相似度算法。关于该问答机器人的原理,可以参考 doc 目录下的实验报告。 - - 小白不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 -------- -------------------------------
资源推荐
资源详情
资源评论
收起资源包目录
UCAS-AI-master.zip (39个子文件)
UCAS-AI-master
doc
实验展示.pptx 1.12MB
实验报告.pdf 748KB
src
main.py 3KB
data
output.json 152KB
test_set.json 102KB
原始数据
标注数据1.xlsx 479KB
zh_data
sports_zh.csv 208B
ath_game_zh.csv 1.73MB
games_zh.csv 888B
ath_event_zh.csv 3.34MB
all_zh.csv 7.06MB
events_zh.csv 3KB
teams_zh.csv 2KB
athlete_zh.csv 989KB
test.csv 1.3MB
测试集.xlsx 34KB
标注数据2.xlsx 492KB
WinterOlympics
xlore.enwiki.concept.list.ttl 276KB
xlore.enwiki.infobox.ttl 17.6MB
xlore.zhwiki.infobox.ttl 572KB
xlore.zhwiki.instance.list.ttl 155KB
xlore.enwiki.taxonomy.ttl 3.17MB
xlore.term.list.ttl 222KB
xlore.concept.sameAs.ttl 8KB
xlore.zhwiki.concept.list.ttl 30KB
xlore.enwiki.concept.url.ttl 331KB
xlore.instance.sameAs.ttl 95KB
xlore.enwiki.instance.list.ttl 4.07MB
xlore.zhwiki.taxonomy.ttl 204KB
xlore.zhwiki.concept.url.ttl 55KB
xlore.enwiki.property.list.ttl 365KB
xlore.zhwiki.instance.url.ttl 103KB
xlore.enwiki.instance.url.ttl 2.28MB
xlore.baidu.infobox.ttl 1.62MB
xlore.baidu.instance.list.ttl 195KB
xlore.baidu.instance.url.ttl 228KB
xlore.zhwiki.property.list.ttl 236KB
train_set.json 1.93MB
README.md 2KB
共 39 条
- 1
资源评论
机器学习的喵
- 粉丝: 518
- 资源: 1269
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功