没有合适的资源?快使用搜索试试~ 我知道了~
谷歌师兄的leetcode刷题笔记-NewsAnalysis:使用词嵌入来发现报纸中的偏见
共26个文件
py:17个
txt:2个
gitignore:1个
需积分: 10 0 下载量 151 浏览量
2021-06-30
08:17:14
上传
评论
收藏 8.1MB ZIP 举报
温馨提示
谷歌师兄的leetcode刷题笔记新闻分析 训练、评估和分析报纸词嵌入。 运行脚本并设置变量 run.py文件包含从数据库构建、评估和分析词嵌入模型所需的步骤。 例如访问数据库或训练模型的参数被设置为环境变量。 更改用于训练词嵌入模型集的文档数量 export NO_DOCS=42 然后运行脚本: python3 run.py 安装依赖 要安装依赖项,请确保您已经安装。 克隆或下载存储库。 升级点: pip install -U pip 安装依赖项: pip install -r requirements.txt 添加模型和数据目录: mkdir models 词嵌入 newsAnalysis/createDatabase.py访问 SQL 数据库,将前 n 篇文章的标题、文本、出版日期、文章和报纸 ID 等信息写入 csv 文件。要连接到数据库,请提供其名称、主机、端口、用户和密码必须提供。 newsAnalysis/Model.py根据存储在 csv 文件中的文档训练词嵌入、fasttext 或 word2vec。 谷歌生成的类比显示模型在特定领域学习关系的程度,例如Tokyo:J
资源推荐
资源详情
资源评论
收起资源包目录
NewsAnalysis-master.zip (26个子文件)
NewsAnalysis-master
docker-compose.yml.example 468B
sampleModels
MoscowTimes_1000 19.53MB
MoscowTimes_1000.pkl 157KB
Dockerfile 329B
run.py 1023B
newsAnalysis
createDatabase.py 752B
Model.py 8KB
WEAT.csv 3KB
Collection.py 2KB
CollectionInfo.py 804B
__init__.py 0B
Projector.py 977B
datastore
collect.py 2KB
__init__.py 0B
model.py 2KB
config.py 212B
questions-words.txt 590KB
ImagePlotter.py 819B
ModelInfo.py 490B
Sentences.py 787B
requirements.txt 213B
setup.py 627B
.gitignore 275B
README.md 3KB
unittests
testModel.py 1KB
testCollectionInfo.py 936B
共 26 条
- 1
资源评论
weixin_38609571
- 粉丝: 8
- 资源: 908
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功