没有合适的资源?快使用搜索试试~ 我知道了~
google-ngrams-db:用于 Google N-gram 的 SQLite 数据库
共26个文件
txt:2个
xaaaaf:1个
xaaaat:1个
需积分: 10 0 下载量 124 浏览量
2021-06-02
01:43:19
上传
评论
收藏 818.73MB ZIP 举报
温馨提示
谷歌 N-grams 数据库 这个 repo 包含 Google N-grams English 百万作为 SQLite 数据库。 这些字段可用: 语法 年 匹配计数 页数 音量_计数 此数据基于 。 Google N-grams 是根据。 这些文件已通过仅采用完全由字母 AZ 组成的英语 100 万 1 克(例如,没有标点符号或数字,没有重音符号或非英文字符)进行了修改。 这些 ngram 已被放入 SQLite 数据库中,使这样的查询变得容易: -- get counts of matches by ngram for appearances after 1990 SELECT ngram, SUM (match_count) AS sum_match_count FROM eng_1m_ascii WHERE year > 1990 GROUP BY ngram; -- ge
资源推荐
资源详情
资源评论
收起资源包目录
google-ngrams-db-master.zip (26个子文件)
google-ngrams-db-master
.gitignore 82B
urls.txt 930B
output_eng_1m_ascii.sqlite.7z
xaaaah 42.92MB
xaaaai 42.92MB
xaaaal 42.92MB
xaaaan 42.92MB
xaaaaa 42.92MB
xaaaac 42.92MB
xaaaak 42.92MB
xaaaat 3.29MB
xaaaae 42.92MB
xaaaaj 42.92MB
xaaaag 42.92MB
xaaaaq 42.92MB
xaaaaf 42.92MB
xaaaas 42.92MB
xaaaap 42.92MB
xaaaao 42.92MB
xaaaam 42.92MB
xaaaad 42.92MB
xaaaab 42.92MB
xaaaar 42.92MB
total_matches_per_year.txt 5KB
.gitmodules 109B
README.md 2KB
img
google_eng1m_relativefreq_1835-2008.png 43KB
共 26 条
- 1
资源评论
皂皂七虫
- 粉丝: 24
- 资源: 4637
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2023-04-06-项目笔记 - 第三百零八阶段 - 4.4.2.306全局变量的作用域-306 -2025.11.05
- Carla 0.9.15编译的zlib-1.2.13.zip
- Carla 0.9.15编译的xerces-c-3.23-src
- 【完整源码+数据库】基于Spring SchedulingConfigurer 实现动态定时任务
- Java Web应用集成支付宝支付功能【附完整源码及数据库设计】
- mysql驱动文件mysql
- python网络编程入门基础
- 基于SpringBoot 整合 AOP完整源码示例
- python基础,python进程和线程
- Java Web 实验项目 初步实现maven和idea的整合
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功