没有合适的资源?快使用搜索试试~ 我知道了~
github-mirror:以多云方式镜像Github的脚本
共121个文件
rb:74个
sql:7个
md:2个
需积分: 9 0 下载量 20 浏览量
2021-02-02
04:31:02
上传
评论
收藏 623KB ZIP 举报
温馨提示
ghtorrent:来自Github API的镜像和索引数据 一个库和一组脚本,用于以模块化和可扩展的方式从Github API检索数据并提取SQL数据库中的元数据。 这些脚本以Gem( ghtorrent )的形式分发,但是也可以通过检出此存储库来运行它们。 GHTorrent可以用于多种目的,例如: 镜像Github API事件流,并跟踪事件到实际数据的链接,以逐步构建 为特定存储库创建可查询的元数据数据库 构造一个数据源以一个或多个存储库的(例如,参见) 组件 GHTorrents组件(可以单独使用)是: :知道如何查询Github API(单个实体和页面)并遵守API请求限制。 如果是多宿主主机,可以配置为覆盖默认IP地址。 :知道如何通过名称检索特定的Github实体(用户,存储库,观察者)。 使用可选的持久程序以避免检索未更改的数据。 :一个键/值存储,可以由一个真实的键/值存储支持,以存储Github JSON回复并根据请求查询它们。 备用键/值存储必须支持对存储的JSON对象的任意查询。 :知道如何从检索器检索的数据中提取信息,以便使用元数据更新SQL
资源详情
资源评论
资源推荐
收起资源包目录
github-mirror:以多云方式镜像Github的脚本 (121个子文件)
ghtorrent-data.bib 2KB
CHANGELOG 5KB
IEEEtran.cls 210KB
Dockerfile 240B
Gemfile 53B
ghtorrent.gemspec 2KB
ght-add-private 2KB
ght-add-private-pg 2KB
ght-data-retrieval 88B
ght-dump-mysql 4KB
ght-dump-pg 4KB
ght-geolocate 917B
ght-load 155B
ght-log-analyzer 4KB
ght-log-influx 5KB
ght-mass-harvester 2KB
ght-mirror-events 87B
ght-restore-mysql 3KB
ght-restore-pg 3KB
ght-retrieve-repo 87B
ght-retrieve-repos 88B
ght-retrieve-user 87B
ght-retrieve-users 88B
ght-update-repo 85B
ght-update-repos 86B
.gitignore 162B
LICENSE 1KB
Makefile 3KB
README.md 6KB
README.md 6KB
ORDER 310B
ghtorrent-schema.pdf 538KB
Rakefile 437B
ghtorrent.rb 69KB
retriever.rb 27KB
api_client.rb 9KB
event_processing.rb 8KB
geolocator.rb 7KB
command.rb 7KB
ght_load.rb 6KB
repo_updater.rb 6KB
mongo_persister.rb 5KB
fix_pull_request_commits.rb 4KB
full_repo_retriever.rb 4KB
ght_mirror_events.rb 4KB
full_user_retriever.rb 4KB
ght_data_retrieval.rb 3KB
base_adapter.rb 3KB
multiprocess_queue_client.rb 3KB
settings.rb 3KB
transacted_gh_torrent.rb 3KB
fix_pull_request_comments.rb 2KB
011_add_issues.rb 2KB
ghtorrent.rb 2KB
logging.rb 2KB
fix_pull_request_commits_2.rb 2KB
update_pullreq_entries_from_events.rb 2KB
refresh_pull_request_history.rb 2KB
021_remove_ext_ref_id.rb 2KB
007_add_pull_requests.rb 2KB
001_init_schema.rb 2KB
fix_forks.rb 2KB
fix_issue_labels.rb 2KB
utils.rb 1KB
fix_commit_comment.rb 1KB
013_add_merged_to_pullreqs.rb 1KB
ght_retrieve_repos.rb 1KB
019_add_fake_to_users.rb 1KB
ght_update_repos.rb 1KB
025_add_updated_at_projects.rb 1KB
003_add_orgs.rb 1019B
031_add_updated_at_users.rb 1015B
fix_fake_users.rb 847B
012_add_forks_to_projects.rb 836B
002_add_external_ref_ids.rb 822B
ght_retrieve_users.rb 819B
015_fix_table_issue_labels.rb 812B
ght_retrieve_user.rb 765B
ght_retrieve_repo.rb 692B
refresher.rb 678B
004_add_commit_comments.rb 657B
027_add_default_values.rb 640B
023_geolocate_users.rb 610B
persister.rb 605B
010_add_forks.rb 603B
017_drop_forks_table.rb 599B
009_add_project_commit.rb 593B
csvify.rb 572B
ght_update_repo.rb 562B
029_add_topics.rb 512B
005_add_repo_collaborators.rb 506B
bson_orderedhash.rb 487B
022_add_project_languages.rb 487B
006_add_watchers.rb 485B
noop_persister.rb 470B
018_drop_merged_user_from_pull_requests.rb 448B
014_add_deleted_to_projects.rb 403B
016_add_actor_pull_request_history.rb 399B
008_add_project_unq.rb 387B
028_add_forked_commit.rb 355B
共 121 条
- 1
- 2
安幕
- 粉丝: 29
- 资源: 4785
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 互联网医院2023年修订计划
- Crawlee - 一个用于 Python 的网页抓取和浏览器自动化库,用于构建可靠的爬虫 提取 AI、LLM、RAG 或 GPT 的数据 从网站下载 HTML、PDF、JPG、PNG
- BDD,Python 风格 .zip
- 个人原创STM32F1 BOOTLOADER,主控芯片为STM32F103VET6
- Alpaca 交易 API 的 Python 客户端.zip
- 基于Django与讯飞开放平台的ACGN文化交流平台源码
- 中国象棋(自行初步设计)
- 微信小程序实现找不同游戏
- 100_Numpy_exercises.ipynb
- 2023-04-06-项目笔记 - 第三百二十六阶段 - 4.4.2.324全局变量的作用域-324 -2025.11.23
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0