指导灯
##(巴哈伊指南图书馆)
这是什么?
我抓取了“指南之光”页面( ),清理了HTML,然后构建了可供开发人员和设计人员使用的整个指南的JSON数据格式。
为什么?
可用的“引导灯”页面很有用; 但是,它非常笨拙,并且不适用于爬网和解析目的。 我的目标是为开发人员和设计人员创建一种通用且易于使用的“导光之光”数据格式,以便在不抓取网站的情况下使用和构建更现代的库(这就是我所做的)。
好东西
指导光的当前可用格式
JSON格式
文字(列为.html)
未来格式
XML格式
SQL
NoSQL
数据结构
JSON数据格式有三个分支/节点:
主要议题
位置基于罗马数字(I,II,III,IV等)
一些main_topic项目没有sub_topics,但是有主题
sub_topics 位置按字母顺序(A,B,C等)
科目
按数字排列
数字为字符串格式
{
" total_s
评论0
最新资源