第 章
10
数据获取(爬虫)
第 2 页
本章的主要内容
第2节 json和Xpath简介
第1节 HTML简介
第3节 Scrapy库的介绍
第4节 静态页面的数据获取
第5节 动态页面的数据获取
第 3 页
1.HTML简介
• HTML(HyperText Markup Language)称为超文本标记语
言,是一种标识性的语言。它包括一系列标签,通过这些
标签来标记要显示的网页中的各个部分。
• 网页文件本身是一种文本文件,通过在文本文件中添加标
记符,可以告诉浏览器如何显示其中的内容(如:文字如
何处理,画面如何安排,图片如何显示等)。
第 4 页
1.HTML简介
访问请求
HTML
互联网网站
浏览器
第 5 页
1.HTML简介
静态网页 动态网页
评论0