网络抓取挑战
在此作业中,您将构建一个Web应用程序,该应用程序将刮擦各个网站以获取与“火星任务”相关的数据,并将该信息显示在单个HTML页面中。 以下概述了您需要执行的操作。
第1步-刮
使用Jupyter Notebook,BeautifulSoup,Pandas和Requests / Splinter完成初始刮擦。
创建一个名为mission_to_mars.ipynb的Jupyter Notebook文件,并使用该文件完成所有的抓取和分析任务。 以下概述了您需要抓取的内容。
美国宇航局火星新闻
刮擦并收集最新的新闻标题和段落文本。 将文本分配给以后可以引用的变量。
JPL火星空间图片-特色图片
在访问JPL Featured Space Image的URL。
用碎片来浏览这个网站,找到当前特色火星图片的网址,并指定URL字符串变量称为featured_image_url 。