实验一:
实验内容:
1)数据可视化,并写出可视化方法中每个参数的含义:
① 以花萼长度和宽度为xy轴,建立鸢尾花数据散点图,使用品种划分数据。
② 画出花瓣的长度的箱图,使用品种划分数据。
③ 画出花瓣长度的小提琴图,使用品种划分数据。
2)分别计算每个品种鸢尾花各个属性(花萼、花瓣的长度和宽度)的最小值、平均值分别是多少(提示:使用min、mean 方法)?写出程序代码,计算结果(截图),并描述计算过程(对计算方法进行介绍,说明方法中每个参数的含义)。
3)计算鸢尾花每个品种的花萼长度大于6cm的数据个数。写出程序代码,计算结果(截图),并描述计算过程(对计算方法进行介绍,说明方法中每个参数的含义)。
实验要求:
1)学习相关中英文教程,熟悉要使用的方法,提前构思实验方案,课上进行编程操作;
2)认真完成并按时提交实验报告,在实验报告中包括实验要求、实验过程、编写的主!要!代!码!及执行结果截图;
3)截图要完整美观。图中字体大小合适,边缘截取对称,拉伸要保持比例;
4)使用A4纸,正反面黑白打印。要考虑图形在黑白打印后图形是否易读(尽量使用形状进行区分,避免使用色彩进行区分),不易读不能得分。
参考:
https://www.kaggle.com/benhamner/python-data-visualizations
实验二:
实验内容
使用urllib.request和BeautifulSoup编写网页爬虫,爬取某一新闻网站的新闻列表(含新闻标题、发布日期,要求爬取列表第1页和第2页),并找出每条新闻中的图片链接,合理的存储在excel表格中。excel表格格式如下图:
新闻标题 发布日期 图片链接1 图片链接2 … 图片链接n
在报告中详细介绍程序中的重要代码(爬取控制、HTML解析、excel输出)和目标网页的HTML结构。
1)学习相关中英文python document,熟悉urllib.request等库的使用;
2)提前构思实验方案,课上进行编程操作。认真完成并按时提交实验报告;
3)截图要完整美观。图中字体大小合适,边缘截取对称,拉伸要保持比例;
4)使用A4纸,正反面黑白打印。
爬取网站:
https://xcb.tjut.edu.cn/zxdt.jsp?urltype=tree.TreeTempUrl&wbtreeid=1009
天津理工大学数据分析实验
版权申诉
5星 · 超过95%的资源 55 浏览量
2021-12-31
23:03:53
上传
评论 2
收藏 3KB ZIP 举报
Jason20
- 粉丝: 421
- 资源: 8