对算法感兴趣的小伙伴们,参加了蓝桥杯比赛的来看看考试考啥,考纲来啦
考纲、蓝桥杯比赛
数据介绍:survived(是否存活),pclass(船舱等级),sex(性别),age(年龄),sibsp(同辈亲属人数),parch(父母子女个数),fare(船票票价),embarked(乘船港湾缩写)class(船舱等级),who(男/女/幼),adultmale(成年男性),deck(舱面位置),embark_town(乘船港湾),alive(是否存活),alone(是否独自登船),可以使用该数据进行分析
Wine葡萄酒数据集是来自UCI数据集上的公开数据集,这些数据是对意大利同一地区种植的葡萄酒进行化学分析的结果,这些葡萄酒来自三个不同的品种。数据包括了三种酒中13种不同成分的数量。每行代表一种酒的样本,共有178个样本,一共有14列,其中,第一个属性是类标识符,分别是1/2/3来表示,代表葡萄酒的三个分类。其它13列为每个样本的对应属性的样本值。属性分别是:酒精、苹果酸、灰、灰分的碱度、镁、总酚、黄酮类化合物、非黄烷类酚类、原花色素、颜色强度、色调、稀释葡萄酒的OD280/OD315、脯氨酸。可以用来进行数据分析和数据挖掘。
鸢尾花数据集是UCI开源的数据集,大家可以自取学习使用,包含excel和csv版本。可以用于数据分析和挖掘(分类和聚类)
公开数据集中的diamonds(钻石)数据。该数据包含53940行,有carat(钻石的重量)、cut(钻石的切工)、color(钻石的颜色)、clarity(钻石的纯净度)、depth(钻石的深度比例)、table(钻石的桌面比例)、price(钻石的价格)、x(钻石的长)、y(钻石的宽)、z(钻石的高)共10列,对应每个钻石的一些参数值,本实验主要是对钻石的切工、钻石的颜色、钻石的纯净度进行统计及可视化分析,并且对钻石的重量、钻石的切工、钻石的颜色、钻石的纯净度对价格的影响进行统计及可视化分析和数据挖掘分析。