编程和脚本
项目
作者:ANTE DUJIC
介绍
鸢尾花数据集也称为Fisher鸢尾花数据集,是由英国统计学家,优生学家和生物学家Ronald Fisher于1936年引入的多元数据集。数据集由150个实例组成,每个实例由50种样本组成,每种样本分别来自3种虹膜。
从每个样本中测量出4个特征:
萼片长度,以厘米为单位
萼片宽度(厘米)
花瓣长度(厘米)
花瓣宽度(厘米)
基于这四个特征的组合,我们可以区分出三种虹膜:
艾里斯·塞托萨(Iris Setosa)
鸢尾花
艾里斯·维珍妮卡(Iris Virginica)
该数据集通常用于数据挖掘,分类和聚类示例以及测试算法。
参考