题目: 七种干豆类型预测分类
数据集介绍
干豆( Phaseolus vulgarisL.) 是世界许多地区的主食,加工使人们能够在日常
饮食中消费和加入这种营养丰富的食物。国际食品信息理事会 (IFIC) 描述了五
个加工级别的连续统一体;从最低限度加工到预制食品/膳食;而三个类别
(组),最小加工,加工和超加工;已被一些流行病学家分类。许多北美消费者、
卫生专业人员和政策制定者认为超加工食品和一些加工食品不健康。本研究使用
了七种不同类型的干豆,根据市场情况考虑了形状、形状、类型和结构等特征。
为了获得统一的种子分类,开发了一个计算机视觉系统来区分七个不同的登记品
种,它们具有相似的特征。对于分类模型,使用高分辨率相机拍摄了 7 种不同登
记的干豆的 13611 粒图像。通过计算机视觉系统获得的菜豆图像经过分割和特征
提取阶段,共有 16 个特征;从晶粒中获得了 12 个尺寸和 4 个形状。
数据来源于 UCI 数据库,网址是
https://archive.ics.uci.edu/ml/datasets/Dry+Bean+Dataset/,数据为
Dry_Bean_Dataset.xlsx 数据集(下载下来格式 xlsx)。该数据集共 13661 条数据,17
个变量,具体变量名及含义如下表所示。
变量名
含义
类型
Area
面积
数值型
Perimeter
周长
数值型
MajorAxisLength
长轴长
度
数值型
MinorAxisLength
短轴长
度
数值型
AspectRation.num
纵横比
数值型
Eccentricity
偏心
数值型
ConvexArea
凸面面
积
数值型
EquivDiameter
当量直
径
数值型
Extent
范围
数值型
Solidity
实度
数值型
roundness
圆度
数值型
Compactness
紧凑度
数值型
ShapeFactor1
形状特
征 1
数值型
ShapeFactor2
形状特
征 2
数值型
ShapeFactor3
形状特
数值型