svm.rar_SVM实验报告_svm数据_保险数据

共1个文件

pdf：1个

版权申诉

svm数据

保险数据

实验报告

189 浏览量 2022-09-21 21:24:05 上传评论收藏 164KB RAR 举报

资源详情

资源评论

资源推荐

收起资源包目录

svm.rar （1个子文件）

svm.pdf 179KB

SVM

分类算法

一、数据源说明

1、数据源说远和理解：

采用的实验数据源为第 6 组：The Insurance Company Benchmark (COIL 2000)

TICDATA2000.txt: 这个数据集用来训练和检验预测模型，并且建立了一个 5822 个客

户的记录的描述。每个记录由 86 个属性组成，包含社会人口数据（属性 1-43）和产品

的所有关系（属性 44-86 ）。社会人口数据是由派生邮政编码派生而来的，生活在具有

相同邮政编码地区的所有客户都具有相同的社会人口属性。第 86 个属性：“大篷车：

家庭移动政策” ，是我们的目标变量。共有 5822 条记录，根据要求，全部用来训练。

TICEVAL2000.txt: 这个数据集是需要预测（ 4000 个客户记录）的数据集。它和

TICDATA2000.txt 它具有相同的格式，只是没有最后一列的目标记录。我们只希望返回

预测目标的列表集，所有数据集都用制表符进行分隔。共有 4003（自己加了三条数据），

根据要求，用来做预测。

TICTGTS2000.txt：最终的目标评估数据。这是一个实际情况下的目标数据，将与我们

预测的结果进行校验。我们的预测结果将放在 result.txt 文件中。

数据集理解：本实验任务可以理解为分类问题，即分为 2 类，也就是数据源的第 86 列，

可以分为 0、1 两类。我们首先需要对 TICDATA2000.txt 进行训练，生成 model，再根

据 model 进行预测。

2、数据清理

代码中需要对数据集进行缩放的目的在于：

A、避免一些特征值范围过大而另一些特征值范围过小；

B、避免在训练时为了计算核函数而计算内积的时候引起数值计算的困难。因此，

通常将数据缩放到 [ -1,1] 或者是 [0,1] 之间。

二、数据挖掘的算法说明

1、svm 算法说明

LIBSVM 软件包是台湾大学林智仁(Chih-Jen Lin)博士等用 C++实现的

SVM 库，并且拥有 matlab,perl 等工具箱或者代码,移植和使用都比较方

便.它可以解决分类问题(包括 C-SVC、n-SVC)、回归问题(包括 e-SVR、

n-SVR)以及分布估计(one-class-SVM )等问题，提供了线性、多项式、

径向基和 S 形函数四种常用的核函数供选择，可以有效地解决多类问题、

交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。

2、实现过程

在源程序里面，主要由以下 2 个函数来实现：

(1) struct svm_model *svm_train(const struct svm_problem *prob, const

struct svm_parameter *param);

该函数用来做训练，参数 prob，是 svm_problem 类型数据，具体结构定义如下：

struct svm_problem //存储本次参加运算的所有样本(数据集)，及其所属类别。

{

int n; //记录样本总数

double *y; //指向样本所属类别的数组

struct svm_node **x; //指向一个存储内容为指针的数组

};

其中 svm_node 的结构体定义如下：

struct svm_node //用来存储输入空间中的单个特征

{

int index; //输入空间序号，假设输入空间数为 m

double value; //该输入空间的值

};

所以，prob 也可以说是问题的指针，它指向样本数据的类别和输入向量，在内存

中的具体结构图如下：

图 1.1LIBSVM 训练时，样本数据在内存中的存放结构

只需在内存中申请 n*(m+1)*sizeof(struct svm_node)大小的空间，并在里面填入

每个样本的每个输入空间的值，即可在程序中完成 prob 参数的设置。

参数 param，是 svm_parameter 数据结构，具体结构定义如下：

struct svm_parameter // 训练参数

{

int svm_type; //SVM 类型，

int kernel_type; //核函数类型

int degree; /* for poly */

double gamma; /* for poly/rbf/sigmoid */

double coef0; /* for poly/sigmoid */

/* these are for training only */

double cache_size; /* in MB 制定训练所需要的内存*/

double eps; /* stopping criteria */

double C; /* for C_SVC, EPSILON_SVR and NU_SVR ，惩罚因子*/

int nr_weight; /* for C_SVC 权重的数目*/

int *weight_label; /* for C_SVC 权重，元素个数由 nr_weight 决定*/

double* weight; /* for C_SVC */

double nu; /* for NU_SVC, ONE_CLASS, and NU_SVR */

double p; /* for EPSILON_SVR */

int shrinking; /* use the shrinking heuristics 指明训练过程是否使用压缩

int probability; /* do probability estimates 指明是否要做概率估计*/

}

其中，SVM 类型和核函数类型如下：

enum { C_SVC, NU_SVC, ONE_CLASS, EPSILON_SVR, NU_SVR }; /* svm_type */

enum { LINEAR, POLY, RBF, SIGMOID, PRECOMPUTED }; /* kernel_type */

只需申请一个 svm_parameter 结构体，并按实际需要设定 SVM 类型、核函数和各

种参数的值即可完成参数 param 的设置。

设定完这两个参数，就可以直接在程序中调用训练函数进行训练了，该其函数返

回一个 struct svm_model *SVM 模型的指针，可以使用 svm_save_model(const char

*model_file_name, const struct svm_model *model)函数，把这个模型保存在

磁盘中。至此，训练函数的移植已经完成。

(2) double svm_predict(const struct svm_model *model, const struct

svm_node *x);

参数 model ，是一个 SVM 模型的指针，可以使用函数 struct svm_model

*svm_load_model(const char *model_file_name)，导入训练时保存好的 SVM 模

型，此函数返回一个 SVM 模型的指针，可以直接赋值给变量 model。

参数 x，是 const struct svm_node 结构体的指针，本意是一个输入空间的指针，

但实际上，该函数执行的时候，是从参数 x 处计算输入空间，

直到遇到单个样

本数据结束标记-1 才结束，也就是说，该函数运算了单个样本中的所有输入空间

数据。因此，在调用此函数时，必须先把预测样本的数据按图 3.4 中的固定格式

写入内存中。另外，该函数只能预测一个样本的值，本文需要对图像中的所有像

数点预测，就要使用 for 循环反复调用。

该函数返回一个 double 类型，指明被预测数据属于哪个类。面对两分类问题的时

候，通常使用+1 代表正样本，即类 1；-1 代表负样本，即类 2。最后根据返回的

double 值就可以知道预测数据的类别了。

三、算法源代码及注释说明

评论收藏

内容反馈

版权申诉

御道御小黑

粉丝: 61
资源: 1万+

svm.rar_SVM实验报告_svm数据_保险数据_实验报告

评论0

最新资源

svm.rar_SVM实验报告_svm数据_保险数据_实验报告

评论0

svm.rar_SVM

svm_data.rar_SVM

SVM.rar_SVM_svm 分类_svm算法

SVM.rar_svm ppt

svm.rar_SVM_svm matlab

机器学习SVM(支持向量机)实验报告.pdf

机器学习SVM(支持向量机)实验报告(带源代码)

实验报告——SVM手写数字识别实现

SVM的两个例子（详细，有实验报告）

SVM.rar_svm matlab

svm.rar_SVM java

svm.rar_SVM_SVM分类_SVM数据分类_SVM；_viewsne

SVM.zip_SVM_svm 数据集_svm数据集

SVM图像分类实验报告.docx

支持向量机（SVM）上机实验报告代码大全

SVM分类算法实验报告+C语言程序 加强版

经典的行人检测算法，利用HOG和SVM实现此算法

SVM分类算法代码及实验报告

SVM.rar_svm python

svm.rar_SVM_SVM java_java svm

SVM.rar_SVM_SVM matlab_svm matlab

svm.rar_SVM 二分类_SVM二分类_svm 分类_二分类SVM

SVM.rar_SVM_SVM visual_svm c++ _visual c

SVM分类器的设计与应用代码+实验报告

SVM.rar_SVM matlab_SVM在matlab_SVM实现_svm matlab

SVM.rar_SVM_SVM-KMExample_SVM.dll_svm-som

SVM.rar_SVM 工具箱_SVM 核_SVM 核函数_svm核函数

svm.rar_SVM_SVM for inverter_inverter svm_inverter svm

最新资源

SVM分类算法实验报告+C语言程序加强版