用进化算法来优化SVM的参数C和Gamma——利用SCOOP库进行分布式加速计算

分布式

70 浏览量 2020-12-21 15:33:08 上传评论 2 收藏 57KB PDF 举报

资源推荐

资源详情

资源评论

用进化算法来优化用进化算法来优化SVM的参数的参数C和和Gamma——利用利用SCOOP库库

进行分布式加速计算进行分布式加速计算

该案例展示了如何利用SCOOP库进行分布式加速计算Geatpy进化算法程序，

本案例和soea_demo6类似，同样是用进化算法来优化SVM的参数C和Gamma，

不同的是，本案例选用更庞大的数据集，使得每次训练SVM模型时耗时更高，从而更适合采用分布式加速计算。

该数据集存放在同目录下的Data_User_Modeling_Dataset_Hamdi Tolga KAHRAMAN.xls中，

有关该数据集的详细描述详见http://archive.ics.uci.edu/ml/datasets/User+Knowledge+Modeling。

在执行本案例前，需要确保正确安装sklearn以及SCOOP，以保证SVM和SCOOP部分的代码能够正常执行。

SCOOP安装方法：控制台执行命令pip install scoop

分布式加速计算注意事项：

1.当aimFunc()函数十分耗时，比如无法矩阵化计算、或者是计算单个个体的目标函数值就需要很长时间时，

适合采用分布式计算，否则贸然采用分布式计算反而会大大降低性能。

2.分布式执行方法：python -m scoop -n 10 main.py 其中10表示把计算任务分发给10个workers。

非分布式执行方法：python main.py

# -*- coding: utf-8 -*-

import numpy as np

import xlrd

import geatpy as ea

from sklearn import svm

from sklearn import preprocessing

from sklearn.model_selection import cross_val_score

from scoop import futures

"""

该案例展示了如何利用SCOOP库进行分布式加速计算Geatpy进化算法程序，

本案例和soea_demo6类似，同样是用进化算法来优化SVM的参数C和Gamma，

不同的是，本案例选用更庞大的数据集，使得每次训练SVM模型时耗时更高，从而更适合采用分布式加速计算。

该数据集存放在同目录下的Data_User_Modeling_Dataset_Hamdi Tolga KAHRAMAN.xls中，

有关该数据集的详细描述详见http://archive.ics.uci.edu/ml/datasets/User+Knowledge+Modeling。

在执行本案例前，需要确保正确安装sklearn以及SCOOP，以保证SVM和SCOOP部分的代码能够正常执行。

SCOOP安装方法：控制台执行命令pip install scoop

分布式加速计算注意事项：

1.当aimFunc()函数十分耗时，比如无法矩阵化计算、或者是计算单个个体的目标函数值就需要很长时间时，

适合采用分布式计算，否则贸然采用分布式计算反而会大大降低性能。

2.分布式执行方法：python -m scoop -n 10 main.py 其中10表示把计算任务分发给10个workers。

非分布式执行方法：python main.py

"""

class MyProblem(ea.Problem): # 继承Problem父类

def __init__(self):

name = 'MyProblem' # 初始化name（函数名称，可以随意设置）

M = 1 # 初始化M（目标维数）

maxormins = [-1] # 初始化maxormins（目标最小最大化标记列表，1：最小化该目标；-1：最大化该目标）

Dim = 2 # 初始化Dim（决策变量维数）

varTypes = [0, 0] # 初始化varTypes（决策变量的类型，元素为0表示对应的变量是连续的；1表示是离散的）

lb = [2**(-8), 2**(-8)] # 决策变量下界

ub = [2**8, 1] # 决策变量上界

lbin = [1] * Dim # 决策变量下边界（0表示不包含该变量的下边界，1表示包含）

ubin = [1] * Dim # 决策变量上边界（0表示不包含该变量的上边界，1表示包含）

# 调用父类构造方法完成实例化

ea.Problem.__init__(self, name, M, maxormins, Dim, varTypes, lb, ub, lbin, ubin)

# 目标函数计算中用到的一些数据

workbook=xlrd.open_workbook("Data_User_Modeling_Dataset_Hamdi Tolga KAHRAMAN.xls") # 打开文件，获取excel文件

的workbook（工作簿）对象

worksheet=workbook.sheet_by_name("Training_Data") # 通过sheet名获得sheet对象

self.data = np.vstack([worksheet.col_values(0)[1:],

worksheet.col_values(1)[1:],

worksheet.col_values(2)[1:],

worksheet.col_values(3)[1:],

worksheet.col_values(4)[1:]]).T # 获取特征数据

self.data = preprocessing.scale(self.data) # 归一化特征数据

self.dataTarget = worksheet.col_values(5)[1:] # 获取标签数据

def aimFunc(self, pop): # 目标函数

Vars = pop.Phen # 得到决策变量矩阵

args = list(zip(list(range(pop.sizes)), [Vars] * pop.sizes, [self.data] * pop.sizes, [self.dataTarget] * pop.sizes))

pop.ObjV = np.array(list(futures.map(subAimFunc, args))) # 调用SCOOP的map函数进行分布式计算，并构造种群所有个体

的目标函数值矩阵ObjV

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

weixin_38723105

粉丝: 4
资源: 969

用进化算法来优化SVM的参数C和Gamma——利用SCOOP库进行分布式加速计算

遗传算法实现对SVM的参数进行优化

鲸鱼优化算法+SVM支持向量机+matlab源代码

dataModel.User：用户主题数据模型存储库

CS-SVM_麻雀优化算法_麻雀优化_麻雀SVM_麻雀搜索算法_麻雀算法svm

鲸鱼优化算法WOA实现函数极值寻优python.rar

MATLAB用于支持向量机-svm_v251.rar

GA_SVM.zip_MATLAB的GA_SVM_ga 核参数_gamma_ga优化svm_惩罚参数C

Python，利用GA、ACO、PSO对SVM模型进行优化，实现分类和预测

ABC_SVM.rar_ABC算法_SVM 参数优化_优化_优化参数_蜂群算法SVM

FA.zip_FA优化_SVM 参数优化_firefly svm_分类算法_萤火虫

麻雀搜索算法（SSA）优化bp网络.zip

CS-SVM_惩罚参数c_核函数_gamma.zip

【SVM预测】基于麻雀搜索算法优化的SVM数据分类预测matlab源码.md

Geatpy遗传算法使用手册.pdf

利用WOA算法优化libsvm中SVDD算法的参数

data-modeling:我的数据建模

【SVM分类】基于布谷鸟算法优化实现SVM数据分类matlab源码.md

麻雀算法（SSA）优化SVM-以滚动轴承故障诊断为例

Origin绘制相关性热图插件(Correlation Plot)

（免费）Chrome浏览器插件axure-chrome-extension

noc指导教师资格认证题库

vep视频快速加密提取器

2011-2022年北大数字普惠金融指数数据（包括省市县）.zip

最新版YS9082HC主控开卡工具 YS9082HC-MPToolV8.00.00.18.826-HCS1A25E2023062

糖尿病数据集diabetes.csv（免费）

IEEE 802.11be（WiFi7） 协议原文pdf文档

Mann -kendall突变检验的MATLAB代码

全国统计用区划代码和城乡划分代码(2023版)

Axhub Charts Pro V2.1.1.rplib

最新资源

IEEE 802.11be（WiFi7）协议原文pdf文档