没有合适的资源？快使用搜索试试~ 我知道了~

文库首页人工智能深度学习摇臂硬币机-强化学习源代码及其注解（matlab）.docx

摇臂硬币机-强化学习源代码及其注解（matlab）.docx

强化学习

需积分: 50 5 下载量 115 浏览量 2021-01-28 12:58:11 上传评论 3 收藏 14KB DOCX 举报

温馨提示

试读

3页

摇臂硬币机-强化学习(greed贪心算法，softmax更新算法)

资源详情

资源评论

资源推荐

function v=R(n,i)

%计算奖赏

%n:摇臂个数

%i:所选摇臂

%v:奖赏

if rand()<(i-1)/n%产生一个随机数在 0 到 1 之间，然后以这个随机数为概率得到回报。

回报非 0 即 1.(i-1)/n 为不同赌博机活得 1 的概率，这个在本处假设是为止但真实存在的参

数。强化学习的目的就是估算它。

v=1;

else

v=0;

end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%%%%%%%%%%%%%%%%%%

function av=explore(n,k)

%仅探索

%n:摇臂个数

%k:试验次数

%av:平均累积奖赏序列

V=0;av=[];

for e=1:k

i=unidrnd(n);%产生从 1 到 N 所指定的最大数数之间的离散均匀随机整数，即随机选

择一台赌博机进行探索

V=V+R(n,i);%累加

av=[av,V/e];%不断存储新的平均奖励

end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%%%%%%%%%%%%%%%%%%%%%%

function av=greed(n,k,ep)

%贪心法

%n:摇臂个数

%k:试验次数

%ep:探索概率，人为设定的

%av:平均累积奖赏序列

V=0;av=[];

for e=1:k

if e==1||rand()<ep%||表示逻辑运算或，满足该条件时，进行探索。且第一次实验

必须为探索实验

i=unidrnd(n);%随机取第 i 台读博机进行探索

else

for j=1:n

a(j)=mean(v(ii==j));%ii==j 为找到使用过 j 号赌博机时为第几号实验(从 ii 中

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

内容反馈

Dr_ZhangL

粉丝: 8
资源: 8

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

摇臂硬币机-强化学习源代码及其注解（matlab）.docx

评论0

最新资源

摇臂硬币机-强化学习源代码及其注解（matlab）.docx

评论0

softmax算法的理解

Matlab实现softmax分类

MATLAB强化学习_多臂赌机问题_softmax策略

基于附加间隔Softmax特征的人脸聚类算法.pdf

基于softmax+k折验证的iris数据分类 pytorch实现

YOLOv8-deepsort 实现智能车辆目标检测+车辆跟踪+车辆计数

YOLOv8网络结构图，自制visio文件，yolov8.vsds，需要的自取，在原有的基础上直接改就行了

yolov8(2023年8月版本),已经下好yolov8s.pt和yolov8n.pt

Transformer模型实现长期预测并可视化结果（附代码+数据集+原理介绍）

社交平台上经济类话题的文章热度信息，数据是真实的，但不是真实日期

Unet眼底血管图像分割数据集+代码+模型+系统界面+教学视频.zip

行人跌倒数据集（VOC格式）

YOLOV5 + 双目相机实现三维测距（新版本）

全新的SOTA模型YOLOv9

YOLOV5口罩检测数据集+代码+模型 2000张标注好的数据+教学视频.zip

Deep Learning Tuning Playbook（中译版）

pycharm连接autodl服务器（yolov8训练自己的数据集）

zotero翻译插件.xpi

基于YOLOv8-Pose的姿态识别项目，带数据集可直接跑通的源码

Informer模型实战案例(代码+数据集+参数讲解)

YOLOv5 人脸口罩图片数据集

YOLOv8改进，融合Gold-YOLO Neck

哈尔滨工业大学-ChatGPT调研报告-20230306-94页.pdf

皮肤病语义分割数据集+代码+unet模型 2000张标注好的数据+教学视频

YOLO数据集数据增强代码

YOLOV5火灾检测数据集+代码+模型 2000张标注好的数据+教学视频

labelme v5.3.1 （2023年8月新版本，双击打开即用）

Unet++舌象图像分割数据集+代码+模型+系统界面+教学视频.zip

zotero 插件分享 茉莉花压缩包

YOLOv8目标追踪实战全套资源包 - 源码与数据集完整分享

最新资源

zotero 插件分享茉莉花压缩包