强化学习：专注于强化学习的相关概念，用例和学习方法

共2个文件

md：2个

reinforcement-learning

需积分: 10 2 下载量 121 浏览量 2021-02-23 14:18:22 上传评论收藏 4KB ZIP 举报

温馨提示

强化学习（RL）专注于强化学习的相关概念，用例和学习方法涵盖了RL中使用的关键术语，基本元素，围绕RL的概念/主题等。地区多武装强盗问题（MABP）有限马尔可夫决策过程（MDP）动态编程方法蒙特卡洛方法时差（TD）学习 n步自举表格解法和近似解法用例临床试验：临床试验期间患者的健康状况以及研究的实际结果极为重要。在这种情况下，探索等同于确定最佳治疗方法，而剥削则是在试验过程中尽可能有效地治疗患者。网络路由：路由是为网络中的流量（例如电话网络或计算机网络（互联网）等）选择路径的过程。可以将信道分配给正确的用户，以使总吞吐量最大化，可以表示为： MABP。在线广告：广告活动的目标是从展示广告中获得最大收益。每次网络用户单击要约时，广告商都会创收。与MABP相似，在探索（目标是使用点击率收集有关广告效果的信息）和利用（我们坚持至今效果最好的广告）之间要权

强化学习：专注于强化学习的相关概念，用例和学习方法

测试用例设计：测试用例的基本概念 测试用例的设计和编写 测试用例评估 测试用例的管理

用例学习：JUnit

测试用例设计方法测试用例设计方法

UML统一用例方法

概念用例图标文件

软件测试用例方法

测试用例设计方法

测试用例输入数据的设计方法和测试用例设计方法

测试用例方法及实践用例

需求分析方法:调研方法、用例分析、类图分析

如何编写用例的方法和例子和描述

基于概念测试用例的快速需求测试过程框架

测试用例的设计方法（全） 史上最全的测试用例设计方法总结

测试用例设计（PPT）

测试用例的设计方法

【软件测试】： 测试用例：基本路径测试法用例编写的方法.doc

测试用例设计方法培训

Qt 5实现串口调试助手 （源工程文件、0积分下载）

【SystemVerilog】路科验证V2学习笔记（全600页）.pdf

AutoSAR标准协议4.2.2

光伏-储能并网系统仿真.rar

NPPJSONViewer.zip

GD32替换STM32注意事项.pdf

XCP协议的规范文档

VS2015安装证书，JavaScript_ProjectSystem.msi，JavaScript_LanguageService.msi

CANoe通过CAPL脚本实现自动测试

蓝牙BLE协议中文版.pdf

BaiduOCR.zip

最新资源

测试用例设计：测试用例的基本概念测试用例的设计和编写测试用例评估测试用例的管理

测试用例的设计方法（全）史上最全的测试用例设计方法总结

【软件测试】：测试用例：基本路径测试法用例编写的方法.doc

Qt 5实现串口调试助手（源工程文件、0积分下载）