没有合适的资源?快使用搜索试试~ 我知道了~
java汽车租赁源码-Reinforcement-Learning-An-Introduction:来自Sutton和Barto...
共190个文件
kt:170个
png:8个
gradle:2个
需积分: 9 0 下载量 145 浏览量
2021-06-05
14:06:04
上传
评论
收藏 946KB ZIP 举报
温馨提示
java汽车租赁源码强化学习:简介 的算法、示例和练习的实现。 该项目的目的是帮助理解 RL 算法并轻松进行实验。 灵感来自和 特征: 算法和问题是分开的。 所以你可以试验 <algorithm> 或 <algorithm> 的各种组合 实现非常接近书中的伪代码。 所以阅读源代码会帮助你理解原始算法。 实现的算法: 基于模型(动态规划): (第 65 页) (第 67 页) 蒙特卡洛(剧集备份): (第 76 页) (第 81 页) (第 83 页) (第 90 页) (第 91 页) 时差(一步备份): (第 98 页) (第 106 页) (第 107 页) (第 109 页) (第 111 页) n-step Temporal Difference(统一MC和TD): (第 117 页) (第 120 页) (第 122 页) (第 125 页) (第 128 页) Dyna(综合规划、表演和学习): (第 133 页) (第 135 页) (第 138 页) (第 140 页) (第 141 页
资源推荐
资源详情
资源评论
收起资源包目录
java汽车租赁源码-Reinforcement-Learning-An-Introduction:来自Sutton和Barto的算法、示例和 (190个子文件)
gradlew.bat 2KB
StockLineChart.css 73B
.gitignore 43B
build.gradle 664B
settings.gradle 51B
gradlew 5KB
gradle-wrapper.jar 54KB
Dimension.kt 12KB
TestCNSet.kt 9KB
`Test FlyPlane Problem with TD(λ)`.kt 9KB
Matrix.kt 9KB
NSet.kt 8KB
Test Function Approximator Tile coding.kt 8KB
CompactNSet.kt 8KB
RodManeuvering.kt 7KB
Test Optimal Sarsa(λ).kt 7KB
Poisson.kt 7KB
Test Policy Iteration.kt 7KB
TestNSet.kt 6KB
DefaultBuf.kt 6KB
Test Optimal Episodic Semi-gradient Sarsa control.kt 6KB
DefaultIntBuf.kt 5KB
RawD3DChartUI.kt 5KB
Test Optimal n-step semi-gradient Sarsa.kt 5KB
FlyPlane.kt 5KB
CarRental.kt 5KB
n-step semi-gradient off-policy Q(σ).kt 4KB
IndexedCollection.kt 4KB
Index.kt 4KB
Test Optimal Differential semi-gradient Sarsa.kt 3KB
DimensionBuilder.kt 3KB
Blackjack.kt 3KB
D3DChartUI.kt 3KB
Sarsa(λ).kt 3KB
Test Optimal Prioritized Sweeping.kt 3KB
PrioritizedSweepingStochasticEnv.kt 3KB
Test Function Approximator Fourier vs Poly.kt 3KB
`Test FlyPlane Problem with Actor-Critic`.kt 3KB
n-step semi-gradient off-policy sarsa.kt 3KB
N-step Off-policy n-step Q(σ).kt 3KB
`Test FlyPlane Problem with REINFORCE`.kt 3KB
ResourceLoader.kt 3KB
NSetMDP.kt 3KB
MathHelpers.kt 3KB
D2DGameUI.kt 3KB
RodManeuveringUI.kt 3KB
Test Prediction Off-line λ-return.kt 3KB
TestBase.kt 3KB
Test Mountain Car with Actor-Critic.kt 3KB
Test Prediction True Online TD(λ).kt 2KB
PolicyIteration.kt 2KB
Test Prediction Semi-gradient TD(λ).kt 2KB
N-step Treebackup.kt 2KB
Dyna-Q-OnPolicy.kt 2KB
Test Prediction n-TD.kt 2KB
PrioritizedSweeping.kt 2KB
package.kt 2KB
Test Optimal Dyna-Q on-policy.kt 2KB
SuttonTileCoding.kt 2KB
N-step Off-policy Sarsa.kt 2KB
MountainCarUI.kt 2KB
Test Optimal TD Q-Learning.kt 2KB
Test Optimal TD Sarsa.kt 2KB
Dyna-Q+.kt 2KB
GridWorldUI.kt 2KB
N-step Sarsa.kt 2KB
Vector.kt 2KB
DynaMaze.kt 2KB
Test Optimal Dyna-Q.kt 2KB
CliffWalking.kt 2KB
True Online Sarsa(λ).kt 2KB
Dyna-Q.kt 2KB
On-Policy Optimal.kt 2KB
Episodic semi-gradient n-step Sarsa.kt 2KB
Actor-Critic with Eligibility Traces (episodic).kt 2KB
N-step TD prediction.kt 2KB
ExploringStarts.kt 2KB
Test Optimal Episodic Semi-gradient QLearning control.kt 2KB
WindyGridworld.kt 2KB
Off-policy Optimal.kt 2KB
REINFORCE with Baseline (episodic).kt 2KB
ChartApp.kt 2KB
Test Optimal TD Doubel Q-Learning.kt 2KB
Test Prediction LSTD.kt 2KB
Test Function Approximator Coarse Coding.kt 2KB
n-step semi-gradient TD.kt 2KB
DoubleQLearning.kt 2KB
MDP.kt 2KB
Test Optimal Prioritized Sweeping Stochastic.kt 2KB
Off-Policy Prediction.kt 1KB
extensions.kt 1KB
Test Optimal n-TD Q(σ).kt 1KB
Test Prediction n-step Semi-gradient TD.kt 1KB
Test Optimal n-TD Off-policy Sarsa.kt 1KB
GridWorld.kt 1KB
IndexedMDP.kt 1KB
Test Prediction Semi-gradient TD(0).kt 1KB
Test Prediction Gradient MC.kt 1KB
Actor-Critic with Eligibility Traces (continuing).kt 1KB
Test Optimal n-TD Sarsa.kt 1KB
共 190 条
- 1
- 2
资源评论
weixin_38551749
- 粉丝: 7
- 资源: 936
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 筷手引流工具.apk
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功