没有合适的资源?快使用搜索试试~ 我知道了~
Admiral:基于Agent的建模和强化学习
共114个文件
py:102个
md:3个
png:3个
需积分: 17 1 下载量 132 浏览量
2021-04-22
20:14:46
上传
评论
收藏 632KB ZIP 举报
温馨提示
上将 Admiral是用于开发基于代理的模拟并通过多代理强化学习对其进行培训的软件包。 我们提供了一个直观的命令行界面,用于培训,查看和分析座席行为。 我们支持多个环境接口,包括Gym.Env和MultiAgentEnv,并提供有用的包装器,用于将模拟与RL堆栈集成在一起。 海军上将是强化学习堆栈中位于RLlib之上的一层。 我们利用RLlib的框架来培训代理,并将其扩展为更轻松地支持自定义环境,算法和策略。 我们使研究人员能够快速进行RL实验和环境设计的原型设计,并降低将RL原型设计作为潜在解决方案的现有项目的障碍。 设计 强化学习实验包含两个主要组件:(1)模拟环境和(2)学习代理,其中包含将观察结果映射到动作的策略。 这些策略可以由研究人员进行硬编码,也可以由RL算法进行培训。 在Admiral中,这两个组件是在单个Python配置脚本中指定的。 这些组件可以在脚本中定义,也可以作
资源推荐
资源详情
资源评论
收起资源包目录
Admiral:基于Agent的建模和强化学习 (114个子文件)
.gitignore 23B
LICENSE 2KB
README.md 11KB
README.md 6KB
README.md 2KB
NOTICE 1KB
workflow.png 458KB
attack_freq.png 35KB
position_freq.png 33KB
test_predator_prey.py 49KB
test_all_step_predator_prey.py 35KB
predator_prey.py 30KB
test_turn_based_predator_prey.py 29KB
test_predator_prey_communication.py 24KB
test_predator_prey.py 20KB
observer.py 19KB
actor.py 17KB
state.py 16KB
test_component_observer_wrapper.py 14KB
agent.py 13KB
test_position_component.py 12KB
test_flatten_wrapper.py 12KB
test_multi_corridor.py 12KB
test_sar_wrapper.py 9KB
observer_wrapper.py 9KB
test_turn_based_multi_corridor.py 9KB
test_movement_component.py 8KB
test_attacking_component.py 8KB
hackathon_prototype_components.py 8KB
test_ravel_discrete_wrapper.py 8KB
test_all_step_multi_corridor.py 8KB
multi_corridor.py 8KB
flatten_wrapper.py 8KB
test_communication_wrapper.py 7KB
ravel_discrete_wrapper.py 6KB
observing_agent_example.py 6KB
test_resources_component.py 6KB
comms_team_battle.py 6KB
predator_prey_example.py 6KB
monte_carlo.py 6KB
fighting_for_resources.py 5KB
runnable_predator_prey_training.py 5KB
bird_fighting.py 5KB
resource_management.py 5KB
play.py 5KB
fighting_teams.py 5KB
done.py 5KB
communication_wrapper.py 5KB
simple_particle.py 4KB
make_runnable.py 4KB
turn_based_manager.py 4KB
test_done_component.py 4KB
bird_flight.py 4KB
test_health_component.py 3KB
test_policy.py 3KB
agent_based_simulation.py 3KB
policy.py 3KB
grid_resources.py 3KB
corridor.py 3KB
helpers.py 3KB
test_corridor.py 3KB
analyze.py 3KB
test_collision_component.py 2KB
sar_wrapper.py 2KB
predator_prey_training.py 2KB
all_step_manager.py 2KB
config_prototype.py 2KB
test_grid_resources.py 2KB
simulation_manager.py 2KB
test_monte_carlo.py 2KB
gym_env_wrapper.py 2KB
scripts.py 2KB
movement_map.py 2KB
wrapper.py 2KB
rllib_multiagentenv_wrapper.py 1KB
single_agent_flight.py 1KB
make_runnable_script.py 1KB
play_script.py 1KB
test_simulation_manager_corridor.py 1KB
multi_agent_predator_example.py 1010B
analysis_prototype.py 946B
mapp_resources_example.py 931B
utils.py 889B
train.py 863B
test_gym_wrapper.py 835B
generate_episode.py 796B
random_policy.py 780B
test_generate_episode.py 773B
numpy_utils.py 772B
setup.py 761B
matplotlib_utils.py 688B
analyze_script.py 673B
arrowcontrol.py 571B
single_agent_monte_carlo.py 537B
test_seed.py 505B
train_script.py 469B
abstract_policy.py 400B
__init__.py 308B
__init__.py 277B
__init__.py 200B
共 114 条
- 1
- 2
资源评论
樊康康
- 粉丝: 33
- 资源: 4690
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功