深度强化学习求解动态柔性作业车间调度问题_强化学习车间调度代码资源-CSDN文库

共150个文件

pt：93个

py：35个

xlsx：15个

版权申诉

深度强化学习

车间调度

柔性作业车间调度

动态调度

5星 · 超过95%的资源 79 浏览量 2022-04-14 17:55:56 上传评论 17 收藏 2.85MB ZIP 举报

深度强化学习（DRL）在近年来已成为解决复杂决策问题的一个强大工具，尤其在处理动态环境中的问题时表现突出。在“深度强化学习求解动态柔性作业车间调度问题”这一主题中，我们关注的是如何利用DRL的技术来优化动态环境中柔性作业车间的调度策略。让我们了解什么是动态柔性作业车间调度问题。在制造业中，柔性作业车间是指具有高度灵活性的生产系统，能够快速调整生产流程以适应不同的产品类型和订单需求。这种调度问题涉及到如何有效地分配有限的资源（如机器、工人和时间）来完成一系列任务，同时考虑到任务之间的依赖关系、加工时间、工作中心的容量限制以及交货期等约束。由于市场需求的不确定性，这些问题往往是动态的，需要实时更新调度方案。深度强化学习在此类问题中的应用基于其独特的优势。传统的优化算法往往难以处理这种高维度、非线性的决策空间。而DRL通过构建神经网络模型，可以自动学习环境状态与动作之间的复杂关系，从而找到近似最优的决策策略。具体来说，智能体（即DRL模型）在环境中不断尝试不同的动作，根据环境反馈（奖励或惩罚）来调整其行为策略，这个过程被称为“探索-开发”过程。在实际应用中，DRL模型通常包括一个状态空间，用来表示车间当前的运行状况，如任务状态、机器状态等；一个动作空间，定义了可能的操作，如分配任务、改变优先级等；一个奖励函数，根据调度效果给予智能体反馈；以及一个策略网络，用于预测在当前状态下应采取的动作。在实现过程中，可能使用到的DRL算法有Deep Q-Networks (DQN)、Proximal Policy Optimization (PPO)、Actor-Critic方法等。这些算法各有优劣，选择哪种取决于问题的具体特性，如是否连续动作空间、环境的稳定性和复杂性等。在“PhD-Thesis-Projects-main”这个项目中，研究者可能详细探讨了以下内容：DRL模型的架构设计、训练过程、性能评估标准、与其他调度算法的比较，以及如何将DRL模型部署到实际的柔性作业车间中。他们可能还研究了如何处理不确定性和实时性对模型性能的影响，以及如何设计奖励函数以更好地反映实际生产目标，如最小化总延迟时间、最大化生产线利用率或提高客户满意度。深度强化学习为动态柔性作业车间调度问题提供了一种新的、强大的解决方案，通过学习和适应环境变化，能够实现更高效、灵活的调度策略，这对于提升制造业的生产效率和竞争力具有重大意义。

资源推荐

资源详情

资源评论

收起资源包目录

深度强化学习求解动态柔性作业车间调度问题（150个子文件）

LICENSE 11KB

README.md 615B

TEST_DDQN_rwd3.pt 75KB

TEST_DDQN_rwd2.pt 75KB

large_state_dict3wc12m.pt 46KB

validated_4machine_large.pt 44KB

validated_4machine_large2.pt 44KB

large_state_dict5wc20m_globalR.pt 44KB

validated_4machine_large3.pt 44KB

TEST_state_dict.pt 44KB

MR_validated_5ops.pt 42KB

MR_direct_rwd13.pt 42KB

MR_direct_big.pt 42KB

MR_direct_rwdbsf.pt 42KB

MR_validated_3ops.pt 42KB

MR_direct_rwdbig.pt 42KB

MR_validated_5ops_1.pt 42KB

bsf_DDQN.pt 42KB

DDQN_rwd12.pt 42KB

MR_validated_4ops.pt 42KB

TEST_DDQN_rwd11.pt 42KB

validated_10_90.pt 42KB

bsf_TEST.pt 42KB

DDQN_rwd5.pt 42KB

DDQN_rwd4.pt 42KB

validated_10_70.pt 42KB

DDQN_rwd3.pt 42KB

TEST_DDQN_rwd12.pt 42KB

TEST_DDQN_rwd5.pt 42KB

TEST_DDQN_rwd4.pt 42KB

bsf_DDQN.pt 42KB

TEST_AS_rwd3.pt 42KB

O_2021_rwd3.pt 38KB

O_2021_rwd12.pt 38KB

MC_rwd11.pt 28KB

MC_rwd12.pt 28KB

MC_rwd13.pt 28KB

MC_rwd2.pt 28KB

DDQN_StrategicIdleness_rwd5.pt 27KB

DDQN_SI_rwd2.pt 27KB

DDQN_SI_rwd5.pt 27KB

A2C_rwd2.pt 27KB

bsf_A2C.pt 27KB

bsf.pt 27KB

bsf_DDQN_6machines.pt 27KB

validated_6_80.pt 27KB

bsf_DDQN_6machines.pt 27KB

validated_10_80.pt 27KB

validated_6_90.pt 27KB

validated_6_70.pt 27KB

validated_LL_ext6.pt 26KB

validated_LH.pt 26KB

validated_HH_ext9.pt 26KB

validated_LL.pt 26KB

validated_HL1.pt 26KB

validated_HL_ext6.pt 26KB

validated_LH1.pt 26KB

validated_LH_ext9.pt 26KB

validated_HL_ext9.pt 26KB

validated_LL1.pt 26KB

validated_HH.pt 26KB

Abstracted_state_rwd12.pt 26KB

validated_HL_ext9.pt 26KB

validated_LH_ext6.pt 26KB

validated_HH_ext6.pt 26KB

validated_HH1.pt 26KB

validated_LL_ext9.pt 26KB

validated_HL.pt 26KB

Abstracted_state_rwd10.pt 26KB

Abstracted_state_rwd3.pt 26KB

validated_abstract_indirect.pt 26KB

U_2020_rwd3.pt 19KB

medium_state_dict3wc9m.pt 11KB

validated_5machine_state_dict2.pt 11KB

validated_5machine_state_dict.pt 11KB

validated_4machine_state_dict2.pt 10KB

validated_4machine_state_dict.pt 10KB

Extended_state_dict.pt 10KB

validated_3machine_state_dict.pt 10KB

medium_state_dict4wc12m_globalR.pt 10KB

N_2019_rwd3.pt 9KB

Abstract_state_dict.pt 6KB

small_state_dict6wc12m.pt 6KB

small_state_dict3wc6m.pt 6KB

0108_state_dict.pt 5KB

small_state_dict3wc6m_globalR.pt 5KB

0123_state_dict.pt 5KB

Deeper_state_dict.pt 5KB

0110_state_dict.pt 5KB

1204_state_dict.pt 5KB

1218_state_dict.pt 5KB

1225_state_dict.pt 5KB

Norm_state_dict.pt 5KB

1123_state_dict.pt 4KB

state_dict.pt 4KB

brain.py 92KB

brain_machine_S.py 67KB

agent_machine.py 47KB

brain_workcenter_R.py 46KB

machine.py 39KB

共 150 条

# PhD-Thesis-Projects This repository contains the code of the deep MARL-based dynamic scheduling algorithms in job shop and flexible job shop. Developed for the thesis entitled "Deep Reinforcement Learning-Based Dynamic Scheduling" submitted to Nanyang Technological University in partial fulfillment of the requirements for the degree of Doctor of Philosophy. The code is crteaed and validated by Liu Renke, PhD candidate of School of Mechanical and Aerospace Enginerring, Nanyang Technological University. The code for experiment in chapter 5 and 6 are stored under the folder "JSP" and "FJSP", respectively.

评论收藏

内容反馈

版权申诉