• pytorch实现的离线强化学习7种常见算法代码

    这个资源包含了BC、BCQ、BEAR、TD3-BC、CQL、IQL、AWAC七种离线强化学习算法的实现,每个算法文件夹都可以独立运行并测试相应算法在不同环境中的性能。

    0
    80
    26.45MB
    2024-03-11
    0
  • pytorch实现的在线强化学习11种常见算法代码

    这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)

    0
    143
    6.68MB
    2024-02-01
    0
  • 中文开源情感词典最全合集

    提供中文开源情感文件中最全的词典,包括Hownet情感词典全,清华情感词典全,台湾大学情感词典全,情感词典及其分类,汉语情感词极值表,褒贬词及其近义词,否定词等。

    0
    52
    3.51MB
    2022-10-20
    0
  • 博客之星–参与

    参与博客之星评选活动可得。
  • 笔耕不辍

    累计2年每年原创文章数量>=20篇
  • 习惯养成

    连续回答技能树练习题 1 天,每天答对至少 1 题
  • 创作能手

    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户
  • 新秀勋章

    用户首次发布原创文章,审核通过后即可获得
  • 分享学徒

    成功上传1个资源即可获取
  • 阅读者勋章

    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
关注 私信
上传资源赚积分or赚钱