训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)

preview
共50个文件
py:12个
md:7个
txt:6个
版权申诉
star 5星 · 超过95%的资源 1 下载量 180 浏览量 2023-09-15 14:33:05 上传 评论 1 收藏 7.73MB ZIP 举报
云哲-吉吉2021
  • 粉丝: 3315
  • 资源: 1130
上传资源 快速赚钱
voice
center-task 前往需求广场,查看用户热搜