<h1 align="center">
Panda中文开源大语言模型
</h1>
<p align="center" width="100%">
<img src="panda_logo.PNG" alt="Panda" style="width: 20%; display: block; margin: auto;"></a>
</p>
<p align="center">
<font face="黑体" color=orange size="6"> PandaLLM系列中文开源大模型 </font>
</p>
<p align="center">
<font face="黑体" color=orange size="6"> PandaLLMOps开源大模型训练、推理、部署工具 </font>
</p>
<p align="center">
<font face="黑体" color=orange size="6"> PandaCommunity中文开源大模型开发者社区 </font>
</p>
<p align="center">
<a href="http://pandallm.ai/">在线体验:pandallm.ai (Working in Process)</a>
</p>
[![Code License](https://img.shields.io/badge/Code%20License-Apache_2.0-green.svg)](https://github.com/tatsu-lab/stanford_alpaca/blob/main/LICENSE)
[![Data License](https://img.shields.io/badge/Data%20License-CC%20By%20NC%204.0-red.svg)](https://github.com/tatsu-lab/stanford_alpaca/blob/main/DATA_LICENSE)
</br></br>
## 📄 项目介绍
欢迎来到我们的海外中文大语言模型开源项目 -- Panda!Panda项目于2023年5月启动,旨在大模型时代帮助整个社区探索大模型的整个技术栈。近期,我们对Panda项目进行了升级。目前Panda项目分为三个子项目:1. PandaLLM 2. PandaLLMOps 3. PandaCommunity。以下是每个子项目的具体介绍:
1. PandaLLM 开源大模型。Panda系列开源大模型目前基于 LLaMA1 和 LLaMA2 进行中文领域上的持续预训练,我们希望能够为中文自然语言处理领域提供具有泛用性的通用基础工具进行探索。PandaLLM 模型以及训练涉及的中文数据集将以开源形式发布,任何人都可以免费使用并参与开发。
2. PandaLLMOps 开源大模型训练、推理、部署工具。PandaLLMOps是一套集成了大模型从模型训练、推理、部署工具。我们希望可以为广大大模型开发人员、爱好者提供一套好用的工具,降低学习难度,提高大家在大模型开发、推理、部署各个环节的效率。目前支持以下场景:1. 从零开始做预训练 2. 基于现有底座做增量预训练、全参数量微调、Lora、QLora 3. 快速部署,已集成vllm、lightllm等,最大化优化推理速度
4. PandaCommunity 大模型中文社区。PandaCommunity旨在建立中文世界大模型开发者学习社区,让大家可以对大模型技术栈能够有深入的了解并且互相交流,发挥集体智慧,攻克大模型探索道路上的技术难关。同时,针对想要学习大模型技术的同学,我们也会定期推出免费技术教程、技术研讨会、论文解读等等。
我们欢迎来自全球的开发者一起参与到该项目中,共同推动自然语言处理技术的发展。
## 🧭 内容导引
- [🐼 PandaLLM](#-pandallm)
- [🔥 最新PandaLLM-LLaMA2-13B上线](#最新pandallm-llama2-13b上线)
- [🍞 PandaLLM 已发布的各版本模型权重](#pandallm已发布的各版本模型权重)
- [🤖 PandaLLM 训练框架](#pandallmops训练框架)
- [📒 PandaLLM 开源训练语料总结](#pandallm开源训练语料总结)
- [🐼 PandaIndex](#-pandaindex)
- [🔥 最新 Panda-Index-Large 上线](#最新pandallm-index-large-en上线)
- [🍞 Panda-Index-Large 已发布的模型权重](#pandallm已发布的各版本模型权重)
- [🐼 PandaLLMOps](#-pandallmops)
- [🔨 PandaLLMOps 工具介绍](#pandallmops工具介绍)
- [🤠 PandaLLMOps 预训练示例](#pandallmops预训练示例)
- [🤗 PandaLLMOps 全参数微调示例](#pandallmops全参数微调示例)
- [😎 PandaLLMOps Lora示例](#pandallmops-lora示例)
- [⏩ PandaLLMOps 流水线并行示例](#pandallmops流水线并行示例)
- [🫡 PandaLLMOps 部署示例](#pandallmops部署示例)
- [🚀 PandaLLMOps 中英双语Tutorial上线](#pandallmops-tutorial)
- [🐼 PandaCommunity 大模型中文社区](#-pandacommunity大模型中文社区)
- [🔥 社区介绍](#社区介绍)
- [🌍 为什么选择PandaCommunity中文社区?](#为什么选择pandacommunity大模型中文社区)
- [🎉 社区活动](#社区活动)
- [🍻 加入我们!](#加入我们)
- [📢 社区公告](#-社区公告)
- [🔥Panda项目最新进展](#panda项目最新进展)
- [📖 学习资料](#-学习资料)
- [💡 原创学习资料](#原创学习资料)
- [📚 LLM 相关论文](#llm相关论文)
- [🎉 致谢](#-致谢)
- [🤔 问题反馈](#-问题反馈)
## 🐼 PandaLLM
### 最新Code-Panda-13B-Python上线
我们基于LLaMA2-13B的底座模型在大量python数据上进行了增量预训练。本研究旨在提高Panda模型对代码的理解能力。本次预训练我们使用了大量github的python数据,该模型展现出了较为强大的python代码生成能力。后续我们会以该模型为基础不断完善Panda模型对代码数据的理解,并探究代码生成与模型推理能力之间的关系。
### 最新PandaLLM-LLaMA2-13B上线
我们最新基于LLaMA2-13B的底座模型在中文数据进行了增量预训练。这项研究是为了进一步提升我们的自然语言处理技术,以更好地适应不断变化的语言环境和应用需求。在这次的增量预训练中,我们选择了大量丰富多样的中文数据,包括文本、对话、新闻文章和社交媒体内容,以增强模型对中文语境的理解和表达能力。该底座模型的LLaMA2-13B架构在之前的研究中已经表现出良好的性能和可扩展性,因此我们选择该模型作为基础,通过增量预训练的方式来进一步优化其效果。
通过在大规模的中文数据上进行增量预训练,我们的底座模型现在具备更深入、更全面的中文语言知识,可以更好地理解中文的语法结构、语义含义以及上下文关联。这为我们在各种中文自然语言处理任务中取得更优秀的结果打下了坚实基础。未来,我们将继续致力于推进中文自然语言处理领域的研究,进一步改进和优化底座模型,并探索更多创新的方法来处理中文语言的特点和复杂性。我们相信,随着技术的不断进步,我们的中文自然语言处理技术将在诸多领域发挥重要作用,为用户提供更智能、更便捷的语言交互体验。
### PandaLLM已发布的各版本模型权重
可商用(基于LLaMA2和OpenLLaMA底座微调)
| 模型名称 | 模型大小 | 下载链接 |
| --------------- | ---------- | -------------------------------------------------------- |
| Legal-Panda-13B-Chat | 13B | [https://huggingface.co/chitanda/llama2.13b.sft.legal](https://huggingface.co/chitanda/llama2.13b.wudao.sft.combine.legal.v1.0.seq2k.w16.adamw.NA100.0921.ds) |
| Code-Panda-13B-Python | 13B | [https://huggingface.co/Michael0025/code-panda-13b-python](https://huggingface.co/Michael0025/code-panda-13b-python) |
| Panda-LLaMA2-13B | 13B | [https://huggingface.co/qcw/llama2-panda-zh-13b](https://huggingface.co/qcw/llama2-panda-zh-13b) |
| Panda-LLaMA2-13B-Chat | 13B | [https://huggingface.co/chitanda/panda-llama2-13b-chat](https://huggingface.co/chitanda/panda-llama2-13b-chat) |
| Panda-OpenLLaMA-7B | 7B | [https://huggingface.co/chitanda/panda-7b-open-llama-preview-300pt](https://huggingface.co/chitanda/panda-7b-open-llama-preview-300pt) |
不可商用(基于LLaMA1底座微调)
| 模型名称 | 模型大小 | 下载链接 |
| --------------- | ---------- | -------------------------------------------------------- |
| Panda-7B | 7B | https://huggingface.co/chitanda/llama-panda-zh-7b-delta |
| Panda-Instruct-7B | 7B | https://huggingface.co/chitanda/llama-panda-zh-coig-7b-delta |
| Panda-13B | 13B | https://huggingface.co/chitanda/llama-panda-zh-13b-delta |
| Panda-Instruct-13B | 13B | [https://hu
没有合适的资源?快使用搜索试试~ 我知道了~
Panda项目是于2023年5月启动的开源海外中文大语言模型项目
共221个文件
json:85个
py:74个
yaml:54个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 139 浏览量
2024-03-14
22:57:03
上传
评论
收藏 1.7MB ZIP 举报
温馨提示
Panda项目是于2023年5月启动的开源海外中文大语言模型项目,致力于大模型时代探索整个技术栈,旨在推动中文自然语言处理领域的创新和合作。.zip
资源推荐
资源详情
资源评论
收起资源包目录
Panda项目是于2023年5月启动的开源海外中文大语言模型项目 (221个子文件)
.gitignore 2KB
unify_format.ipynb 20KB
tokenizer.json 2.02MB
pytorch_model.bin.index.json 23KB
partition_100.json 7KB
partition_300.json 7KB
partition_200.json 7KB
partition_1000.json 6KB
partition_400.json 6KB
partition_700.json 6KB
partition_500.json 6KB
partition_600.json 6KB
partition_300.json 6KB
partition_100.json 6KB
partition_800.json 6KB
partition_200.json 6KB
partition_900.json 6KB
partition_400.json 5KB
partition_550.json 3KB
partition_600.json 3KB
partition_450.json 3KB
partition_500.json 3KB
partition_800.json 3KB
partition_400.json 3KB
partition_150.json 3KB
partition_100.json 3KB
partition_300.json 3KB
partition_1000.json 3KB
partition_750.json 3KB
partition_50.json 3KB
partition_350.json 3KB
partition_200.json 3KB
partition_850.json 3KB
partition_950.json 3KB
partition_700.json 3KB
partition_650.json 3KB
partition_900.json 3KB
partition_250.json 3KB
partition_700.json 2KB
partition_100.json 2KB
partition_1000.json 2KB
partition_225.json 2KB
partition_725.json 2KB
partition_800.json 2KB
partition_625.json 2KB
partition_325.json 2KB
partition_600.json 2KB
partition_975.json 2KB
partition_525.json 2KB
partition_400.json 2KB
partition_150.json 2KB
partition_300.json 2KB
partition_550.json 2KB
partition_450.json 2KB
partition_850.json 2KB
partition_175.json 2KB
partition_825.json 2KB
partition_925.json 2KB
partition_650.json 2KB
partition_475.json 2KB
partition_25.json 2KB
partition_500.json 2KB
partition_750.json 2KB
partition_50.json 2KB
partition_275.json 2KB
partition_675.json 2KB
partition_950.json 2KB
partition_900.json 2KB
partition_125.json 2KB
partition_375.json 2KB
partition_425.json 2KB
partition_200.json 2KB
partition_775.json 2KB
partition_575.json 2KB
partition_250.json 2KB
partition_875.json 2KB
partition_75.json 2KB
partition_350.json 2KB
partition_1025.json 2KB
partition_1050.json 2KB
partition_1100.json 2KB
file_samples_50.json 1KB
config.json 1KB
partition_000.json 298B
tokenizer_config.json 237B
special_tokens_map.json 99B
generation_config.json 91B
Readme.md 38KB
README.md 12KB
LICENSE.md 11KB
panda_logo.PNG 813KB
roberta.py 59KB
llama.py 43KB
flash_attn_triton.py 28KB
hf_prefixlm_converter.py 27KB
trainer_base_fsdp_mul.py 22KB
evaluator.py 21KB
trainer_base_ds_mp_aws.py 20KB
modeling_mpt.py 20KB
trainer_base_ds_mul_aws.py 19KB
共 221 条
- 1
- 2
- 3
资源评论
极致人生-010
- 粉丝: 3254
- 资源: 3077
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- mc.as
- 618家具社群团购清单.xlsx
- Javascript的鼠标手势
- hdmi in视频采集,输出到hdmi out, 支持HDMI指令控制,支持TFTP远程下载图片
- 批量word文件内容替换工具1.0 (批量实现多个 Word 文档文件文字替换利器).exe
- Cartoon GUI Pack 1.2.zip
- 我分享个魔兽内存修改器
- Python毕业设计基于Django的网易云数据分析可视化大屏系统的设计与实现+使用说明+全部资料(优秀项目).zip
- mp3 idv2,idv1,frame分析工具
- 鹈鹕优化算法POA MATLAB源码, 应用案例为函数极值求解以及优化svm进行分类,代码注释详细,可结合自身需求进行应用
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功