# 动手学大模型应用开发
## 项目简介
本项目是一个面向小白开发者的大模型应用开发教程,旨在结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:
1. 大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,针对小白开发者的简单介绍;
2. 如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;
3. 大模型开发流程及架构,大模型应用开发的基本流程、一般思想和本项目的架构分析;
4. 数据库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建;
5. Prompt 设计,如何设计 Prompt 来让大模型完成特定任务,Prompt Engineering 的原则和技巧有哪些;
6. 验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么;
7. 前后端开发,如何使用 Gradio、FastAPI 等框架快速开发大模型 Demo,展示应用能力。
**目录结构说明:**
notebook:教程源码,可运行的 Notebook,更新频率最高,更新速度最快。
docs:在线阅读版本,基于 notebook 源码订正。
figures:图片文件。
project:个人知识库助手项目代码。
## 立项理由
LLM 正逐步成为信息世界的新革命力量,其通过强大的自然语言理解、自然语言生成能力,为开发者提供了新的、更强大的应用开发选择。随着国内外井喷式的 LLM API 服务开放,如何基于 LLM API 快速、便捷地开发具备更强能力、集成 LLM 的应用,开始成为开发者的一项重要技能。
目前,关于 LLM 的介绍以及零散的 LLM 开发技能课程已有不少,但质量参差不齐,且没有很好地整合,开发者需要搜索大量教程并阅读大量相关性不强、必要性较低的内容,才能初步掌握大模型开发的必备技能,学习效率低,学习门槛也较高。
本项目从实践出发,结合最常见、通用的个人知识库助手项目,深入浅出逐步拆解 LLM 开发的一般流程、步骤,旨在帮助没有算法基础的小白通过一个课程完成大模型开发的基础入门。同时,我们也对项目本身做了清晰、全面的逐层规划及封装,实现了不同 LLM API 到项目的统一整合,帮助开发者能够自由、统一调用不同 LLM,充分降低学习门槛。
## 项目受众
所有具备基础 Python 能力,想要掌握 LLM 应用开发技能的开发者。
本项目对学习者的人工智能基础、算法基础没有任何要求,仅需要掌握基本 Python 语法、掌握初级 Python 开发技能即可。
本项目对本地硬件基本没有要求,不需要 GPU 环境,个人电脑及服务器均可用于学习。
## 项目亮点
1. 充分面向实践,动手学习大模型开发。相较于其他从理论入手、与实践代差较大的类似教程,本教程基于具有通用性的个人知识库助手项目打造,将普适的大模型开发理念融合在项目实践中,帮助学习者通过动手搭建个人项目来掌握大模型开发技能。
2. 从零开始,全面又简短的大模型教程。本项目针对个人知识库助手项目,对相关大模型开发理论、概念和基本技能进行了项目主导的重构,删去不需要理解的底层原理和算法细节,涵盖所有大模型开发的核心技能。教程整体时长在数小时之内,但学习完本教程,可以掌握基础大模型开发的所有核心技能。
3. 兼具统一性与拓展性。本项目对 GPT、百度文心、讯飞星火、智谱GLM 等国内外主要 LLM API 进行了统一封装,支持一键调用不同的 LLM,帮助开发者将更多的精力放在学习应用与模型本身的优化上,而不需要花时间在繁琐的调用细节上;同时,本教程拟上线 [奇想星球 | AIGC共创社区平台](https://1aigc.cn/),支持学习者自定义项目为本教程增加拓展内容,具备充分的拓展性。
## 项目规划
### 时间规划
2023.10.01~2023.10.22 完成初稿
2023.10.23~10.31 内测
2023.11.01 开放公测
2023.11.15 正式上线
### 示例
正在开发仓库:https://github.com/logan-zou/Tutorial_for_developing_LLM_application
### 内容大纲及对应负责人
**目录:**
第一章 大模型简介 @徐虎
1. 什么是大模型
2. 大模型的能力、特点
3. 常见大模型
4. 什么是 LangChain
第二章 调用大模型 API @邹雨衡
1. 基本概念
2. 调用 ChatGPT
3. 调用百度文心
4. 调用讯飞星火
5. 调用智谱GLM
6. 总结
第三章 大模型开发流程及架构 @邹雨衡
1. 大模型一般开发流程简介
2. 个人知识库助手项目流程简析
第四章 数据库搭建 @高立业
1. 知识库文档处理
2. 向量数据库简介及使用
3. 构建项目数据库
第五章 Prompt 设计 @徐虎
1. Prompt 设计的原则及技巧
2. 基于问答助手的 Prompt 构建
3. 添加历史对话功能
第六章 验证迭代 @邹雨衡
1. 验证迭代的一般思路
2. 解决 Bad Case
3. 大模型评估方法
第七章 前后端搭建 @高立业
1. Gradio 简介与页面搭建
2. FastAPI 进行前后端分离
第八章 总结及拓展 @邹雨衡
## 项目负责人
邹雨衡
微信:Logan12120421
Github主页:https://github.com/logan-zou
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸! 个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸! 个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸! 个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸! 个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸! 个人深耕AI大模型应用领域积累的成果,希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题,欢迎详聊,能为您解决问题是我的荣幸!
资源推荐
资源详情
资源评论
收起资源包目录
《AI大模型应用》-一个面向小白的大模型应用开发课程.zip (226个子文件)
index_0a21ea39-d07d-45a7-80e3-a7e68cca4cb8.bin 6.72MB
index_1c24e063-9da4-403a-9153-f6b210c294d6.bin 307KB
.env 279B
.env 63B
.env 63B
index.html 2KB
3. 大模型评估方法-checkpoint.ipynb 45KB
3. 大模型评估方法.ipynb 45KB
1. Gradio 的介绍与前端界面的搭建-checkpoint.ipynb 45KB
1. 知识库文档处理.ipynb 37KB
2. 解决Bad Case.ipynb 34KB
2. 解决Bad Case-checkpoint.ipynb 34KB
1. Gradio 的介绍与前端界面的搭建.ipynb 33KB
1. 知识库文档处理-checkpoint.ipynb 32KB
1.Prompt 设计的原则和技巧-checkpoint.ipynb 28KB
1.Prompt 设计的原则和技巧.ipynb 28KB
2. 向量数据库的介绍及使用.ipynb 22KB
2. 向量数据库的介绍及使用-checkpoint.ipynb 20KB
2. 调用ChatGPT-checkpoint.ipynb 16KB
2. 调用ChatGPT.ipynb 16KB
3. 调用百度文心-checkpoint.ipynb 14KB
3. 调用百度文心.ipynb 14KB
2.基于问答助⼿的 Prompt 构建.ipynb 14KB
2.基于问答助⼿的 Prompt 构建-checkpoint.ipynb 14KB
5. 调用智谱 AI(ChatGLM)-checkpoint.ipynb 12KB
附2.将大模型 API 封装成本地 API-checkpoint.ipynb 11KB
附2.将大模型 API 封装成本地 API.ipynb 11KB
6. 调用智谱 AI(ChatGLM)生成 embedding-checkpoint.ipynb 10KB
5. 调用智谱 AI(ChatGLM).ipynb 10KB
附3.LangChain 自定义 LLM embedding-checkpoint.ipynb 10KB
附3.LangChain 自定义 LLM embedding.ipynb 10KB
6. 调用智谱 AI(ChatGLM)生成 embedding.ipynb 9KB
4. 调用讯飞星火-checkpoint.ipynb 9KB
4. 调用讯飞星火.ipynb 9KB
附1.LangChain自定义 LLM-checkpoint.ipynb 8KB
附1.LangChain自定义 LLM.ipynb 8KB
test.ipynb 7KB
3.添加历史对话的记忆功能.ipynb 7KB
3.添加历史对话的记忆功能-checkpoint.ipynb 7KB
2. fast api 进行前后端分离.ipynb 5KB
3. 构建项目数据库-checkpoint.ipynb 5KB
3. 构建项目数据库.ipynb 5KB
2. fast api 进行前后端分离-checkpoint.ipynb 4KB
structure.jpg 112KB
structure.jpg 112KB
强化学习入门指南.json 159KB
3. 大模型评估方法.md 37KB
2. 提示原则 Guidelines.md 37KB
6. 文本转换 Transforming.md 31KB
3. 迭代优化 Iterative.md 31KB
1. 知识库文档处理.md 27KB
2. 解决Bad Case.md 27KB
1. Gradio 的介绍与前端界面的搭建.md 21KB
1.Prompt 设计的原则和技巧.md 21KB
3. 常⻅⼤模型.md 18KB
3. 常⻅⼤模型.md 18KB
5. 推断 Inferring.md 18KB
8. 聊天机器人 Chatbot.md 17KB
4. 文本概括 Summarizing.md 17KB
7. 文本扩展 Expanding.md 16KB
2. 向量数据库的介绍及使用.md 15KB
4. 什么是 LangChain.md 11KB
4. 什么是 LangChain.md 11KB
2. 调用ChatGPT.md 11KB
3. 调用百度文心.md 10KB
2.基于问答助⼿的 Prompt 构建.md 8KB
1. 基本概念.md 7KB
1. 基本概念.md 7KB
附2.将大模型 API 封装成本地 API.md 7KB
1. 大模型开发流程.md 7KB
1. 大模型开发流程.md 7KB
附3.LangChain 自定义 LLM embedding.md 7KB
2. ⼤模型的能⼒、特点.md 6KB
2. ⼤模型的能⼒和特点.md 6KB
附1.LangChain自定义 LLM.md 6KB
5. 调用智谱 AI(ChatGLM).md 6KB
README.md 6KB
README.md 6KB
4. 调用讯飞星火.md 5KB
3. 项目架构简析.md 5KB
3. 项目架构简析.md 5KB
6. 调用智谱 AI(ChatGLM)生成 embedding.md 5KB
1. 简介 Introduction.md 4KB
3.添加历史对话的记忆功能.md 4KB
2. 项目流程简析.md 4KB
2. 项目流程简析.md 4KB
1. 什么是⼤模型.md 4KB
1. 什么是⼤模型.md 4KB
1. 验证迭代的一般思路.md 3KB
1. 验证迭代的一般思路.md 3KB
2. fast api 进行前后端分离.md 3KB
3. 构建项目数据库.md 3KB
_sidebar.md 2KB
9. 总结 Summary.md 1KB
7. 总结.md 867B
7. 总结.md 867B
readme.md 33B
readme.md 23B
强化学习入门指南.mp4 34.08MB
.nojekyll 0B
共 226 条
- 1
- 2
- 3
资源评论
季风泯灭的季节
- 粉丝: 1902
- 资源: 3370
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功