没有合适的资源?快使用搜索试试~ 我知道了~
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 199 浏览量
2023-08-13
09:03:25
上传
评论
收藏 3.71MB PDF 举报
温馨提示
试读
12页
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天.pdf
资源推荐
资源详情
资源评论
2023/6/28 11:21
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天
https://mp.weixin.qq.com/s/cd7g7l01V5poP41hRt1IPQ
1/12
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑
聊天
文 | 炼 丹 学 徒
近来,AI领域迎来各个领域的大突破,ChatGPT展现出强大的语言问答能力和推理能力,然而
作为一个自然语言模型,它无法处理视觉信息。
与此同时,视觉基础模型如Visual Transformer或者Stable Diffusion等,则展现出强大的视觉
理解和生成能力。
Visual Transformer将ChatGPT作为逻辑处理中心,集成若干视觉基础模型,从而达到如下效
果:
视觉聊天系统Visual ChatGP T可以接收和发送文本和图像
提供复杂的视觉问答,或者视觉编辑指令,可以通过多步推理调用工具来解决复杂视觉
任务
可以提供反馈,总结答案,主动询问模糊的指令等
这个工作开启了ChatGP T借助视觉基础模型作为工具,进行视觉任务处理的研究方向。
论 文 链 接 :
https://arxiv.org/abs/2303.04671
开 源 代 码 :
炼丹学徒 2023-03-10 11:15 发表于北京
原创
夕小瑶科技说
2023/6/28 11:21
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天
https://mp.weixin.qq.com/s/cd7g7l01V5poP41hRt1IPQ
2/12
https://github.com/microsoft/visual-chatgpt
论 文 作 者 :
Chenfei Wu, ShengmingYin, Weizhen Qi, Xiaodong Wang, Zecheng Tang, Nan Duan
机 构 : 微软亚洲研究院
模型效果
2023/6/28 11:21
王炸!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天
https://mp.weixin.qq.com/s/cd7g7l01V5poP41hRt1IPQ
3/12
工作流程
剩余11页未读,继续阅读
资源评论
地理探险家
- 粉丝: 1046
- 资源: 5416
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功