没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业研究
行业报告
杭电小哥抢先搞定GPT读图功能,单卡就能实现新SOTA|CVPR 2023
精选学习资源,大学生必学!
杭电小哥抢先搞定GPT读图功能,单卡就能实现新SOTA|CVPR 2023
共1个文件
docx:1个
语言模型
毕业设计
人工智能
需积分: 0
5 下载量
79 浏览量
更新于2023-03-30
1
收藏
3.01MB
ZIP
举报
能读图的GPT-4震撼发布了!但要用它还得排队。。。 不如先试试这个~ 加上一个小模型,就能让ChatGPT、GPT-3这类目前只能理解文本的大语言模型轻松读图,各种刁钻的细节问题都能手拿把掐。 并且训练这个小模型单卡(一块RTX 3090)就能搞定。 效果呢,直接看图。 比如说,给训练后的GPT-3输入一张“音乐现场”的图片,问它:现场在举办什么活动? 毫不迟疑,GPT-3给出了音乐会的答案。 再来加点难度,再给GPT-3酱紫的一张照片,让它来分辨照片中的帘子是什么类型的材质。 GPT-3:蕾丝。 Bingo!(看来是有点儿东西在身上的) 这个方法呢,是杭州电子科技大学和合肥工业大学的一个团队的最新成果:Prophet,半年前他们就已经着手进行这项工作。 论文一作是杭电研究生邵镇炜,他在1岁那年被诊断患有“进行性脊肌萎缩症”,高考时遗憾与浙大擦肩,选择了离家近的杭州电子科技大学。 目前该论文已经被CVPR2023接收。 跨模态任务上达到新SOTA 话不多说,直接来看在Prophet这种方法的加持下GPT-3的读图能力。 我们先来看看它在数据集上的测试结果。 研究团队在两个基于外
收起资源包目录
杭电小哥抢先搞定GPT读图功能,单卡就能实现新SOTA|CVPR 2023.zip
(1个子文件)
杭电小哥抢先搞定GPT读图功能,单卡就能实现新SOTA|CVPR 2023.docx
3.08MB
共 1 条
1
资源推荐
资源预览
资源评论
我把GPT 的学习轨迹可视化了!竟和人类十分类似 |ACL2023.pdf
2023-08-12 上传
这篇在ACL2023会议上的论文对比了人类儿童和GPT模型的语言习得过程,发现它们遵循相似的顺序模式,即从简单的语言结构逐渐过渡到复杂的句法结构。 描述中提到,人类儿童的语言学习通常经历三个阶段:首先,他们发出...
我把GPT 的学习轨迹可视化了!竟和人类十分类似 |ACL2023.
2023-10-13 上传
在ACL2023大会上,一项引人注目的研究展示了GPT模型的学习轨迹可视化结果,揭示了其训练过程中的知识习得与人类学习的惊人相似性。这项工作聚焦于人工智能生成内容(AIGC)领域,它对于理解深度学习模型的工作机制...
2023最新ChatGPT商业运营网站系统源码+ChatGPT4.0+支持ai绘画+GPT联网功能+插件功能+Prompt角
2023-07-11 上传
程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 API绘画、插件功能、新增GPT联网功能(2023年7月1日更新)、GPT回答语音播放功能、GPT聊天记录分享 (快照链接)、绘画广场功能、Prompt功能,后台自定义添加,用户也...
基于python的GPT2中文文本生成模型项目实现
5星 · 资源好评率100%
101 浏览量
在本项目中,我们将深入探讨如何使用Python编程语言来实现基于GPT-2的中文文本生成模型。GPT-2(Generative Pre-trained Transformer 2)是由OpenAI开发的一个强大的预训练语言模型,它能够根据输入的文本自动生成...
震惊!外国小哥用ChatGPT完成80%工作,同时打4份工
2023-04-28 上传
国外小哥Ben就表示,一个ChatGPT就能完成我本职工作80%的内容。剩下的精力接着薅GPT的羊毛,搞兼职。 Ben说,「现在GPT-4又来了,工作完成起来更得心应手了。」 这种一人打多份工的现象,被概括为过度就业...
如何全面了解ChatGPT背后的技术与影响? 40页最新《GPT- 技术、潜在应用、新挑战和未来方向》综述 .pdf
2023-05-26 上传
GENERATIVE PRE-TRAINED TRANSFORMER(GPT):A COMPREHENSIVE REVIEW ON ENABLING TECHNOLOGIES, POTENTIAL APPLICATIONS, EMERGING CHALLENGES, AND FUTURE DIRECTIONS chatGPT自然语言处理的技术架构 从技术...
一文搞定GPT学习之路
2023-05-22 上传
2022年,OpenAI推出了ChatGPT,这是基于GPT-3的对话机器人,功能更为完善。ChatGPT不仅能够进行日常对话,还能理解和生成各种文本,如读后感、翻译等,几乎能覆盖所有领域的问题。它的出现迅速引起了广泛关注,人们...
当 GPT 遇上低代码,Power Platform 新功能来了!
105 浏览量
在 Power Platform 2023 年度的第一次功能更新中,Power Automate、Power Apps、Power Pages 和 Power Virtual Agents 在应用细节及功能方面进行了进一步丰富,以下将为您分享本次更新中加入的七大亮点功能,其中...
ChatGPT新逆天功能曝光!GPT-4迎来AGI历史性时刻!
105 浏览量
北美时间 4 月 20 日,Open AI 联合创始人 Greg Brockman 受邀出席“2023TED”大会,并在现场分享了多个 ChatGPT Plus(GPT-4)未发布的新功能和插件。 根据 Greg 现场演示视频来看,GPT-4 已经具备了跨业务流程、...
Python-GPT2训练的一个实现支持GPUs和TPUs
190 浏览量
在这个项目中,开发者已经考虑到了这一点,并且实现了在GPU和TPU上运行GPT-2训练的功能,这使得训练过程可以更高效地进行。 首先,关于GPU训练,GPU因其并行计算能力而被广泛用于深度学习模型的训练。NVIDIA的CUDA...
GPT-4上传照片视频一键解读
2023-03-21 上传
GPT-4刚发布,就已经有手机应用接入了! 只需要上传图像,再用语音提出需求,GPT-4就能...只需要给GPT-4看眼物品描述、甚至只是物体形状,它就能搜索并输出这个产品的功能、具体说明和使用方法。 再例如公众场合导航。
最新AI创作系统ChatGPT网站源码V5.1.2+新增GPT联网功能+支持GPT4+支持ai绘画+实时语音识别输入
102 浏览量
最新AI创作系统ChatGPT网站源码V5.1.2+新增GPT联网功能+支持GPT4+支持ai绘画+实时语音识别输入. 新增GPT联网功能和Midjourney绘画,正版授权永久更新,前端UI可二次开发! 1、第一步,系统说明 AI创作系统 1.1 提问...
GPT2-基于Pytorch实现GPT2文本生成大模型算法-附项目源码-优质项目实战.zip
2024-10-20 上传
GPT2_基于Pytorch实现GPT2文本生成大模型算法_附项目源码_优质项目实战
GPT2_for_Chinese_chitchat用于中文闲聊的GPT2模型
129 浏览量
GPT2_for_Chinese_chitchat用于中文闲聊的GPT2模型(实现了DialoGP_GPT2-chitchat
击败GPT3,刷新50个SOTA!谷歌全面统一NLP范式.rar
2023-10-18 上传
CV代表计算机视觉,虽然与NLP直接关联不大,但可能表明这项新技术能与其他AI领域交叉融合,实现更复杂的任务,如图文生成或者视觉问答。 AI和深度学习是当今技术的核心,NLP的进步往往伴随着深度学习模型的创新。...
OpenAI ChatGPT实现GPT联网功能python代码.docx
5星 · 资源好评率100%
119 浏览量
OpenAI ChatGPT实现GPT联网功能python代码
最新AI创作系统ChatGPT程序源码+支持Ai绘画+GPT4+GPT联网功能+知识库+思维导图生成+MJ以图生图
2023-08-13 上传
最新AI创作系统ChatGPT程序源码+支持Ai绘画+GPT4+GPT联网功能+知识库+思维导图生成+MJ以图生图 本系统使用Nestjs和Vue3框架技术,持续集成AI能力到本AIGC系统! 二、部署搭建教程 2.1安装环境: Nginx >= 1.19.8 ...
GPT-4究竟能做什么
2023-03-19 上传
作为GPT系列的升级版,GPT-4不仅在性能上有着显著的提升,还在功能多样性和应用范围上有了更大的突破。本文将深入探讨GPT-4的能力与潜在应用。 首先,GPT-4在自然语言处理(NLP)任务上的表现将达到前所未有的高度...
GPT是什么?GPT能帮助你做什么?如何使用GPT?
2023-04-07 上传
GPT是划时代的产品,可以极大地提升知识工作者学习和工作的效率。本文是一个GPT的科普,所有答案基本上都来自于GPT;最后分享了一些我的用法。 零、GPT的工作原理 略。这一块我不懂,相关论文还没有阅读,但这一块...
DB-GPT数据库大语言模型
189 浏览量
DB-GPT数据库大语言模型是近年来在人工智能领域中一个创新性的技术成果,它结合了数据库技术和大语言模型的优势,旨在提升数据库查询效率、理解和生成能力。这个模型的主要目标是理解和生成与数据库相关的复杂查询,...
Qt C++实现的基于GPT 语言模型的聊天系统,支持输入输出文本处理插件包含源码
2024-09-20 上传
对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同...
聊天 GPT 4 有什么新功能?发现 Chat GPT 4 的最新功能 - 从图像处理到Acing Tests
2023-04-26 上传
该公司一直对其新语言模型的功能赞不绝口,吹嘘它比以前的任何版本都更具协作性和想象力。 抓住你的帽子,乡亲们!这是个大新闻——GPT 4 改变了游戏规则。虽然其前身,基于 GPT 3.5 的 ChatGPT 只能接受文本输入,...
GPT-GPT2训练的实现-支持TPU-附项目源码-优质项目实战.zip
2024-05-17 上传
在本项目中,我们将深入探讨如何实现GPT和GPT2模型的训练,并且这个实现是针对TPU(Tensor Processing Unit)优化的。这是一份高质量的实战项目,旨在帮助开发者掌握深度学习模型的训练技巧,特别是对于大规模语言...
基于 GPT3 的多乐器MIDI音乐AI实现_python_Jupyter_代码_下载
5星 · 资源好评率100%
基于SOTA GPT3 的多乐器 MIDI 音乐 AI 实现 现在采用 TMIDIX 改进了 MuseNet 多乐器 TXT 编码的再现 原始基线性能音乐 AI 实现:Optimus-VIRTOOSO 这是一种自回归实现(基于字符的方法),有其优点但也有缺点。然而...
2024最新版ChatGPT网站源码+支持ai绘画+GPT4.0+AI绘画+TTS实时语音识别输入+用户会员套餐+管理后台
147 浏览量
该系统兼容OpenAI-GPT全模型及国内所有AI模型,具备GPT-4大模型支持、联网提问、DALL-E3文本生成图像、GPT4-All联网搜索模型、思维导图、会员套餐、分销系统以及Midjourney绘画动态全功能等,提供AI换脸、图像混合、...
基于python的GPT2中文摘要生成模型代码实现
5星 · 资源好评率100%
在本项目中,我们将深入探讨如何使用Python编程语言来实现GPT-2模型进行中文文本摘要。GPT-2(Generative Pre-trained Transformer 2)是OpenAI开发的一个大型语言模型,它能根据输入的上下文自动生成连贯、高质量的...
gpt2w.rar_GPT2w_GPT2w_5_et2w_对流层_对流层延迟
5星 · 资源好评率100%
标题中的“gpt2w.rar_GPT2w_GPT2w_5_et2w_对流层_对流层延迟”暗示这是一个与GPT2w模型相关的项目,可能包含了特定的版本(GPT2w_5)以及与电离层和对流层延迟计算有关的代码或数据。GPT2w模型,全称为Global ...
小型GPT模型:用300行PyTorch代码实现的小型GPT语言模型库
2023-11-29 上传
特斯拉AI总监Andrej Karpathy用300行PyTorch代码实现的小型GPT语言模型库,适用于自然语言生成和文本分类任务。
34个经典javaweb项目实例.zip
106 浏览量
34个项目实例(含源码),可用于毕业设计以及学习,欢迎下载
项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计
2023-10-30 上传
项目源码:基于Hadoop+Spark招聘推荐可视化系统 大数据项目 计算机毕业设计 基于Hadoop+Spark的招聘推荐可视化系统是一种利用Hadoop和Spark等大数据处理技术,实现招聘推荐和可视化展示的应用系统。以下是该系统的主要介绍: 数据采集:系统通过各种渠道(如招聘网站、社交媒体等)获取大量的招聘相关数据,包括职位信息、公司信息、求职者信息等。这些数据以结构化或半结构化形式存在
能读图的
GPT-4
震撼发布了!但要用它还得排队。。。
不如先试试这个~
加上一
个小模型
,就能
让
ChatGPT
、
GPT-3
这类目前只能
理解文
本的
大语言模型轻松
读图
,各种
刁钻的
细节问题
都能手拿把掐。
并且训练这个小模型
单卡
(一块
RTX 3090
)就能搞定。
效果呢,直接看图。
比如说,给训练后的
GPT-3
输入一张
“
音乐现场
”
的图片,问它
:
现场在
举办什么活动?
毫不迟疑,
GPT-3
给出了
音乐会
的答案。
再来
加点
难
度,
再给
GPT-3
酱紫的
一张
照片
,
让它
来分
辨
照片
中
的帘
子是什么类型的材质。
GPT-3
:
蕾丝
。
Bingo
!(看来是有点儿东西在身上的)
这个方法呢,
是杭州电子科技大学和合肥工业大学的一个团队的最新成
果:
Prophet
,半年前他们就已经着手进行这项工作。
论文
一作
是
杭电
研究
生
邵镇
炜,
他
在
1
岁
那年
被
诊断
患有
“
进
行
性脊
肌
萎缩症
”
,
高考时遗憾与浙大擦肩,
选择了离家近的杭州电子科技大学。
目前该论文已经被
CVPR2023
接收。
跨模态任务上达到新
SOTA
话不多说,
直接来看在
Prophet
这种方法的加持下
GPT-3
的读图能力。
我们先来看看它在数据集上的测试结果。
研
究
团
队
在
两
个
基
于
外
部
知
识
的
视
觉
问
答
数
据
集
OK-VQA
和
A-OKVQA
测试了
Prophet
,均创造了
新
SOTA
。
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
a_juvenile
粉丝: 30
资源:
854
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
形状分类31-YOLO(v5至v11)、COCO、CreateML、Darknet、Paligemma、VOC数据集合集.rar
常见排序算法概述及其性能比较
前端开发中的JS快速排序算法原理及实现方法
基于Java的环境保护与宣传网站论文.doc
基于8086的电子琴程序Proteus仿真
基于java的二手车交易网站的设计和实现论文.doc
纯真IP库,用于ip查询地址使用的数据库文件
基于javaweb的动漫网站管理系统毕业设计论文.doc
废物垃圾检测28-YOLO(v5至v11)、COCO、CreateML、Paligemma、TFRecord、VOC数据集合集.rar
探索CSDN博客数据:使用Python爬虫技术
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功