没有合适的资源?快使用搜索试试~ 我知道了~
ChatGPT学习笔记.pdf
需积分: 1 25 下载量 79 浏览量
2023-02-15
16:06:06
上传
评论
收藏 449KB PDF 举报
温馨提示
试读
11页
chatGPT学习笔记.pdf
资源推荐
资源详情
资源评论
爆红出圈的 AI 聊天机器人 chat GBT 背后的研究实验室 OpenAI,正在以收购邀约的
形式出售现有股份,估值高达 290 亿美元,在没有收入和利润的情况下,成为最值
钱的美国出场公司之一。我们认为这一个事件可能是 AI 时代资本定价的一个标杆事
件,商业价值已经获得了全球资本的高度认可。
Q:拓尔思公司发展的背景和场景应用?
A:公司曾于 1993 年成立是全球的中文检索的创始者,公司成立之初,主要的技术方
向围绕着中文全文检索,第一批用户主要是媒体用户。 1997 年获得过国家科技进步
二等奖,电子部科技进步一等奖。2000 年到 2011 年阶段,公司核心技术是基于检
索技术,开发智能内容的管理。2007 年我们启动了核高机的非结构化数据系统的研究
专项。
拓尔思是作为第一家大数据公司上市 A 股,公司持续在自然语言处理技术上做研究。
语音智能是公司的核心技术的发展场景。NLP 自然语言处理的技术在各个场景中的应
用上,我们不断进行深入的拓展。治安语言处理在整个搜索引擎、智能客服,舆情分
析还有内容处理方面。通过持续的打造,形成了我们每个板块深度应用场景,同时打
造了一批属于公司专属的软件平台,这一块是我们业务收入的增长,基于我们对各个
场景应用的熟悉,为用户输出了大量的、有时效的应用效果。
拓尔思公司所有的人工智能应用来自于公司对各种算法模型的积累。在 A 股市场横向
比较,在诸多的公司里,我们真正掌握了大量数据资产。2000 多台服务器分布在全国
的三个数据中心,每天日增 1 亿条的开源的互联网的数据,公司已经积累了将近 1300
亿条的开源的数据资产。因为有了数据资产,我们才能做各种各样的训练模型,才能
够积累算法。
公司已经积累了 300 种以上的算法,并且对每个场景,如知识图谱的展现、知识库
的建立档案、包括前期数据采集、数据的标引,关于数据要素的环节,我们都有自己
以完全知识产权的软件平台。搜索引擎是公司自然语言处理的核心应用技术,公司 30
免费入群每日获取资料:请添加:weini9992
年以来坚持这方面的积累。在全国大量企业级的搜索都在用 ELSG 的设计 spark 开源
软件的时候,公司完全做到了自主可控,应用到政府、金融,包括媒体等诸多行业。
公司数字经济研究院目前主要研究方向是人机对话,公司近几年在智能问答,围绕着
像中国中医科学院的中医中文问答,中国标准化研究院的国家标准的问答,人民卫星
出版社的小 a 机器人,时代经济出版社的审计问答、吉林政务的小机智能机器人等。
除此之外,公司围绕着知识图谱事件分析,包括机器人自动写作、智能内容创作,我
们都有多个成功的案例。
公司研究人员对于整个 OpenAI 过去、现在和未来进研究。结合公司的技术沉淀的事
实和对场景应用研究,未来的展望,我们做了系统的梳理。ChatGPT 引领了数字劳动
力时代,它将是生产力的第五次革命,在新的一经济时代,用工模式将会快速演变。
目前人员用工模式有全职员工、外包员工、兼职员工三大传统的用工模式。现在出现
了第四种用工模式,即数字化的劳动力,打破了人与机器的边界,依托人工智能技
术,包括 NLP 相关技术,自主完成或者协助人类完成各种工作,比如前端对客或者员
工文案的工作等。或者中后台运营协同的等工作。在传统劳动力跟数字劳动力的结合
下,通过 NLP 技术赋能,让传统劳动力爆发出更高效增长力。根据麦肯锡统计到
2030 年,数字化,劳动力市场规模可以达到 1.73 万亿水平。chat GPT 的火爆,加
速推动这个事件。
劳动数字化全面转变核心在于劳动力它的大脑、认知能力跟分析能力决定了数字劳动
力是否能够准确的理解人类的任务指令,是否能够高效准确完成任务。chatGPT 基于
人类反馈的强化学习,经过千亿规模的模拟训练,能够有非常好的模型表现,可以融
合世界的知识跟规则,使得认知能力跟沟通能力能够取得接近人的水平。chatGPT 的
火爆将增强大众对于对话式的 AI 的信心。我们会有更多的研究来加入行列,推动整
个对话式的 AI 的发展。
对话式 AI 方向大概分成四类,一类是信息查询类的,用户可查询企业相关信息,相当
于我数字化劳动力能够替代枯燥重复性的劳动。另一类是专家咨询类,相当于数字劳
动力能够替代部分或者扩充资源稀缺的劳动力。数字化劳动力需要大脑赋能。第三类
是助手类,数字化劳动能够帮助人类去完成任务,帮订机票,帮预定会议等。相当于
数字化劳动力能够帮助人类高效完成某些任务的动作。第四类是交流类的,数字化劳
动力能够满足人类情感交流的需求,情感的陪伴,或者闲聊的场景等。在第一个场景
精力查询类应用的比较多,比如智能客服机器人,零售,电商银行等售前信息的查
询,是通过数字化劳动力去替代重复枯燥的人类的活动,是降本增效。
专家咨询类是 NLP,加上世界知识,行业知识,为企业打造企业咨询。比如在法律咨
询市场,根据司法部数据显示,全国办理各类的法律事务事件大概是 1300,相当于我
们涉及到诉讼或者是非诉讼的大概 1300 万件。按照中国的律师平均费率是大概一个
小时 2788,每个案件平均服务时长十小时来算,整个法律的咨询的总体市场规模达到
3600 个亿。
我们要把法律相关的知识形成一种企业的大脑,能够对外赋能,涉及到怎么去利用知
识构建复杂的知识体系。第三个场景是助手类,很重要的一点是智能创作,如直播文
案,广告文案的生成,剧本的创作。智能创作整个市场,主要分成几个,数字资讯
类、数字营销类、行政办公类的。
18 年各级的网信办审批的互联网信息、新闻信息服务单位总共有 700 多家。在主要
的门户资讯,微信公众号,总量大概 2100 万,活跃账户有 350 万,每年 SaaS 软件
一年 3000 块,这种报价来算,总体规模在 120 个亿。
数字营销类每年全球的广告支出蛮高的,Emaster 数据显示,18 的全球广告支出高达
6000 多亿美元,使用数字广告占到了 2800 亿美金。行动办公领域是智能创作的重
点挖掘的对象,比如帮你协助,创作,写邮件,写报告等。按照每个用户付费 100,
总体规模达到 530 亿。第四交流类,在游戏行业,元宇宙的 NPC,给养老机提供大
脑。在医疗里行业里头,提供跟老人的情感陪伴,做主动式的问答,做痴呆式的预防
剩余10页未读,继续阅读
资源评论
CITART
- 粉丝: 474
- 资源: 491
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功