
爆红出圈的 AI 聊天机器人 chat GBT 背后的研究实验室 OpenAI,正在以收购邀约的
形式出售现有股份,估值高达 290 亿美元,在没有收入和利润的情况下,成为最值
钱的美国出场公司之一。我们认为这一个事件可能是 AI 时代资本定价的一个标杆事
件,商业价值已经获得了全球资本的高度认可。
Q:拓尔思公司发展的背景和场景应用?
A:公司曾于 1993 年成立是全球的中文检索的创始者,公司成立之初,主要的技术方
向围绕着中文全文检索,第一批用户主要是媒体用户。 1997 年获得过国家科技进步
二等奖,电子部科技进步一等奖。2000 年到 2011 年阶段,公司核心技术是基于检
索技术,开发智能内容的管理。2007 年我们启动了核高机的非结构化数据系统的研究
专项。
拓尔思是作为第一家大数据公司上市 A 股,公司持续在自然语言处理技术上做研究。
语音智能是公司的核心技术的发展场景。NLP 自然语言处理的技术在各个场景中的应
用上,我们不断进行深入的拓展。治安语言处理在整个搜索引擎、智能客服,舆情分
析还有内容处理方面。通过持续的打造,形成了我们每个板块深度应用场景,同时打
造了一批属于公司专属的软件平台,这一块是我们业务收入的增长,基于我们对各个
场景应用的熟悉,为用户输出了大量的、有时效的应用效果。
拓尔思公司所有的人工智能应用来自于公司对各种算法模型的积累。在 A 股市场横向
比较,在诸多的公司里,我们真正掌握了大量数据资产。2000 多台服务器分布在全国
的三个数据中心,每天日增 1 亿条的开源的互联网的数据,公司已经积累了将近 1300
亿条的开源的数据资产。因为有了数据资产,我们才能做各种各样的训练模型,才能
够积累算法。
公司已经积累了 300 种以上的算法,并且对每个场景,如知识图谱的展现、知识库
的建立档案、包括前期数据采集、数据的标引,关于数据要素的环节,我们都有自己
以完全知识产权的软件平台。搜索引擎是公司自然语言处理的核心应用技术,公司 30