4 月 14 日,在刚刚落幕的 GTIC 2023 中国 AIGC 创新峰会上,aiXcoder
(硅心科技)CTO 郝逸洋带来了主题为《大型语言模型(LLM)时代下的代码
生成》的主题演讲。
他谈道,GPT-4 带来了代码生成的新变革,支持更长序列、更多指令号微调、
多模态(图片输入)等操作,展现出更适于泛用的效果,同时也面临不少问题,
包括缺乏相关文件、依赖库及需求文档,以及速度较慢、信息安全威胁等。
实际上,程序生成模型与语言模型有较大区别,比如在交互方式方面,普通
的对话语言模型以问答、续写为主,程序生成模型则需要填空、补全、备份。
郝逸洋称,未来,aiXcoder 将促进模型从百亿级扩展到千亿级,加入大量
自然语言处理+代码的混合数据,针对编程中的各类场景专门构造指令数据集,
从而得到综合性能更好的代码编辑工具。
据悉,aiXcoder(硅心科技)是一家 AI 虚拟编程机器人研发商,旗下有
“aiXcoder 智能编程机器人”,基于深度学习模型,并针对不同的专业领域和
编程语言,能够自动预测程序员的编程意图,向用户推荐即将书写的下一段代码,
进而提升代码的编写效率。
以下为郝逸洋的演讲实录:
各位下午好!
之前的一些环节其实都是在讲一些比较大的、涉及到整个 AI 领域上的一些
事情,接下来我讲的内容可能会比较聚焦一些,重点聚焦在代码这个小领域上。