用于金融文本挖掘的多任务学习预训练金融语言模型.docx资源-CSDN文库

版权申诉

198 浏览量 2022-06-10 14:27:10 上传评论收藏 792KB DOCX 举报

资源推荐

资源详情

资源评论

摘要近年来，机器学习，尤其是深度神经网络方法促进了金融文本挖

掘研究的发展，在金融科技领域起着越来越重要的作用如

何从金融大数据中提取有价值的信息已经成为学术界和工业界一个非

常有挑战的研究由于深度神经网络需要大量标注数据，但是金融领域

缺乏训练数据，因此，将深度学习应用于金融大数据挖掘并没有取得

很好效果为了更好地解决该问题，利用自监督学习和多任务学习等深

度学习领域最新的思想和技术，提出了基于  模型架构的开源金

融预训练语言模型  是一种针对特定领域金融文本数

据的预训练语言模型，它通过在大型金融语料库上进行无监督训练得

到基于  架构， 可以有效地自动将知识从金融大数据中

提取出并记忆在模型中，而无需进行特定于金融任务的模型结构修改

从而可以直接将其应用于下游各种金融领域任务，包括股票涨跌预测

金融情绪分类、金融智能客服等在金融关系提取、金融情绪分类、金

融智能问答任务上的大量实验表明了  模型的有效性和鲁棒性

同时， 在这  个有代表性的金融文本挖掘任务上均取得了很

高的模型准确率，进一步验证了模型的性能

关键词 ；金融文本挖掘；多任务学习；预训练；迁移学习；金

融科技

海量的互联网金融信息在金融市场中有着举足轻重的地位对网络

金融文本信息的挖掘工作具有很大的实际价值随着大数据时代的到来，

金融大数据挖掘已成为行业热点趋势面向金融的机器学习技术吸引了

越来越多的关注面对每日产生的数量惊人的金融文本数据，如何从中

提取有价值的信息已经成为学术界和工业界一个非常有挑战的研究如

果我们采取人工的方式来分析这些文本信息并从中获得可行的见解几

乎是一项极其艰巨的任务机器学习技术的进步使金融科技中的金融文

本挖掘模型成为可能但是，在金融文本挖掘任务中，构建有监督训练

数据代价非常高昂，因为这需要使用财务领域的专家知识由于可用于

金融文本挖掘任务的有标签训练数据量很少，因此大多数金融文本挖

掘模型无法直接利用深度学习技术

在本文中，我们创新地提出了  模型，通过利用自监督学习

和多任务学习的深度神经网络方法来解决该问题当前，金融科技中的

金融文本挖掘模型主要是采取基于深度学习的自然语

言处理技术

目前，自然语言处理主要使用基于深度神经网络的技术，其发展

主要有两大里程碑工作  首先是  年提出并不断发展的以

 

!"

为代表的词向量技术，例如  ，# 

!"

等；第

 个里程碑是在 $ 年底由谷歌提出的以 %

&'&'

!"

为典型代表的预训

练语言模型     ' 技术，例如

，()*

!+"

等其中，诸如  ，#  之类的词编码是从

无监督语料库中提取知识的一种方式，已成为自然语言处理的主要进

步之一但是，由于在金融领域中包含了很多专业术语，因此这些简单

剩余28页未读，继续阅读

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3652
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip