没有合适的资源?快使用搜索试试~ 我知道了~
1143710316_乐远_软件学院本科生实习及毕业设计中期报告1
需积分: 0 3 下载量 162 浏览量
2022-08-04
16:21:26
上传
评论
收藏 1.21MB PDF 举报
温馨提示
试读
29页
1. 毕业设计(论文)内容概述 1 2. 中期完成情况说明 8 1. 毕业设计(论文)内容概述
资源详情
资源评论
资源推荐
哈 尔 滨 工 业 大 学
国 家 示 范 性 软 件 学 院
本 科 毕 业 设 计 (论文)中 期 报 告
题 目:基于深度学习的命名实体识别系统设
计与实现
专 业 软件工程
学 生 姓 名 乐远
学 号 1143710316
联 系 方 式 13069875982
年 级 2014 级
实 习 基 地 深圳证券交易所
基地指导教师 许保勋
联 系 方 式 ____13069875982
校内指导教师 郭 勇
联 系 方 式 13030000672
中 检 日 期 2018.03.31
哈尔滨工业大学软件学院
哈尔滨工业大学软件学院本科毕业设计(论文)中期报告
目 录
1. 毕业设计(论文)内容概述 ............................................................................ 1
1.1 项目来源及开发目的和意义 ...................................................................... 1
1.1.1 项目来源 ............................................................................................... 1
1.1.2 项目开发目的和意义 ........................................................................... 1
1.2 主要开发任务 ............................................................................................... 4
1.3 本人所承担任务(模块)说明 .................................................................. 5
1.4 开发环境和开发工具 .................................................................................. 5
1.4.1 开发语言 ............................................................................................... 5
1.4.2 开发工具 ............................................................................................... 6
1.4.3 开发环境 ............................................................................................... 6
1.5 项目原定进度安排 ...................................................................................... 7
2. 中期完成情况说明 ............................................................................................ 8
2.1 预定计划的执行情况 .................................................................................. 8
2.2 中期工作说明及成果汇报 .......................................................................... 8
2.2.1 系统详细设计 ....................................................................................... 8
2.2.2 系统算法详细设计 ............................................................................. 10
2.2.3 系统实现与结果 ................................................................................. 15
2.3 存在的困难与问题 .................................................................................... 24
2.4 如期完成预定任务的可能性分析 ............................................................ 24
2.5 后期工作安排(或进度和计划调整) .................................................... 25
哈尔滨工业大学软件学院本科毕业设计(论文)中期报告
- 1 -
1. 毕业设计(论文)内容概述
1.1 项目来源及开发目的和意义
1.1.1 项目来源
本项目主要来源于我在在深圳证券交易所实习阶段所参与的《证券金融知
识图谱》项目以及许保勋许博士的指导。
1.1.2 项目开发目的和意义
互联网+时代的到来标志着互联网从一个工具变成了一个基础性的设施,
在互联网+时代,万物通过互联网进行互联,互联网的基础性地位日显重要,
已经渗透到包括金融、物流、电子商务、工业生产等各个领域。互联网以信息
作为作为其载体及表现形式的特性,与金融行业有天然的融合性。金融行业从
本质上而言,就是用不同的数字与信息去表达金融资源的时间与空间特性,通
过对信息进行处理,完成不同金融资源的时间及空间的匹配,以达到资源效用
最大化的目的。
金融证券行业对信息的分析与处理方法的探索从来没有停止过。以股票市
场为例,早期受到分析手段及资讯传导速度的限制,人们以分析结构化数据,
例如股票的成交量、成交价格为主;在公司的基本方面,则以分析公司的财务
结构数据为主。在报业时代,受信息更新速度、传播速度的影响,通过对非结
构化的文本数据包括并不多;与此同时,报业时代产生的数据量并不大,由人
工分析足以满足业务应用需求。在信息时代,一方面随着互联网时代的到来,
资讯的生产方由专业媒体变成了大众,各类关于公司、市场的信息由不同的人
士生成并发布,数据量空前丰富;另一方面,空前丰富的数据体量使得人工分
析变得越来越不现实,信息技术的成熟、应用成本的降低使得将信息技术应用
于金融非结构化数据的分析服务成为可能。在这个时期,证券行业通过搭建各
类分析平台对结构与非结构化数据进行采集与分析。
然而上述对信息的分析方法仍然存在缺陷。首先,目前互联网已经进入到
哈尔滨工业大学软件学院本科毕业设计(论文)中期报告
- 2 -
了互联网+时代,万物互联已经成为主流,而上述的信息分析方法将一个个信
息点进行孤立的分析,形成一个个信息分析孤岛,其表现形式为对单一问题、
单一信息分析较为全面,但对多个问题、多个信息的关联分析等能力较为欠
缺,分析结果零散,查询结果不够智能,只能就查询者的某个问题回答相应的
答案,而不能够就问题所描述的知识结构完整全面的战士给查询方。这些等等
问题催生了 Google 公司推出的知识图谱在金融证券领域的应用。
自 2012 年谷歌将知识图谱成功应用到搜索引擎以来,知识图谱在学术界
和工业界收到了广泛关注。知识图谱的本质是由概念、实体以及实体之间的关
系构成的语义网络。知识图谱的构建主要是将零散的结构化、半结构化和无结
构化数据通过信息抽取、信息融合等技术处理成集中的结构化数据,并通过图
的方式表达实体与实体之间的复杂关系,方便上层应用系统从整个知识系统的
角度去分析复杂的逻辑推力问题。构建金融证券领域的知识图谱需要从基于互
联网平台的股吧、论坛、门户网站、微信、微博、公告、研报、招股相关文档
等等结构化或非结构化的数据中进行信息抽取、信息融合,达到人、公司、产
品、行业的“万物互联”(如图 1-1),从而提高行业信息利用的精准度和可信
度,以及广度。通过证券行业知识图谱将所有重点相关联的行业、版块、公
司、股票以及个人进行影响价值,对上述信息可能产生的正面或者负面影响进
行实时的分析并得出相应的结论,使得机构可以先于市场其他参与者发掘出潜
在关联方并全面的分析出事件波及影响层面,从而快速作出投资决策实现盈利
或止损。因此研究金融领域证券知识图谱的构建具有重大意义。
哈尔滨工业大学软件学院本科毕业设计(论文)中期报告
- 3 -
图 1-1 证券知识图谱万物互联图
如果把金融领域证券知识图谱构建分为知识构建、知识计算、知识存
储、知识应用四大部分(如图 1-2),那么知识构建应该是最核心基础的一大
部分,即怎么从海量文本中得到行业图谱。
图 1-2 金融知识图谱构建组成部分
而金融领域证券知识图谱的知识构建最核心的两大技术就是命名实体识
别(Named Entity Recognition)和关系抽取(Relation Extraction),而命名实
体识别就是如何从文本数据中抽取概念、实体、关系和属性并进行消歧、对
剩余28页未读,继续阅读
雨后的印
- 粉丝: 15
- 资源: 288
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0