没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
人工智能-机器学习-面向作战文书智能处理的电子词典的研究与实现.pdf
人工智能-机器学习-面向作战文书智能处理的电子词典的研究与实现.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
人工智能
文档资料
机器学习
0 下载量
39 浏览量
2022-05-19
02:53:43
上传
评论
收藏
3.54MB
PDF
举报
温馨提示
618特惠:¥9.90
19.90
人工智能-机器学习-面向作战文书智能处理的电子词典的研究与实现.pdf
资源详情
资源评论
曲向作战文
书处埋的电
了词典的创
究仃实现
目录
1
绪论
1
」
研究的背景
和意义
1.2
电子词典简史
和国内外研究
现状
1.3
木文所做的丄
「
作及内容安
排
.
3
2
电子词典的内
容
,5
2.1
词汇的语法语义
信息
5
2.1.1
词语的分类体
系
2.2
词语的屈性描述
12
2.2.1
词法信息
13
2.2.2
句法信息
14
223
照应信息
15
224
语义信息
16
2.2.5
兀余性利可扩充性
16
2.3
本章小结
17
3
词典的构建
17
3.1
词典质握衡量
标准
18
3.1.1
词语的收录与收录原则
19
3
」
・
2
词语屈性的确定
21
3.1.3
词语属性值的类型
,23
3.2
词典的整体结
构
24
3.2.1
建库思想
,24
322
系统结构
25
3.3
词典中词表
的数据结构
25
3.4
本章小结
35
4
词典的实现
36
4.1
词库的建立
.36
4.1.1
词表
37
4.1.2
关系图
38
HI
血向作战
文书处理
的电
?
词典的砂
究打实观
4.2
诃典的维护
40
4.3
系统安全性
43
4.4
木章小结
43
5.
基于词典的
作战文书智
能处理
44
5
1
文训处理系统
44
5
1.1
自动分词
1.2
切分歧义处
理
1.3
词性标注
1.4
词汇功能描
述
1.5
文书内容结构
模型
2
用户接口
5.3
本章小结
结束语
致谢
参考文献
附录
A
45
46
49
51
53
55
56
.58
59
60
,63
IV
硕
1.
•论文
血向作战
文衲智能
处理的电
了词典的
硏究打实
现
1
绪论
1.1
研究的背景和意义
在
“
计算机文化
”
到来的
会里社语言已不仅是人与人之间的交际工具
,
而
」
L
是人机对话的基础
。
电子计算机的岀
现和发展
,
引起了科学技术
的巨大变化,
也为语言学开
辟了新的发展
途径
。
计算机一方面对语言学提岀
了一系列新的耍
求
,
來武装其
“
头脑二以发展它的智力
(
如赋予它信息
检索能力
,
语言翻译能力
,
门然语言理
解能力
)
,
给它添加
“
翅膀"以赋予它听觉
(
如识别口语
)
,
更强的视觉
(
如识别文字
)
,
说话能力
(
如言语合成
)
和听写能力
(
如语音打字
)
。
另一方面它
又充当语言学习的得力助手
,
帮助语言学工作者对语言素材进行分类
、
演算
、
控制和模拟等
。
总之
,
将计算机与语
言学有机结合
起來
,
彼此互助
,
彼此互补,
从而使得实现计
算机高度智能化
成为可能
。
利用计算机来处理自然语言是一门
新学科一计算语
言学
,
目前研究得比较多的
课题有:机器翻译
、
情报检索
、
汉
字信息处理
、
语音分析
、
人工智能中的自然语言理解和生
成等
。
与此同时
,
所有这些工作
的一个基础性
工作
—
—
知识源的利用日益成为当
丽国际语
g
学和计算机科学领域的一个共同的重要研
究内容
。
从
20
世纪
90
年代开始
,
国际自然语言处理领域
发生了一些重大变化
,
其特征之一就是转向
对大规模真实文本的研究和处理
,
以大规模真实文本为基础的
语料库及其语言
研究受到高度重
视
,
并且越來越走
向深入和实用
。
语料库语言学就是此时自然
语
§
处理研究的一个重要方向
,
语料库语言学的目的是企图通过对大规模真实
语料的调査來发
现并总结自然语
言的各种语言事
实和语法规律
。
对这些语言
事
实和规律很好
的组织以便于
利用
,
就是电子词典
编撰所做的工
作
。
电子词典是
与文本词典相对
,
以计算机等媒
体做载体
,
并可借助机器查询
、
阅读的词典
。
电子词典的编撰具有重要的
意义
。
首先
,
电子词典是自然语言处理的
基础
。
联机词典为机
器翻译
、
自然语
g
理解
、
高级文字处理等提供了基本知识源
。
没
冇词典提供的知识
,
也就无法进行
其他处理工作
。
其次
,
电子词典是大规模知
识工程的基础工作
。
人类的职能表现为对知识的积累和运用
,
人工智能
(
AI
)
研究同样需要开展大规模的知识工程的研究
。
知识工程系统都离不开知识的获
収
,
而获取新的知识
又离不开足够的
已有知识和词汇
。
电子词典作为词汇的一
种系统表示形式
,
是机器进行知识处理的重要知识源
。
真正能满足现实
需要的词典必须
包含数量巨大的
词条
。
电子词典的建造
是
i
项费时费力的工
程
,
而有了一部大规模的电子词典
,
就可以构成一个知识处
理的良好坏境和基础
,
许多人工智能就可以
由此展开
。
正是由于电子词典的
ffi
第
I
页
硕
I:
论文
血向作战文书智
能处理的电了词
典的研究与实现
耍作用
,
用际上己经形成了
•个新兴的交叉学科
一
一电子词典学
(
Electr
onic
Lexicogra
phy
),
它专门研究电子词
典的组织和利用
。
我国在
“
863
计划
”
和
“
九五十五
”
规划中安排了一系列与中文信息
处理有关的理论
课题研究
。
本教研室的
“
十五"项目中
《
集团军(师)防空作
战指挥系统
》
的子课题
一
—
《
兵力机动辅助决策系统
》
中军用文书的理解与生
成
,
它是一个针对特定系统的
语言处理系统
。
它涉及到语言
的理解和生成
两方
而的中文信息处理
,
而词典是这两个
过程不可缺少的
基础语料库
。
为这个系统
捉供支持性知识
源就是本文研究
工作的目的
。
1.2
电子词典简史和国内外研究现状
电子词典始于上个世纪
40
末期美国学者对机器翻译的研究
,
在
20
世纪
50,
60
年代中期曾引
起人们的髙度
重视
,
但由于各种原因一直停滞不前
,
到
20
世纪
80
年代
,
进入了活跃期
。
由于机器翻译和自然语言理解等实用系统开
发的迫切需耍
,
国内外计算语言学界
对于词汇的研究越来
越更视
,
人们更加注
总机器词典中词汇信息的
表示和处理
。
在国外
,
出现了以词汇功能语
法为代表
的一系列基于
复杂特征集和
合一运算的理
论和方法
,
,
特别注意包含在词汇中
的信息
;
在国内
,
20
世纪
80
年代我国学者
提出用
“
多值标记函数
”
表示的各种
信息中
,
就特别强调指
出
,
机器词典中记录
的静态信息是汉
语自动句法语义
分
析的基础
,
在自然语言处理的过程中
所运算出的各种信息
,
都是以机器
词典中
的静态信息为基础推演出來的
:
20
世纪
90
年代初我国学
者提出的
,
,
词专家系
统
”
和
“
词汇语义驱动
”
的理论
,
更加重视对机器词
典中词汇信息的研
究
,
把词汇
信息的重要性
,
提到了方法论的高度
。
这些情况说明
,
在各种自然语
言处理系
统中
,
仅仅依靠反映语言
共性的句法规则
,
已经远远不能满足
开发实用系统的
需要
,
全面地研究
、
整理和挖掘蕴藏
在自然语言词汇
中的个性规则已
经迫在眉
itko
电子词典旨在
为我们提供了
描述非常深入
、
内容相当丰富的
包含在现代
汉语词汇中的
语法
、
语义信息
,
这些信息是记录在
一个个单词上的
,
反映的是
彳个单词的个性规则
。
但是
,
事物的一般性是存在于
事物的特殊性之中的
,
通
过对各个单词的个性
规则的深入观察
,
有洞察力的研究者一定能够从中提炼
出更为深刻的
共性规则
,
并进一步丰富已经发现的那些共性规则
,
使我们对于
现代汉语的各种规律性获得更高层次的认识
,
这必将大大地推动国内外中文
信息处理的研究
,
加速中文信息处理成果实
用化和商品化的过程
。
目前
,
国内北京大学的
《
现代汉语语法信息词典
》
⑹是专门为
汉语句子的
自动分析与自动生成研制的
,
具有较高的权威性和可靠性
。
它也代表了国
内
第
2
a
硕
I:
论文
曲向作战文书智能处理的电了•词典的
研究
b
实现
语言处理领域的先
进水平
,
这是一部比较全面的信息词典
,
包括语言处理可
能遇到的语法和一些语义的大部分
信息
。
其他一些则是专门
为各个应用领域
研制的
,
象北方交通大学研制了地理査询系统中的词典
,
还有上海交大研
制
的天气预报生成系统阿中的词典
;
还有专门用于信息处理领域的词典
,
象分
词词典的研制
,
汉英互译词典
的研制等
。
国际上
,
在
1986
年日本提出了一
个
“
自然语言处理用的电子词典的研究
”
的研究计划⑸
,
这个计划的目的是研究大型的
、
高水平的电子词典
,
以满足下
i
代自然语言处理
技术和知识信息
处理的需要
。
为了实现这个目标
,
R
本于
1986
年
4
月成立了
H
本电子词典研究所
(
Japan
Electr
onic
Dicti
onary
Resea
rch
instit
ute,
简称
EDR)
,
这个研究所由日本关键技术中心和富士通
、
NEC
、
松下
、
夏普
、
东芝
、
日立和三菱等八家公司给以财政支持
。
这个电子词
肌计划
,
引起了全世界机器翻译界和自然语言处理界的瞩目
。
到目前为止
,
这部词典包括
主词典
、
概念词典
、
搭配词典和对译词典等
。
Victor
Raskin
和
Sergei
Nirenbur
g
两个人研究的用于机
器翻译的计算词典
确定和表示一类
词性(形容词)的
内涵
,
其结果具有广泛的
应用价值
,
从而
形成了一个计算语义存在性的微
理论
。
Comlex
Syntax
系统(⑼是一个英语句法词典
,
是由语言数据
协会
(LDC)
赞助的纽约大学
Porteus
Proje
ct
小组开发的
。
它包括了
39,
500
个头词汇
(head
words)
,
主要的会话常用词汇
〔
名词
,
动词
,
形容词和副词)的特点
和内容都相当丰
富
,
它主要的目的就是
服务于
NLP
的研究
。
Max
Silbe
rztei
n
设计的
Intex
系统是一个语言开发环境
,
其中就包
括覆盖面很大的实时词
典
、
语法和文本分析
。
其中词典用于
确定文本形态
,
词汇和造句方式
,
消除模糊和标注单复数等
。
本文研制的电子
词典是应用于特
定领域的信息处
理
:
军用文书的理解
和
个•成
。
针对军用领域的文
本和词汇的特点
,
构建和实现了本文这部词典
。
1
・
3
本文所做的工作及内容安排
如询所述
,
本文所做工作
,
就是为文本的理解
和生成提供支持
。
一般來
说汉语的理解
分为以下步骤
:原文输入
、
句子词语切分及词
语属性特征标注
、
语法及句法分析
、
语义及语用和语境分析
、
生成目标形式表示
、
句群及篇章
理解等
。
汉语文本生成分成两个阶段
:
1
)
规划阶段
:
文本的内容和结构决策
;
2)
转化阶段
:
规划中的决策信息转化成自然语言文本
。
本文就是针对各个过
程需要的词汇信息来对词汇信息存储和
管理
。
信息的管理决定着其
使用的效
第
3
页
剩余70页未读,
继续阅读
评论
收藏
内容反馈
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
618特惠:¥9.90
19.90
评论0
去评论
最新资源
39371_blackUnique.js
4_base.apk.1
Flower_SS 3.txt
Flower_SS.txt
xiaomi system upload
xiaomi rom upload
xiaomi system upload
xiaomi system upload
xiaomi system upload
xiaomi system upload
programcx
粉丝: 41
资源:
13万+
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
人工智能-机器学习-智能卡安全协议研究与实现.pdf
人工智能-机器学习-智能卡安全协议研究与实现.pdf
人工智能-机器学习-IHSMTS中面向对象智能型实例模式库的设计与实现.pdf
人工智能-机器学习-IHSMTS中面向对象智能型实例模式库的设计与实现.pdf
人工智能-机器学习-涉密局域网数据智能备份研究与实现.pdf
人工智能-机器学习-涉密局域网数据智能备份研究与实现.pdf
人工智能-机器学习-智能卡密钥管理研究及实现.pdf
人工智能-机器学习-智能卡密钥管理研究及实现.pdf
人工智能-机器学习-智能轮椅自动避障方法研究与实现.pdf
人工智能-机器学习-智能轮椅自动避障方法研究与实现.pdf
人工智能-机器学习-智能家居云服务平台的研究与实现.pdf
人工智能-机器学习-智能家居云服务平台的研究与实现.pdf
人工智能-机器学习-智能化虚拟存储的研究与实现.pdf
人工智能-机器学习-智能化虚拟存储的研究与实现.pdf
人工智能-机器学习-城市道路交通指路标志智能设计系统的研究与实现.pdf
人工智能-机器学习-城市道路交通指路标志智能设计系统的研究与实现.pdf
全国计算机等级考试二级Python真题及解析.docx
全国计算机等级考试二级Python真题及解析 全国计算机等级考试二级Python真题及解析全文共19页,当前为第1页。全国计算机等级考试二级Python真题及解析全文共19页,当前为第1页。全国计算机等级考试二级Python真题及解析(5) 全国计算机等级考试二级Python真题及解析全文共19页,当前为第1页。 全国计算机等级考试二级Python真题及解析全文共19页,当前为第1页。 一、选择
1000份ppt模版,PPT模板优秀PPT
ppt模版,商务模版,海量精品流行PPT模板全新上线,各类动态创意PPT模板/优秀PPT模板/国内外PPT模板,创意设计,ppt模板,只要您想的..PPT模板网提供各类PPT模板免费下载,PPT背景图,PPT素材,PPT背景,免费PPT模板下载,PPT图表,精美PPT下载,PPT课件下载,PPT背景图片免费下载;简约红蓝渐变圆点背景PPT模板免费下载 简洁PPT模板 下载:13187次 紫色简约时
导入证书可以解决”无法建立到信任根颁发机构的证书链"问题。
解决”无法建立到信任根颁发机构的证书链",则导入相关证书。
5星 · 资源好评率100%
matlab批量读取excel表格数据并处理画图
批量读取全部sheet内容,可指定,并对无效内容处理,提取所需数据并画图
5星 · 资源好评率100%
OpenCv车辆识别训练模型
OpenCv车辆识别训练模型
5星 · 资源好评率100%
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf c++ java go
Vue-Element UI集成ECharts实现数据统计分析页代码部分(如果帮助到你,感谢关注点赞)
关于《Vue-Element UI集成ECharts实现数据统计分析页》文章的具体代码实现。(如果帮助到你,感谢关注点赞)
数学建模对乙醇偶合制备C4烯烃的问题研究
全国大学生数学建模对乙醇偶合制备C4烯烃的问题研究省一等奖,小白第一次建模。提交的所有完整版论文pdf,可供参考。
5星 · 资源好评率100%
STM32F103C8T6中文数据手册
Cortex-M3在架构上进行的多项改进,包括提升性能的同时又提高了代码密度的Thumb-2指令集,大幅度提高的中断响应,而且所有新功能都同时具有业界最优的功耗水平。目前ST是第一个推出基于这个内核的主要微控制器厂商。STM32F100C8T6B的目的是为MCU用户提供新的自由度。它提供了一个完整的32位产品系列,在结合了高性能、低功耗和低电压特性的同时,保持了高度的集成性能和简易的开发特性。1.
5星 · 资源好评率100%
(头歌)计算机组成原理存储系统设计(HUST)1-7关答案
头歌平台计算机组成原理存储系统设计(HUST)1-7关答案txt版,想要用logisim打开要先把文件拓展名换成.circ。对应关卡为:第1关—汉字字库存储芯片扩展实验,第2关—MIPS寄存器文件设计,第3关—MIPS RAM设计,第4关—全相联cache设计,第5关—直接相联cache设计,第6关—4路组相连cache设计,第7关—2路组相联cache设计。
5星 · 资源好评率100%
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0
最新资源