没有合适的资源?快使用搜索试试~ 我知道了~
2017-3基于抽象概念的知网词语相似度计算_朱新华1
需积分: 0 0 下载量 168 浏览量
2022-08-04
15:51:20
上传
评论
收藏 621KB PDF 举报
温馨提示
试读
8页
摘要:针对基于知网的词语相似度算法进行研究,提出一种基于抽象概念的词语相似度的快速计算方法。将 《知网》义项语义表达式中带有关系约束的第一独立义原定义成抽象概念
资源详情
资源评论
资源推荐
2017
年
3
月
第
38
卷
第
3
期
计算机工程与设计
COMPUTER
ENGINEERING
AND
DESIGN
Mar.2017
Vol.38
No.3
基于抽象概念的知网词语相似度计算
朱新华
1
,
2
,
郭小华
1
,
邓
涵
1
,
马润聪
1
(
1.
广西师范大学 计算机科学与信息工程学院
,
广西 桂林
541004
;
2.
广西区域多源信息集成与智能处理协同创新中心
,
广西 桂林
541004
)
摘
要
:
针对基于知网的词语相似度算法进行研究
,
提出一种基于抽象概念的词语相似度的快速计算方法
。
将
《
知网
》
义
项语义表达式中带有关系约束的第一独立义原定义成抽象概念
,
将义项语义表达式转换成一个多层次的抽象概念组
;
根据
义项定义中的抽象概念将义项挂到
《
知网
》
现有的义原树中
,
形成一棵包含义原
、
抽象概念与义项等概念的义项树
;
利用
义项树中的深度与路径
,
在现有优秀算法基础上
,
通过适当的义项定义的预处理与参数调节
,
直接计算义项间的语义相似
度
,
避免复杂的意义相似性计算
。
实验结果表明
,
该方法对于
MC30
词对的相似度计算值与人工判定值相比
,
取得了
0.84
的
Pearson
相关系数
,
达到了目前优秀词语相似度算法的水平
。
关键词
:
词语相似度
;
知网
;
义项树
;
抽象概念
;
最短路径
;
深度
中图法分类号
:
TP391
文献标识号
:
A
文章编号
:
1000
-
7024
(
2017
)
03
-
0664
-
07
doi
:
10.16208
/
j
.issn1000
-
7024.2017.03.020
收稿日期
:
2016
-
01
-
06
;
修订日期
:
2016
-
03
-
10
基金项目
:
国家自然科学基金项目
(
61462010
、
61363036
)
作者简介
:
朱新华
(
1965
-
),
男
,
广西桂林 人
,
教授
,
研究方向为自然语言处理
、
智能教学系统等
;
郭小 华
(
1992
-
),
女
,
湖北 武 汉人
,
硕士研究生
,
研究方向为自然语言处理
;
邓涵
(
1991
-
),
女
,
湖北荆州人
,
硕士研究生
,
研究方向为自然语言处理
;
马润聪
(
1989
-
),
男
,
湖北洪湖人
,
硕士研究生
,
研究方向为自然语言处理
。
E
-
mail
:
zxh429
@
263.net
Word
similarit
y
calculation
based
on
abstract
conce
p
t
in
HowNet
ZHU
Xin
-
hua
1
,
2
,
GUO
Xiao
-
hua
1
,
DENG
Han
1
,
MA
Run
-
con
g
1
(
1.Colle
g
e
of
Com
p
uter
Science
and
Information
Technolo
gy
,
Guan
g
xi
Normal
Universit
y
,
Guilin
541004
,
China
;
2.Collaborative
Innovation
Center
of
Multi
-
Source
Information
Inte
g
ration
and
Intelli
g
ent
Processin
g
in
Guan
g
xi
,
Guilin
541004
,
China
)
Abstract
:
B
y
researchin
g
word
similarit
y
al
g
orithms
based
on
HowNet
,
an
efficient
method
for
calculatin
g
word
similarit
y
based
on
the
abstract
conce
p
t
was
p
ut
forward.The
first
inde
p
endent
sememe
with
relationshi
p
constraints
in
the
semantic
ex
p
ression
of
a
sense
was
defined
as
an
abstract
conce
p
t
,
and
the
semantic
ex
p
ression
of
the
meanin
g
s
was
transferred
into
a
multi
-
level
ab
-
stract
conce
p
t
g
rou
p
.Accordin
g
to
the
abstract
conce
p
t
in
the
definition
of
a
sense
,
the
senses
were
hun
g
on
the
existin
g
sememe
tree
in
the
HowNet
and
a
sense
tree
that
containin
g
all
the
conce
p
ts
was
formed.Throu
g
h
the
p
ro
p
er
p
retreatment
and
p
arameter
ad
j
ustment
of
the
senses
’
definition
,
usin
g
de
p
th
and
p
ath
in
the
sense
tree
and
im
p
rovin
g
the
existin
g
outstandin
g
al
g
orithm
,
the
semantic
similarit
y
between
the
senses
was
directl
y
calculated
and
the
com
p
licated
meanin
g
similarit
y
calculation
was
avoided.
That
the
Pearson
correlation
coefficient
between
the
human
j
ud
g
ments
in
MC30dataset
and
the
com
p
utational
measures
p
resen
-
ted
in
this
a
pp
roach
is
0.84is
showed
in
the
ex
p
eriments
,
which
achieves
the
cevel
of
g
ood
word
similarit
y
al
g
orithms.
Ke
y
words
:
word
similarit
y
;
HowNet
;
sense
tree
;
abstract
conce
p
t
;
shortest
p
ath
;
de
p
th
0
引
言
目前词语相似度计算方法大致可以分为以下两种
:
一
种是基于大规模语料库进行统计和计算
;
另一种是基于世
界知识进行计算
[
1
]
。
目前
,
国内基于世界知识计算词语相
似度的方法主要有基于同义词词林
[
2
]
的词语相似度计算和
基于知网
[
3
]
的词语相似度计算
。
同义词词林的结构清晰
,
所有义项都在同 一 棵 大 树 中
,
因此非常便于使用直观的深
度与路径方法计算词语相似度
;
而在
《
知网
》
中
,
只存 在
一棵义原树
,
并没有给出义项树
,
而是给出了义项的定义
CyberNinja
- 粉丝: 20
- 资源: 297
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于yolov5识别算法实现的DNF自动脚本源码.zip
- 基于Python实现的自动化办公项目.zip
- 基于python实现的基于PyQt5和爬虫的小说阅读系统.zip
- 机械设计整经机上纱自动化sw20非常好的设计图纸100%好用.zip
- Screenshot_20240427_031602.jpg
- 网页PDF_2024年04月26日 23-46-14_QQ浏览器网页保存_QQ浏览器转格式(6).docx
- 直接插入排序,冒泡排序,直接选择排序.zip
- 在排序2的基础上,再次对快排进行优化,其次增加快排非递归,归并排序,归并排序非递归版.zip
- 实现了7种排序算法.三种复杂度排序.三种nlogn复杂度排序(堆排序,归并排序,快速排序)一种线性复杂度的排序.zip
- 冒泡排序 直接选择排序 直接插入排序 随机快速排序 归并排序 堆排序.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0