没有合适的资源?快使用搜索试试~ 我知道了~
基于词向量的情感新词发现方法_杨阳1
需积分: 0 0 下载量 131 浏览量
2022-08-04
14:28:42
上传
评论
收藏 384KB PDF 举报
温馨提示
试读
8页
摘要:词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向,如何自动识别情感新词,并判断其情感倾向性已经成为当前亟待解决的问题。首先用基于统计量的方法识别
资源详情
资源评论
资源推荐
第
49
卷 第
11
期
Vol. 49 No. 11
山 东 大 学 学 报
(
理 学 版
)
Journal of Shandong University(Natural Science)
2014
年
11
月
Nov.
2014
收稿
日期
:2014-08-28;
网络出版时间
:2014-10-24 14∶ 10
网络出版地址
:http : / / www . cnki. net /kcms / doi /10. 6040 / j. issn. 1671. 9352. 3. 2014. 255. html
基金项目
:
国家自然科学基金资助项目
(60673039,60973068)
;
国家高技术研究发展计划
(“
八六三
”
计划
)
项目
(2006AA01Z151);
教育部留学
回国人员科研启动基金资助项目
(20090041110002)
;
高等学校博士学科点专项科研基金资助项目
(20110041110034)
作者简介
:
杨阳
(1989 - ),
男
,
硕士研究生
,
主要研究方向为情感计算
. E-mail:yangyang0477@ mail. dlut . edu. cn
*
通讯作者
:
林鸿飞
(1962 - )
,
男
,
教授
,
主要研究方向为搜索引擎
、
文本挖掘
、
情感计算和自然语言处理
. E-mail: hflin@ dlut. edu. cn
文章编号
:1671-9352(2014)11-0051-08 DOI:10. 6040 / j. issn. 1671-9352. 3. 2014. 255
基于词向量的情感新词发现方法
杨阳
,
刘
龙飞
,
魏现辉
,
林鸿飞
(
大连理工大学信息检索研究室
,
辽宁
大连
116023)
摘要
:
词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向
,
如何自动识别情感新词
,
并判断其情
感倾向性已经成为当前亟待解决的问题
。
首先用基于统计量的方法识别微博语料中的新词
,
然后利用神经网络
去训练语料中词语的词向量
,
从语料自身挖掘出词与词之间的相关性
,
最后提出了基于词向量的情感新词发现方
法
。
实验表明该方法可以有效应用于情感新词发现
。
关键词
:
情感词
;
神经网络
;
词向量
中图分类号
:TP391
文献标志码
:A
New methods for extracting emotional words based on
distributed representations of words
YANG Yang,LIU Long-fei,WEI Xian-hui,LIN Hong-fei
(Information Retrieval Laboratory,Dalian University of Technology,Dalian 116023,Liaoning,China)
Abstract: Word-level sentiment analysis is a hot research interest in the field of affective computing. How to recognize
and analyze these new emotional words automatically becomes an urgent problem. Firstly,statistics-based approach w as
used to identify the new words in Micro-blog corpus and then distributed representation of new words was trained by u-
sing neural network in order to get the correlation betw een w ords in corpus. Finally three vector-based methods to find
new emotional words were introduced. The experimental results indicate that the proposed methods in this paper can be
effectively used in discovery of new emotional w ords.
Key words:emotional words; neural network; distributed representations of w ords
0
引言
随着互联网迅速的发展
,
人人
网
、
微博
、
微信等这些新型社交媒体逐渐改变着人们的生活习惯
。
人们倾
向于从微博上获取资讯
、
新闻
、
观点
、
评论
、
娱乐等信息
,
每日的热门话题和各地的新闻事件往往会第一时间
出现在微博中
。
不知不觉间
,
微博对网络舆情的传播施加了越来越重要的影响
,
已经成为网络上新词创造和
传播的主要平台之一
,
每天都会有富含情感的新词出现
。
这种
“
新
”
不仅包括真正意义上的新词
,
如
“
屌丝
”,
“
高富帅
”,“
切糕
”,“
傲娇
”
等
,
也包括大量带有错别字的
“
新词
”
。
拿
“
尼玛
”
这个新词来说
,
其源于
“
你妈
”
这一词语
,
但不仅限于
“
尼玛
”
这种表达
,
在微博中常会发现
“
尼马
”,“
泥马
”
等一些另类表达
。
正因为微博
这种言论自由
、
口语化
、
毫无约束
、
不严肃表达的特性
,
使其与传统的文本写作表达有很大的不同
,
常会出现
阿葱的葱白
- 粉丝: 26
- 资源: 313
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0