知识图谱的理论基础
词频分析
词频分析法是利用能够揭示或表达文献核心内容的关键主题词,在某一研究领域文献中
出现的频次高低来确定该领域研究热点和发展动向的文献计量方法。在科技文献中,常与共
词聚类分析相结合,从而定性结合定量的分析某科技领域的知识结构、研究热点等问题。
近年来,越来越多的学者开始关注科技文献中某些词语在短时间内词频的暴然增长趋势,
以此来洞察该领域的发展变化。突变词监测是 Kleinberg 于 2002 年提出的,它关注焦点词
内相对增长率突然上升的词汇。突变词监测强调的是词频变化的速率,即在短时间内词频的
相对大幅度增加,这反映了该领域中重要概念的提出或某些重大事件导致的研究兴趣的兴起
或转移,能够更灵敏的扑捉到那些研究活跃、有潜在影响研究热点的因素,能从更微观的角
度把握、监测学科的发展动向。
共词分析
早在 1986 年,法国国家科学研究中心的两位文献计量学家出版了《 Mapping the
Dynamics of Science and Technology》,详细探讨了共词分析方法。
共词分析方法属于内容分析方法的一种,通过对一组词两两统计它们在同一篇文献
中出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,
进而分析这些词所代表的学科和主题的结构关系。
共词分析是建立在词频分析基础之上的,首先要提取文献中的高频关键词或主题词;
然后统计这些“词汇对”共同出现在同一篇文献中的次数,形成共词网络;这些关键词
节点代表的研究主题之间相互关联,形成错综复杂的网络关系,尤其是在文献数据量较
评论0
最新资源