没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
64页
文本可视化涉及文本信息提取技术和可视表达两个方面。本章介绍了文本可视化领域常用的文本可视化基础知识和方法以及文本信息提取技术,并从文本内容、文本关系、多层面展示信息的角度阐述了文本可视化的研究内容和现有成果。需要注意的是,这三个层 面不是相互隔离的,而是相互连通的。 文本可视化不同于具有空间属性的科学可视化——文本信息没有空间位置等结构化信 息。因此,如何将没有空间结构属性的文本信息转换为用户乐于接受的二维或三维空间的可视表达结果是文本可视化面临的一个核心问题。在未来的文本可视化研究中,如何将文本分析模型和信息可视化技术无缝结合,如何更好地处理海量、时变、具备多重语义的文本信息是极大的研究挑战。
资源推荐
资源详情
资源评论
第六章
文本和文档可视化
第 2 页
竢实扬华,自强不息
目 录
CONTENT
1
文本可视化释义
文本内容可视化
文本多层面信息的可视表达
文本信息分析基础
文本关系可视化
总结
3
5
2
4
6
第 3 页
竢实扬华,自强不息
文本信息无处不在,邮件、新闻、工作报告等
都是日常工作中需要处理的文本信息。面对文本信
息的爆炸式增长和日益加快的工作节奏,人们需要
更高效的文本阅读和分析方法,文本可视化正是在
这样的背景下应运而生。
6.1
文本可视化释义
“
”
第 4 页
竢实扬华,自强不息
6.1.1 文本信息的层级
词汇级信息指从一连串的文本文字中
提取的语义单元信息。语义单元是由
一个或多个字符组成的词元,它是文
本信息的最小单元。
词汇级( Lexical
Level )
语法级( Syntactic
Level )
语义级( Semantic
Level )
文本信息涉及的数据类型多种多样,如邮件、新闻、文本档案、微博等。文本是语言
和沟通的载体,文本的含义以及读者对文本的理解需求均纷繁复杂。这种对文本信息
需求的多样性,要求从不同层级提取与呈现文本信息,文本的提取由浅入深可总结为
三个层级。
语法级信息指基于文本的语言结构对
词汇级的语义单元进一步分析和解释
而提取的信息。语法级信息的提取过
程被称作命名实体识别方法。
语义级信息是研究文本整体所表达的
的语义内容信息和语义关系,是文本
的最高层信息。
文本关键字、分词技术
( Tokenization )
词性、单复数、相近词、以及地点、
时间、人名等实体信息
文本的字词、短语等在文本中的含义
和彼此关系;作者通过文本传达的信
息。
第 5 页
竢实扬华,自强不息
6.1.2 文本可视化的研究内容
文本可视化的研究内容可从多个角度总结。例如,以文本文档的类别作为归纳标准的文本可视化,可分为:
单文本可视化
文本集合可视化
时序性可视化
本章依据可视化所重点表现的文本信息特征来分类介绍当前的文本可视化研究内容:
文本内容可视化
文本关系可视化
文本多层面信息的可视化
这三个方面并非相互独立,而是相辅相成、相互依赖的。
剩余63页未读,继续阅读
资源评论
- 猪丽叶^(oo)^2020-02-23感谢,非常有学习价值shiter2020-04-10可转我的博客,加群探讨
shiter
- 粉丝: 1w+
- 资源: 153
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功