大数据可视化分析
大数据可视化分析
摘要:人类利用形象思维获取视觉符号中所蕴含的信息并发现规律,进而
获得科学发现。文章介绍科学可视化、信息可视化和数据可视化的内涵,阐述
大数据可视化分析方法。
关键词:大数据;可视化分析;并行计算
0 引 言
人类的创造性不仅取决于逻辑思维,还与形象思维密切相关。人类利用形
象思维将数据映射为形象视觉符号,从中发现规律,进而获得科学发现。期间,
可视化关键技术对重大科学发现起到重要作用。在大数据时代,大数据可视化
分析的研究与发展将为科学新发现创造新的手段和条件。
数据可视化于 20 世纪 50 年代出现,典型例子是利用计算机创造出了图形
图 表 。 1987 年 , 布 鲁 斯 · 麦 考 梅 克 等 撰 写 的 《 Visualization inScientific
Computing》促进了可视化技术的发展,将科学计算中的可视化称之为科学可视
化。20 世纪 90 年代初期,出现了信息可视化。目前将科学可视化与信息可视化
都归为数据可视化。
2 科学可视化
2.1 问题的提出
传统的科学可视化技术已成功应用于各学科领域,但如果将其直接应用于
大数据,将面临实用性和有效性问题,这说明需要对科学可视化技术重新审视
与深入研究。
2.2 分布式并行可视化算法
可扩展性是构造分布式并行算法的一项重要指标。传统的科学可视化算法
应用在小规模的计算机集群中,最多可以包括几百个计算节点,而实际应用是
要在数千甚至上万个计算节点上运行。随着数据规模的逐渐增大,算法的效率
逐渐成为数据分析流程的瓶颈,设计新的分布并行可视化算法已经成为一个研
究热点。
2.2.1 并行图像合成算法
传统的并行图像合成算法主要包括前分割算法、中间分割算法和后分割算
法 3 种类型,前分割算法主要分为如下 3 步骤:
(I)将数据分割并分配到每个计算节点上;