电子设计工程
Electronic Design Engineering
第 28卷
Vol.28
第 9期
No.9
2020年 5月
May 2020
收稿日期:2019-09-12 稿件编号:201909081
作者简介:王 岩(1980—),女,满族,辽宁本溪人,硕士,副教授。研究方向:大数据和 Java 应用开发。
随着云时代的到来,大数据受到的关注程度也
越来越高。大数据指的是大量的非结构化与半结构
化的数据,这些数据进行分析与下载时,会花费更多
的成本与时间
[1]
。现今社会中,大数据的应用优势越
来越 明显 ,应 用的 领域也在逐渐扩大,例如 电子 商
务、物流配送等,各种利用大数据的行业也在不断的
开展新业务、创新运营模式,为社会发展提供更加有
效的动力。但是,在大数据应用中依然存在着许多
问题,其中集中碎片数据的产生就是最严重的问题,
对于集中碎片数据来说,其严重影响了大数据的整
体性与有效性,也会对大数据的应用也会产生较大
的影响。为此,将大数据集中碎片数据实时标记研
究作为重点研究部课题之一是十分有必要的
[2]
。
基于 Java 的大数据集中碎片数据实时标记方法
王 岩
(沈阳工学院 信息与控制学院,辽宁 抚顺 113122)
摘要:现有大数据集中碎片数据实时标记方法存在标记实时性差、鲁棒性差的问题,为了解决上述
问题,提出基于 Java 的大数据集中碎片数据实时标记方法。提取大数据中碎片数据,以碎片数据
特征为基础创建最优数据集合树,完成碎片数据的集合,得到集合碎片数据,利用线性函数转换方
法处理集中碎片数据。选取适当的核函数,确定标记因子,以确定的标记因子为依据,基于 Java 平
台编写集中碎片数据实时标记程序,实现大数据集中碎片数据的实时标记。实验结果表明,提出
的大数据集中碎片数据实时标记方法极大的提升了标记实时性与鲁棒性,充分说明提出的大数据
集中碎片数据实时标记方法具备更好的性能。
关键词:Java;大数据;集中碎片数据;实时标记
中图分类号:TN301 文献标识码:A 文章编号:1674-6236(2020)09-0046-04
DOI:10.14022/j.issn1674-6236.2020.09.010
Java⁃based real⁃time marking method for fragmented data in large data sets
WANG Yan
(Information Technology College,Shenyang Institute of Technolog,Fushun 113122,China)
Abstract:The existing real ⁃ time marking methods for fragmented data in large data sets have the
problems of poor real ⁃time marking and poor robustness. To solve these problems,a real⁃time marking
method for fragmented data in large data sets based on Java is proposed. The fragmentation data is
extracted from large data, the optimal data set tree is created based on the characteristics of
fragmentation data,the fragmentation data set is completed,and the fragmentation data set is obtained.
The fragmentation data is processed by linear function transformation method. Choose the appropriate
kernel function,determine the marking factor,and write a real ⁃ time marking program based on Java
platform to realize the real⁃time marking of fragmentation data in large data sets. The experimental results
show that the proposed real ⁃ time marking method greatly improves the real ⁃ time performance and
robustness of the marking,which fully demonstrates that the proposed real⁃time marking method for large
data sets has better performance.
Key words: Java;big data;centralized fragmentation data;real⁃time markup
-- 46
评论0
最新资源