论文研究-基于海量牧区羊群轨迹的区域属性挖掘研究.pdf

所需积分/C币:10 2019-07-22 21:52:41 1.19MB .PDF
收藏 收藏
举报

现代畜牧业在实际放牧中依靠定位设备对牲畜进行管理。为了从牧区牲畜海量日常移动轨迹中挖掘出潜在的有用价值,提出一种新的基于轨迹速度扰动划分与聚类方法。该方法首先将连续定位轨迹以所设速度阈值进行划分;然后以聚类方法将所划分轨迹数据进行地理位置聚类,识别出牲畜不同生活区域。为处理海量数据,以云计算进行数据挖掘。最后为展示各区域不同强度,以核密度分析法对不同轨迹聚类区域进行可视化。理论与实验表明,提出的方法可以有效从海量牲畜定位轨迹中发现其不同生活区域及强度关系,并对后续草场分布及牲畜习性研究具有指导意义。
第4期 杜永兴,等:扆于海量牧区羊群轨迹的区域属性挖握研究 1035 示特征区域的频繁性或其强度,对牧区特征区域采用核密度分 由图4可以看出.羊群轨迹数据更多基于低速状态,即羊 析来显示特征区域强度关系。 群更多时间处于静止或低速运动,而这种状态符合牧区羊群运 核密度估计: 动特性。羊群运动状态更多地趋近于两类,即处于停留区域状 牲畜运动及聚集区域所产生的不同的轨迹具有不同的功态(包括休息区及生活区等)低速运动区域状态(更多地处于 能属性。为直观展小其不同区域强度,通过区域访问量来表征觅食时断断续续行进状态)。对此,本文重点关注两种特征区 特征区域强度。详细步骤为:给定N个划分后的特征区域轨域,即草场区域及停留区域。 迹点T1,T2,…,T,则某个位置上的核密度估计值为 A(s 其中:d1,是T;到s的距离;r是搜索带宽;K(*)是核数。核 两数的变化与距离成反比,与带宽成正比,从而增加所形成图 形的平滑度。本文所用高斯核函数如式(2)所示。 d (2) 通过核密度估计对所形成的轨迹特征区域轨迹数据进行 0.10.20.30.40.50.60.70.80.9 计算,并以热力图形式可视化展示出牧场牲畜特征区域热力强 图4羊群轨迹速度分段百分比 度,由颜色的差异直观展示出不同区域(如草场分布、聚居区3.1.1草场区域及停留区减判断 域等)的分布强度 在实际放牧中,由羊群运动而产生一系列连续轨迹数 3实验设计分析 据。由图4数据可知,迹数据更多地处于低速区间,可以认 为更多的吋间羊群的运动状态为低速或停驻状态,即羊群在 实验数据来源于内蒙古包头市2015年10月至2016年6草场食时史多为低速运动状态,而在聚居区域则吏多为停 月50万条羊群轨迹数据信息。每个牧区设置单独设备号,并驻状态。 产生当前地区牲畜的连续定位数据,包括设备号、设备电压值、 在特征区域轨迹划分中,速度阈值△v、时间阈值r及距离 经纬度、时间信息等。本文中只以经纬度及时间值作为基础数值d的设定是影响算法准确性的主要参数。这些参数的含 据进行处理,并进行聚类计算分析。同时,为满是处理海量牧义非常直观,领域专家很容易确定一个比例适合的阈值。例如 区軌迹数据要求,基于云计算平台进行数据处理。具休包括原Δ的设定不能太小,太小则容易将轨迹中重要特征细节丢失 始軌迹数据初步处理、基于速度扰动的轨迹划分与聚类、数据同样,设定值过大时也容易包含异常轨迹或突变轨迹,从而影 分析及结果输出,流程如图3所示。 响最终结果。 7草原改区轨迹数据云计算挖抓平台 本文为判断羊群在草场觅食区域分布,即适合羊群食用草 基于速度扰动的轨迹划分与聚类 场分布,将轨迹数据速度低于Δv(本文中△=0.3m/s)时进 返度抗动轨迹划分 数据分析 轧迹划分。同时,这部分轨迹点也会包含停留时轨迹数据 为进步判断其是否为停留区域,在轨迹划分时设置时间阈值 迹 特征轨迹点抽取 及距离阈值d(本文中设r=Ih,d=50m),判断所划分轨迹 君处 特征轨迹点聚类 是否为停留区域。 图3牲侖轨迹挖掘分析流程 3.1.2不同特征区域聚类 实验环境:基于 Hadoop0.20.2-cdh3u6搭建了10个节点 对轨迹数据进行划分后,所形成两种不同区域集合,即草 的 Hadoop集群,包活一个主控服务器节点9个从服务器节场区域集合及停留区域集合。为更详区分区域属性,对不同 点。设置HDFS副本数为3,从节点最多同时并行5个Map任集合轨迹数据进行聚类,结果如表1所示。 务和5个 Reduce任务,共他均为默认配置。木文为满足聚类 表1基于速度划分特征区域聚类结果 算法需求,采用K- means聚类算法并结合 Canopy算法进行基 轨迹划分阀值 特征区域 聚类效量/个 础聚类3 △v-0.3ms 草场区域 283 3.1基于速度划分的轨迹特征区域聚类 d=50m 停留区域 草原牧区在实际放牧中,因商运动状态的不同所产牛的 轨迹序列之间的速度也不相同。例如羊群实际放牧中,包括觅32特征区域强度估计 食、休息、奔跑等状态,为研究实际轧迹序列中速度分布,本文 对于轨迹划分及聚类后生成的特征区域,为直观展示其强 基于3个不同牧区共5万条執迹数据走行速度分布初步统计。度特性,结合核密度算法对特征区域进行核密度分析,并以热 如图4所示,统计数据基于0.0~0.1m/s轨迹数据占总数据力图形式展小出区域强度。木文中为对比停留区域与草场区 量47%,0.1~0.2m/s占总数据量14%,而0.2~0.9m/s则域之间强度,将同一牧区中停留区域及草场区域一并显小其热 共占39%(统计中在速度大于0.9m/s占总量不足1%,本文力图状态。如图5所示,图(a为两种区域轨迹数据共同展示 中更主婁关注于低速区轨迹值,将数据并人θ.8~0.9m/s速的热力图,图中方框区域为算法识别出的停留区域;(b)为热 度区间 力图结合实际地形图所形成的特征区域热力图。 ·1036 计算机应用研究 笃35卷 结束语 本文针对由牧区生产过程中所产生的海量轨迹数据,设计 了种基于速度划分与聚类方法,对羊群轨迹数据进行划分处 (a) 理,以达到适合于牧区羊群轨迹挖掘要求。为满足海量数据处 图5某牧场区域强庋热力图分布 理要求,构建云计算平台对数据进行预处理及聚类分析,最终 从图5中可以看出,停留区域所形成的热度比草场区域更展现羊群轨迹移动模式规律及草场分部形态。 为强烈,即说明羊群处于停留区域频度高于草场区域频度;同 草原轨迹挖掘由于数据及产业关注度等原因,所涉及研究 时,同一牧区中不同停留区强度并不相同,可认为不同停留区相对较少,基于此科研究背景,本义在结合轨迹挖掘及牧区特 域其属性也不相同。而对比于佇留区域,草场区域热度图其分性下提出适合于草原收区轨迹划分方法:同时为更全面精确地 布以连续片状形式存在,并以局部不均匀性分布,更多地反映体现特征轨迹状态,结合云计算平台,进行海量轨迹数据果类 了牧区草场的分布状况 分析,最终实现牲畜运动区域及草场区域分布划分。这些结果 3.3算法准确性分析 对未来草原畜牧业生产,商业应用及草场科研可以提供有力的 鉴于目前鲜有针对草原畜牧轨迹的挖掘算法,实验无法与 信息保障。 其他算法进行性能上的直接比较,本文中只考虑所提方法的准 参考文献 确性。为验证算法的实际正确性,对算法结果进行扯样,并抽 [1. Huang Xin, Chen Huijuan, Zheng Maogong, et al. Trajectory patlern 取所对应牧区草场进行实地勘测。实验中对某一牧区进行了 mining: methods and applications[ J_. Applied Mechanics Mate rials.2014,490-491:1361-1367 实地测试,结果如表2所示。 表2实地实验对比 L2 Yuan Guan, Sun Penghui, Zhao Jie, et al. A review of moving object trajectory clustering algorithms[ J]. Artificial Intelligence Review 轨迹数据國值 特征Ⅸ域及数量 2017,47(1):123-144 判断为停留区域数量:4 [3 Feng Zhenni, Zhu Y anmin. A survey on trajectory data mining: tech T-1 h 判断为草场区域数量:4 l4> iques and applicalions[ J.IEEE Access, 2016, 4: 2056-20017 1 Ashbrook D, Starner T. Using GPS to learn significant locations and 同时,对于在轨迹中所检测出的不同区域进行热度显示。 predict movement across multiple users[ J. Personal Ubiquitous 如图6所示,图(a)为停留区域所形成热度图,(b)为草场区域 Computing,2003,7(5):275-286 所形成的热度图。 [5 Alvi G, Pedersen T B. Mining long, sharable patterns in trajectories of moving objects[ J]. Geolnformatica, 2009, 13(1): 27 [6]王亮,胡琨元,库涛,等、随机采祥移动轨迹时空热点区域发现 aB2 及模式挖掘[J].吉林大学学报:工学版,2015,45(3):913 [7 Zhong Haidong, Zhang Shaozhong, Wang Yanlin, et al. Mining users' similarity from moving trajectories for mobile E-commerce re- 图6两组实验分别所选区域 commendation[J]. International Journal of Hybrid Information 为检测结果的正确性,对牧场所属区域进行实地勘测实 Technology,2014,7(4):309-320 验。在实地测试中,分别进行了两组实验: [8 Lee J G, Han Jiawei, Li Xiaolei, et al. TraClass: trajectory classifi 第一红测试所属区域为停留区域。本文测试了四个区域 点A1、A2、A3、A4(图6(a)进行实地验证,并证明在低速驻点 [J. Proceedings of the VLDB Endowment, 2008, 1(1):1081 区域内聚类区域为牲畜休息及生活地点(图7(a),图中分别 为三个栖息地(A1、A3、A)及一个水槽(A2)。 [9]袁冠,夏士雄,张磊,等,基于结枃相似度的轨迹聚类算法[J] 第二组实验验证草场区域。结合核密度分析热度图对四 通信学报,2011,32(9):103-110. 个不同热度区域B1、B2、B3、B1(图6(b)进行实地勘测,结果[0 Zheng Yu, Zhang lizhu, Xie Xin,eta, Mining correlation between 如图7(b)所示。实地测试显示对于同等热度区域牧场区别不 locations using human location history [C]//Advances in Geographic 大(B2、B3)(图7(b)),而对于不同热度区域草场,则有明显长 009:472-475 势密度差异(B1、B4)(图7(b)。 [ Il Li Zhenhui, Han Jiawei, Ji Ming, et al. MoveMine: mining moving abject data for dist cvery of animal movement patterns[J.ACM A M B B Trans on Intelligent Systems technology, 2011, 2(4): 135 [12] Giannotti F, Nanni M, Pedreschi D, el al. Unveiling the complexity of human mobility by querying and mining massive trajectory data LJ. VLDB Journal,2011,20(5):695-719 [13]气典辉,基于 算法[J].计算 图7牧区实地实验效果 机二程与应用,2012,48(27):22-26

...展开详情
试读 4P 论文研究-基于海量牧区羊群轨迹的区域属性挖掘研究.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分,得勋章
最新推荐
论文研究-基于海量牧区羊群轨迹的区域属性挖掘研究.pdf 10积分/C币 立即下载
1/4
论文研究-基于海量牧区羊群轨迹的区域属性挖掘研究.pdf第1页

试读结束, 可继续读1页

10积分/C币 立即下载 >