没有合适的资源?快使用搜索试试~ 我知道了~
面向分布式列式存储的轨迹大数据k近邻查询.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 191 浏览量
2022-11-30
09:27:08
上传
评论
收藏 464KB DOCX 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/87214272/0001-d2187d518e969314566e7f4774b5ec18_thumbnail-wide.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
15页
面向分布式列式存储的轨迹大数据k近邻查询.docx
资源推荐
资源详情
资源评论
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![](https://csdnimg.cn/release/download_crawler_static/87214272/bg1.jpg)
随着导航定位技术的进步、移动互联网的发展和智能终端的普及,人们能够愈加方便
地获取并记录关于人、车、动物与自然现象(如台风、雨云)等移动对象的轨迹数据
[1]
。
目前,交通行业(如优步、滴滴出行等)和开放街道地图(OpenStreetMap,OSM)等众
源门户已经汇聚了大量轨迹数据,且其规模与日俱增,已形成轨迹大数据。海量的轨迹数
据为人们理解自然和社会的变化规律提供了前所未有的信息,促进了基于位置的社交网
络、智能交通系统和城市计算的发展
[2]
。轨迹大数据携带的时空信息也催生了许多基于轨
迹的应用,如传染病潜在接触人员追溯
[3]
、个性化路线推荐
[4]
、路网生成与更新等。
在上述应用中,人们通常希望查询在某一时间范围内经过指定地点附近的轨迹。例
如,在传染病潜在接触人员追溯中,需要查询近期经过疫情暴发地附近的人员或车辆轨
迹,更进一步地,可能需要查询与这些人员或车辆轨迹存在时空相关性的轨迹,以追溯潜
在的接触人员;当游客前往陌生景点时,希望查询最近经过该景点附近的轨迹,将其路线
作为下一步的出行参考
[5]
;在利用轨迹生成或更新局部路网时,需要获取最近一段时间内
经过相应范围的轨迹。显然,上述应用需要根据地理空间位置从大规模轨迹数据集中高效
查询出带有时间约束的最近邻轨迹。因此,本文面向轨迹大数据,利用分布式存储技术研
究具有一定时间约束的点-轨迹 k 近邻(point to trajectory k nearest neighbor,
P2T_kNN)查询处理问题。
目前,已有学者对 P2T_kNN 查询处理进行了研究。文献[6-7]使用 R 树或全局堆
[7]
等
数据结构设计了高效的 P2T_kNN 查询算法。然而,这些研究只关注轨迹的空间语义,难
以满足带时间约束的 P2T_kNN 查询需求。更重要的是,这些方法侧重于算法设计,仅适
用于集中式存储方案。为满足大规模时空数据的存储及查询需求,越来越多的研究试图在
非关系型数据库(not only SQL,NoSQL)
[8]
上建立时空数据引擎,充分利用其非固化模
式与分布式存储来实现时空数据的高效存储与查询
[9]
。MD-HBase
[10-11]
和 G-HBase
[12]
借助
Z 阶曲线在 HBase
[13]
之上建立了高效的空间索引,支持空间点数据的快速 k 近邻查询,但
是对时间语义的支持不足。GeoMesa
[14-15]
和 GeoWave
[16-17]
利用空间填充曲线
[18]
(space-
filling curve,SFC)对高维时空数据进行降维处理,从而建立了面向分布式键值存储的统
一时空引擎,支持时空点数据的快速 k 近邻查询,但其对时间约束的处理仍不够灵活。此
外,这些时空数据引擎仅支持传统的点-点 k 近邻查询处理,难以直接应用于 P2T_kNN 查
询。THBase
[19]
基于 HBase 的协处理机制,提供了轨迹数据的存储及 P2T_kNN 查询处理
方案,但是并没有考虑轨迹数据的空间分异性给查询带来的不利影响,数据稀疏区域的查
询性能较低。综上所述,本文工作与现有工作的异同见表 1。
表 1 近邻查询相关工作比较
Table 1. Comparison Between Related Works on Nearest Neighbor Query
统计项
输入
输出
扩展性
时空支持
平台
P2T_
k
NN
时间约束、空间点
Top-
k
近邻轨迹
可扩展
时空
NoSQL
文献[7-8]
空间点
Top-
k
近邻轨迹
不可扩展
空间
单机
MD-HBase
[10-11]
、G-HBase
[12]
空间点
Top-
k
近邻点
可扩展
空间
NoSQL
GeoMesa
[14-15]
、GeoWave
[16-17]
时间范围、空间点
Top-
k
近邻点
可扩展
时空
NoSQL
![](https://csdnimg.cn/release/download_crawler_static/87214272/bg2.jpg)
统计项
输入
输出
扩展性
时空支持
平台
THBase
[19]
时间范围、空间点
Top-
k
近邻轨迹
可扩展
时空
NoSQL
下载: 导出 CSV
| 显示表格
鉴于现有工作在面对大规模轨迹数据时,难以进行高效、带有任意时间约束的
P2T_kNN 查询处理,本文利用分布式列式存储技术设计了面向大规模轨迹数据的 k 近邻
查询处理框架,提出了一种融合时空剖分和轨迹分段的轨迹组织方法,在此基础上实现了
一种顾及轨迹数据空间分异性的自适应空间单元搜索算法。本文方法一方面借助于轨迹数
据的时空分段与降维编码,充分利用列式存储数据库的高效键值检索能力,另一方面通过
感知轨迹数据在给定时间约束下的空间分异特征,动态调整近邻查询的空间单元搜索步
长。
1. 点-轨迹 k 近邻查询
本文主要关注对于轨迹数据,具有一定时间约束的 P2T_kNN 查询处理问题,首先给
出相关的形式化定义。
定义 1 轨迹:移动对象在地理空间中经过的路径由一系列按时间顺序排列的轨迹点
表示,T = { p
1
…p
card (T)
},其中 p
i
= (x
i
,y
i
,t
i
),x
i
、y
i
、t
i
分别表示轨迹点的经度、纬度和采
样时间,且在一条轨迹中,∀1 ≤ i < j ≤ card (T),均有 t
i
< t
j
。
定义 2 点-轨迹距离
[20]
:点 p 到轨迹 T 的点-轨迹距离是 p 到 T 中所有轨迹点的最小
距离,即:
D(p,T)=minq∈Td(p,q)D(p,T)=minq∈Td(p,q)
(1)
其中,d (∙)为两点之间的距离函数,在欧氏空间中一般取 L
p
范数。
定义 3 时间约束集合:由互不相交的时间区间构成的集合,W = { W
1
…W
card(W)
},其
中 W
i
=(t
is
,t
ie
),t
is
< t
ie
,t
s
表示时间区间的开始,t
e
表示时间区间的结束,且∀1 ≤ i < j ≤
card (W),t
ie
< t
js
。
![](https://csdnimg.cn/release/download_crawler_static/87214272/bg3.jpg)
定义 4 点-轨迹 k 近邻(P2T_kNN)查询:给定时间约束集合 W,空间点 p,近邻数
k,待查询轨迹集合 S
T
,P2T_kNN 查询是从 S
T
中检索出一个有序集合 Q
T
,满足如下条
件:
1)card (Q
T
) = k;
2)∀ T ∈ Q
T
,均有 T ∈ S
T
;
3)∀ T
i
∈ Q
T
,设 p = (x
p
,y
p
,t
p
) ∈ T
i
,且是使 T
i
成为第 i 条近邻轨迹的轨迹点,那
么 Ǝ W
j
∈ W,使得 t
p
∈ W
j
;
4)设 T
i
和 T
j
分别是 Q
T
的第 i 条和第 j 条轨迹,如果 1 ≤ i < j ≤ k,那么 D (p,T
i
)
≤ D (p,T
j
);
5)∀ T
μ
∈ S
T
,T
μ
∉ Q
T
,T
ν
∈ Q
T
,均有 D (p,T
μ
)> D (p,T
ν
)。
在上述 P2T_kNN 查询问题的定义中,条件 3)保证满足时间约束条件,条件 4)说
明 Q
T
是按点-轨迹距离排序的集合,而条件 5)指出距离查询点 p 最近的 k 条轨迹一定在
输出结果之中。需要说明的是,时间约束集合 W 可以包含任意数量的时间区间,这对轨迹
数据的周期性对比分析具有重要意义,如查询过去 1 个月每天同一小时内前 k 条近邻轨迹
的分布和移动信息,用于挖掘蕴含其中的规律或异常。
2. P2T_kNN 查询框架
BigTable 是第一个面向列的存储模型,采用了基于内存表和 SSTable 的存储技术
[21]
。与模式固化的关系型数据库相比,列式存储具有自由模式表达和分布式组织等特征,
支持海量存储、高并发访问和弹性扩展。因此,本文基于分布式列式存储技术设计了面向
P2T_kNN 查询的处理框架,如图 1 所示。在轨迹数据组织方面,数据表以轨迹标识符为
行键来存储整条轨迹,而索引表以时空剖分形成的单元编码为行键来存储落入对应时空范
围内的轨迹片段;在近邻查询处理方面,首先基于空间的递归剖分机制确定搜索空间单元
的起点和步长,然后依据时空编码从索引表检索出候选的轨迹片段,最后进行过滤和排序
处理,以得到满足查询条件的轨迹标识符,据此从数据表中获取完整的 k 条近邻轨迹。
剩余14页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/3f07197aad004e4fa57ac5a008eb6aaf_weixin_57147647.jpg!1)
罗伯特之技术屋
- 粉丝: 4047
- 资源: 1万+
![benefits](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-1.c8e153b4.png)
下载权益
![privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-2.ec46750a.png)
C知道特权
![article](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-3.fc5e5fb6.png)
VIP文章
![course-privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-4.320a6894.png)
课程特权
![rights](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-icon.fe0226a8.png)
开通VIP
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 一个简单的MATLAB仿真示例,展示如何使用MATLAB进行基本的信号处理仿真:生成一个正弦波信号,并对其进行低通滤波处理
- 串口空闲中断 cubemax 任意长度数据
- GDAL-3.7.3-cp311-cp311-win-amd64.whl
- IE8或IE9浏览器下提升:请升级浏览器版本
- mat2pngmat2pngmat2png
- 一个简单的Python爬虫示例,用于爬取时光网电影排行榜上的电影名称和评分信息 这个示例仅用于教育目的,展示如何使用Python
- React全家桶框架.rar
- (PC+WAP)货物运输快递物流网站pbootcms模板 汽车贸易网站源码下载
- svg动画-源文件压缩包
- Python 中文数据结构和算法教程.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)