没有合适的资源?快使用搜索试试~ 我知道了~
地理格网模型支持下的轨迹数据管理与分析框架:方法与应用.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 158 浏览量
2022-11-30
09:26:43
上传
评论
收藏 295KB DOCX 举报
温馨提示
试读
11页
地理格网模型支持下的轨迹数据管理与分析框架:方法与应用.docx
资源推荐
资源详情
资源评论
自卫星定位、传感网络、无线通信等技术出现与普及以来,各个领域产生了大量轨迹
数据,并正在持续累积
[1]
。轨迹数据是指一个或多个移动对象在运动过程中由定位设备在
不同时刻采集的地理位置、运动状态及相关属性的数据,用数学公式通常可表示为按时间
顺序排列的一串轨迹点集合 T={p
1
,p
2
,p
3
… p
n
},其中 p
i
={x,y,a,t},(x,y)是轨迹
点坐标,a 是轨迹点的属性值,t 是信息采集时间。轨迹数据来源多种多样,可以通过全球
卫星导航定位、移动通信基站定位、射频识别技术、摄像头视觉定位、卫星遥感影像识别
和手机端应用等不同方式获取。
按照移动对象的类型,轨迹数据主要包括人类活动轨迹、交通车辆轨迹、动物活动轨
迹和自然现象轨迹 4 种类型
[2]
。轨迹数据能够反映移动对象个体或群体在精细尺度上的位
置及状态的全过程变化,具有丰富的时间、空间、语义及交互信息特征,因此具有很大的
研究价值
[3]
。轨迹数据挖掘已广泛应用于智能交通
[4-5]
、城市规划
[6-8]
、公共安全
[9-10]
、环境保
护
[11]
、社会行为
[12-13]
、文化旅游
[14-15]
等领域。
为了尽可能地挖掘轨迹数据蕴含的应用价值,学者们在轨迹数据管理与分析方法方面
开展了大量研究工作
[16-17]
,其中轨迹数据管理作为数据挖掘与应用的基础,一直以来是国
内外研究的热点,主要包括轨迹数据表达模型、轨迹数据索引与检索、轨迹数据库、轨迹
数据预处理(数据清洗、数据压缩、轨迹分段、路网匹配)等几个方面
[1]
。另外,在轨迹
数据分析方面也产生了大量的研究成果
[2]
,如为研究移动对象的代表性路径或公共倾向行
为的轨迹聚类
[18]
、用来识别轨迹的不同运动状态以区分出行方式和活动类型的轨迹分类
[19]
、研究移动对象群体行为特征和规律的模式挖掘,包括伴随模式挖掘
[20]
、频繁模式挖掘
[21]
、周期模式挖掘
[22-23]
、异常行为探测
[24]
等。
但进入大数据时代以来,轨迹数据呈现井喷式增长,轨迹大数据的“5V”特性为其挖掘
分析带来了巨大困难
[25]
,学者们尝试将大数据处理技术应用于轨迹研究,即利用云计算、
分布式计算、并行计算等高性能计算模式加速大规模轨迹数据分析
[26-29]
,但此类方法主要
依赖计算资源,不是从算法本身解决轨迹数据计算与分析复杂的问题。也有部分学者探索
优化索引结构或提高算法性能,如文献[17]和文献[30]分别提出了 Geohash-Tree 和
TripCube 轨迹数据索引结构实现对轨迹数据的高效管理,文献[31]和文献[32]分别对相似
性分析与地图匹配算法进行优化,降低算法复杂度,但算法效率未得到数量级提高,应对
大规模轨迹数据仍然存在困难。
综上所述,虽然现有研究工作取得了一些积极的成果,但是现有轨迹管理与分析方法
在同时面对大规模、复杂异构、多维动态的轨迹数据特点与高时效性应用需求时,仍然面
临以下挑战:
1)轨迹数据来源不一导致位置表达方式、空间参考、定位精度等高度不一致,具有
多源异质特性,使得多源异构轨迹数据的统一管理与融合分析困难;
2)缺乏适合于大规模轨迹数据的高效索引与快速检索方法;
3)已有的轨迹数据分析算法计算复杂度高,难以满足即时分析的需求;
4)矢量表达轨迹数据精度高,但跨尺度分析相对独立,无法根据不同应用场景自适
应、灵活地调整轨迹数据表达尺度,以降低上层分析复杂度。
总之,现有轨迹数据管理与分析理论难以满足日益迫切的时效性高、灵活性强的轨迹
数据应用需求。
近些年来,随着计算机技术、地理信息技术的快速发展,以及地理空间信息的表达、
更新与分析日益复杂,地理格网空间数据模型得到重新的认识和重视,并成为重要的前沿
方向
[33-34]
。地理格网模型是由一系列离散而规则的单元,按照一定的规则组合而形成的对
地理实体的表达体系
[35]
。它具有统一性、离散化、多尺度、多分辨率以及编码计算等特
性,在多源异构数据融合、大规模空间数据高性能运算等方面具有得天独厚的天然优势
[36-
38]
,为大规模轨迹数据管理与分析打开了新的视角。
在这样的背景下,本文提出了基于地理格网模型的轨迹数据管理与分析框架,该框架
以地理格网模型为基础,实现对轨迹数据的多尺度编码表达与组织,通过表达方法、算法
实现、方法策略等多方面改造并构建基于格网编码的轨迹计算与分析算法集,进一步结合
高性能计算技术,为海量轨迹数据挖掘应用提供支撑。
1. 基于地理格网模型的轨迹数据管理与分析
1.1 总体框架
基于地理格网模型的轨迹数据管理与分析框架主要包含地理格网模型、轨迹多尺度表
达与组织、轨迹计算与分析、高性能计算技术、轨迹挖掘应用 5 部分内容,涵盖了轨迹数
据挖掘研究“表达-管理-分析-应用”的全链条。基本内容如图 1 所示,首先地理格网模型主
要提供格网剖分与编码理论,以及编码转换、空间操作等基础算子,是改造轨迹数据表
达、管理、分析及应用的基础理论;其次,轨迹多尺度表达与组织是在地理格网模型基础
上将出租车轨迹、公交集成电路卡(integrated circuit card,IC)消费数据以及飞机自动
广播相关监视数据(automatic dependent surveillance-broadcast,ADS-B)等轨迹数据
映射为一维格网地址编码,并构建高效索引结构,是轨迹计算与分析的支撑技术;然后,
轨迹计算与分析部分包含一系列基于格网编码空间的低复杂度、高性能计算与分析算法;
而轨迹挖掘应用则针对各个领域的具体需求,提供高时效、智能的解决方案,以更好地满
足实际所需,发挥轨迹数据的潜在价值;最后,高性能计算部分则借助大数据处理技术为
整个框架提供高效的存储和计算资源,保证框架的高速平稳运作。
图 1 基于地理格网模型的轨迹数据管理与分析框架
Figure 1. Technology Framework of Trajectory Data Management and Analysis Based
on Geographical Grid Model
下载: 全尺寸图片 幻灯片
1.2 关键理论与方法
1.2.1 地理格网模型
地理格网模型的核心内容是格网剖分与编码,是将地球表面空间按照一定的规则逐级
划分,并通过地址编码的方式表达任意空间位置。地理格网模型有很多种,以四叉树格网
为例,它是最流行的格网模型之一,具有矢量坐标兼容性好、索引成熟、空间分析简单等
优势
[39-41]
,其基本原理如图 2(a)所示。
剩余10页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3697
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功