移动对象轨迹序列模式挖掘

移动对象轨迹是由大量的时空数据组成的一系列数据,具有实时性、海量性、不确定性等特点,如何通过对实时的时空轨迹数据进行分析进而挖掘出用户需要的轨迹行为模式是基于位置服务的一大研究热点。

数据挖掘 (Data Mining) 近来一直备受关注,相关研究也逐渐深入,加之技术日趋成熟,已逐渐转变成用户移动数据挖掘的一种重要工具。由时间序列引出的序列模式挖掘 (Sequence Pattern Mining),作为数据挖掘的一个重要方法,吸引了很多研究者前来研究,一定程度上解决了如何通过用户的移动轨迹数据集挖掘出有效信息的困惑。面对时间和空间两个方面的移动轨迹信息,首先通过时间这一属性将轨迹数据转化为时间线上的序列模式 (Sequence Pattern),再对每条的序列数据进行模式挖掘 (Pattern Mining),去除噪音,挖掘出有效信息。序列模式挖掘已经成为将移动对象的大量轨迹数据转化为有用的信息资源的有效工具,进而可以进行高效的科学决策。

对于序列模式挖掘算法,国内外的一些研究均在 Apriori 的算法以及 PrefixSpan 算法这两大类的基础上进行的。Apriori 算法是 R.Agrawal 和 R.Srikant 共同提出的规则挖掘频繁项集的算法,并且此算法衍生了很多其他的算法,例如:AprioriAll 算法、GSP 算法和 SPADE 算法等。而 PrefixSpan 算法则是由 J.Han 等人提出的基于数据库投影模式增长的算法,此算法也衍生出很多算法,例如:Freespan 算法等。

序列模式挖掘 (Sequence Pattern Mining) 是指在时间序列数据中挖掘频繁出现的时间序列。序列模式挖掘在数据挖掘的研究中占着十分重要的位置。时间序列数据通过系统提取,能够让人们做出适当的调整或者及时发现变动,而且时间序列数据之间的规律通过序列模式挖掘之后则可以发现更多潜在的知识,甚至成为一个重要的理论热点或者发现更高的实用价值。

0%