摘要:針對傳統(tǒng)序列模式挖掘算法都是針對單機環(huán)境、靜態(tài)實例以及非連續(xù)軌跡的不足,提出了Map/Reduce系統(tǒng)與經(jīng)過優(yōu)化的PrefixSpan序列模式挖掘算法相結(jié)合的改進型算法。該算法在生成投影數(shù)據(jù)庫時,只有當待投影序列的第一個元素和前綴的最后一個元素相同時才會被選中,保證了挖掘出的都是連續(xù)軌跡片段。同時采用并行處理的方法,使用Map函數(shù)構(gòu)建每個頻繁序列前綴對應(yīng)的投影數(shù)據(jù)庫,使用Reduce函數(shù)整合所有的中間鍵值對得到需要的結(jié)果。