为此,研究人员通过两个步骤分析了北京市2014年4月至6月间约16亿次公交卡刷卡数据记录,共涉及约600万名乘客。第一步,他们把北京划分为居住、工作、教育、购物、娱乐、医疗等多个小功能区块,建立起包括896条公交路线、近4.5万个公交车站与18条地铁路线、320个地铁站的公共交通网络数据集,通过数据建模从庞大的公交卡记录中过滤掉普通乘客;第二步,结合从警方报告和微博上收集到的失窃信息,通过机器学习算法从异常出行信息中挖掘出潜在的小偷。【详细】