本算法基于Spark计算引擎,能够从海量的手机基站数据中挖据出用户的主要活动地点,比如工作地点和居住地点。实现好挖掘算法之后,通过JavaEE来整合上面的算法,让用户能够通过简单的Web UI就能够操作使用该算法,同时为用户提供了可视化数据的功能。
1、移动用户主要活动地点挖掘算法
1.1 算法输入数据字段:
字段名称
说明
例子
phoneNo
手机号码,唯一标志一个用户
DEF2B5CA38FF9699732B65BA3941DBA2
time
用户连接基站的时间
20160923032356
longitude
经度
113.4138
latitude
纬度
23.1205
算法数据是以CSV格式保存,只要csv数据中包含上面的四个字段就可以作为本算法的输入数据集。
1.2 手机基站数据的特点:
优点: 1)、获取成本低 2)、数据量多 3)、覆盖人群广 4)、轨迹数据联系
缺点: 1)、数据不准确:手机基站的日志信息里面包含移动用户的经纬度数据