基于Spark的移动用户主要活动地点的挖掘算法实现以及JavaEE技术整合

xiaoxiao2021-02-28  94

本算法基于Spark计算引擎,能够从海量的手机基站数据中挖据出用户的主要活动地点,比如工作地点和居住地点。实现好挖掘算法之后,通过JavaEE来整合上面的算法,让用户能够通过简单的Web UI就能够操作使用该算法,同时为用户提供了可视化数据的功能。

1、移动用户主要活动地点挖掘算法

1.1 算法输入数据字段:

字段名称 说明 例子 phoneNo 手机号码,唯一标志一个用户 DEF2B5CA38FF9699732B65BA3941DBA2 time 用户连接基站的时间 20160923032356 longitude 经度 113.4138 latitude 纬度 23.1205

算法数据是以CSV格式保存,只要csv数据中包含上面的四个字段就可以作为本算法的输入数据集。

1.2 手机基站数据的特点:

优点: 1)、获取成本低 2)、数据量多 3)、覆盖人群广 4)、轨迹数据联系

缺点: 1)、数据不准确:手机基站的日志信息里面包含移动用户的经纬度数据

转载请注明原文地址: https://www.6miu.com/read-31567.html

最新回复(0)