首页 > 代码库 > vehicle time series data analysis
vehicle time series data analysis
以HADOOP为代表的云计算提供的只是一个算法运行环境,为大数据的并行计算提供了在现有软硬件水平下最好的(近似)方法,并不能解决大数据应用中的所有问题。从具体应用而言,通过物联网方式接入IT圈的数据供应商(Data Provider)所面临的首要问题是数据分析的算法,其次才是算法的并行计算。
以汽车厂商(OEM,Tire1,Vendor,TSP)为例,所面临的大数据问题在 4V(Volume,Velocity,Variety,Veracity/Value)中,最突出的差异是Velocity,即实时性(Real Time),有些信号的更新周期达到10ms。当然从应用采样和算法处理角度而言,可能并不需要这么密的数据,这就涉及到系统架构的区别,哪些功能放在终 端上运行,哪些功能在后台服务器上运行。以发动机转速信号为例,总线上这个信号的周期一般是10ms±5%,如果整个车联网系统要做的只是驾驶员行为分析 (反映车辆运行状态),根本就用不上这么高频度的采样周期,完全可以10s往后台打包发一次数据。但是如果整个车联网的应用是发动机故障诊断或防盗报警, 需要的精度就不一样了,正常启动转速低于500rpm几乎可以肯定发动机异常,如果等到30s后驾驶员才得到提示,发动机就该冒烟了。而对于一些事件触发 信号,如锁车状态下发动机异常启动,后台服务器判断车辆被盗的时间要求则更高。
遗憾的是时间序列的分析和处理在车联网领域几乎没有成熟的工具和方法,即使Matlab、R、WolframAlpha这类专业的数学工具,提供的算法库也很少。这一方面是因为物联网行业积累的数据不够丰富,应用前景不清晰,更重要的是时间序列数据的处理涉及各专业领域的技术和方法,处理难度很大。以汽车速度这一数据为例,机械工业时代大家关心的单位是小时,电子和信息工业时代单位是s,物联网行业全过程、大样本场景下讨论的则是ms。
vehicle time series data analysis