公司新(xīn)闻您的位置:首页 > 新(xīn)闻资讯 > 公司新(xīn)闻 >
公交車(chē)能(néng)耗分(fēn)析系统——存储与检索的优化
时间:2021-04-29 09:55来源:北京理(lǐ)工新(xīn)源 作者:BITNEI

技术背景

 

公交車(chē)能(néng)耗分(fēn)析系统结合运用(yòng)大数据技术,根据能(néng)耗影响因素构建模型进行分(fēn)析,并对公交車(chē)能(néng)耗流向进行统计,协助企业分(fēn)析、挖掘能(néng)耗问题,指导公交运营企业提升运营效率,降低运营成本。
 
基于上述背景下,接入多(duō)种类型的数据源后,為(wèi)提高存储效率与检索效率,针对“存储”和“检索”功能(néng)进行优化。
 

数据接入待优化问题

 

Ø 除了项目合作双方已沟通预定好的数据类型外,还存在其他(tā)待定数据类型;
Ø  若是业務(wù)扩展,则数据项的需求也随之扩展,数据存储的模式也需要变更;
Ø  现有(yǒu)灵活性存储模式都是冗余存储键值,存储空间利用(yòng)率较低;
Ø  开发人员的干预度较高,代码的耦合度较高,维护成本高。
 
优化方案流程介绍
 

 

 
针对公交車(chē)能(néng)耗分(fēn)析系统的多(duō)种类数据源接入,即多(duō)辆車(chē)的历史运营状态的多(duō)趟次信息,包括整車(chē)、空调、電(diàn)机、電(diàn)压、電(diàn)池、仪表電(diàn)压電(diàn)流、逆变器、充電(diàn)桩、发动机类型数据。存储模块主要实现消息报文(wén)的数据清洗、解析数据、规约数据、数据分(fēn)类处理(lǐ)后,压缩持久化存入分(fēn)布式文(wén)件系统HDFS中;检索模块主要实现类型和时间的检索,根据路径按类型和时间粒度划分(fēn)的存储层级替换变量匹配到真实路径,获取具體(tǐ)数据之后,关联汇总数据集,并封装返回,最后以“T+1”形式产出报表。

 

优化效益

 

本系统收集的数据来自于第三方通过硬件采集的数据,具有(yǒu)数据量大、数据密集等特点。
 
1.存储优化
 
在能(néng)耗数据产生后,需要将数据进行简单的预处理(lǐ)操作后存储至 HDFS,以供平台下一步利用(yòng)。根据消息可(kě)实现动态分(fēn)类,并完成数据的预处理(lǐ),实现数据类型、数据项的高可(kě)扩展。此外,除了压缩存储,降低对磁盘的空间占用(yòng),还去除存储的“键”值,降低数据的冗余性。
 
2.检索优化
 
為(wèi)了解决对一段时间内的历史数据的查询分(fēn)析任務(wù),横向扩展了查询模块,可(kě)以针对不确定数据项的存储提供弹性支持,并在一定程度上降低了模块间的耦合度,提高了模块的复用(yòng)率。数据集的存储保持一定的有(yǒu)序性,采用(yòng)类结构化的存储方式,相比无序的数据集可(kě)提高检索效率。并且,高内聚的模块开发,使用(yòng)无需关注细节,均采用(yòng)黑盒的方式操作,使用(yòng)简便。