公交車(chē)能(néng)耗分(fēn)析系统——存储与检索的优化_北京理(lǐ)工新(xīn)源信息科(kē)技有(yǒu)限公司，政府级新(xīn)能(néng)源汽車(chē)监控平台，新(xīn)能(néng)源汽車(chē)自助分(fēn)时租赁平台。

公司新(xīn)闻您的位置：首页 > 新(xīn)闻资讯 > 公司新(xīn)闻 >

公交車(chē)能(néng)耗分(fēn)析系统——存储与检索的优化

时间:2021-04-29 09:55来源:北京理(lǐ)工新(xīn)源作者:BITNEI

技术背景

公交車(chē)能(néng)耗分(fēn)析系统结合运用(yòng)大数据技术，根据能(néng)耗影响因素构建模型进行分(fēn)析，并对公交車(chē)能(néng)耗流向进行统计，协助企业分(fēn)析、挖掘能(néng)耗问题，指导公交运营企业提升运营效率，降低运营成本。

基于上述背景下，接入多(duō)种类型的数据源后，為(wèi)提高存储效率与检索效率，针对“存储”和“检索”功能(néng)进行优化。

数据接入待优化问题

Ø 除了项目合作双方已沟通预定好的数据类型外，还存在其他(tā)待定数据类型；

Ø 若是业務(wù)扩展，则数据项的需求也随之扩展，数据存储的模式也需要变更；

Ø 现有(yǒu)灵活性存储模式都是冗余存储键值，存储空间利用(yòng)率较低；

Ø 开发人员的干预度较高，代码的耦合度较高，维护成本高。

优化方案流程介绍

针对公交車(chē)能(néng)耗分(fēn)析系统的多(duō)种类数据源接入，即多(duō)辆車(chē)的历史运营状态的多(duō)趟次信息，包括整車(chē)、空调、電(diàn)机、電(diàn)压、電(diàn)池、仪表電(diàn)压電(diàn)流、逆变器、充電(diàn)桩、发动机类型数据。存储模块主要实现消息报文(wén)的数据清洗、解析数据、规约数据、数据分(fēn)类处理(lǐ)后，压缩持久化存入分(fēn)布式文(wén)件系统HDFS中；检索模块主要实现类型和时间的检索，根据路径按类型和时间粒度划分(fēn)的存储层级替换变量匹配到真实路径，获取具體(tǐ)数据之后，关联汇总数据集，并封装返回，最后以“T+1”形式产出报表。

优化效益

本系统收集的数据来自于第三方通过硬件采集的数据，具有(yǒu)数据量大、数据密集等特点。

1.存储优化

在能(néng)耗数据产生后，需要将数据进行简单的预处理(lǐ)操作后存储至 HDFS，以供平台下一步利用(yòng)。根据消息可(kě)实现动态分(fēn)类，并完成数据的预处理(lǐ)，实现数据类型、数据项的高可(kě)扩展。此外，除了压缩存储，降低对磁盘的空间占用(yòng)，还去除存储的“键”值，降低数据的冗余性。

2.检索优化

為(wèi)了解决对一段时间内的历史数据的查询分(fēn)析任務(wù)，横向扩展了查询模块，可(kě)以针对不确定数据项的存储提供弹性支持，并在一定程度上降低了模块间的耦合度，提高了模块的复用(yòng)率。数据集的存储保持一定的有(yǒu)序性，采用(yòng)类结构化的存储方式，相比无序的数据集可(kě)提高检索效率。并且，高内聚的模块开发，使用(yòng)无需关注细节，均采用(yòng)黑盒的方式操作，使用(yòng)简便。