公司新(xīn)闻您的位置:首页 > 新(xīn)闻资讯 > 公司新(xīn)闻 >
北理(lǐ)新(xīn)源数据质量画像體(tǐ)系為(wèi)重型車(chē)遠(yuǎn)程排放监控数据质量保驾护航
时间:2020-08-26 09:14来源:北京理(lǐ)工新(xīn)源 作者:BITNEI

2018年12月,生态环境部、发改委、工信部、交通运输部等11部门联合印发《柴油货車(chē)污染治理(lǐ)攻坚战行动计划》,提出要加快建设完善“天地車(chē)人”一體(tǐ)化的机动車(chē)排放监控系统和开展排放大数据分(fēn)析应用(yòng)工作,其中“天地車(chē)人”中的“車(chē)”即重型車(chē)OBD遠(yuǎn)程排放监控平台。
 

目前,各地方政府纷纷加快重型車(chē)OBD遠(yuǎn)程排放监控平台建设的步伐,并积极开展三级架构下的数据互联互通。但地方平台管理(lǐ)部门对接入車(chē)辆数据质量的把控缺乏有(yǒu)效抓手,很(hěn)难支撑后期减排大数据分(fēn)析应用(yòng)工作的开展,具體(tǐ)表现為(wèi):(1)缺少完善的数据质量评价體(tǐ)系结构,对采集数据的一致性问题、完整性问题、重复性问题等,尚没有(yǒu)完整的评价體(tǐ)系结构;(2)没有(yǒu)形成系统化的数据质量评估指标,且针对数据质量评估指标没有(yǒu)形成具體(tǐ)的量化标准,很(hěn)难支撑后期数据质量治理(lǐ)工作。
 

基于此,北理(lǐ)新(xīn)源建立了一套标准化、专业化的“端到端”数据质量画像體(tǐ)系,系统化、精准化识别車(chē)辆遠(yuǎn)程数据传输存在的问题,可(kě)辅助地方生态环境部门进行终端硬件设备和平台软件系统的优化工作,不断提高車(chē)辆遠(yuǎn)程数据接入质量,為(wèi)后期基于遠(yuǎn)程监测数据开展深层次的分(fēn)析应用(yòng),為(wèi)柴油货車(chē)污染防治攻坚战管理(lǐ)决策奠定坚实基础。

图1 北理(lǐ)新(xīn)源重型車(chē)OBD遠(yuǎn)程排放监控数据质量画像體(tǐ)系
 

北理(lǐ)新(xīn)源重型車(chē)OBD遠(yuǎn)程排放监控数据质量画像體(tǐ)系将从数据质量分(fēn)析标准制定、评价指标和评价模型构建、数据质量分(fēn)析报告制定三部分(fēn)开展。首先,从数据的完整性、有(yǒu)效性、时效性、一致性四个维度建立数据遠(yuǎn)程传输质量评价标准;其次,依据评价标准,建立评价指标體(tǐ)系和约束规则,并提炼形成数据遠(yuǎn)程传输数据质量通用(yòng)评估模型,量化评估终端采集、传输的数据质量情况;最后,设计数据质量分(fēn)析报告體(tǐ)系,基于通用(yòng)评估模型成果,定期化、定制化输出专业化数据质量评估报告,实现研究成果的业務(wù)化应用(yòng)。
 

(一)数据质量评估标准:為(wèi)评估工作绘好蓝图
 

完整性:完整性是描述数据信息缺失程度的重要标准。根据國(guó)家及地方通讯协议对终端上传数据项的要求,建立空值率计算公式,判定终端上传数据项是否完整。
 

有(yǒu)效性:有(yǒu)效性是描述数据遵循预定的语法规则的程度,是否符合其定义,比如数据类型、格式、取值范围等。有(yǒu)效性规则从类型有(yǒu)效、格式有(yǒu)效和取值有(yǒu)效三个方面建立。
 

时效性:时效性评估将结合数据时间戳信息,检验数据的采集周期、转发周期,终端评估数据上传的时效是否符合标准规范要求。
 

一致性:数据质量的一致性主要體(tǐ)现在数据记录的规范和数据是否符合逻辑。如百公里尿素使用(yòng)量、百公里油耗等是否符合正常用(yòng)車(chē)习惯,為(wèi)识别数据作弊車(chē)辆奠定基础。 
 

(二)数据质量评估模型:全面勾勒数据现状
 

数据质量评估模型以車(chē)辆静态数据和终端上报数据為(wèi)对象,通过建立数据质量画像标签體(tǐ)系和数据质量检测评分(fēn)體(tǐ)系,对影响数据质量的各环节的核心指标进行计算,并出具综合评分(fēn)和评价等级结果,作為(wèi)数据质量是否通过评价的依据。通过指标赋权,以数值形式展示各指标对评价结果的重要性,提高评价结果的科(kē)學(xué)性、合理(lǐ)性。
 

(三)数据质量报告:多(duō)维度输出评估结果
 

在评估的基础上,将根据地方环保部门业務(wù)管理(lǐ)需求,输出不同维度的分(fēn)析报告,包括:平台技术鉴定报告、数据质量评分(fēn)报告、車(chē)型技术分(fēn)析报告、终端技术分(fēn)析报告等。报告将以图文(wén)并茂的形式,形象展示数据分(fēn)析结果,
 

图 2 北理(lǐ)新(xīn)源重型車(chē)OBD数据质量技术鉴定模块
 

通过北理(lǐ)新(xīn)源重型車(chē)OBD数据质量评估體(tǐ)系,将有(yǒu)效解决地方政府重型車(chē)遠(yuǎn)程传输数据质量分(fēn)析中检查手段单一、及时性与准确性程度不够、管理(lǐ)难度大等问题,有(yǒu)效提升整體(tǐ)数据质量,為(wèi)后期数据分(fēn)析和决策支撑奠定坚实基础。同时,该评估體(tǐ)系具有(yǒu)良好的扩展性,可(kě)广泛应用(yòng)于車(chē)辆监管部门、車(chē)辆运营单位、终端制造企业等各类主體(tǐ),提升行业大数据分(fēn)析平台数据质量,促进数据挖掘、人工智能(néng)等新(xīn)技术在車(chē)联网领域的研究和应用(yòng)。

 

撰稿:徐   莎
审核:陈奕昆