北京市大数据治理项目
发布时间:2020-08-06

项目背景

为贯彻落实习近平总记 “推动实施国家大数据战略”的指示,按照市委市政府的总体部署,北京市正在实施北京大数据行动计划,编制了《关于组织实施北京大数据行动计划的工作方案》,以建设首善标准的城市大数据中心为目标,旨在全面升级全市信息化建设水平,实现数据资源开放共享全覆盖,通过大数据应用促进城市精细化管理,提高科学决策能力,保障和服务民生,建设世界级智慧城市。

2018年以来,通过对北京大数据行动计划的推进和落实,结合疏解整治促提升、城市规划建设管理、社会信用等主题应用需求,依托市级大数据平台,完成了相关政府部门和社会机构的数据汇聚,结合区块链理念,开展了全市大数据目录体系的建设,对已汇聚的数据进行清洗、治理和服务。

 

解决方案

一、项目目标

基于市级大数据平台,充分利用大数据、区块链、AI等先进理念和技术,进一步完善北京市大数据目录体系,实现对全市大数据的统一管控;重点针对人、企、物等基础数据,开展政务数据汇聚和社会数据接入,并对汇聚数据进行清洗、标签、质量管理、安全管理、接口封装等全生命周期管理,完成市级大数据平台的基础数据建设,为相关主题应用提供支撑。


二、主要内容


1. 目录体系建设

全市各部门、各区从三定职责入手,逐级梳理“职责-数据-库表”三级目录 ,引入区块链的公开、分权、不可篡改、合约机制等理念和技术,将各部门的职责目录和数据目录“上链”锁定,实现数据与职责的强关联、数据变化的实时探知及数据访问的全程留痕,保证各部门目录的可见、可用、可考核,从根本上解决目录不全、目录与数据“两张皮”、目录变更和数据共享授权随意、数据更新不及时等传统“老大难”问题。


2. 数据汇聚

城市级大数据平台的构建,其基本原则是全市数据一盘棋,打破数据无序交换、重复流通的状态,通过汇聚和汇通的方式,实现数据的统筹集约化管理。当前聚为主、通为辅,主要针对基础数据、共性高频数据通过“一次汇聚,多次共享”的模式,此阶段核心是解决思想问题;下步过度到通为主、聚为辅,将城市数据所有数据源联通,实时掌握数据的状态情况,通过服务的方式按需调用。

                                              

3. 数据治理

北京市大数据平台的数据治理分为五层:

(1)原始数据层:北京市大数据平台汇聚的原始数据,包括政务数据和社会数据。

(2)数据治理层:即“中台”,横向上由清洗数据层(贴源)、标准数据层(原子)、关系图谱层(关联)组成,纵向上由元数据、标签、质量、规则、安全等流程贯穿。

(3)数据服务层:北京市大数据平台的基础库和主题库,按需服务于前台业务。


主要工作内容:

(1)数据清洗

基于市级大数据平台汇聚的政务数据和社会数据,制定数据清洗方案,根据结构化、半结构化、非结构化等不同的数据类型以及不同的数据敏感等级,重点明确相应的数据入库、存储、清洗规则和处理流程;根据相应规则,对数据进行入库、整理和规范化处理,形成“人”、“企”、“物”基础数据库。

(2)数据标签

建设标签类目体系和标签规则,对汇聚数据开展表级、字段级的打标签工作,通过标签构建数据关系图谱。对标签类目根据管理和服务的需求进行动态管理,在保障高效管理的前提下,满足业务的灵活适配,并满足轻量级数据服务的需求。

(3)数据质量管理

制定数据质量管理体系和规则,通过统一的数据质量度量、数据质量逻辑处理、执行的规范化步骤,对数据的完整性、准确性、一致性、时效性、规范性等方面进行质量评价,形成数据质量报告,对数据质量进行全流程管理。

(4)数据安全管理

制定市级大数据平台的数据分级授权和分权管理方案,从管理和技术两个层面明确数据安全管理的角色、责任、流程和具体操作,确保数据在市级大数据平台的所有流向、操作能够全流程可监控、可追溯。


4. 数据服务

基于治理后的数据,进行标准数据接口的封装和配置,具体包括接口规则配置、接口调用规范编制、接口授权及接口对接联调等工作。能实现符合规则的单条或多条数据查询、比对和更新,并根据不同的业务需求进行定制。

 

应用价值

通过北京大数据治理工作,形成“人”、“企”、“物”基础数据库,以数据、标准接口、专题分析等多种方式,向55个市级部门和16个区提供了数据共享,日均共享数据近3亿条,支撑疫情防控、复产复工、领导驾驶舱、一网通办、疏解整治促提升、社会信用、反恐维稳等全市重点主题应用,及财源建设、不动产登记、楼宇经济等上百项市区核心业务应用,为世园会、国庆阅兵等重大活动提供保障。

电话:010-57702888

邮箱:taiji@mail.taiji.com.cn

点击
留言