导读
当前数字经济已经成为全球最重要的经济形态,以“云大物移智链”等信息技术为支撑,强化顶层设计和统筹协调,通过实施数字化转型实现内生性增长成为某铁路集团“智能铁路”建设的发展目标和发展要求。
一、某铁路集团客户业务困境分析
随着数字化转型工作的深入,某铁路集团也面临着以下困境:
数据孤岛现象明显
铁路信息系统已覆盖客货营销、运输组织、经营管理等各个领域,各系统都积累了海量的数据,但各系统各自为政,独立建设,数据共享不够等数据孤岛情况明显,数据集成较弱,基础数据多头维护、数据标准化程度不高等现象尤为突出;
缺乏深层次的数据价值挖掘
对于数据的利用还停留在初级阶段,数据价值的进一步挖掘、数据的深层次分析和业务的科学预测基本空白;对于数据的利用仍以专业为界限,缺乏跨部门、跨业务系统之间的数据综合分析。
传统数据查询提取效率低下
受限于传统的基于关系型数据库(RDS)架构的数据分析系统,当表单数据超过千万,对于RDS 的压力就会呈指数增加,系统在生产库中提取数据进行分析处理时,数据表之间的连表查询需求增加导致压力非常大,严重的甚至会导致系统崩溃,影响正常业务。
二、数果智能专家库的解决方案
1、制定需求总体实现方案
(1)数据萃取
为了突破专业及信息系统的界限进行数据的深层次挖掘和分析,数果智能的专家组从整体、宏观的角度厘清集团数据关系,明确以数据分类为出发点,通过数据萃取实现各专业、各系统数据在数据仓库中的互联互通,高效提取数据中的价值进行跨专业分析和挖掘数据,提升系统的效率。
(2)构建One ID
通过集团内部One ID的建立,打破数据孤岛的现状,打通分散在各个平台的数据,整合数据,实现各平台存储的数据融通,从而提升业务效率和用户体验。
图:数果智能数据萃取方案示意图
2、关键环节-ID Mapping
技术往往服务于实际的业务,数据萃取和One ID构建过程中,ID Mapping是最关键环节。
它要解决的场景问题是:多端数据的识别和多源数据的打通。
即将同一个用户在各个不同业务系统中的身份标识通过数据手段串联起来,生成一个统一的用户标识,解决用户的属性、行为相关数据分散在不同的数据来源中导致的数据孤岛问题。
ID Mapping的质量决定了数据萃取的成败,那么它的实施步骤又包含哪些呢?
#1 要素识别
识别实体对象、用户信息的各个要素。
如用户原始 ID 、名称、编码等信息。
#2 设定识别规则
通过抽象手法设置相应的规则。
如不同来源的数据中相同的站名识别为同一个站。
同时还需要设定边阈值,过滤弱连接和“噪音”。
#3 构建图模型
用连通子图的算法求得哪些ID标识是属于同一个对象。
#4 结果集输出
连通的所有数据采用同一OneID代表同一对象数据。
未连通的数据分配一个新的OneID。
通过循环去重,合并数据,最终生成结果。
三、解决方案的应用效果
1、形成规范的主数据字典
通过ID Mapping,数果智能成功帮助客户实现了孤立的系统数据从 ID 层面打通了,输出规范的ID映射字典。
由数果智能自研的主数据字典管理模块,能够帮助客户实现各专业不同基础数据的Mapping,达到数据融通的目的对入库的数据建立统一字典,规范各专业的数据字典,也为后期大数据的关联钻取分析做准备。
2、充分利用数据字典功能
#1 字典配置
通过数据管理的模块,我们可以在【字典配置】中对识别出来需要进行ID Mapping的对象以及涉及该对象的专业进行配置。
图:数据字典配置功能界面示意图
#2 规则配置
对识别出来的映射规则进行配置,系统可以根据已配置的规则对新增数据进行自动映射。
图:数据字典自动审核规则界面示意图
#3 数据维护
在系统中,我们还额外提供了人工维护的功能,可以手动维护系统无法自动完成映射的数据,确保映射正确。
图:数据维护界面示意图
四、总结
数果智能通过数据萃取、ID Mapping,成功帮助某集团客户将各专业、各系统数据全部连通,从而为跨专业分析、挖掘数据夯实了数据基础,有效提升了数据价值。
数果智能的One ID方案,就像一座桥梁,把集团内部不同时期孤立建设的业务系统,用统一的ID串联起来,数据孤岛就连成一片,客户得以站在更加宏观的层面,更全面、更完整的了解业务状况。