宋庄网站建设什么是域名解析错误
news/
2025/10/3 0:30:34/
文章来源:
宋庄网站建设,什么是域名解析错误,如何自己做公众号,眼镜网站模板一、大数据时代还需要数据治理吗#xff1f;
数据平台发展过程中随处可见的数据问题
大数据不是凭空而来#xff0c;1981年第一个数据仓库诞生#xff0c;到现在已经有了近40年的历史#xff0c;相对数据仓库来说我还是个年轻人。而国内企业数据平台的建设大概从90年代末…一、大数据时代还需要数据治理吗
数据平台发展过程中随处可见的数据问题
大数据不是凭空而来1981年第一个数据仓库诞生到现在已经有了近40年的历史相对数据仓库来说我还是个年轻人。而国内企业数据平台的建设大概从90年代末就开始了从第一代架构出现到现在已经经历了近20年的时间。 在这20年的时间里国内数据平台实施者可以说是受尽折磨数据项目一直不受待见是出了名的脏活累活。 可以说忽视数据治理给数据平台建设带来了不少问题。随处可见的数据不统一难以提升的数据质量难以完成的数据模型梳理等源源不断的基础性数据问题限制了数据平台发展导致数据应用不能在商业上快速展示效果。
举一个典型商业智能应用的例子管理驾驶舱可能大家都听说过很多企业建设了管理驾驶舱但是建设完之后往往成为摆设只有当领导需要看的时候大家才去拼命改数据。
为什么数据平台的建设遇到这么多“坎”而且难以真正发挥其商业价值其实核心问题还是数据本身不统一数据内容准确度不高。
数据治理逐渐受到各行业认识
我国最早意识到数据治理重要性的行业银行是金融行业。由于对数据的强依赖金融业一直非常重视数据平台的建设经过几代数据平台的验证发现数据治理是平台建设的主要限制因素而且随着投资和建设的投入增加对数据治理的重要性的认识也越来越深刻。
央行与银监会也非常重视数据治理早在2008年开始在全国银行业推行统一的数据标准控制行业的数据质量。工行、建行、国开等大型银行对数据治理都非常重视下图是某大型银行针对数据全生命周期的数据管控。 现阶段各领域都开始了大数据平台的搭建期望运用大数据的能力来实现数字化转型。大数据平台的搭建实际上还是数据信息的搭建传统型数据平台遇到的全部难题大数据平台都会有可能遇到鉴于数据信息量级的发生变化大数据平台必定还会出现新的难题。
大数据时代下需用新一代的数据治理能力
现阶段大数据平台的重要难题具体体现在下列四个方面 数据信息不可知用户不了解大数据平台中有什么数据信息也不知道这一些数据信息和业务的关联性有哪些尽管认识到大数据的重要性但平台中是否有能化解自个所面对业务难题的关键数据信息该到哪里寻找这一些数据信息
数据信息不可控数据信息不可控是在传统型数据平台开端就一直存在的不足在大数据时代体现得更加显著。并没有统一的数据标准致使数据信息很难集成和统一并没有质量控制致使大量数据因质量过低而很难被运用并没有能有效的管控整体大数据平台的流程管理。
数据信息不可取用户即便 知道自个业务所需用的是那些数据信息也无法方便自助式地取得数据信息反之获取数据需用较长的研发过程致使业务剖析的需求很难被迅速满足需要而在大数据时代业务寻求的是针对于特定业务难题的迅速剖析这类漫长的需求处理速度是很难满足需要业务需求的。
数据信息不可联大数据时代企业有着着大量数据但企业数据知识相互间的关联性还较为弱并没有把数据信息和知识结构关联性起来企业员工很难作到数据信息与知识相互间的迅速转换无法对数据信息开展自助式的的探索和挖掘数据信息的深层次价值很难体现。
通过剖析上述四种难题能够发现传统型数据平台面对的难题在大数据时代不但并没有消失还不断涌现而出更新的难题传统型的数据治理需用提升能力来化解大数据平台搭建过程中的这一些难题。
在传统型数据平台阶段数据治理的目标主要是做管控为数据信息部门创建1个的治理办公环境涉及范畴、质量等。
在大数据平台阶段用户对数据信息的需求持续上升用户范畴从数据信息部门拓展到全企业数据治理无法再仅仅面向数据信息部门了需用变为面向全企业用户的办公环境需用以全企业用户为中心从给用户提供服务的角度管控好数据信息的同时为用户提供自助式获得大数据的能力幫助企业实现数字化转型。 二、如何面向用户开展大数据治理
面向用户的大数据治理实践案例
很多企业经过一段时间的摸索已经看到了用户对大数据治理的这种需求大数据治理也持续在各行业的大数据平台建设中得到关注。
以某公司数据治理平台建设为例该公司以元数据为基础实现了贯穿数据设计、产生、存储、迁移、使用、归档等环节的数据全生命周期管理以及数据从源端到数据中心再到应用端的全过程的管理做到了以用户为中心通过大数据治理为用户提供了更便捷、更灵活、更准确地获得企业大数据资产的能力。 该公司的大数据治理的起点是先以元数据为基础构建数据资产管理体系。从用户的视角说明白企业数据有哪些哪些用户能够使用。在该公司的数据资产定义过程中选择了贴近业务用户的数据分类方案梳理和识别企业运营数据资源。 基于第一步形成的数据分类管理体系框架梳理、整合各级各类数据资源建立了数据资产树按照不同数据细类制定相应的工作模板对指标数据和明细数据进行梳理和归并。 所有资产梳理和控制的最终目标都是为了用户能够使用数据通过L0–L1–L2三个层次的定义以业务驱动为导向提高数据查询的实用性。 L0按照公司行业业务域–业务主题–业务活动的结构化方法对查询进行分类导航。
L1依据业务和数据源中数据资源情况按业务主题对数据进行预处理和定义。
L2将数据库表字段等技术元数据转换为业务人员可以理解的业务元数据。
通过梳理数据、管理数据、提供数据、关联业务形成了一整套以用户为中心的大数据治理能力最终为用户直接使用数据提供了帮助从而使数据治理完成了从以管控为中心到以业务为中心的转变。
面向用户的大数据治理的四个阶段
面向用户的大数据治理该如何做总结为以下四个阶段 1第一阶段全面梳理企业信息自动化构建企业的数据资产库
在第一阶段主要是对企业大数据的梳理从而全面掌握企业大数据的情况主要有以下三个方面。 梳理全企业数据架构对企业的数据模型、数据关系、数据处理有清晰化的认识。
对数据资产形成统一的自动化管理形成企业的元数据库。
对企业数据资产形成多种视图使数据资产能够让不同用户有不同视角的展示。
2第二阶段建立管理流程落地数据标准提升数据质量
在第二阶段需要建立大数据管控能力包括从业务的角度梳理企业数据质量问题形成质量控制能力形成核心数据标准并抓标准落地。针对关键问题建立数据的管理流程少而精控制核心问题。 在这个阶段主要是为数据部门形成一套管理大数据的能力同时为数据部门形成数据管理的工作环境。
3第三阶段直接为用户提供价值向用户提供数据微服务
通过前两个阶段企业能够建立基本的数据治理的能力在此基础上还需要以用户为中心为用户提供直接获取数据的能力。 第三阶段依赖于前两个阶段能力的建设在这个阶段的目标是向用户提供自助化的数据服务使用户能够自助地获取和使用数据并且在用户的使用过程中再反过去进一步落地标准、控制质量。
4第四阶段智能化企业知识图谱为全企业提供数据价值
最后一个阶段是将数据沉淀成为知识形成企业的知识图谱提供从“关系”的角度去分析问题的能力。
一般来说数据搜索是通过业务术语知识来搜索的而知识之间是有相互联系的例如水果和西红柿是上下位关系后者是前者的具体体现好的搜索除了要列出直接结果还需要显示与之关联的知识这就要建立知识图谱。 简单说知识图谱就是概念、属性以及概念之间的关联关系这个关系可以手工建立也能通过自然语言处理等方法对政策、法规、需求、数据库comments、界面等多种来源进行分析自动化建立起企业知识图谱。从而使数据治理成为整个企业的数据工作环境强化企业数据与知识体系之间的关联加快企业员工数据与知识之间的转换效率让数据的深层价值得以体现。
通过这四个阶段的建设使数据治理平台由数据部门的工作环境转变成为全企业的数据工作环境以用户为中心让用户能够直接使用大数据并通过用户的使用来管理数据持续优化数据质量在达到治理数据目标的同时也最大限度发挥了数据的价值。
三、面向用户的自服务大数据治理架构
自服务大数据治理架构
以用户为中心的自服务大数据治理技术架构包括5部分数据资产管理、数据监控管理、数据准备平台、数据服务总线消息与流数据管理。 整个平台分为5块核心能力数据资产、数据准备、数据服务总线、消息流数据管理、数据监控管理。
数据资产管理是对企业数据信息统一管理也是整个平台的基础数据准备平台是资产服务化的加工厂它不但能将原始数据通过服务形式以用户能看懂的方式提供也可以通过在线数据模型设计实现最终数据产品的发布起到承上启下的作用。
数据服务总线和消息流数据管理的价值层次是一致的只是从数据时效性上面对数据进行了区分去适应用户不同的管理和应用诉求。起到数据通道和安全管理两个核心内容。
数据监控管理有别于大数据中的数据节点管理而是从数据管理的视角切入对数据的结构的变化、关系的变化进行管理和控制它是数据持续发挥价值的监管者。
自服务大数据治理的关键技术
1人工智能的知识图谱构建
知识图谱的构建主要有以下三个步骤
a、基于企业元数据信息通过自然语言处理、机器学习、模式识别等算法以及业务规则过滤实现知识提取。
b、以本体形式表示和存储知识自动构建成起资产知识图谱。
c、通过知识图谱关系利用智能搜索、关联查询手段为最终用户提供更加精确的数据。 2细粒度的敏感信息控制
数据内容安全管理包括对IT系统和数据进行敏感度等级划分的定义、浏览、检核辅助安全规则在业务、技术领域的应用。 从功能上包括数据敏感性分级、系统敏感性分级数据安全策略定义管理安全策略输出安全管理报告数据安全检核敏感数据角色管理敏感数据权鉴管理及相关电子审批流程。
3自助化的大数据服务生产线
这里有4个关键点
a、自助的查询到想要的数据。
b、自动的生成数据服务。
c、及时稳定的获得数据通道。
d、数据安全有保证。 通过自助化的数据生产线数据使用方业务人员大大减少了对开发人员依赖80%以上的数据需求都能通过自己进行整合开发最终获取数据。让所有用数据的人能方便得到想要的数据。
4多维度实时的数据资产信息的展示
数据治理平台提供实时、全面的数据监控不仅能从作业、模型、物理资源等各方面进行全面的数据资产盘点还能对数据及时性、问题数据量等方面的数据健康环境进行全面的预警。
5以业务元模型为核心的数据微服务
数据需要以服务的形式提供给最终用户在服务的提供上不能再采用传统的方式而需要用微服务的方式提供每个单独数据微服务自己对所提供数据做缓存在其中利用元数据能力把知识业务模型与技术数据模型相结合从而向最终数据用户提供多种数据能力使用户能够以多种方式使用数据。 最后在整个大数据治理平台的构建中还需要满足一系列原则包括元数据、数据标准和数据质量总结起来一共12个原则。 四、总结
大数据时代企业急需建立以用户为中心的自服务大数据治理信息梳理、数据管控、连接用户、智能化是实现自服务大数据治理的四个主要阶段掌握一系列关键技术和技术原则是实现自服务大数据治理的重要基础。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/925441.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!