数据创新的四个陷阱

简介: 数据的重要性在当今已经无需在多言,所有的企业都意识到数据的重要性,都希望利用数据来驱动业务的发展。但是,很多企业信息化管理者依然存在对于数据智能,数据驱动的一些误解,这些误解会让企业的数据利用陷入深渊。

陷阱一、应用尚未建设,所以不考虑数据利用

当我们跟一些企业信息化管理者聊起应该尽早的考虑数据的利用,要对数据做整体规划时,会经常听到这样一句话。

“我现在业务都还没做起来,还不到考虑数据利用的时候”

这一句话代表了很大一部分企业对于数据利用的认知,那就是,数据利用是从先有数据开始的,而数据是在应用建设之后存到数据库里的,所以先建设应用,然后等数据库里有了数据后,在考虑如何利用数据。

听上去,这个逻辑完全正确。

但是其实这就是很多企业存在的首要的对于数据利用的误区:”先建设应用,再考虑数据利用“。

如果用这样的思路去建设,过了一年以后,往往这个企业就会立刻提出新的问题,“多个应用系统之间的数据不打通,不对齐,不一致,数据用不起来”。

这个误解,是根本上不充分理解数据利用的两个本质:

第一,数据是客观存在的,不取决于你建不建设应用
一个企业,只要业务在运行,哪怕它没有建设任何系统,它的数据都是在实时产生的,只是你没有把它采集起来而已。

数据是业务在数字化世界里的构成原子,业务流程和行为会时刻产生各种数据,而不是必须要建设应用这些数据才产生的。举个例子,当快递员接到一个快递订单的时候,发件人,收件人,货物类别,发货地,发货地,运输工具类型,距离等这些数据就已经产生,并且会驱动这个快递的走向。有没有信息化系统的支持,只是改变了这些数据的记录和传递的手段是一张纸还是一个网络而已。这些数据是客观存在的,他不会因为信息化系统本身而改变。

我们要从本质上认知到,数据是业务在数字化世界里的投影模型,它是业务的镜像,是客观存在的。

只要有业务,那么就存在对应的数据。应用只是把数据通过软件采集到存储设备里而已。

第二,数据利用的规划要早于应用和流程的建设
我们在建房子之前,就要做整体设计,规划出一栋大厦的各种利用场景,只有这样才不会出现一个不能被进入的房子。

现在,每个企业都意识到,数据是企业的核心资产,应用是采集和利用这些资产的工具。为了更好的在数据采集之后得到充分的利用,每个企业必须要在应用和流程的规划之前,完成数据利用的规划。

这就包括企业的数据资产目录的规划设计,企业的数据利用场景的规划和数据的存储,处理分析这些数据的技术平台的需求规划等。

Data First,在系统还没有建设的时候,做好了数据的蓝图规划,完成了各个应用系统的数据分布全景图,企业就能规避数据孤岛的存在。

所以,如果你现在还没有建设应用,那么恭喜你,这是最好的规划数据利用蓝图的机会,赶紧开始吧。

陷阱二、没有大数据,所以就不考虑数据利用

“我们现在的数据很少,只能叫小数据,所以还谈不上数据利用”,这也是一个典型的数据利用的误解。

我第一次听到这句话就是在B2B2C的零售企业。的确,传统的通过经销商为主要渠道的品牌商,往往没有建立自己的电商体系,所以最终消费者的行为数据拿不到。他们有的就是Sell In的数据,而Sell In的数据往往量不大,并且维度不多,所以利用价值有限。

但是,现在的这个企业正在做的事情就是通过一个个的小程序,小应用,建立各种和终端消费者,客户的触点,从而获取各类数据,单个的看都是小数据,量不大,维度也不多,但是,当这所有的点连接在一起,就构成了一个丰富,多样的用户数据全景。

这个企业的业务负责人笃信,在数字化时代,谁拥有更多的数据场景,谁就能够拥有更强的竞争优势。

这个事例充分的说明,也许现在你的业务模式决定了你并没有丰富的数据,但是,你依然要通过各种应用创新来多渠道,全方位获取用户,消费者的数据。而要建设什么应用,获取什么数据,获取的这些单个点状数据间如何构成相互联结,组合出数据场景价值呢?

这就是需要在构建应用之前有数据规划,勾勒出一个数据场景地图,从而沿着这个地图去建设个中小应用。

陷阱三、数据利用就是做数据分析和挖掘,交易应用系统就用不到数据技术

过去的应用系统被划分为OLTP和OLAP,在线交易型系统和在线分析型系统。所以,往往一看到这个应用本身是一个交易型的软件,按照传统的架构,那就是OLTP系统,所以往往不会用到一些OLAP的技术。

但是,目前的情况则发生了巨大的变化。

拿约车调度系统来讲,按照传统的划分,这是典型的交易系统,创建订单,分配司机。但是,如果要能够支撑每秒几万单的调度分配,用手工分配的方式是不可能的,这个调度系统需要具有实时数据分析能力,而这里面价格确定和路线的规划的部分,又需要参考历史的相关数据分析结果。这样一来,这个典型的交易应用是被数据驱动的,它的底层和和核心其实是批量数据分析和实时数据处理。

未来的所有的应用都会是这样,那就是OLAP在支撑着OLTP系统的每一个决策和行为,从而成为智能的应用。

数据技术正在逐渐重构所有的传统流程类应用,让他们成为数据驱动的系统,从而变得更智慧。

陷阱四、最重要的是算法,所以软件工程公司是做不了数据科学项目的

一提到数据项目,很多人脑子里第一个想到的就是算法模型,似乎只有做研究的,做算法的,做人工智能的才是做数据的。

所以,现在有一类观点,认为信息化产业里分为做算法的和做软件的,而只有做算法的才是做人工智能和数据的。

这是一个典型的误解,将算法与软件工程割裂开来。就像不久前,一个长期合作的客户用一个固有印象,”思特沃克不是做人工智能的“,就否定了我们的一个机会,这就是对于人工智能应用的误解。

我们用下面这张图来体现算法和人工智能(数据科学)的关系。

 

1CF104DC-AEF5-49CF-AC78-6EC7D14E61B3.png

人工智能的最底层是由各种算法组成的,但是,目前行业里所有人使用的常用算法,都是公开的,而真正研究和产出这些算法的,是学术研究机构。

人工智能分为两个领域,一个是前沿研究领域,一个是应用领域。而作为从事工业生产和商业运营的企业来说,需要的是后者。而后者最重要的是利用软件工程能力将适合的算法应用到有价值的场景,从而去赋能业务。

在算法之上,人工智能的应用更重要的是充分的高质量的数据集,将算法和数据开发成为良好用户体验的智能软件的工程能力。

所以,优秀的做人工智能的企业除了拥有调优,调用公开的算法和代码之外的能力更重要的是业务创新和软件工程的能力。

总结和启示

通过逐个分析这四个对于数据智能的四个陷阱,我们可以得出如下启示:

 一、数据规划应该优先于业务系统的建设,构建拉通的,一致的数据全景图,避免应用之间的数据孤岛

二、构建起数据全景图后,在沿着这个地图来构建一个个去采集填满这些数据的小应用,从而构建自己的数据资产

三、所有的应用软件都会被数据技术所赋能,成为数据驱动的智能应用

四、人工智能应用于业务最重要的是场景创新能力和软件工程能力

作者:智询

原文链接 

本文为阿里云原创内容,未经允许不得转载

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/514438.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Parallels 发布 Desktop 17版本,支持 Windows 11 和 macOS Monterey

Parallels Desktop 17 亮点速揽:性能提升,对图像效果加以改进、增强了 Windows 游戏体验,同时是全球首个在搭载 Apple M1 芯片的 Mac 上运行的 macOS Monterey 虚拟机,带来更为无缝的跨平台工作体验。 编辑 | 宋慧 头图 | Paralle…

如何将实时计算 Flink 与自身环境打通

简介: 如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 客训练营产品、技术专家齐上阵,从 Flink的发展、 Flink 的技术原理、应用场景及行业案例,到开源Flink功能介绍和实时计算 Flink 优势详解,现场实操&…

一文知晓浪潮云海OS在SPEC Cloud测试中的调优实践!

日前,SPEC(Standard Performance Evaluation Corporation,即国际标准性能评测组织)公布了最新 Cloud IaaS 2018 Benchmark 测试成绩,在同规模测试场景下浪潮数据核心产品浪潮云海OS再次刷新世界纪录,性能得…

阿里云 EMR Delta Lake 在流利说数据接入中的架构和实践

简介: 为了消灭数据孤岛,企业往往会把各个组织的数据都接入到数据湖以提供统一的查询或分析。本文将介绍流利说当前数据接入的整个过程,期间遇到的挑战,以及delta在数据接入中产生的价值。 背景 流利说目前的离线计算任务中&…

怎么提升写代码的能力

简介: 对于程序员而言,我始终认为代码是展现能力的关键,一个优秀程序员写的代码,和一个普通程序员写的代码是很容易看出差别的,代码作为程序员的硬实力和名片的展示,怎么提升写代码的能力始终是一个关键的话…

发力LPWAN 升哲打磨数智城市物联网通信之“芯”

8月上旬,随着多项物联网芯片与通信领域技术发明专利证书的下发,升哲科技(SENSORO)已在低功耗广域物联网(LPWAN)及相关领域拥有近百项独家专利,突破国外专利封锁实现国产、自主、可控。这些专利技…

android studio证件照代码,Android 修图(换证件照背景,污点修复)

背景前段时间的一个周末,一个女生让我帮她换一下他的证件照背景,我又没带电脑。我又不好意思拒接,怎么办呢?应用商店下载一个证件照换背景的APP,瞬间换完,我正准备保存时,跳出来一个支付框&…

闲鱼是怎么让二手属性抽取准确率达到95%+的?

闲鱼是怎么让二手属性抽取准确率达到95%的? 先上效果 图1 - 二手属性抽取算法效果Demo(1) 背景 闲鱼作为一款C2X的app,站在商品发布的角度,闲鱼商品相对于淘宝商品的特点有: 轻发布导致商品信息不足 闲鱼采用图文描述的轻发布模…

代号红狗:那些站在微软云起点的中国创业者

作者:亲爱的数据 来源:亲爱的数据011996年的北京。上高中二年级的左玥,代表崇文区参加市一级"四通杯"青少年计算机程序设计竞赛,得了一等奖。据左玥回忆,在去参赛的路上,辅导老师还在吐槽&#x…

如何迁移 Flink 任务到实时计算

简介: 本文由阿里巴巴技术专家景丽宁(砚田)分享,主要介绍如何迁移Flink任务到实时计算 Flink 中来。 通常用户在线下主要使用 Flink run,这会造成一些问题,比如:同一个配置因版本而变化&#xf…

如何落地云原生DevOps?

简介: 什么是云原生DevOps?在阿里内部有怎样的实践?企业又该如何落地?阿里云云效专家团队提出了下一代精益产品开发方法体系——ALPD,提供了系统的云原生DevOps落地的方法支撑,帮助企业渐进式地迈入云原生D…

亚马逊独霸美国安云计算未来十年订单;英伟达推出首个元宇宙平台;华为云、天翼云会合并吗?...

NEWS本周新闻回顾亚马逊独霸美国安云计算未来十年订单,微软表示不服亚马逊AWS获得美国国家安全局100亿美元云计算合同。得知亚马逊拿下订单后,微软已向政府问责提交文件,提出抗议。最终……还是亚马逊笑到了最后英伟达推出全球首个元宇宙平台…

如何做好技术 Team Leader?

简介: 作为一个技术TL(Team Leader),除了自身技能,还会面临诸多团队管理上的困难和挑战。如何定义和明确团队的目标?怎样建立优秀的工程文化?让团队长期发挥战斗力和创新能力的核心是什么&#…

android应用控制百度地图,Android中应用百度地图API开发地图APP实例-显示百度地图...

场景效果在使用百度地图API之前需要先在百度地图开放平台中申请API_KEY申请API_KEY登录百度开放平台后找到控制台下的应用管理-创建应用依次输入应用名,应用类型选择Android SDK然后下面需要输入发布版SHA1和包名获取应用SHA1首先来到.Android文件所在的位置&#x…

数禾云上数据湖最佳实践

简介: 数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展,大数据团队承担的责任也越来越重,实时数仓需求,日志分析需求,即…

程序员只能吃“青春饭”?IT行业年龄焦虑如何破局?

2019 年搜狐科技《中国互联网简史》报告显示,国内近一半的程序员年龄在 25-29 岁之间,其次为 30-34岁,占比 24.6%,35 岁 -39 岁的程序员占比 6.1%,而 40岁 的程序员仅占 1.2%。由于程序员需要长时间面对电脑工作&#…

对容器镜像的思考和讨论

简介: 常言道,startup 有 startup 的好,大厂有大厂的好,那么大厂究竟好在哪呢?拿硅谷老牌大厂们 FLG 来说,如果要问最令人怀念的是什么?Free food 和基础设施(Infrastructure)一定是会上榜的&am…

android 高度上分权重,Android LinearLayout weight权重使用

在日常的开发过程中,我们通常或多或少会使用到LinearLayout的weight属性来进行权重设置,进而达到按比例显示布局的意图通常我们在使用时,会这样使用android:layout_width"match_parent"android:layout_height"match_parent&qu…

实时计算pv/uv Demo

简介: 本文由阿里巴巴高级技术专家邓小勇(静行)分享,主要用 Demo 演示如何通过实时计算 Flink 实时计算pv/uv的场景。 本文由阿里巴巴高级技术专家邓小勇(静行)分享,主要用 Demo 演示如何通过实…

《天际友盟DRP数字风险防护报告(2021年上半年)》重磅发布

今天,数字化正在发生,整个社会正在步入数字化革新。根据市场研究公司IDC的预测,到2023年超过50%的全球经济将由数字经济所驱动。在中国,2021-2024数字化转型总支出将达到1.5万亿美元,年均增长率超过17%。由此可见&…