做网站要的图片斗鱼合肥做淘宝网站推广

web/2025/10/2 21:10:05/文章来源:
做网站要的图片斗鱼,合肥做淘宝网站推广,公司建设网站的请示,服务公司logo概念与容器为什么先说这个#xff0c;其实很简单#xff1a;因为绝大多数人都把这两个概念混为一谈。然后就会出现各种各样的问题#xff1a;oracle不是数据库么#xff0c;怎么又是数据仓库#xff1f;Hive不是数据仓库么#xff1f;怎么又是数据库#xff1f;数据仓库…概念与容器为什么先说这个其实很简单因为绝大多数人都把这两个概念混为一谈。然后就会出现各种各样的问题oracle不是数据库么怎么又是数据仓库Hive不是数据仓库么怎么又是数据库数据仓库、数据库是一个概念是一些技术的集合。类同于切菜刀法和雕刻刀法Oracel、DB2、MySQL、Hive是一个容器是一种工具。类同于一把刀。当我们在说数据仓库的时候我们在说什么说的是你用的mysql还是oracle用的是Hive还是Kylin用的是druid还是doris都不是因为这些是实现数据仓库的工具我们在说数据仓库的时候我们实际上说的是一种面向主题沉淀历史不可变信息对明细数据进行汇总的为决策提供在线分析服务的数据技术的集合。我们在实现数据仓库的时候需要用到数据仓库设计数据库设计工具、数据存储技术数据库工具、数据处理技术ETL工具、监控报警、数据管理技术元数据、数据地图、血缘关系等等技术。而oracle、mysql、hadoop等都只是数据存储技术中的一种而已。数据仓库发展历史1、数据仓库概念诞生数据仓库概念公认最早的定义者是数据仓库之父比尔·恩门Bill Inmon在1991提出的。在此之前所有的业务操作数据和分析数据都是存在一个数据库中的并没有分开。这个inmon就是inmon、kimball建仓方法论的inmon是不是很熟悉如同绝大多数新概念一样刚诞生的数据仓库同样遭受到了巨大的失败。inmon的建设理念是自上而下这个上指的是数据的上游不是数据分层的上层。大家都是做数仓的你肯定理解为什么一开始数据仓库概念会惨败。因为自上而下太难见效得把所有的业务理清楚把所有系统的数据理清楚然后分主题分层一点点的设计然后按照这个设计一层层的建。而且一旦其中有任何变动整个设计全废。所以第一批吃螃蟹的那些公司基本上都是小白鼠。2、数据集市概念诞生这个时候有个英雄站出来了这就是Kimball他写了一本书《The DataWarehouse Toolkit》开启了数据集市的狂潮也开创了另一种数据仓库建设的流派-Kimball的自下而上流派。这个上、下也是上下游的意思。Kimball建议百鸟在林不如一鸟在手。先搞一个销售部门摸清销售部门的需求等于把下游的需求先锁死。然后再顺藤摸瓜把数仓的每一层设计好最后再摸到业务系统CRMERP人力系统找业务系统的数据这样就建立了一个销售部门级的数据集市。由于这种方法的需求少了设计工作少难度也就低了对应的建设难度和工作量也少建设速度就快见效也就快啊非常利于工作的开展。所以数据集市大行其道。3、DWDM融合两派吵了很久很久各自都有死忠也都有对的理由各自也都说服不了对方。双方也明白了“one size fits all”一码通用是不可能的。终于在1998年 Inmon提出了新的BI架构CIF(CorporationInformation Factory,企业信息工厂)。上面这张图就是inmon老爷子画的看上去很乱对吧其实按照咱现在的视角看就很清晰了这个架构是不是很熟悉对这个架构从1998年到现在就没变过而且也是所有数据仓库建设的框架性指南。4、实时数仓一直到最近两年实时处理技术的飞速发展才将数据仓库的架构往前又推了一步出现了实时数仓。实时数仓又分为批数据流数据、批流一体两种架构。从这里开始也就正式进入了大数据环境下的数据仓库范畴。大数据环境下的数据仓库1、离线数仓刚转到大数据环境中的哥们会很奇怪为啥有一个数仓叫离线数仓从来没听过啊其实离线数仓就是咱以前做的传统数仓数据以T1的形式计算好放在那里给前台的各种分析应用提供算好的数据。这也被称为“大数据的批处理”。只不过原本的单体环境工具oracle、informatica等基本都被替换成了大数据体系内Hadoop、Hive、Sqoop、oozie等的工具而已。大数据环境中工具清单数据采集flume/logstashkafka替代传统数仓的FTP批量数据同步Sqoop、Kettle跟传统数仓一样用Kettle部分商用ETL工具也开始支持大数据集群;大数据存储Hadoop HDFS/Hive、TiDB、GP等MPP替代传统数仓的Oracle、MySQL、MS SQL、DB2等大数据计算引擎MapReduce、Spark、Tez替代传统数仓的数据库执行引擎OLAP引擎Kylin/druidMolap需预计算、Presto/ImpalaRolap无需预计算替代BO、Brio、MSTR等各种BI工具。2、实时计算就是因为有实时数据处理所以才会有离线数据处理。相对应的也就有实时数仓和离线数仓。实时数仓最开始是在日志数据分析业务中被广泛使用后来在各种实时战报大屏的推动实时数仓开始应用。与离线计算相比实时计算这边减少了数据落地替换了数据计算引擎目前纯流式数据处理基本上就只有Spark Streaming了。Storm会丢数据Flink是批流一体的。实时数据计算好结果后可以落地到各种数据库中也可以直接对接到大屏进行展示。大数据环境下的数据仓库架构1、Lambda 架构Lambda架构核心就三个批数据处理层、流数据处理层和服务层。批数据处理层应对历史长时间数据计算流数据处理层应对短时间实时数据计算。如果一个需求要历史到当前所有数据的累加结果那就在服务层将两部分数据进行累加就好了。Lambda架构需要维护两套计算引擎如果需要历史到现在实时数据的累加则需要在两边同时做相同的计算然后还得加总一下非常麻烦。因此就有了最近非常火热的Kappa架构。2、Kappa 架构Kappa架构的设计很有意思。Lambda架构反正还是分离线和实时两部分的所以可以从离线库和实时消息队列取数分别计算后在服务层加总就可以了。Kappa的设计理念是干脆不要离线了全部都进行流式计算。流式计算的数据来源是消息队列那我把所有需要计算的数据放在消息队列里就好了然后让流计算引擎计算所有数据不就好了因为所有数据都存在Kafka上面接Flink批流一体数据处理引擎将kafka的数据计算好存在服务层的table n中。如果需求有变化了就讲kafka的offset调整一下Flink则重启一个任务重新计算存在table N1中当N1的数据进度赶上table n了就停掉table n的任务。3、Kappa 架构查询分析展示Kappa架构只到数据服务层Flink本身只是一个计算引擎因此还需要一个提供快速查询的工具和一个展示的工具。所以现在的架构就变成了这样总结综上所述传统数仓和大数据环境下的数仓还是有很多区别的数仓设计的工具都是一样的这个不会变由于大数据集群中表关联的代价比较大因此数仓建模会更多的使用宽表所以这里会有一些变化数据处理和调度工具用kettle基本都OK没啥太大变化但是需要了解一下Flume、Kafka等工具数据存储这边需要深入了解一下这是单体数据库和集群数据库的差别会有分布式一致性的各种乱七八糟的问题数据计算引擎也有变化也是单体数据库和集群数据库的差别。分布式计算会有数据倾斜、join代价高等问题所以优化的方法和方向也不一样数据总体架构设计的时候也会有所变化传统数仓整个BI套件就ok了大数据环境下可能要面对更多的各种复杂需求所需的大数据组件就变多了需要系统学习。建议传统数据仓库工程师的转型路线传统数仓-离线数仓批数据处理-实时数据处理流数据处理-lambda架构-kappa架构批流一体。来源网络侵删

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/85815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站首页布局分析网站开发工程师 招聘

文章目录 案例信息介绍后端异步处理请求和后端同步处理请求同步方式异步方式 环境文件目录配置.envrequirements.txt 完整代码ext.pyapp.pykafka_create_user.py 运行方式本地安装 kafka运行 app.py使用 postman 测试建立 http 长连接,等待后端处理结果发送 RAW DAT…

郯城县网站建设消防公司宣传册设计样本

参考自:计算机体系结构-寄存器重命名 - 知乎 (zhihu.com) 这里的重点在红色部分描述上,也是容易想不通的地方; 在SRAM方法中要恢复映射表状态,需要事先把分支指令来临时刻的映射表全份拷贝下来,然后在恢复时把备份复制…

网站增加权重吗wordpress带样式备份

这里写目录标题 基于Python微博舆情数据爬虫可视化分析系统(NLP情感分析爬虫机器学习)一、项目概述二、微博热词统计析三、微博文章分析四、微博评论分析五、微博舆情分析六、项目展示七、结语 基于Python微博舆情数据爬虫可视化分析系统(NLP情感分析爬虫机器学习) 一、项目概…

aspnet网站开发教程数据库重庆网站建设师

玩转幻兽帕鲁服务器,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云服务器网aliyunfuwuqi.com分享2024年新版基于阿里云搭建幻兽帕鲁服…

宝塔搭建网站教程集团微网站建设

来到大学,好多时候填写一些班级或者身份证的表格时都要求设置文本格式,具体该怎么做呢,music走起嘿嘿。 Excel实现设置文本格式随手录了一个小视频,希望对你有所帮助,有帮到你的话可以点个赞,鼓励一下创作哈…

网站建设捌金手指专业1做网站项目前期工作包括哪些

文章目录 一. 斐波那契数列模型1. 第 N 个泰波那契数2. 三步问题3. 使用最小花费爬楼梯解法一:从左往右填表解法二:从右往左填表 一. 斐波那契数列模型 解题步骤: 确定状态表示(最重要):明确dp表里的值所…

白酒网站模板南方数据企业网站管理系统

在Linux上有很多监控工具,比如Zabbix、Prometheus、APM和ELK 监控工具是确保系统稳定运行的关键组件之一,它可以帮助系统管理员和开发人员及时发现并解决问题。 以下是几种流行的监控工具的简要介绍: Zabbix: Zabbix 是一个企…

南通企业模板建站wordpress 调用侧边栏

丝杆支撑座是丝杆和电机之间连接的重要组成部分,发挥着非常重要的功能。提到丝杆支撑座和滚珠丝杆,很多人都会想到支撑关系,但丝杆支撑座作为滚珠丝杆系统中至关重要的角色,其作用远不止于简单的支撑。 丝杆支撑座安装过程非常简单…

公司网站建设方案拓扑图ps网页入口设计步骤

解释器的结果通常通过上述表格展示: 1. select_type 表示查询的类型 simple: 表示简单的选择查询,没有子查询或连接操作 primary:表示主查询,通常是最外层的查询 subquery :表示子查询,在主查询中嵌套的查询 derived: 表示派…

网站建设费计入无形资产做网站买域名要买几个后缀最安全

系列文章目录 什么是计算机网络? 什么是网络协议? 计算机网络的结构 数据交换之电路交换 数据交换之报文交换和分组交换 分组交换 vs 电路交换 计算机网络性能(1)——速率、带宽、延迟 计算机网络性能(2)…

完整网站模板网站营销理念

在此推荐2篇发表在lancet以及jama子刊上的paf文章,这两篇文章套路是一样的,只是在不同国家进行。 在计算combined PAF或者说weighted PAF的时候,先建立了相关矩阵,再做主成分分析,得到communality。详细信息大家可翻阅…

做品牌的人常用的网站关键词优化如何做

目录 前言一、准备工作—准备各类文件1、准备实体类、枚举类、常量类2、准备配置文件 二、先编写Controller三、再编写Service、serviceImpl四、再编写mapper后续敬请期待 前言 Java开发功能简单思路 一、准备工作—准备各类文件 提前知道需要用到哪些类可以提前准备好&#…

北京微信网站建设报价旅游网站建设可行性分析

文章目录 1. 前言2. 常用api介绍3. 需求假设(获取离我最近的停车场)4. 代码示例 1. 前言 接着上一篇Redis那些事儿(二) ,这一篇主要介绍Redis基于Geo数据结构实现的地理服务,它提供了一种方便的方式来存储和…

高州市网站建设广州越秀公司网站建设

Full authentication is required to access this resource解决办法 报错问题:在使用 postman 测试接口时,该接口需要在 Header 中传入 access_token,实际上也在请求的 Header 中添加上了 access_token 参数,但是服务端还是返回4…

做淘宝客建网站要多少费用网站编辑心得体会

四 路由配置及页面跳转 (1)路由配置 uni-app页面路由全部交给框架统一管理,需要在pages.json里配置每个路由页面的路径以及页面样式(类似小程序在app.json中配置页面路由) (2)路由跳转 uni-app有两种页面路由跳转方式:使用navigator组件跳转(标签式导航)、调用API跳…

唐山网站制作案例网站设计流程软件

背景:在测试中,测试MM总喜欢连续重复点击Button,如果click事件的处理业务,稍微有些耗时,或者设备反应比较慢时,就会响应2遍处理,导致错误的现象出现。 前提:click事件的处理业务&…

企业网站模板 html广告公司平面设计培训

目录 一、下载 二、移植数据库 三、测试sqlite3 一、下载 SQLite Download Page 暂时先下载最新版的试试,我们以前其实在ubuntu上直接使用过 嵌入式数据库sqlite3_常见的嵌入式数据库-CSDN博客 当时我把常用的操作和怎么使用记录下来了 现在把他移植到开发板…

做计划的网站类似设计师联盟的网站

查看原文>>>【深度解析】WRF-LES与PALM微尺度气象大涡模拟 针对微尺度气象的复杂性,大涡模拟(LES)提供了一种无可比拟的解决方案。微尺度气象学涉及对小范围内的大气过程进行精确模拟,这些过程往往与天气模式、地形影响和…

怎么建立自己网站wordpress 生成页面

UML精简概述 UML精简概述 UML精简概述UML的定义常见的关系 在学习设计模式之前,需要掌握一些预备知识,主要包括UML类图和面向对象设计原则,它们是“基础内功”,将为后续的“深入修行”奠定基础。UML类图可用于描述每一个设计模式的…

杭州网站前端建设嘉定网站设计制作公司

FPGA里面的可执行文件都涉及到 *.bit, *.mcs, *.bin 和 *.elf。 bit文件 bit 文件一般用于JTAG在线进行调试的时候,是把bit文件是烧写到FPGA中进行在线调试。 bin文件 bin 文件是二进制文件,按顺序只包含原始字节流&#xff0c…