建设网站app想找工作去哪个网站

bicheng/2026/1/19 13:13:29/文章来源:
建设网站app,想找工作去哪个网站,linux做网站用什么语言,学网站建设好不好文章目录 一. 概述二. 维度数据模型建模过程三. 维度规范化四. 维度数据模型的特点五. 维度数据模型1. 星型模式1.1#xff0e;事实表1.2#xff0e;维度表1.3#xff0e;优点1.4#xff0e;缺点1.5#xff0e;示例 2. 雪花模式2.1#xff0e;数据规范化与存储2.2#x… 文章目录 一. 概述二. 维度数据模型建模过程三. 维度规范化四. 维度数据模型的特点五. 维度数据模型1. 星型模式1.1事实表1.2维度表1.3优点1.4缺点1.5示例 2. 雪花模式2.1数据规范化与存储2.2优点2.3缺点2.4示例 一. 概述 维度数据模型Dimensional modeling, DM是一套技术和概念的集合用于数据仓库设计。不同于关系数据模型维度模型不一定要引入关系数据库。 根据数据仓库大师Kimball的观点维度模型是一种支持最终用户ing对数据仓库进行查询的设计技术是围绕性能和易理解性构建的。 尽管关系模型对于事务处理系统表现非常出色但它并不是面向最终用户的。 事实与维度的概念 事实和维度是两个维度模型中的核心概念。 事实表示对业务数据的度量而维度是观察数据的角度。事实通常是数字类型的可以进行聚合和计算而维度通常是一组层次关系或描述信息用来定义事实。 例如销售金额是一个事实而销售时间、销售的产品、购买的顾客、商店等都是销售事实的维度。 维度模型按照业务流程领域即主题域建立例如进货、销售、库存、配送等。 二. 维度数据模型建模过程 星型模型 所谓星型模式就是以一个事实表为中心周围环绕着多个维度表。 一般使用下面的过程构建维度模型 选择业务流程 — 声明粒度 — 确认维度 — 确认事实 这种使用四步设计法建立维度模型的过程有助于保证维度模型和数据仓库的可用性。 1选择业务流程 确认哪些业务处理流程是数据仓库应该覆盖的是维度方法的基础。因此建模的第一个步骤是描述需要建模的业务流程。例如需要了解和分析一个零售店的销售情况那么与该零售店销售相关的所有业务流程都是需要关注的。 2声明粒度 确定了业务流程后下一步是声明维度模型的粒度。   粒度用于确定事实中表示的是什么例如一个零售店的顾客在购物小票上的一个购买条目。 在选择维度和事实前必须声明粒度因为每个候选维度或事实必须与定义的粒度保持一致。   从给定的业务流程获取数据时原始粒度是最低级别的粒度。建议从原始粒度数据开始设计因为原始记录能够满足无法预期的用户查询。   汇总后的数据粒度对优化查询性能很重要但这样的粒度往往不能满足对细节数据的查询需求。   不同的事实可以有不同的粒度但同一事实中不要混用多种不同的粒度。   维度模型建立完成之后还有可能因为获取了新的信息而回到这步修改粒度级别。 3确认维度 设计过程的第三步是确认模型的维度。维度的粒度必须和第二步所声明的粒度一致。 维度表是事实表的基础也说明了事实表的数据是从哪里采集来的。   典型的维度都是名词如日期、商店、库存等。维度表存储了某一维度的所有相关数据例如日期维度应该包括年、季度、月、周、日等数据。 4确认事实 它是和系统的业务用户密切相关的。大部分事实表的度量都是数字类型的可累加可计算如成本、数量、金额等。 三. 维度规范化 对维度的规范化又叫雪花化可以起到去除冗余属性的作用。 规范化后一个维度会对应多个维度表。实际上在很多情况下维度规范化后的结构等同于一个低范式级别的关系型结构。 设计维度数据模型时会因为如下原因而不对维度做规范化处理 规范化会增加表的数量使结构更复杂。不可避免的多表连接使查询更复杂。不适合使用位图索引。查询性能原因。分析型查询不适合使用第三范式分析型查询需要聚合计算或检索很多维度值此时第三范式的数据库会遭遇性能问题。如果需要的仅仅是操作型报表可以使用第三范式因为操作型系统的用户需要看到更细节的数据。 规范化的争议 总体来说当多个维度共用某些通用的属性时做规范化会是有益的。例如客户和供应商都有省、市、区县、街道等地理位置的属性此时分离出一个地区属性就比较合适因为这减少了数据冗余。 四. 维度数据模型的特点 易理解 在维度模型中信息按业务种类或维度进行分组这会提高信息的可读性也方便了对于数据含义的解释。关系模型中数据被分布到多个离散的实体中对于一个简单的业务流程可能需要很多表联合在一起才能表示。 2. 高性能 维度模型更倾向于非规范化因为这样可以优化查询的性能。 介绍关系模型时多次提到规范化的实质是减少数据冗余以优化事务处理或数据更新的性能。 可扩展。 维度模型是可扩展的。由于维度模型允许数据冗余因此当向一个维度表或事实表中添加字段时不会像关系模型那样产生巨大的影响。这种新增可以是单纯地向表中增加新的数据行而不改变表结构也可以是在现有表上增加新的属性。 基于数据仓库的查询和应用不需要过多改变就能适应表结构的变化老的查询和应用会继续工作而不会产生错误的结果。 但是对于规范化的关系模型由于表之间存在复杂的依赖关系改变表结构前一定要仔细考虑。 五. 维度数据模型 1. 星型模式 星型模式是维度模型最简单的形式也是数据仓库以及数据集市开发中使用最广泛的形式。 星型模式由事实表和维度表组成一个星型模式中可以有一个或多个事实表每个事实表引用任意数量的维度表。星型模式的物理模型像一颗星星的形状中心是一个事实表围绕在事实表周围的维度表表示星星的放射状分支这就是星型模式这个名字的由来。 星型模式将业务流程分为事实和维度。 事实包含业务的度量是定量的数据如销售价格、销售数量、距离、速度、重量等是事实。维度是对事实数据属性的描述如日期、产品、客户、地理位置等是维度。 避免蜈蚣模式 一个含有很多维度表的星型模式有时被称为蜈蚣模式。蜈蚣模式的维度表往往只有很少的几个属性这样可以简化对维度表的维护但查询数据时会有更多的表连接严重时会使模型难于使用因此在设计中应该尽量避免蜈蚣模式。 1.1事实表 事实表记录了特定事件的数字化考量一般由数字值和指向维度表的外键组成。 注意通常会把事实表的粒度级别设计得比较低使得事实表可以记录很原始的操作型事件但这样做的负面影响是累加大量记录可能会更耗时。 事实表有以下三种类型 ● 事务事实表。记录特定事件的事实如销售。 ● 快照事实表。记录给定时间点的事实如月底账户余额。 ● 累积事实表。记录给定时间点的聚合事实如当月的总的销售金额。 没有含义的代理键 一般需要给事实表设计一个代理键作为每行记录的唯一标识。代理键是由系统生成的主键它不是应用数据没有业务含义对用户来说是透明的。 1.2维度表 维度表的每条记录包含有大量用于描述事实数据的属性字段。 维度表可以定义各种各样的特性以下是几种最常用的维度表 时间维度表。描述星型模式中记录的事件所发生的时间具有所需的最低级别的时间粒度。数据仓库是随时间变化的数据集合需要记录数据的历史因此每个数据仓库都需要一个时间维度表。地理维度表。描述位置信息的数据如国家、省份、城市、区县、邮编等。产品维度表。描述产品及其属性。人员维度表。描述人员相关的信息如销售人员、市场人员、开发人员等。范围维度表。描述分段数据的信息如高级、中级、低级等。 维度表的代理键 通常给维度表设计一个单列、整型数字类型的代理键映射业务数据中的主键。业务系统中的主键本身可能是自然键也可能是代理键。 自然键指的是由现实世界中已经存在的属性组成的键如身份证号就是典型的自然键。 1.3优点 星型模式是非规范化的在星型模式的设计开发过程中不受应用于事务型关系数据库的范式规则的约束。 星型模式的优点如下 简化查询。查询数据时星型模式的连接逻辑比较简单而从高度规范化的事务模型查询数据时往往需要更多的表连接。简化业务报表逻辑。与高度规范化的模式相比由于查询更简单因此星型模式简化了普通的业务报表如每月报表逻辑。获得查询性能。星型模式可以提升只读报表类应用的性能。快速聚合。基于星型模式的简单查询能够提高聚合操作的性能。便于向立方体提供数据。星型模式被广泛用于高效地建立OLAP立方体几乎所有的OLAP系统都提供ROLAP模型关系型OLAP它可以直接将星型模式中的数据当作数据源而不用单独建立立方体结构。 1.4缺点 星型模式的主要缺点是不能保证数据完整性。 一次性地插入或更新操作可能会造成数据异常而这种情况在规范化模型中是可以避免的。星型模式的数据装载一般都是以高度受控的方式用批处理或准实时过程执行的以此来抵消数据保护方面的不足。 星型模式的另一个缺点是对于分析需求来说不够灵活。 它更偏重于为特定目的建造数据视图因此实际上很难进行全面的数据分析。 星型模式不能自然地支持业务实体的多对多关系需要在维度表和事实表之间建立额外的桥接表。 1.5示例 假设有一个连锁店的销售数据仓库记录销售相关的日期、商店和产品其星型模式如图2-3所示。 Fact_Sales是唯一的事实表Dim_Date、Dim_Store和Dim_Product是三个维度表。 每个维度表的Id字段是它们的主键。事实表的Date_Id、Store_Id、Product_Id三个字段构成了事实表的联合主键同时这个三个字段也是外键分别引用对应的三个维度表的主键。 Units_Sold是事实表的唯一一个非主键列代表销售量是用于计算和分析的度量值。维度表的非主键列表示维度的附加属性。 查询2015年各个城市的手机销量是多少。 select s.city as city, sum(f.units_sold)from fact_sales finner join dim_date d on (f.date_id d.id)inner join dim_store s on (f.store_id s.id)inner join dim_product p on (f.product_id p.id)where d.year 2015 and p.product_category mobilegroup by s.city;2. 雪花模式 与星型模式相同雪花模式也是由事实表和维度表所组成。 所谓的“雪花化”就是将星型模式中的维度表进行规范化处理 当所有的维度表完成规范化后就形成了以事实表为中心的雪花型结构即雪花模式。 将维度表进行规范化的具体做法是把低基数的属性从维度表中移除并形成单独的表。 基数指的是一个字段中不同值的个数如主键列具有唯一值所以有最高的基数而像性别这样的列基数就很低。 星型模式和雪花模式都是建立维度数据仓库或数据集市的常用方式适用于加快查询速度比高效维护数据的重要性更高的场景。这些模式中的表没有特别的规范化一般都被设计成一个低于第三范式的级别。 2.1数据规范化与存储 规范化的过程就是将维度表中重复的组分离成一个新表以减少数据冗余的过程。 正因为如此规范化不可避免地增加了表的数量。在执行查询的时候不得不连接更多的表。但是规范化减少了存储数据的空间需求而且提高了数据更新的效率。 一个事实 从存储空间的角度看典型的情况是维度表比事实表小很多。这就使得雪花化的维度表相对于星型模式来说在存储空间上的优势没那么明显了。 两种模型数据冗余举例 假设在220个区县的200个商场共有100万条销售记录。 星型模式的设计会产生1,000,200(事实表100万与维度表200个商场)条记录每个区县信息作为商场的一个属性显式地出现在商场维度表中。 在规范化的雪花模式中会额外建立一个区县维度表该表有220条记录总的记录数是1,000,4201,000,000200220。在这种特殊情况下星型模式所需的空间反而比雪花模式要少。  如果商场有10,000个情况就不一样了星型模式的记录数是1,010,000雪花模式的记录数是1,010,220从记录数上看还是雪花模型多。但是星型模式的商场表中会有10,000个冗余的区县属性信息而在雪花模式中商场表中只有10,000个区县的主键而需要存储的区县属性信息只有220个当区县的属性很多时会大大减少数据存储占用的空间。   有些数据库开发者采取一种折中的方式底层使用雪花模型上层用表连接**建立视图(? 怎么建立)**模拟星型模式。这种方法既通过对维度的规范化节省了存储空间同时又对用户屏蔽了查询的复杂性。但是当外部的查询条件不需要连接整个维度表时这种方法会带来性能损失。 2.2优点 星型模式是雪花模式的一个特例维度没有多个层级。某些条件下雪花模式更具优势 一些**OLAP有哪些**多维数据库建模工具专为雪花模型进行了优化。规范化的维度属性节省存储空间。 2.3缺点 雪花模型的主要缺点是维度属性规范化增加了查询的连接操作和复杂度。相对于平面化的单表维度多表连接的查询性能会有所下降。 2.4示例 如下是星型模式规范化后的雪花模式。日期维度分解成季度、月、周、日期四个表。产品维度分解成产品分类、产品两个表。由商场维度分解出一个地区表。 如星型模型查询效果一致的sql selectg.city, sum(f.units_sold)fromfact_sales finner joindim_date d onf.date_id d.idinner joindim_store s onf.store_id s.idinner joindim_geography g ons.geography_id g.idinner joindim_product p onf.product_id p.idinner joindim_product_category c onp.product_category_id c.idwhered.year 2015 andc.product_category mobilegroup byg.city;参考《Hadoop构建数据仓库实战》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/88638.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微网站生成app网站服务器商

目录 一、基础操作 1、通过属性名等方式 2、通过属性组合 3、子节点方式 4、子节点加属性组合方式 5、孙节点offspring 6、兄弟节点sibling 7、父节点parent 8、正则表达式 9、直到某个元素出现 10、直到某个元素消失 二、通过局部坐标定位 1、使用局部坐标系的cli…

网站上的html内容怎么修改网站建设 会计分录

🚀🚀🚀本文改进:Focaler-IoU更加聚焦的IoU损失Focaler-IoU,能够在不同的检测任务中聚焦不同的回归样本,使用线性区间映射的方法来重构IoU损失 🚀🚀🚀RT-DETR改进创新专栏:http://t.csdnimg.cn/vuQTz 🚀🚀🚀学姐带你学习YOLOv8,从入门到创新,轻轻松松搞…

网站配置服务Wordpress北京文化墙设计公司

一、性能轮盘赌 机器码相同,但放置在不同的地址上,性能可能截然不同。 作为软件开发人员,我们经常假设特定代码的性能仅由代码本身和运行它的硬件决定。这种假设让我们在优化代码以获得更好性能时感到有控制力。虽然在大多数情况下这种假设…

衡阳市做淘宝网站建设俄罗斯ip地址

Mac M2芯片配置PHP环境 1. XAMPP2. PHPBrew(PHP版本管理)安装php7.4.33版本 3. 直接使用homebrew 安装php环境参考 1. XAMPP 官网地址 https://www.apachefriends.org/ 安装 安装完成 web server打开后,在打开localhost 成功! 2. PHPBrew(PHP版本管…

浙江网站建设专家评价网站做子站点有什么用

目录 分治快排算法原理 力扣75. 颜色分类 解析代码 分治快排算法原理 分治就是分而治之,快排在数据结构也学过了,现在来学一学三路划分快排(数组划分三块): 前面我们已经实现了三个版本的快速排序的算法&#xff0…

城乡建设学校官方网站城阳网站建设哪家好

接线图: #include "stm32f10x.h" // Device header//1: 开启RCC时钟,包括ADC和GPIO的时钟//2:配置GPIO将GPIO配置为模拟输入模式//3:配置多路开关将左边的通道接入到规则组中//4:配置ADC转…

公司为什么要网站备案wordpress文章顺序

目录 一、题目 描述 输入描述&#xff1a; 输出描述&#xff1a; 示例1 二、结论 三、代码 四、讲解 五、注意点&#xff1a; 一、题目 描述 输入M、N&#xff0c;1 < M < N < 1000000&#xff0c;求区间[M,N]内的所有素数的个数。素数定义&#xff1a;除了1以…

公司优化网站的案例做网站用哪个编程语言

纽扣电池由于体积小&#xff0c;容易被小孩吞入&#xff0c;因此各国对安装在带电产品上面的纽扣电池都有要求。 2023年9月美国消费品安全委员会&#xff08;CPSC&#xff09;发出最终法规文件&#xff0c;决定采用UL4200A:2023作为含纽扣强制安全标准&#xff0c;同时编入16C…

网站首页广告代码制作一个网站的全过程

plasmo&#xff1a;GitHub - PlasmoHQ/plasmo: &#x1f9e9; The Browser Extension Framework plasmo是一个开发浏览器插件的框架&#xff0c;支持使用react和vue等技术&#xff0c;而且不用手动管理manifest.json文件&#xff0c;框架会根据你在框架中的使用&#xff0c;自…

公司公众网站微信平台建设方案网站的建设项目是什么

一、概述 最近几天公司项目开发上线完成&#xff0c;做个收获总结吧~ 今天记录Redis的收获和提升。 二、Redis异步队列 Redis做异步队列一般使用 list 结构作为队列&#xff0c;rpush 生产消息&#xff0c;lpop 消费消息。当 lpop 没有消息的时候&#xff0c;要适当sleep再…

网站怎么做404页面跳转网页制作q元素

一篇论文回顾 Sora 文生视频技术的背景、技术和应用。 追赶 Sora&#xff0c;成为了很多科技公司当下阶段的新目标。研究者们好奇的是&#xff1a;Sora 是如何被 OpenAI 发掘出来的&#xff1f;未来又有哪些演进和应用方向&#xff1f; Sora 的技术报告披露了一些技术细节&…

苏州高端网站建设门户网站怎么做才好看

一、引言 美国大学生数学建模竞赛&#xff08;MCM/ICM&#xff0c;通常被称为“美赛”&#xff09;是全球范围内最具影响力和挑战性的大学生数学建模竞赛之一。参与美赛不仅能锻炼大学生的数学建模、问题分析、团队协作和英文写作能力&#xff0c;还能为他们未来的学术和职业生…

如何将自己做的网站推广出去网站建设高度

大家是否会遇到需要勾中选项的情况&#xff0c;我们可以在电子表格中制作出可以勾选、选中的选项按钮&#xff0c;今天我们一起学习一下设置方法。 首先&#xff0c;我们需要先在excel工具栏中添加一个功能模块&#xff1a;开发工具 依次点击excel中的文件 – 选项 – 自定义…

网站栏目策划 有思想的新闻深圳福田区口岸社区

PaaS种类繁多&#xff0c;包括公共PaaS、私有PaaS和混合PaaS&#xff0c;可以根据IT人员要求的方式提供所需工具&#xff0c;以实现更快地应用交付。 新兴科技的发展、移动端的深入应用&#xff0c;让人们对应用设备的需求不断增长&#xff0c;但在需求增长的同时&#xff0c;…

网站设计研究方法做一个微信小程序需要多少钱

-性价比高&#xff1a;0月租&#xff0c;免费接收短信&#xff0c;充值一次&#xff0c;接码可以用20年以上&#xff08;仅需半年保号一次&#xff09;&#xff0c;可能是国内性价比最高的接码实体卡&#xff01;-安全&#xff1a;实体卡无须担心因号码被风控&#xff0c;还可以…

pc主页网站建设义乌小商品市场进货渠道

给定一个包含非负整数的 m x n 网格 grid &#xff0c;请找出一条从左上角到右下角的路径&#xff0c;使得路径上的数字总和为最小。 说明&#xff1a;每次只能向下或者向右移动一步。 思路一&#xff1a;动态规划 int minPathSum(int** grid, int gridSize, int* gridColSi…

西安+美院+网站建设网站色彩运用

在这篇博客中,让我们讨论什么是卷积神经网络 (CNN) 以及 卷积神经网络背后的架构——旨在解决 图像识别系统和分类问题。 卷积神经网络在图像和视频识别、推荐系统和自然语言处理方面有着广泛的应用。 目录 计算机如何读取图像? 为什么不是全连接网络?

响应式网站设计教程淘宝网站建设论文

目录 1 -> 什么是空间配置器 2 -> 为什么需要空间配置器 3 -> SGI-STL空间配置器的实现原理 3.1 -> 一级空间配置器 3.2 -> 二级空间配置器 3.2.1 -> 内存池 3.2.2 -> SGI-STL中二级空间配置器设计 3.2.3 -> SGI-STL二级空间配置器之空间申请 …

济南网站优化建设做网站站主需要什么条件

参考&#xff1a;https://www.cnblogs.com/cheer-lingmu/p/16467561.html 参考&#xff1a;shell中各种括号的作用详解()、(())、[]、[[]]、{}(推荐)_linux shell_脚本之家 一、小括号() 1、命令替换&#xff1a;等同于cmd&#xff0c;shell扫描一遍命令行&#xff0c;发现了…

沈阳做网站找黑酷科技wordpress数据多大后慢

Java实现从JSON字符串中解析指定的key值 简介 在Java开发中&#xff0c;我们经常需要从JSON字符串中解析出指定的key值&#xff0c;以便进行后续的处理和使用。本文将介绍如何使用Java代码实现这一功能。首先&#xff0c;我们来看一下整个过程的流程。 流程图 journey title …