浅谈数据模型

1:事实表和维表的概述

前言:数据仓库是一种用于存储和管理大量数据的技术。其中,事实表和维表是数据仓库中的两个重要概念,首先了解一下事实表和维度表

1.事实表:是指用于存储测量“事实数据”的表,事实数据表包含描述业务(例如产品销售)内特定事件的数据,例如订单信息表、销售记录表等

2.维表是用于提供事实表上下文和维度信息的表,例如时间表、地区表、客户表等

事实表通常包含多个维表,这些维表提供了与事实数据相关的上下文和维度信息,维表通常与事实表相关联,以提供关于数据测量的上下文和描述信息。

以上总结:

1.事实表存储的是度量值,也可以是计算值,是一条一条的明细,可分为周期快照事实表(按一定的周期业务积累的数据)和累计快照事实表(记录整个过程的数据)

2.维度表:由上图可看,维度表一般都是每条数据都是唯一的,有主键设置,它的主键是事实表的外键。可细分一般维度表(数据是不断增加和变化的)和固定维度表(数据是不变的,例如码值表)

2.数据模型

数据模型一般分为:星型模型、雪花模型、星型-雪花模型、事实星座模型

一、星型模型

星型模型是由一个事实表和多个维度表组成的一种体系结构。事实表位于星型模型的中心,维度表则呈辐射状与事实表相连,各种维度表之间不存在联系。这种模型的结构简单,易于理解和实现。此外,星型模型还具有较好的查询性能和可扩展性,因此在数据仓库的构建中被广泛采用。

二、雪花模型

雪花模型是由1个事实表和多个维度表组成的一种体系结构。维度表和维表相连,再连接到事实表,形成一个复杂的网状结构。与星型模型相比,雪花模型的结构更加灵活,能够更好地支持复杂的数据分析需求。然而,这种模型的构建和维护较为困难,且查询性能相对较低。

三、事实星座模型

事实星座模型是由多个事实表和多个维度表组成的一种体系结构。与雪花模型不同的是,事实星座模型的事实表之间不再直接相连,而是通过维度表相连形成一个星座状结构。这种模型的结构非常灵活,能够更好地支持复杂的数据分析需求。然而,这种模型的构建和维护非常困难,需要谨慎使用。

3.维度建模四个步骤

1.选择业务过程
表示的是业务执行的活动,产生一系列事实表。
2.声明粒度
粒度是事实表的度量细节级别。通常从原子级别粒度开始设计,这样可以支持上卷,也支持下钻细节,能够承受各种用户查询。
3.确认维度
文本属性,用来修饰事实表。
4.确认事实
是维度建模的核心。
不同粒度的度量要放在不同的事实表中。
通过外键关联相关维度。
查询操作是基于事实表开展计算和聚合

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/828722.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法学习笔记Day8——回溯算法

本文解决几个问题: 回溯算法是什么?解决回溯算法相关的问题有什么技巧?回溯算法代码是否有规律可循? 一、介绍 1.回溯算法是什么? 回溯算法就是个多叉树的遍历问题,关键在于在前序和后序时间点做一些操作…

Java基础入门day35

day35 js 简介 js:JavaScript,是一种解释性语言,动态类型、弱类型的计算机语言 它的解释器被称之为JavaScript引擎,作为浏览器的一部分,广泛用于客户端脚本语言,用来给html网页增加动态功能 问题描述&…

哈希表练习题

前言 本次博客将要写一写,哈希表的一些使用 哈希表主要是一个映射,比如数组就是一个哈希表 是一个整型对应另一个整型,介绍的哈希表还是要以写题目为例 第一题 242. 有效的字母异位词 - 力扣(LeetCode) 直接来看…

chrome插件 脚本 使用和推荐

chrome插件使用 在极简插件中可以进行下载并进行安装, 内部有安装教程在极简插件中搜索"油猴",下载一个油猴插件,并安装,可以用于下载很多的用户脚本用户脚本下载地址Greasy Fork,里面有很多实用的用户脚本供下载,并在油猴中进行管理 推荐的插件 Tampermonkey 篡改…

小红书自动互动,建立个人品牌的秘密武器!

在数字化的今天,个人品牌的重要性不言而喻。它不仅能让你在人群中脱颖而出,还能为你的事业或生意带来无尽的机会。然而,建立并推广个人品牌并非易事,需要策略、耐心和一定的工具辅助。在这里,我们要探讨的是如何利用小…

【Python数据库】Redis

文章目录 [toc]数据插入数据查询数据更新数据删除查询存在的所有key 个人主页:丷从心 系列专栏:Python数据库 学习指南:Python学习指南 数据插入 from redis import Redisdef insert_data():redis_cli Redis(hostlocalhost, port6379, db…

智慧健康旅居养老产业,做智慧旅居养老服务的公司

随着社会的进步和科技的飞速发展,传统的养老模式已经无法满足 现代老年人的多元化 需求。智慧健康旅居养老产业应运而生,成为了一种新型的养老模式,旨在为老年人提供更加舒适、便捷、安全的养老生活。随着社会的进步和人口老龄化趋势的加剧&a…

如何3分钟,快速开发一个新功能

背景 关于为什么做这个代码生成器,其实主要有两点: 参与的项目中有很多分析报表需要展示给业务部门,公司使用的商用产品,或多或少有些问题,这部分可能是历史选型导致的,这里撇开不不谈;项目里面也有很多C…

Sping源码(七)—context: component-scan标签如何扫描、加载Bean

序言 简单回顾一下。上一篇文章介绍了从xml文件context component-scan标签的加载流程到ConfigurationClassPostProcessor的创建流程。 本篇会深入了解context component-scan标签底层做了些什么。 component-scan 早期使用Spring进行开发时,很多时候都是注解 标…

项目上线流程(保姆级教学)

01:注册阿里云账户 02:登录阿里云 03:在桌面新建记事本保存个人账号密码等信息 04:完成重置密码 05:安装宝塔面板 命令行 yum install -y wget && wget -O install.sh http://download.bt.cn/install/instal…

大学生在线考试|基于SprinBoot+vue的在线试题库系统系统(源码+数据库+文档)

大学生在线考试目录 基于SprinBootvue的在线试题库系统系统 一、前言 二、系统设计 三、系统功能设计 试卷管理 试题管理 考试管理 错题本 考试记录 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍&#…

Java数据结构堆

堆的概念 所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中。 小根堆:根节点的大小小于孩子节点。整棵树都是小根堆必须满足每颗子树都是小根堆。 堆的存储方式 从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的…

【JVM】java内存区域

目录 一、运行时数据区域 1、方法区 2、堆 3、虚拟机栈 4、本地方法栈 5、程序计数器 6、运行时常量池 二、HotSpot虚拟机的对象 1、对象的创建 指针碰撞: 空闲列表: 2、对象的内存布局 对象头 实例数据 对齐填充 3、对象的访问定位 句…

git忽略文件配置 !

.gitignore中!表示取反 注意,如果父目录被排除,则父目录下的子目录也会被排除,此时对父目录下的子目录取反也不会生效,比如存在目录结构,再.gitignore目录下配置的 /*(排除所有文件)&#xff0c…

【LLM多模态】Qwen-VL模型结构和训练流程

note 观点:现有很多多模态大模型是基于预训练(和SFT对齐)的语言模型,将视觉特征token化并对齐到语言空间中,利用语言模型得到多模态LLM的输出。如何设计更好的图像tokenizer以及定位语言模型在多模态LLM中的作用很重要…

面试算法题之暴力求解

这里写目录标题 1 回溯1.1 思路及模板1.1 plus 排列组合子集问题1.2 例题1.2.1 全排列1.2.2 N 皇后1.2.3 N皇后问题 II1.2.4 子集 (子集/排列问题)1.2.4 组合(组合/子集问题)1.2.5 全排列 (排列问题)1.2.1做过1.2.6 子集II &#…

项目十一:爬取热搜榜(小白实战级)

首先,恭喜各位也恭喜自已学习爬虫基础到达圆满级,今后的自已python爬虫之旅会随着网络发展而不断进步。回想起来,我学过请求库requests模块、解析库re模块、lmxl模块到数据保存的基本应用方法,这一次的学习python爬虫之旅收获很多…

模块三:二分——153.寻找旋转排序数组中的最小值

文章目录 题目描述算法原理解法一:暴力查找解法二:二分查找疑问 代码实现解法一:暴力查找解法二:CJava 题目描述 题目链接:153.寻找旋转排序数组中的最小值 根据题目的要求时间复杂度为O(log N)可知需要使用二分查找…

vue集成百度地图vue-baidu-map

文章目录 vue集成百度地图vue-baidu-map1. Vue Baidu Map文档地址2. 设置npm数据源3. 安装vue-baidu-map4. 配置vue-baidu-map4.1 main.js全局注册4.2 vue页面设置4.3 效果 vue集成百度地图vue-baidu-map 1. Vue Baidu Map文档地址 https://dafrok.github.io/vue-baidu-map/#…

Golang GMP解读

概念梳理 1. 1 线程 通常语义中的线程,指的是内核级线程,核心点如下: 是操作系统最小调度单元;创建、销毁、调度交由内核完成,cpu 需完成用户态与内核态间的切换;可充分利用多核,实现并行. …