怎么做网站优化排名到前面wordpress发布视频

bicheng/2026/1/16 21:17:46/文章来源:
怎么做网站优化排名到前面,wordpress发布视频,游戏网站的建设,网站开发工具的大数据仓库开发规范示例 一、前提概要二、数仓分层原则及定义2.1 数仓分层原则2.2 数仓分层定义 三、数仓公共开发规范3.1 分层调用规范3.2 数据类型规范3.3 数据冗余规范3.4 NULL字段处理规范3.5 公共字段规范3.6 数据表处理规范3.7 事实表划分规范 四、数仓各层开发规范4.1 分… 大数据仓库开发规范示例 一、前提概要二、数仓分层原则及定义2.1 数仓分层原则2.2 数仓分层定义 三、数仓公共开发规范3.1 分层调用规范3.2 数据类型规范3.3 数据冗余规范3.4 NULL字段处理规范3.5 公共字段规范3.6 数据表处理规范3.7 事实表划分规范 四、数仓各层开发规范4.1 分层实例4.2 表的属性词条相关规范4.3 ODS层设计规范4.4 DWD层设计规范4.5 DWS层设计规范4.6 DIM设计规范4.7 DM层设计规范4.8 TMP层设计规范 五、总结 一、前提概要 大数据平台开发规范示例 发布一段时间后有小伙伴表示我汤姆就是个Sql Boy可否来个 数据仓库开发规范示例安排 调侃归调侃如果想做一名合格的Sql Boy还真不容易… 一臻在此对过去和做数仓Ing的小伙伴们361°C鞠躬Respect以表敬意。 二、数仓分层原则及定义 2.1 数仓分层原则 数仓分层的目的是为了给业务提供高效的数据支撑和层次清晰、功能明确的数据存储为企业各角色提供稳定、准确、多元化的高可用数据同时为数据提供更方便的管理和运维。 2.2 数仓分层定义 数仓主要包含ODS,DWD,DWS,DIM,DM几个标准化的分层同时结合企业实际的情况如补录的数据在数据ETL过程中的临时处理数据等根据用途汇总为贴源层、数据共享层、数据服务层。 ODSOperational Data Store: 贴源层数据仅导入业务业务数据,不做任何数据的清洗转换和修改保持与源库一致。具体情况根据项目场景设定。除了业务系统的数据还包括补录数据处理源系统数据快照处理等。DWDData Warehouse Detail: 数仓明细层数据保留业务实体的原子粒度并且通过数据清洗和一定程度的数据转换保障数据质量。数据来源于ODS层保留所有历史数据。业务实体、数据行、字段级的完整性在该层实现。DWSData WareHouse Service: 数仓服务层数仓的服务层与之前所提到的数据服务层不同DWS层为公共汇总层指标均可在DWS层落地。该层使用DWD层数据维度数据对业务上有关联的实体做连接形成统一粒度的跨业务流程的多业务实体的轻度汇总数据。DIMDimension: 数据维度层存储维度含主数据信息表或配置表来源数据质量高的ODS数据(如主数据)和DWD层数据。DMData Market: 数据集市层提供数据服务的分层有明确的分析主题基于具体的业务需求场景或者分析场景数据仅包含维度和指标没有复杂的逻辑处理。数据来源于DWD,DWS,DIM层大多数为指标宽表有较多的维度和指标。TMP临时数据处理层用于各层的数据加工处理过程中的临时数据处理临时需求场景加工数据的处理。 三、数仓公共开发规范 3.1 分层调用规范 数据分层的标准流向不含维度为ODS-DWD-DWS-DM标准流向中禁止出现反向依赖。 维度流向为DWD-DIM或者ODS-DIM使用ODS直接到DIM的情况必须保障足够高的数据质量。 DIM、DWS、DM可以往自身分层写入数据如不同粒度的数据写入。 数据流向如下图所示 3.2 数据类型规范 在保障数据不失真且不会增加数据存储复杂度不增加数据处理计算量的情况下尽量减少数据类型的数量兼容原始数据原有的类型。 数据类型依据具体的数据存储环境而定比如使用Apache Doris的情况如下: ID类BIGINT标签枚举INT字符串STRING状态描述STRING日期DATE yyyy-MM-dd日期时间:DATETIME yyyy-MM-dd HH:mm:ss.SSSSSS业务数额类默认使用 DECIMAL精度根据实际情况做调整 3.3 数据冗余规范 宽表的冗余字段要确保以下原则 冗余字段要使用高频下游3个或以上使用。冗余字段引入不应造成本身数据产生过多的延后。冗余字段和已有字段的重复率不应过大原则上不应超过 60%如需要可以选择join或原表拓展。 3.4 NULL字段处理规范 数据类型为int的默认为-999数据类型为bigint的默认为-999999数据类型为decimal的默认为0 3.5 公共字段规范 所有数仓分层中的字段均为小写且不可出现中文。 物理表中的公共字段信息如下: 3.6 数据表处理规范 增量表: 依据具体的时间和其他标签粒度做对应的分区或多层分区处理过程中源表必须包含可增量的属性字段确保数据的完整性。全量表: 每次写入的数据都是最新的 每次写入的数据都是完整的全量数据。拉链表: 记录一个事物从开始一直到当前状态的所有变化的信息 拉链表每次上报的都是历史记录的最终状态是记录在当前时刻的历史总量 当前记录存的是当前时间之前的所有历史记录的最后变化量(总量)。 3.7 事实表划分规范 在维度建模中按粒度划分数据表分为维度表和事实表事实表包含三种事务型事实表周期快照型事实表累计快照型事实表。 事务型事实表 事务事实表记录事务层面的事实保存最为原子的数据其数据在事务发生后发生粒度为每一行数据。周期快照型事实表 有规律的可预见的时间间隔的业务累计数据比如按天、周、月等做业务的统计度量。累计快照型事实表 在整个业务的生命周期中表述业务多个阶段的开始和结束过程通常有多个时间字段并且时间不可预测随着阶段周期的变化记录也会随着变化而发生修改。 四、数仓各层开发规范 4.1 分层实例 数仓分册实例如下表所示 4.2 表的属性词条相关规范 表的属性中会存在以下的属性词条需要通过业务元数据去描述不直接通过表名避免表名太长的问题: 是否宽表时效: 实时和非实时更新方式:增量全量 以下属性需要通过表名去区分: 统计周期y表示年m表示月w表示周d表示天h表示小时mi表示分钟维度类型缓慢变化维(scd)非缓慢变化维。 4.3 ODS层设计规范 命名规则 ODS层表命名规则ods_[类别]_[表内容]。类别分为业务表business简称bsn快照表snapshot简称snap和补录表amended简称amd。示例ods_doris_load.ods_snap_stream_load其中ods_doris_load是库名doris是系统load 是导入库snap表示是快照表stream_load是stream_load导入方式表名。 处理内容 源系统数据的采集和同步保持和源系统数据的一致性。 处理过程分为实时和离线实时接入的数据需要有对应的数据写入状态(新增、修改、删除)实时数据写入时间。快照表处理 对于源表数据量少于100万的可按天/周/月不同的周期间隔做全量快照表 对于源表数据量大于1000万的需要根据业务主键做拉链表 对于源表数据量大于100万小于1000万的根据具体业务的需求做全量快照补录表处理主要针对业务系统中没有的数据需要导入或者补录平台录入的用以修复数据或者完善指标规则的如财务手工账订单时效的基线等。补录数据需要有以下约束固定的模板数据适用范围和有效期补录数据的更新机制补录数据更新后的数据处理机制补录表需在表中增加字段(表述补录类别和用途)。 4.4 DWD层设计规范 命名规则 DWD层表命名规则dwd_[实体名]示例dwd_doris.dwd_doris_load其中dwd_doris是库名doris表示AP域doris_load表示导入凭证 处理内容 数据的完整性包括实体的完整性(分段的业务表)数据行的完整性(不同阶段的业务周期的汇集)字段的完整性(关键业务字段)。数据清洗对于脏数据按规则进行清洗保障原子粒度的数据质量。维度关联映射。 4.5 DWS层设计规范 命名规则 DWS层表命名规则dws_[主题内容]_[统计周期]示例dws_doris.dws_load_d其中dws_doris是库名load是导入全流程相关的主题内容最后的d表示按天统计 处理内容 不同实体间的关联和逻辑转换。维度退化。不同粒度的指标度量表以及轻度汇总。不同类型的事实表。粒度较细的宽表。 4.6 DIM设计规范 命名规则 DIM表命名规则dim_[主题域][维度类型][维度],维度统一库名对于有主题域来源通过表名识别主题域。示例dim.dim_doris_scd_load其中dim表示维度的库名doris 表示AP域scd 表示缓慢变化维load表示导入维度 处理内容 维度的一致性和准确性。数据行中为空维度的兼容。缓慢变化维。 4.7 DM层设计规范 命名规则 DM层表命名规则dm_[项目/分析域][主题内容][统计周期]。示例dm_doris.dm_doris_load_d其中dm_doris是库名doris是表示AP项目load 表示导入相关的分析最后的d表示按天统计 处理内容 基于不同分析主题的宽表基于应用场景的维度和指标的提取。指标粒度的一致性。数据的高度汇总。保障维度完整性(所有的维度包含为空的兼容都可在维表中关联)。 4.8 TMP层设计规范 命名规则 TMP层表命名规则 ETL作业tmp_[分层库名_分层表名][流水] 临时使用的表:tmp[用户][表内容][有效期] 处理内容 ETL作业中的临时表可在ETL中临时创建和删除必须满足模型管理员清理TMP层数据策略的要求。临时使用的表必须有确定的生命周期不确定有效期的可设置较长的有效期模型管理- 员根据有效期和用户不定时沟通确认该临时表的清理计划。 五、总结 规范示例仅作为参考实际开发中需要根据业务要求和场景进行调整适配。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/89800.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

海口模板建站定制为什么大网站的百度快照更新速度慢还排第一

Flask维护者:李辉, 最近看b站的flask相关,发现了这个视频:[PyCon China 2023] 濒危 Flask 扩展拯救计划 - 李辉_哔哩哔哩_bilibili 李辉讲他在维护flask之余,开发了apiflask这个依托flask的框架。GitHub - apiflask/a…

建设网站费用入什么科目小语种外贸建站

目录 ❀expect命令运用于bash❀ expect使用原理 expet使用场景 常用的expect命令选项 Expect脚本的结尾 常用的expect命令选参数 Expect执行方式 单一分支语法 多分支模式语法第一种 多分支模式语法第二种 在shell 中嵌套expect Shell Here Document(内…

网站推广怎么做的石灰土做击实检测网站怎么填

Package cli version 3.6.0 Usage ansi_toupper(x)ansi_tolower(x)ansi_chartr(old, new, x) Arguments 参数【x】:输入字符串。可能有ANSI的颜色和样式。 参数【old】:指定要翻译的字符的字符串。如果提供长度为2或更多的字符向量,则使用…

如何做网站收录上海外贸网站建设公司价格

1、打开项目文件 打开文件后点击vs code左侧工具栏中第三个源代码管理图标,点击初始化仓库,此时会创建一个本地仓库会检查该项目中的文件变更 2、创建远程仓库 点击克隆/下载,复制HTTPS地址 3、添加远程地址 1)图形化操作 2…

最大网站建设公司一键免费生成网页的网站

在很多软件公司,特别是一些创业型的团队中,对于这样的情景可能大家都很熟悉:项目经理或者产品经理(产品狗)口头或者简单记录一下软件产品的大致要做的功能,直接就让研发团队的兄弟(程序猿&#…

有些人做网站不用钱的,对吗?沧州网络推广渠成网络

设计思路 系统设计过程中充分考虑各个子系统的信息共享要求,对各子系统进行结构化和标准化设计,通过系统间的各种联动方式将其整合成一个有机的整体,使之成为一套整体的、全方位的数据中心大楼综合管理系统,达到人防、物防和技防…

山东网络推广公司潍坊百度推广优化

Netty线程模型 Netty中两个线程池, 分别是BossGroup和WorkGroup, 线程模型如下图所示: 模型解释: Netty 抽象出两组线程池BossGroup和WorkerGroup,BossGroup专门负责接收客户端的连接, WorkerGroup专门负责网络的读写BossGroup和WorkerGr…

网站建设分金手指专业十八软文推广的标准类型

附源代码,一定能实现! 目录 EDA设计练习题: 实验要求如下: 思路分析: 代码 99进制计数器 码转换 顶层文件 特别注意 测试 编译通过 结果展示 RTL视图 技术映射视图 软件:Quartus II 13.0 (64…

创意策划网站建立局域网的步骤

目录 0、引言 1、由于RabbitMq是erlang语言开发的,所有需要先安装erlang 2、更新源并安装RabbitMq 3、安装完成之后,服务是启动的,可以通过以下语句查看状态 4、这样安装完成之后,是看不到web页面的,需要再安装一…

农村电商网站建设ppt免费网站申请域名com

阿里云2核4G服务器5M带宽可以选择轻量应用服务器或云服务器ECS,轻量2核4G4M带宽服务器297元一年,2核4G云服务器ECS可以选择计算型c7、c6或通用算力型u1实例等,买5年可以享受3折优惠,阿腾云分享阿里云服务器2核4G5M带宽五年费用表&…

网站建设 维护 运营情况报告专业做物业网站的公司

专题一 CMIP6中的模式比较计划 1.1 GCM介绍全球气候模型(Global Climate Model, GCM),也被称为全球环流模型或全球大气模型,是一种用于模拟地球的气候系统的数值模型。这种模型使用一系列的数学公式来描述气候系统的主要组成部分…

广州网站建设 骏域网站建设石油网站建设价格

如果您希望将 QPlainTextEdit 的背景颜色设置为与窗口背景相似的灰色,您可以使用窗口的背景颜色作为基准来设置 QPlainTextEdit 的背景颜色。以下是一个示例代码,展示如何实现这一点: from PyQt5.QtWidgets import QApplication, QMainWindo…

成品网站w灬源码火龙果西安建站软件

Part1 漏洞案例demo&#xff1a; 没有java代码审计XSS漏洞拿赏金的案例。 所以将就看看demo吧 漏洞原理&#xff1a;关于XSS漏洞的漏洞原理核心其实没啥好说的&#xff0c;网上一查一大堆 反射性XSS漏洞 <% page language"java" contentType"text/html; c…

做网站公司推荐wordpress 4.6漏洞

文章目录 Java的三大核心特性是&#xff1a;封装、继承和多态 Java的三大核心特性是&#xff1a;封装、继承和多态 封装&#xff08;Encapsulation&#xff09;&#xff1a;封装是指将对象的状态信息隐藏在对象内部&#xff0c;不允许外部程序直接访问对象内部信息&#xff0c;…

个人网站建设好之后怎么赚钱直播营销的优势有哪些

本文结合PTA专项练习带领读者掌握指针&#xff0c;刷题为主注释为辅&#xff0c;在代码中理解思路&#xff0c;其它不做过多叙述。 目录 6-1 删除字符串中数字字符6-2 找最大值及其下标6-3 求两数平方根之和6-4 求一组数中的最大值、最小值和平均值6-5 两个4位正整数的后两位互…

小公司做网站紧急紧急626969

功能&#xff1a;循环 格式&#xff1a;loop 标号 执行过程&#xff1a; cxcx-1判断cx的值&#xff0c;不为0则转至标号处执行程序&#xff0c;如果为0则向下执行 从上面的执行过程可以看出&#xff0c;cx存放的是循环次数 举个例子&#xff1a;实现2的12次方 assume cs:co…

网站网址注册域名解析到服务器ip然后服务器怎么弄才能跳转到那个网站

背景 分布式场景下需要一个全局 ID 来标识唯一性&#xff0c;比如在单数据库时通过表唯一主键即可实现唯一 ID&#xff0c;分库分表时就需要全局唯一 ID。 业务对唯一 ID 的要求如下&#xff1a; 全局唯一性 不能出现重复的 ID 号&#xff0c;既然是唯一标识&#xff0c;这…

海外网站平台大同住房和城乡和建设网站

文章目录 86 正则表达式87 字符串和正则相关的方法88 正则表达式语法(1)89 正则表达式语法(2)90 邮件的正则 86 正则表达式 <!DOCTYPE html> <html> <head> <title></title> <meta charset "utf-8"> <script type"tex…

上海创意型网站建设怎么制作公众号封面图

推荐链接&#xff1a; 总结——》【Java】 总结——》【Mysql】 总结——》【Redis】 总结——》【Kafka】 总结——》【Spring】 总结——》【SpringBoot】 总结——》【MyBatis、MyBatis-Plus】 总结——》【Linux】 总结——》【MongoD…

做钓鱼网站教程视频教程西安电商网站

一、简要描述 打开Jenkins管理后台,进入项目详情在构建->增加构建步骤->执行shell添加编写构建执行shell脚本更改Springboot java项目源码版本,并提交到Gitlab登录到Gitlab管理后台,新建一个v3.0的tag到Jenkins管理后台,对项目执行构建构建记录详情,查看构建日志在宿…