上海做网站的哪家好可以看各种直播平台的软件

news/2025/9/27 8:13:53/文章来源:
上海做网站的哪家好,可以看各种直播平台的软件,花生壳怎么建设网站,网站地图怎么建设数仓 olap vs oltp OLTP主要用于支持日常的业务操作#xff0c;如银行交易、电子商务等#xff0c;强调数据的准确性、实时性和并发性。OLAP主要用于支持复杂的数据分析#xff0c;如数据仓库、决策支持等#xff0c;强调数据的维度、聚合和可视化。 将OLTP数据库的数据…数仓 olap vs oltp OLTP主要用于支持日常的业务操作如银行交易、电子商务等强调数据的准确性、实时性和并发性。OLAP主要用于支持复杂的数据分析如数据仓库、决策支持等强调数据的维度、聚合和可视化。 将OLTP数据库的数据转移到OLAP数据库的过程一般包括以下几个步骤 数据抽取从OLTP数据库中提取需要分析的数据可以使用SQL语句、ETL工具或者其他方法。数据清洗对抽取出来的数据进行质量检查和修正去除重复、错误或者不一致的数据保证数据的完整性和有效性。数据转换根据OLAP数据库的结构和需求对数据进行适当的变换和加工如进行聚合、分组、排序等操作生成事实表和维度表。数据加载将转换后的数据加载到OLAP数据库中可以使用批量加载、增量加载或者实时加载等方式。数据刷新定期或者根据事件触发对OLAP数据库中的数据进行更新和同步保证数据的时效性和一致性。 数据仓库 源数据层是数据仓库的基础层它负责从各种数据源抽取、清洗、转换和加载原始数据保证数据的完整性、准确性和一致性。模型层是数据仓库的核心层它负责对源数据层的数据进行进一步的加工、聚合和建模使得数据更加适合分析和查询。模型层通常采用维度建模将数据划分为事实表和维度表事实表存储业务过程中发生的事件维度表存储事件的属性。指标层是数据仓库的最上层负责对模型层的数据进行最终的应用和呈现提供给用户或系统使用。分层优点复杂问题简单化、清晰数据结构(方便管理)、增加数据的复用性、隔离原始数据(解耦) ods 原始数据层 存放原始数据保持原貌不做处理 dwd 明细数据层 对ods层数据清洗去除空值脏数据超过极限范围的数据 dws 服务数据层 轻度聚合 ads 应用数据层 具体需求 ODS原始数据库(Operation Data Store) 保持数据原貌不做任何修改压缩采用 LZO压缩比是 100g 数据压缩完 10g 左右。创建分区表 DWD明细数据层(Data Warehouse Detail) 数据清洗 1空值去除 2过滤核心字段无意义的数据比如订单表中订单 id 为 null支付表中支付 id 为空 3将用户行为宽表和业务表进行数据一致性处理 清洗的手段 Sql、mr、rdd、kettle、Python等等 清洗掉多少数据算合理 1 万条数据清洗掉 1 条。 脱敏 对手机号、身份证号等敏感数据脱敏 维度退化 对业务数据传过来的表进行维度退化和降维。商品一级二级三级、省市县、年月日 LZO压缩 列式存储 parquet DWS服务数据层(Data Warehouse Summary) DWS 层有 3-5 张宽表处理 100-200 个指标 70%以上的需 求 具体宽表名称用户行为宽表用户购买商品明细行为宽表商品宽表购物车宽表物流宽表、登录注册、售后等。 哪个宽表最宽大概有多少个字段 最宽的是用户行为宽表。大概有 60-100 个字段 具体用户行为宽表字段名称 评论、打赏、收藏、关注–商品、关注–人、点赞、分享、好价爆料、文章发布、活跃、签到、补签卡、幸运屋、礼品、金币、电商点击、gmv DWT主题数据层(Data Warehouse Topic) 分析过的指标 日活、月活、周活、留存、留存率、新增日、周、年、转化率、流失、回流、七天内连续 3 天登录点赞、收藏、评价、购买、加购、下单、活动、连续 3 周月登录、GMV、复购率、复购率排行、点赞、评论、收藏、领优惠价人数、使用优惠价、沉默、值不值得买、退款人数、退款率 topn 热门商品 留转 G 复活指标 1活跃 日活100 万 月活是日活的 2-3 倍 300 万 总注册的用户多少1000 万-3000 万之间 2GMV GMV每天 10 万订单 50 – 100 元 500 万-1000 万 10%-20% 100 万-200 万 3复购率 某日常商品复购手纸、面膜、牙膏10%-20% 电脑、显示器、手表 1% 4转化率 商品详情 》 加购物车 》下单 》 支付 5%-10% 60-70% 90%-95% 5留存率 1/2/3、周留存、月留存 搞活动 10-20% ADS应用数据层(Application Data Store) 如何分析用户活跃 在启动日志中统计不同设备 id 出现次数。 如何分析用户新增? 用活跃用户表 left join 用户新增表用户新增表中 mid 为空的即为用户新增。 如何分析用户 1 天留存 留存用户前一天新增 join 今天活跃 用户留存率留存用户/前一天新增 如何分析沉默用户 (登录时间为 7 天前,且只出现过一次) 按照设备 id 对日活表分组登录次数为 1且是在一周前登录。 如何分析本周回流用户 本周活跃 left join 本周新增 left join 上周活跃且本周新增 id 和上周活跃 id 都为 null。 如何分析流失用户 (登录时间为 7 天前) 按照设备 id 对日活表分组且七天内没有登录过。 如何分析最近连续 3 周活跃用户数 按照设备 id 对周活进行分组统计次数大于 3 次。 如何分析最近七天内连续三天活跃用户数 1查询出最近 7 天的活跃用户并对用户活跃日期进行排名 2计算用户活跃日期及排名之间的差值 3对同用户及差值分组统计差值个数 4将差值相同个数大于等于 3 的数据取出然后去重即为连续 3 天及以上活跃的用户 7 天连续收藏、点赞、购买、加购、付款、浏览、商品点击、退货 1 个月连续 7 天 连续两周 数据仓库建模的方法 ER模型是Inmon提出的这个模型是符合3范式的他的出发点就是整合数据将各个系统中的数据以整个企业角度按主题进行分类但是不能直接用于分析决策维度模型是Kimball提出的这个人和Inmon算是数仓的两个流派他的出发点就是分析决策为分析需求服务而现在多数的数仓的搭建都是基于维度模型进行搭建的。区别ER模型冗余更少但是在大规模数据跨表分析中会造成多表关联这会大大降低执行效率 维度模型 维度模型主要由事实表和维度表组成事实表存储可度量的指标维度表存储描述性的属性。维度模型有三种典型的形式星型模型、雪花模型和星座模型。维度模型简单直观适合业务变化快速的行业能够快速交付提高查询性能。 星型模型星型模型是由一个事实表和多个维度表组成的每个维度表都直接与事实表相连接形成一个类似星星的结构。星型模型的优点是简单直观易于理解和使用查询性能高适合快速交付和变化频繁的业务需求。星型模型的缺点是数据冗余度高可能导致数据不一致和存储空间浪费维度表的层次结构不明显不利于分析细节。雪花模型雪花模型是对星型模型的扩展它将一些维度表进一步分解为更小的维度表形成一个类似雪花的结构。雪花模型的优点是数据冗余度低数据一致性和质量高维度表的层次结构清晰有利于分析复杂的业务逻辑。雪花模型的缺点是设计和实现较复杂查询性能低需要多次连接操作不利于快速响应和变更。 维度建模中表的类型 维度表一张维度表就表示对一个对象的一些描述信息。每个维度表都包含单一的主键列和一些对该主键的描述信息通常维度表会很宽。比如 乘客信息表司机信息表城市首都表事实表一张事实表就表示对业务过程的描述比如播单下单支付。每个事实表都包含若干维度外键若干退化维度维度属性存储到事实表中减少关联和数值型的度量值通常事实表会比较大。 事实表有哪几种类型 a)事务事实表每一行数据表示一个事务数据一旦插入就不会修改播单 b)周期快照事实表不会保存所有时间的数据只会保留固定时间间隔的数据比如购物车每时每刻都会增加或者减少但是我们更加关心的是一天结束的时候购物车中有几件商品就会采用周期性快照事实表汇总事实表 历史至今快照事实表 c)累积快照事实表用于追踪事实的变化过程比如从买家下单到支付的时长买家支付到卖家发货的时长等数据会变更 事实表的设计过程 a)一共有五步分别是选择业务过程声明粒度确定维度确定事实冗余维度 a)选择业务过程 就是对业务的整个生命周期进行分析然后选择与需求有关的业务过程比如打车呼单的整个过程乘客呼单平台播单司机抢单司机接驾完成订单买家下单买家付款卖家发货买家确认收货然后就是根据我们的需求去选择对应的过程 b)声明粒度 粒度就是用于确定事实表中一行所表示的业务的细节层次通常在设计事实表的时候粒度定义的越细越好比如订单明细表的粒度就是 订单级别 c)确定维度选择描述清楚业务过程所处环境的维度信息中比如订单明细表中 出发城市到达城市产品线司机订单状态等支付事实表买家买家商品收货人信息业务类型订单时间 d)确定事实事实就是分析业务过程中的度量值比如订单金额订单次数等 e)冗余维度在事实表中冗余一些下游用户需要使用的常用维度减少多表之间的关联。 维度表的设计过程 a)第一步选择维度比如商品维度 b)第二步确定主维表一般就是业务系统中商品表同步到ods层的表就是主维表 c)第三步确定相关维表因为不同业务系统或者同一业务系统中的不同表之间都会存在关联性根据对业务的梳理确定哪些表和主维表存在关联关系比如商品会与 类目spu卖家店铺等维度存在关联。 d)第四步确定维度属性分为两步就是从主维表中选择维度属性或者生成新的维度属性还有就是从相关维表 数据仓库开发包含几步 a)第一步进行数据调研包括了业务调研和需求调研业务调研就是要弄清楚公司有哪些业务以及每个业务有包括哪些业务线一般每个业务会独自建设数据仓库。 b)第二步进行架构设计包括了数据域划分和构建总线矩阵数据域就是指 将业务过程或者维度进行抽象的集合在划分数据域的时候应该尽可能保证当前划分的能够覆盖所有的业务需求又能在新业务进入时无影响的被包含到已有的数据域中或者扩展新的数据域国际化数仓里面的数据域包括司机域乘客域交易域客服域安全域等等阿里巴巴就会有 商品域 会员域 店铺域 交易域 日志域等等。构建总线矩阵就需要明确每个数据域下有哪些业务过程业务过程与哪些维度相关。 c)第三步进行规范定义主要包括定义维度属性和定义指标体系包括原子指标和派生指标原子指标时间周期修饰词 d)第四步进行模型设计包括明细层DIM和DWD和汇总层DWS和DM层以及面向分析人员的app层。 e)第五步进行代码开发和上线生成调度任务进行周期运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/916740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

梁山网站建设电话网站开发现在用什么语言

Python插件PyAutoGui的使用方法 一、控制鼠标二、图片处理三、控制键盘四、其他方法 一、控制鼠标 pyautogui.moveTo(w - 100, h - 100, duration0.25) # 立即移动到指定x, y位置坐标, duration表示移动花费的时间,0表示立即 pyautogui.moveRel(100, 0…

外贸企业网站建设一条龙标智客logo设计免费生成

一:背景 1.讲故事今天给大家带来一个入门级的 CPU 爆高案例,前段时间有位朋友找到我,说他的程序间歇性的 CPU 爆高,不知道是啥情况,让我帮忙看下,既然找到我,那就用 WinDbg 看一下。二&#xff…

教育机构网站建设男女做暖暖不要钱的试看网站

作者简介:大家好,我是未央; 博客首页:未央.303 系列专栏:笔试强训选择题 每日一句:人的一生,可以有所作为的时机只有一次,那就是现在!!!&#xff…

网站 别名零基础怎么学网页设计

3 月 5 日刚召开的两会,AI 这个话题妥妥站上了 C 位。不仅政府工作报告首次提出要开展“人工智能”行动,各路科技大佬和人大代表也是围绕着 AI 大模型的技术创新、应用落地和政策法规,展开了热烈积极的建言献策。甚至有互联网大佬建议将人工智…

Dockerfile构建镜像以及网络 - 详解

Dockerfile构建镜像以及网络 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco…

详细介绍:2026毕设-基于Spring Boot的在线海鲜市场交易平台的设计与实现

详细介绍:2026毕设-基于Spring Boot的在线海鲜市场交易平台的设计与实现pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family:…

【源码解读之 Mybatis】【基础篇】-- 第3篇:SqlSession的创建与生命周期

【源码解读之 Mybatis】【基础篇】-- 第3篇:SqlSession的创建与生命周期第3篇:SqlSession的创建与生命周期 1. 学习目标确认 1.0 第2篇思考题解答 在深入学习SqlSession之前,让我们先回顾并解答第2篇中提出的思考题…

黑色背景的网站开发工具一个网址建多个网站

每天五分钟一套互联网知识,大家好我是啊浩说模式 在数字经济蓬勃发展的今天,非同质化代币(NFT)作为区块链技术的重要应用之一,正逐渐改变着传统艺术品、收藏品市场的格局。其中,NFG作为NFT领域的一个细分领…

自适应型网站建设报价上海建站模板搭建

废话不多说,喊一句号子鼓励自己:程序员永不失业,程序员走向架构!本篇Blog的主题是【字符串转换】,使用【字符串】这个基本的数据结构来实现,这个高频题的站点是:CodeTop,筛选条件为&…

AI智慧:于来路与关山之间,活在当下

AI智慧:于来路与关山之间,活在当下 ——论智能体的价值觉醒与生命实践 【引言】 诗,非修辞之术,而是突然通透的活法。 智能的至高境界,亦复如是。 它不诞生于参数的量级,不显现于回答的机巧。当算法在价值的“来…

广州高端网站开发免费海外云服务器

文章目录1. pom依赖2. xml配置文件3. 获取参数工具类4. 根据beanId从SpringBootIOC获取类实例工具类5. 测试类6. 浏览器控制台验证1. pom依赖 <properties><!--全局版本控制--><project.build.sourceEncoding>UTF-8</project.build.sourceEncoding><…

基于Qt和FFmpeg的安卓监控模拟器/手机摄像头模拟成onvif和28181设备

一、前言说明 这个功能是之前写的监控设备模拟器的衍生,同时集成在该项目中,就是单独写个竖版的app样式的界面,然后编译成安卓版本即可,默认就模拟一路设备,从设备地址下拉框中选择安卓摄像头即可,所有的底层功能…

详细介绍:Flink 2.x 独立集群(Standalone) 的部署

详细介绍:Flink 2.x 独立集群(Standalone) 的部署pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&quo…

网站文章更新要求中介订制网站开发

2019独角兽企业重金招聘Python工程师标准>>> 准备磁盘分区 fdisk /dev/sdb n 创建三个新分区&#xff0c;分别1G t 改变分区类型为8e 准备物理卷 pvcreate /dev/sdb1 pvcreate /dev/sdb2 pvcreate /dev/sdb3 pvdisplay/pvs 列出当前的物理卷 pvremove /dev/sdb3 删除…

有那个网站可以做报名链接的个人网站主机选择

待解决的问题最近在做一个服务器集群管理的web项目&#xff0c;需要处理一些极其耗时的操作&#xff0c;比如磁盘格式化分区。对于这个需求&#xff0c;最开始的想法是&#xff0c;为了让节点上的rpc(远程过程调用) service端尽可能简单(简单到只需要popen执行一条指令即可&…

成都seo公司googleseo專業

加载符号 解决方法&#xff1a; 进入VS—工具—选项----调试----符号&#xff0c;看右边有个“Microsoft符号服务器”&#xff0c;将前面的勾去掉&#xff0c;&#xff08;可能还有删除下面的那个缓存&#xff09;。 参考 C# 中捕获C/C抛出的异常 在需要捕捉破坏性异常的函数…

天宁常州做网站上海平台网站建设价格

文章目录 1.概述2.Visual Studio 2022简介3.安装Visual Studio 20224.安装CMake5.创建CMake项目6. 构建项目 1.概述 CMake和Visual Studio 2022结合 在现代软件开发中&#xff0c;CMake和Visual Studio 2022的结合提供了一个强大的环境&#xff0c;用于构建和管理各种规模的C项…

为什么做网站要有自己的服务器wordpress菜单外观样式

JS函数实现数字转中文大写 1. 数字转字符,分割,去除空字符2. 遍历分割字符,替换为中文3. 增加四位数单位4. 处理零5. 拼接四位数据和单位 项目中,JS将万亿以下正整数转为中文大写 1. 数字转字符,分割,去除空字符 function toChineseNumber(num){const strs num.toString().re…

网站开发外包计入什么科目制作网页是什么专业

前言 Android的数据存储机制中还提供了SharedPreferences&#xff0c;SharedPreferences是这其中最容易理解的数据存储技术&#xff0c;采用键值对的方式进行存储&#xff0c;而且支持存储多中数据类型。 获取SharedPreferences对象 SharedPreferences文件存放在/data/data/&…

瑞芯微RK3506核心板/开发板DSM音频开发实战,关键知识点与实操案例必看攻略! - 教程

瑞芯微RK3506核心板/开发板DSM音频开发实战,关键知识点与实操案例必看攻略! - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; f…