数据仓库项目启动与管理

数据仓库项目启动与管理

确定项目

评估项目就绪情况

项目就绪的三个条件

  1. 强力型高级业务管理发起人
    • 对数据仓库解决方案的影响有先见之明
    • 是所在组织内有影响的领导者
    • 要求严格,但是又比较现实,会为其他成员提供强力支持
  2. 强制型业务动机
    • 数据仓库系统和战略性业务动机紧密结合在一起
  3. 可行性
    • 数据仓库准备过程中和数据本身相关的可行性,若缺失,脏造成预处理十分复杂,甚至没有收集到,就会面对比较重大的可行性问题.
    • 评估可行性主要是使用数据探查技术,主要描述数据的内容 一致性 结构

弥补不足并确定下一步工作

  • 低质量的数据: 项目不当继续进行,应当为业务发起人确定另一个业务价值高且数据可行性障碍比较少的需求,同时在项目延缓期间,解决数据方面的问题
  • 能力弱的业务发起人和仅动IT的发起人: 需要再机构中物色新的业务发起人 最有效的方法是进行一次高层业务需求分析
    • 理解业务管理部门的战略性商业计划
    • 为他们监控和施加影响的每个核心业务过程确定主要的绩效度量或者成功标准
    • 确定业务信息访问的改进对业务的潜在影响 进行概念验证不能成为放弃与功能性业务部门直接交互的理由,不应该单纯地进行概念验证
  • 多个业务发起人提出过多要求: 借助促谈会进行一次协商 基于对业务价值和可行性的综合评估业务需求优先次序
  • 过于冒进的业务发起人: 坚持在项目中立即继承多个重要的源系统 每引进一个新的主要数据源就将数据仓库的开发周期延长6个月,有助于将精力集中到正确的主题上

确定初步范围和章程

项目范围的确定应该由业务需求来驱动,在生命周期图中,这种关系是由"项目/项目群规划" "业务需求定义"两个方框之间的双向箭头来表示的

  • 聚焦与一个单独的业务过程: 集中关注单个业务过程有助于为设计和开发迭代确定一个更易处理的范围,在项目缺的早期成型阶段 较为合理的做法是仅仅从单个源系统重提取和转换数据

    • 在项目早期,每次迭代中都应当将数据的来源限定到单个业务过程中,当单个实现周期中多个业务过程的度量固定下来的时候,数据抽取,转换,装载方面的工作量都会成指数增长
    • 补充原则
      • 范围有意义且易于处理
      • 需要IT代表与业务代表的共同努力
      • 一旦范围确定下来就应当确立项目的成功标准
  • 快速应用程序开发

    • 精力集中于要交付业务价值的主要目标上
    • 业务代表与开发团队之间的价值协作
    • 同业务代表进行面对面沟通 反馈和确定优先级等熊东
    • 尽快适应金华后的需求 变更是不可避免的
    • 以迭代 怎两的方式处理可冲用软件的开发问题 多层任务并发重叠
    • 一种开发模型并不能适用于所有项目群 BI团队成员在工作中要尽可能接近业务 另一方面 在显示世界中提取 转换 装载过程本来就比较复杂 而且还依赖于结构与顺序
    • 不要凭空创建分析方法 或者报告方案 如果条件合适 鼓励使用敏捷开发方法 但是必须避免建立孤立的数据集
    • 经常需要进行功能发布 也必须在整体架构 和总体规划的背景下实现
  • 编制项目群范围 章程文档

    • 背景
    • 工程范围
    • 工程之外的事项
    • 工程成功的标准
    • 风险和降低风险的行动方案

建立商业报告和合理性证明

  • 确定财政投资和成本
  • 确定财务效益和收益
  • 利用投资和回报计算ROI

项目规划

  • 确立项目标识

  • 项目人员配备

    • 决策人员
    • 数据仓库主管
    • 指导者,项目经理和项目领导者
    • 核心项目团队
    • 专门团队
  • 指定项目计划 数据仓库项目需要一份详细的综合的项目计划 应当从项目任务和项目参加人员两个方面来考虑复杂性

  • 细节跟踪

  • 任务目标跟踪

    • 人员

    • 原来估算的工作量

    • 原来估算的开始日期

    • 原来估算的完成日期

    • 状态

    • 更新后的开始日期

    • 更新后的完成日期

    • 完成工作量

    • 延迟天数

    • 完成百分比

      依赖关系

  • 制定沟通计划

    • 确定每个团队每个团队的沟通频率 形式 消息
    • 需要和发起人和驱动者面对面的沟通
    • 与业务用户us合区沟通
    • 同其他有关方进行沟通

项目管理

  • 交叉功能实施团队: 该团队所有成员在DW/BI项目中承担不同职责 紧密监控项目状态

  • 迭代开发周期: 数据仓库环境的开发过程没有尽头 需要更多沟通来保证人员的同步 需要对问题/变化进行跟踪 确保今后系统功能的提升 需要详细的项目文档来支持团队各项工作的展开

  • 不可避免的数据问题: 数据项目很容易受到各种未知数据问题的困扰 这会严重损害进行精心制定的项目计划 需要再设计各个候选数据源的数据管道之前 尽可能早地进行数据探查

  • 高可见度: 业务机构对数据仓库的期望值都会很高 因此必须进行主动沟通来确保这些期望在掌控之中

召开项目团队启动会议

  • 工程目标与目的
  • 工程范围
  • 团队角色与职责
  • 团队工程管理
  • 问题与解答
  • 后续步骤

监控项目状态

  • 项目状态会议
    • 审查项目计划
    • 审查问题和后续工作
    • 审查变更请求
    • 公告/一般性评论.问题和解答
  • 项目状态报告: 项目状态报告提供了项目进度和高层快照,报告的提交和定期安排的状态会议应当同步

维护项目计划

整个项目计划应当每周更新一次 以便能够准确地反映项目的进展情况 随后还应当同核心团队共享更新后的计划.

项目计划应当反映事实 不论是好事 坏事 还是令人讨厌的事情 今早识别出项目计划中存在的问题 就可以使项目团队制定适当的策略 从而使下游连锁反应减少到最小

整理项目文档

数据仓库项目具有不断发展的特性 这就需要对项目文档进行整理 当时间压力不断增加 首先会考虑取消的事项通过长是编制正式的文档 一定要避免调入这样的陷阱

项目文档包括:

  • 所有项目沟通的情况
  • 需要提交的主要项目资料的副本

范围管理

数据仓库项目必然会发生变化,项目经理必须管理项目范围变更

  • 鼓励关注业务用户和他们的需求
  • 需要沿着系统开发的轨迹前进

对于未定义用户请求时:

  • 对请求说"不"
  • 保持工作量总体不变 对范围内外的内容进行调整
  • 对项目范围进行扩展 随后强制性地延长项目期限 并适当增加项目预算

项目经理不应当凭空确定项目范围 在评价项目范围候选方案时 IT和业务的密切合作至关重要

问题跟踪
  • 问题和问题描述
  • 问题识别日期
  • 呈报方
  • 归属方
  • 状态
  • 优先级别
  • 预定解决日期
  • 结束日期
变更控制
  • 变更请求控制和相关描述
  • 请求日期
  • 请求递交方
  • 优先级别(按业务影响)
  • 归属方
  • 估计工作量
  • 估计成本
  • 状态
  • 结束日期

范围管理

  • 执行沟通计划
  • 使用户参与生命周期的整个过程

辨识项目陷入困境的征兆

  • 没有从高级业务机构引入有影响力的设计人员
  • 认为参与项目的人员能够学习工作中所需的所有知识
  • 一次性处理的任务过多
  • 一心专注于技术层面而没有集中注意力于业务目标和需求
  • 认为在整个项目生命周期中不需要业务机构参与就可以进行数据仓库项目的开发
  • 在明知数据源质量较差甚至很糟的情况下 没有认真研究数据能否支持开发任务 就承诺向前推进项目的开发进程
  • 低估了数据清洗和质量保证的工作量
  • 过于关注ETL而葫芦哦了BI查询性能和是否易于使用
  • 没有认识到数据仓库项目的成功与用户的验收息息相关 如果业务机构并没有认可数据仓库系统 也没有将其作为改进决策指定的基础 那么努力就白费了

项目群管理

  • 确立管理职责和管理过程
  • 将数据管理员的地位提升到企业层 建立企业级架构是项目群层应该关注的重要问题 与其让每个部门都建立独立的 以部门为中心的数据库 不如对公司的信息资源预先进行规划和管理 数据管理员应当为企业内部的所有交叉机构信息确立通用的定义和业务转换规则
    • 机构的描述性主数据应当进行集中处理 随后分发给需要相关信息的项目
    • 核心的绩效度量应当从源系统中一次性抽取和共享 而不是每个部门重复的抽取自己感兴趣的信息
  • 利用高效的方法和架构最优方法
  • 进行定期评估
  • 沟通沟通沟通沟通

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/76452.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C 标准库 - `<ctype.h>`

C 标准库 - <ctype.h> 在C语言编程中&#xff0c;标准库函数 <ctype.h> 提供了一组用于检查字符类型、转换大小写以及其他字符处理的函数。这些函数对于字符处理和字符串操作至关重要&#xff0c;特别是在处理用户输入或文件内容时。以下是关于 <ctype.h> 标…

安装完 miniconda3 ,cmd无法执行 conda 命令

提示&#xff1a;安装 miniconda3 文章目录 前言一、安装二、安装完&#xff0c;cmd 无法执行 conda 前言 提示&#xff1a;版本 系统&#xff1a;win10 codna: miniconda3 安装完 miniconda3 &#xff0c;cmd无法执行 conda 命令 提示&#xff1a;以下是本篇文章正文内容&am…

RedisTemplate 的 6 个可配置序列化器属性对比

RedisTemplate 的 6 个可配置序列化器属性对比 RedisTemplate 提供了以下 6 个核心属性&#xff0c;用于分别配置键、值、哈希类型数据的序列化方式&#xff1a; 1. keySerializer 作用&#xff1a;定义 Redis 键的序列化方式。默认值&#xff1a;JdkSerializationRedisSeria…

设计模式之适配器模式(二):STL适配器

目录 1.背景 2.什么是 STL 适配器&#xff1f; 3.函数对象适配器 3.1.std::bind 3.2.std::not1 和 std::not2 3.3.std::mem_fn 4.容器适配器 4.1.std::stack(栈) 4.2.std::queue&#xff08;队列&#xff09; 4.3.std::priority_queue&#xff08;优先队列&#xff0…

LabVIEW故障诊断数据处理方法

在LabVIEW故障诊断系统中&#xff0c;数据处理直接决定诊断的准确性和效率。工业现场常面临噪声干扰、数据量大、实时性要求高等挑战&#xff0c;需针对性地选择处理方法。本文结合电机故障诊断、轴承损伤检测等典型案例&#xff0c;详解数据预处理、特征提取、模式识别三大核心…

51单片机的五类指令(二)——算术运算类指令

目录 一、加法指令 &#xff08;一&#xff09;不带进位加法指令&#xff08;ADD&#xff09; &#xff08;二&#xff09;带进位加法指令&#xff08;ADDC&#xff09; &#xff08;三&#xff09;加 1 指令&#xff08;INC&#xff09; &#xff08;四&#xff09;十进制…

【FPGA】状态机思想回顾流水灯

【FPGA】状态机思想回顾流水灯 一、LED流水灯实现1. 基本要求2. 状态机思想3. 关键代码4. 仿真测试5. 效果演示 二、CPLD和FPGA1. 技术区别2. 应用场景 三、HDLbits组合逻辑题目四、实验总结 一、LED流水灯实现 1. 基本要求 用状态机思想写一个 LED流水灯的FPGA代码写出仿真测…

Python网络爬虫:从入门到实践

目录 什么是网络爬虫&#xff1f; 网络爬虫的工作原理 常用Python爬虫库 编写爬虫的步骤 实战示例 注意事项与道德规范 未来趋势 1. 什么是网络爬虫&#xff1f; 网络爬虫&#xff08;Web Crawler&#xff09;是一种自动化程序&#xff0c;通过模拟人类浏览行为&#x…

3D意识(3D Awareness)浅析

一、简介 3D意识&#xff08;3D Awareness&#xff09;主要是指视觉基础模型&#xff08;visual foundation models&#xff09;对于3D结构的意识或感知能力&#xff0c;即这些模型在处理2D图像时是否能够理解和表示出图像中物体或场景的3D结构&#xff0c;其具体体现在编码场景…

红包-算法

function resPackage(money,num){// 总金额 目前剩余总金额let sum money, currentsum moneylet res [];// 最大值for(let i 0;i<num-1;i){let n parseFloat((Math.random()*currentsum).toFixed(2)) //0-10的随机数if(n<0.1) n 0.1;if(n>sum…

最小二乘求解器lstsq,处理带权重和L2正则的线性回归

目录 代码注释版&#xff1a; 关键功能说明&#xff1a; torch.linalg.cholesky 的原理 代码示例 Cholesky 分解的应用 与 torch.cholesky 的区别 总结 代码注释版&#xff1a; from typing import Optionalimport torchdef lstsq(matrix: torch.Tensor, rhs: torch.Te…

AI辅助下基于ArcGIS Pro的SWAT模型全流程高效建模实践与深度进阶应用

目前&#xff0c;流域水资源和水生态问题逐渐成为制约社会经济和环境可持续发展的重要因素。SWAT模型是一种基于物理机制的分布式流域水文与生态模拟模型&#xff0c;能够对流域的水循环过程、污染物迁移等过程进行精细模拟和量化分析。SWAT模型目前广泛应用于流域水文过程研究…

DHT11数字温湿度传感器驱动开发全解析(下) | 零基础入门STM32第八十八步

主题内容教学目的/扩展视频DHT11芯片电路连接&#xff0c;手册分析。驱动程序&#xff0c;读出数据。能读出温湿度值即可。 师从洋桃电子&#xff0c;杜洋老师 &#x1f4d1;文章目录 一、硬件接口与通信原理1.1 硬件连接拓扑1.2 单总线通信时序 二、驱动代码深度解析&#xff…

24、网络编程基础概念

网络编程基础概念 网络结构模式MAC地址IP地址子网掩码端口网络模型协议网络通信的过程&#xff08;封装与解封装&#xff09; 网络结构模式 C/S结构&#xff0c;由客户机和服务器两部分组成&#xff0c;如QQ、英雄联盟 B/S结构&#xff0c;通过浏览器与服务器进程交互&#xf…

【超详细】讲解Ubuntu上如何配置分区方案

Ubuntu 的分区方案 一、通用分区方案&#xff08;200G为例&#xff09; EFI系统分区&#xff08;仅UEFI启动模式需要&#xff0c;&#xff09; 大小&#xff1a;512MB–1GB类型&#xff1a;主分区&#xff08;FAT32格式&#xff09;挂载点&#xff1a;/boot/efi说明&#xff1…

函数的局部变量和全局变量的区分,Kimi的回答

这段代码的目的是通过计算 2**i 和 5**i 的首位数字&#xff0c;并将这两个首位数字的乘积添加到一个集合中&#xff0c;最终返回这些乘积的总和。下面是具体的解释和问题的分析。 sum_t的角色&#xff1a; sum_t 是一个累加器&#xff0c;用来存储所有独特的&#xff08;不重复…

RNN模型及NLP应用(5/9)——多层RNN、双向RNN、预训练

声明&#xff1a; 本文基于哔站博主【Shusenwang】的视频课程【RNN模型及NLP应用】&#xff0c;结合自身的理解所作&#xff0c;旨在帮助大家了解学习NLP自然语言处理基础知识。配合着视频课程学习效果更佳。 材料来源&#xff1a;【Shusenwang】的视频课程【RNN模型及NLP应用…

【3.软件工程】3.4 原型及相关模型

软件开发模型进化论&#xff1a;从原型驱动到混合模型的完整指南 &#x1f504; 一、模型进化关系全景图 #mermaid-svg-GcOFjt54gUs4oPeu {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GcOFjt54gUs4oPeu .error-i…

硬件与软件的边界-从单片机到linux的问答详解

硬件与软件的边界——从单片机到 Linux 设备驱动的问答详解 在嵌入式开发和操作系统领域&#xff0c;经常会有人问&#xff1a; “如果一个设备里没有任何代码&#xff0c;硬件是不是依然会工作&#xff1f;例如&#xff0c;数据收发、寄存器数据存储、甚至中断触发&#xff…

玛卡巴卡的k8s知识点问答题(七)

25. 说明 Job 与 CronJob 的功能 Job 功能&#xff1a; 用于运行一次性任务&#xff08;批处理任务&#xff09;&#xff0c;确保一个或多个 Pod 成功完成任务后退出。 适用于数据处理、备份、测试等场景&#xff0c;任务完成后 Pod 不会自动重启。 特点&#xff1a; 任务…