「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...

数据分析师群体,有别于一般的传统开发群体和数据库运维群体,对Sqlserver的功能需求上也各不相同,本篇以笔者的亲身经历,用一种有别于一般性教程的角度来讲解Sqlserver值得我们学习,投入产出比高的一些功能模块。
当然,知道地越多,能够产生的价值也越大,在平衡投入产出比的前提下,越往深入学习,在特定时候会产生成倍的回报。

相关阅读

数据分析师有理由爱Sqlserver之一-好用的插件工具推荐
数据分析师有理由爱Sqlserver之二-像使用Excel一般地使用SqlServer

数据分析师的定义

虽然真正意义上的数据分析师是很高级的分析水平,也有超强的学习能力,大不必来阅读笔者所写的这些不太有营养的入门读物。

但就像市面上大家都对一个小软件叫系统,一个简单进销存叫ERP一样,大家对数据分析师的称号也是很大的宽容,类似笔者这样一个三流分析水平,经常各种方向到处寻觅的各种知识领域的人,也能叫上个数据分析师的头衔。

本篇的定义的数据分析师也同样是宽泛的,可能只是一个普通数据文员,统计员的角色,但谁都是从普通工作做起,普通数据统计慢慢爬升起来的,笔者也相信这些分享也可以帮助许多的没有明确方向指引的、在数据领域摸爬滚打的人群带来一些帮助的。

数据分析师的刚需

普通的数据分析师,在数据量不大的情形下,使用Excel是一个很不错的选择,但数据量一大,Excel的性能也开始出现瓶颈,就算是现在自助式BI技术的普及,对于定位为单机版的Excel、ACCESS、PowerBIDesktop等工具来说,仍然容易存在性能的瓶颈。

所以,笔者对数据分析师的刚需理解为:数据存储和数据查询与处理方面的相关功能。对应于Sqlserver的使用场景是,能够帮我们把数据顺利地把手头上的数据放到数据库中集中式存放,当要使用时,可以将其重新导出,并且可以适当地作一些加工处理如多个表关联查询,数据颗粒度的汇总聚合等。最终可以有很好的载体来承接这些数据如导出至Excel表格或导入到PowerBI模型或其他SPSS、python等更专业的分析软件或工具中。

总结为Sqlserver上的功能掌握为:数据导入导出、会使用SQL查询数据,知道怎样使用其他软件工具访问Sqlserver数据。

数据分析师的进阶需求

有了前面的一些简单掌握后,基本可满足自身的数据分析需求,但如果需要更加自动化、更灵活安全地数据分发、对数据运算性能的更多地优化,也是需要继续学习Sqlserver的其他一些企业级的功能知识点的。

企业级IT主导和个人部门级业务主导很大的差异点在于企业级的解决方案可满足到:数据权限控制,流程自动化处理,流程稳定性保障,性能并发性满足等等,这些都是单机版文件型的解决方案所难于满足到的。

所以进阶性的需求对应于Sqlserver的知识点为:登录名、用户名的运维,各数据表、视图、存储过程等数据库对象的权限授予分发,查询性能的优化如索引的添加维护、复杂SQL查询的创建,特别是专为数据分析师准备的数据分析窗口函数非常有必要完全掌握,还有一些自动化调度作业系统的使用满足流程的自动化。

数据分析师较少需要关注到的方面

因数据分析的场景不像生产数据环节的业务系统那般高要求,例如不能随便出错,没有机会让你随便死机后重启系统,应对大量用户的高并发查询请求和数据增删改查任务,所以往往一些教材上谈及的高级的功能,对数据分析的群体来说,都是非常少的应用面和非常不实用的知识。

例如:数据库锁机制、触发器、事务、游标、高性能查询优化、日志的维护等等。这些知识点如果在学习过程中遇到,笔者认为只需略略地带过,了解一下即可。

更合理的方案是数据分析使用的数据库,与业务系统的数据库分离,一般专业一点的叫法是组建一个数据中心或数据仓库,专门用于数据分析的查询性需求(这个一般专业做法是使用BI系统中的数据ETL工具,将数据从生产性环境同步一份到分析服务器上)。

有了专门不受生产环境影响的数据仓库,再怎么出错,也最多重启一下,数据不会因这短暂的停止而影响业务进展,同时一般分析性的数据仓库,并发性访问也不高,也无需苦苦地为了优化一个查询从100秒的等待时间优化为1秒这种需要大量的知识储备和专业知识才能完成的高难度任务。

结语

经过以上的简单梳理,再结合上两篇提及的Sqlserver的使用方式(尽可能地使用界面化操作完成降低难度和大量使用外部工具插件提升SQL书写的便捷性),自己再入门一些简单的教程和示例(微软MSDN和微软Learn等资源已经非常丰富,易学),相信对于一名数据库新手来说,要往数据分析师方向发展,往前迈出一步学习下Sqlserver也不会是太难的事情。

当然笔者也会在日后有限的时间内,尽量分享一些简单易行、功能强大的个人的知识输出和观点分享,相信是除了系统学习外一个很好的补充,祝读者朋友们在学习上一路顺利,有问题多回来交流。如果觉得受用,也请多多帮忙传播分享给有需要的人。

笔者未来聚焦在数据领域的分享,不限于Excel,会分享更多Sqlserver、dotNET、Azure、PowerBI等话题,升级数据分析的能力,欢迎继续关注。

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q

640?wx_fmt=png
联系作者
640?wx_fmt=png
公众号

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/314851.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【WC2019】数树【子集反演】【结论】【树形dp】【生成函数】【函数求导】【多项式全家桶】

题意:有两棵基于同一点集的树,点集大小为 nnn ,两棵树中有 opopop 棵未确定,可以取所有 nn−2n^{n-2}nn−2 种可能。给每个点染上 [1,y][1,y][1,y] 中的一个颜色,要求若 uuu 到 vvv 在两棵树上的路径完全相同&#xff…

Educational Codeforces Round 73 (Rated for Div. 2) F. Choose a Square 线段树 + 二维转一维

传送门 文章目录题意:思路:题意: 给你nnn个点(xi,yi)(x_i,y_i)(xi​,yi​),每个点有个价值cic_ici​,现在你可以框一个正方形,要求左下角和右上角的坐标(x,y)(x,y)(x,y)必须xyxyxy,也就是说必须…

.NET开发框架(八)-服务器集群之网络负载平衡(视频)

【视频教程在文章底部】,本文讲解Windows服务器集群的网络负载平衡NLB的作用,以及在.NET开发框架的架构设计中,如何应用NLB与ARR,使用它们各有什么优点。视频教程目录:1、讲解NLB概念与演示其作用 2、安装配置负载均衡…

【CF113D】Museum【概率期望】【高斯消元】

题意:一张 nnn 个点的无向连通图,两个人开始时分别在 a,ba,ba,b。每次在 uuu 时会以 ppp 的概率原地不动,1−p1-p1−p 的概率等概率随机选择到一个相邻的点,当两人在同一点时停止。分别求在每个点相遇的概率。 n≤22n\leq 22n≤22…

人生如戏,别太入戏

这里是Z哥的个人公众号每周五早8点 按时送达当然了,也会时不时加个餐~我的第「81」篇原创敬上大家好,我是Z哥。对,就是脑袋很大的那个。大到什么程度呢?我给新来的小伙伴们说说。我昨天还打算配副新眼镜来着&#xff0…

Codeforces Round #588 (Div. 2) F. Konrad and Company Evaluation 图论 + 建反图 好题

传送门 文章目录题意:思路:题意: 给你一张nnn个点mmm条边的图,其中每个点iii初始编号为iii,边是有向的,方向为从编号大的指向编号小的。定义一个贡献为存在某三个点a,b,ca,b,ca,b,c有两条边为a−>b,b−…

【SDOI2017】硬币游戏【KMP】【概率期望】【高斯消元】

题意:给 nnn 个长度为 mmm 的 01 串,一个 01 串初始为空,不断随机一个字符加在后面,当出现给定的 nnn 个串中的一个时停止。分别求在 nnn 个串处停止的概率。 考场思路历程: 显然建出 AC 自动机(flag&…

C#只用属性来解决兔子,不用方法和循环

属性在调用者看来就像一个普通的变量,但作为类的设计者,你可以利用属性来隐藏你类中的一些字段,使外界只能通过属性来访问你的字段,你可以通过属性来限制外界对你的字段的存取,就利用get、set。如果想让用户随意存取你…

Codeforces Round #730 (Div. 2) D2. RPD and Rap Sheet (Hard Version) 交互 + k进制的转换

传送门 文章目录题意:思路:题意: 定义a⊕kba\oplus_k ba⊕k​b为a,ba,ba,b在kkk进制下的不进位加法。系统会随机生成一个数xxx,你猜这个数,假设当前猜的数为yyy,如果猜对了就返回111,否则要猜的…

【ZJOI2019】线段树【线段树上dp】【大讨论】

题意:有一个 [1,n][1,n][1,n] 的线段树和 mmm 个区间赋值操作,求任取一个操作的子集并按顺序在线段树上跑后线段树上有 lazy 标记的点的个数之和 模 998244353998244353998244353。 n,m≤105n,m\leq 10^5n,m≤105 真线段树上 dp 考虑线段树的情况很复杂…

.netcore项目docker化,以及docker之间通信

简言:最近刚完成公司的新系统,系统使用的是微服务架构,由于领导说要将服务docker化。下面将我的研究结果分享出来,如若有错误的地方,还请各位大佬多多指点。目录:  什么是docker?使用docker有…

Codeforces Round #592 (Div. 2) F. Chips 构造 + 细节

传送门 文章目录题意:思路:题意: 思路: 恶心的构造题,思路很简单但是代码细节很多,搞了半天。 根据题目的性质不难发现,如果有两个相同颜色的球相邻,那么他们的颜色永远不会改变。 …

.NET CORE 多语言实现方案

根据市场需求,基于.NET CORE平台开发的RoadFlow工作流平台需要实现多语言版本。经过方案讨论和比对,决定采用.NET自带的本地化功能来实现多语言。话不多说,直接上实现方式。首先修改Startup.cs在public void ConfigureServices(IServiceColle…

【CTSC2018】暴力写挂【边分治】【虚树】

题意:给两棵基于同一点集的带边权树,记 lca⁡(x,y),depth⁡(x)\operatorname{lca}(x,y),\operatorname{depth}(x)lca(x,y),depth(x) 为第一棵树上的 lca、到根的边长度之和,lca⁡′(x,y),depth⁡′(x)\operatorname{lca}(x,y),\operatorname{…

hdu 6153 A Secret kmp + dp

传送门 文章目录题意:思路:题意: 给你两个串a,ba,ba,b,让你求对于bbb的每个后缀,设其长度为lenlenlen,其在aaa中出现的次数为cntcntcnt,那么他的贡献为len∗cntlen*cntlen∗cnt,求每…

中国程序员,请挺起你的腰杆!

这两天发生一个事,登月50周年之际,阿波罗11号制导计算机(AGC)指令和登月模块的源代码在Github上发布公开了,大量中国人前往围观,把issues区当成了论坛版块灌水留言。猎奇起哄本为消遣作乐,有不妥…

【BZOJ3252】攻略【闵可夫斯基和】【堆启发式合并】

题意:给一棵 nnn 个点的有点权的树,你需要找 kkk 条根到叶子的路径,使得路径并集的权值和最大。 n≤2105n\leq 2\times 10^5n≤2105 其实就是个贪心,只是从这个角度更自然一点( 先有个显然的 dp,设 f(u,k)f(u,k)f(u,…

Codeforces Round #592 (Div. 2) G. Running in Pairs 构造(水)

传送门 文章目录题意:思路:题意: 思路: 史上最水GGG题,没有之一。 考虑最小的情况如何构造,显然就是让a,ba,ba,b都1−n1-n1−n依次排列即可,这样的最小值为n∗(n1)2\frac{n*(n1)}{2}2n∗(n1)​…

Async,Await和ConfigureAwait的关系

在.NET Framework 4.5中,async / await关键字已添加到该版本中,简化多线程操作,以使异步编程更易于使用。为了最大化利用资源而不挂起UI,你应该尽可能地尝试使用异步编程。虽然async / await让异步编程更简单,但是有一…

【洛谷P5114】八月脸【边分治】【闵可夫斯基和】

题意:一棵 nnn 个点的树,每个点有两个权值 ai,bia_i,b_iai​,bi​,有黑白两种颜色。mmm 次询问,每次给定一个 kkk,求一条端点异色的路径,使得 k∑ai∑bik\sum a_i\sum b_ik∑ai​∑bi​ 最大化。 n≤2105n\leq 2\times…