Oracle 正则,开窗,行列转换

1.开窗函数 基本上在查询结果上添加窗口列

1.1 聚合函数开窗

基本格式:

        ..... 函数() over([partition by 分组列,...][order by 排序列 desc|asc][定位框架])

1,partition by  字段 相当于group by 字段 起到分组作用2,order by 字段 即根据某个字段进行排序,默认包含该分组的所有行的数据,进行聚合或          排序操作定位框架必须和ORDER BY 一起使用
定位框架 rows|ranges BETWEEN UNBOUNDED PRECEDING AND CURRENT ROWROWS 按照行进行累计操作 RANGES 按照值进行累计操作
3,ROWS|RANGE 窗口子句,跟在 order by 子句后面用来限制当前行聚合或排序操作的范围4,range和rows的区别:rows   是物理窗口,是哪一行就是哪一行,与当前行的值(order by key的key的值)无                    关,只与排序后的行号相关,就是我们常规理解的那样。range 是逻辑窗口,与当前行的值有关(order by key的key的值),在key上操作range范围   (查看示例代码2,3即可理解)5,窗口子句的几个范围语法的格式:current row :当前行unbounded proceding  窗口上边界不设限(即区间的第一行)unbounded  following   窗口下边界不设限(即区间的最后一行)N proceding   当前行之前的N行,可以是数字也可以是能计算数字的表达式N  following   当前行之后的N行 ,同上 

聚合函数 over()可以不强制要求写partition by 和Order by

--创建表格
create  table  student(name varchar2(20),city varchar2(20),age  number,salary number );
--插入数据
INSERT INTO student(name,city,age,salary)
VALUES('Kebi','JiangSu',20,3000);
INSERT INTO student(name,city,age,salary)
VALUES('James','ChengDu',21,4000);
INSERT INTO student(name,city,age,salary)
VALUES('Denglun','BeiJing',22,3500);
INSERT INTO student(name,city,age,salary)
VALUES('Yangmi','London',21,2500);
INSERT INTO student(name,city,age,salary)
VALUES('Nana','NewYork',22,1000);
INSERT INTO student(name,city,age,salary)
VALUES('Sunli','BeiJing',20,3000);
INSERT INTO student(name,city,age,salary)
VALUES('Dengchao','London',22,1500);
INSERT INTO student(name,city,age,salary)
VALUES('Huge','JiangSu',20,2800);
INSERT INTO student(name,city,age,salary)
VALUES('Pengyuyan','BeiJing',24,4500);
INSERT INTO student(name,city,age,salary)
VALUES('Baoluo','London',25,8500);
INSERT INTO student(name,city,age,salary)
VALUES('Huting','ChengDu',25,3000);
INSERT INTO student(name,city,age,salary)
VALUES('Hurenxiang','JiangSu',23,2500);

查询从第一行到当前行的工资总和
 

select name,city,age,salary,sum(salary) over(order by salary rows between unbounded preceding and current row) 到当前行工资求和
from   student

over后面的括号中的unbounded  preceding表示第一行,current  row表示当前行。上面这段代码指的是首先将表中的数据按照salary进行排序,如果不指明是升序还是降序,默认的是升序。然后看到rows这个字段,说明计算是按照行进行的。就是计算unbounded  preceding(第一行)到current  row(当前行)的和。比如第一行的salary为1000,第二行的salary为1500,那么第一行到第二行的和为1000+1500=2500;同理第三行salary为2500,那么从第一行到第三行的和为1000+1500+2500=5000,以此类推......

查询从第一行到当前行的工资总和 

select fname,fcity,fage,fsalary,sum(fsalary) over(order by fsalary range between unbounded preceding and current row) 到当前行工资求和from t_person

range和rows,rows是按照行进行计算的,而range是按照范围进行计算的。这两种方式的不同点是处理并列数据的情况,上面第三行和第四行出现了两个2500,如果是rows就会在第三行显示1000+1500+2500=5000,第四行显示1000+1500+2500+2500=7500;如果是range就会在第三行显示1000+1500+2500+2500=7500,第四行显示1000+1500+2500+2500=7500,因为第三行和第四行中的salary是一样的,同时又是按照range进行计算的,所以从第一行开始r无法判断并列行中的当前行是哪一行,所以直接将并列的数相加

1.2 2.排名函数
      

注意:排名函数必须要配合order by一起使用
       row_number():忽略值重复的情况,直接现实一个连续的不重复的名次,相当于行号。
       rank():相同的值名次一样,但是整个排名是跳跃的,不连续
       dense_rank():相同的值相同的名次,并且排名连续。

select  name , city ,age , salary,
row_number()over ( order by salary) as row_number,   --按薪水依次排名
rank()over ( order by salary) as rank,               --按薪水排名,相同薪水并列
dense_rank()over ( order by salary) as dense_rank    --按薪水排名,相同薪水隔几个排名
from  student

每个员工比自己早入职的5个人和后入职的5个人的工资平均值,看看自己和他们之间的差距。

select EMPNO,job,sal,avg(sal) over (order by HIREDATE rowsbetween 5 preceding and 5 following ) from EMP e;

查询大于自己部门平均工资的员工信息

select ENAME,DEPTNO,sal,JOB,RN from(
select e.*,avg(sal) over (partition by DEPTNO order by sal descrows between unbounded preceding and unbounded following ) RN from EMP e)
where sal>RN;

排序类开窗函数

RANK--序列集排序,相等值的行排名相同

--如果排名中,有相同的值,那么排名并列存在

--有几个并列存在的人,下一个排名就会顺延几个整数

select ENAME,job,sal,rank()over (partition by DEPTNO order by sal desc) RK from EMP e

DENSE_RANK--稠密排名

计算序组中的行的排名,排名从1开始的连续整数

select ENAME,job,sal,dense_rank()over (partition by DEPTNO order by sal desc) RK from EMP e

ROW_NUMBER

--给你已定的排序组中,从1开始为每一行分配一个唯一的数字。

--不会有并列

select ENAME,job,sal,row_number()over (order by sal desc) RK from EMP e

ntile() 平均分组函数

--将30号部门的人,按照工资高低分为三个档

--将30号部门的人,按照工资高低分为三个档

select ENAME,job,sal,ntile(3) over (order by sal desc) RK_level from EMP e
where DEPTNO =30;

1.2..3 连续性问题怎么解决

1.ORACLE查询各个用户最大连续登陆天数

思路:对数据进行去重 ->对去重后的数据编号->计算差值 连续的差值相等 ->使用 Group by

分组 count(*)计算值

SELECT team,rn,COUNT(*) FROM(SELECT n.*,y-row_number()OVER(PARTITION BY team ORDER BY y ) rn FROM nba n) GROUP BY team,rnHAVING COUNT(*)>=2

1.3 lag lead 位移函数

 注意:必须要配合order by一起使用
       1.lag():下移函数
         语法:lag(列名,n[,空值替换值]) over(....order by ....)
       
       2.lead():上移函数
                  语法:lag(列名,n[,空值替换值]) over(....order by ....)
                 
        使用场景:计算环比和同比
        --将员工的工资进行下移一行
        SELECT e.*,LAG(sal,1) OVER(ORDER BY sal) FROM emp e;

        --计算每一个月的同比率和环比率
        SELECT MONTHS,sell,round((sell-同比)/同比*100,2)||'%' 同比率,
        ROUND((sell-环比)/环比*100,2)||'%' 环比率 from(
        SELECT s.*,LAG(sell,12) over(ORDER BY MONTHS) 同比,
        LAG(sell,1)OVER(ORDER BY MONTHS)环比 FROM sales s);

2.1 行列转换

横表是指多列记录同一类属性的不同取值,而纵表则是将这类属性及其对应的取值展开为多行记录

-- 创建横表 Employee_Projects     CSND-小小野猪
CREATE TABLE Employee_Projects (EmployeeID VARCHAR2(10),ProjectName VARCHAR2(30),Score NUMBER
);-- 插入示例数据  CSND-小小野猪
INSERT INTO Employee_Projects VALUES ('Emp1', 'ProjectA', 85);
INSERT INTO Employee_Projects VALUES ('Emp1', 'ProjectB', 90);
INSERT INTO Employee_Projects VALUES ('Emp2', 'ProjectA', 92);
INSERT INTO Employee_Projects VALUES ('Emp3', 'ProjectA', 95);
INSERT INTO Employee_Projects VALUES ('Emp3', 'ProjectB', 88);
INSERT INTO Employee_Projects VALUES ('Emp3', 'ProjectC', 93);COMMIT;

Oracle SQL从11g版本开始引入了Pivot关键字,用于将横表转换为纵表。其基本语法如下:

select * from EMPLOYEE_PROJECTS
pivot (max(Score) for ProjectName in ('ProjectA' A,'ProjectB' B,'ProjectC' C));
-- 方法2
select EmployeeID, max(case ProjectName when 'ProjectA' then Score else 0 end) A,
max(case ProjectName when 'ProjectB' then Score else 0 end) B,
max(case  ProjectName when 'ProjectC' then Score else 0 end) Cfrom EMPLOYEE_PROJECTS group by EmployeeID
-- 方法3
select EmployeeID,max(decode(ProjectName,'ProjectA',Score,0)) A,max(decode(ProjectName,'ProjectB',Score,0)) B,
max(decode(ProjectName,'ProjectB',Score,0)) Bfrom EMPLOYEE_PROJECTS group by EmployeeID;

列转行

with tmp1 as(
select EmployeeID, max(case ProjectName when 'ProjectA' then Score else 0 end) A,
max(case ProjectName when 'ProjectB' then Score else 0 end) B,
max(case  ProjectName when 'ProjectC' then Score else 0 end) Cfrom EMPLOYEE_PROJECTS group by EmployeeID)
select * from tmp1 unpivot (score for Projectname in(A as 'ProjectA',B as 'ProjectB',Cas 'ProjectC'));

3.正则

3.1 基本语法

(1)字符匹配

.  :匹配除了换行外的任意一个字符;
\d:匹配任何数字,相当于 [0-9];
\D:匹配任何非数字字符,相当于 [^0-9];
\w:匹配任何字母数字字符或下划线,相当于 [a-zA-Z0-9_];
\W:表示匹配任何非字母数字字符或下划线,相当于 [^a-zA-Z0-9_]。

(2)限定符

*:匹配前一个字符出现0次或多次;
+:匹配前一个字符出现1次或多次;
?:匹配前一个字符出现0次或1次;
{n}:匹配前一个字符出现n次;
{n,}:匹配前一个字符出现n次或更多;
{n,m}:匹配前一个字符出现n~m次。
'|' :指两项之间的一个选择。

e.g.  ^([a-z]+|[0-9]+)$:表示所有小写字母或数字组合成的字符串。

(3)边界匹配

^:匹配开始位置;
$:匹配结束位置;
\b:匹配单词边界,即单词的开头或结尾位置;
\B:匹配非单词边界,即不是单词的开头或结尾位置。
(4)分组和引用

():分组,标记一个子表达式的开始和结束位置;
\num:引用第num个子表达式,num从1开始。
(5)字符集合

[]:表示一组字符中的任意一个。
(6)转义符

\\:表示转义一个字符。
oracle正则表达式还支持一些高级语法,例如贪婪匹配、非贪婪匹配、零宽断言(zero-width  assertion)、后向引用(backreference)、捕获组等。

3.2 POSIX字符类

Oracle数据库中的POSIX字符类是一组特殊的字符类,用于在正则表达式中匹配特定的字符。POSIX字符类以 [: 开头,以 :] 结尾,中间包含一个或多个字符,代表特定的字符集合。POSIX字符类中的字符集合可以是预定义的,也可以是自定义的。

[[:alpha:]] 任何字母,等同于字符集合 [a-zA-Z];
[[:digit:]] 任何数字,等同于字符集合 [0-9];
[[:alnum:]] 任何字母和数字,等同于字符集合 [a-zA-Z0-9];
[[:space:]] 任何白字符;
[[:upper:]] 任何大写字母;
[[:lower:]] 任何小写字母;
[[:punct:]] 任何标点符号;
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
Oracle数据库中,POSIX字符类可以用于各种正则表达式相关的操作,如模式匹配、替换、分割等。由于Oracle数据库中的POSIX字符类与其他数据库或编程语言中的POSIX字符类可能略有不同,具体使用时需要查看相关文档。

3.3 正则表达式函数

3. 正则表达式函数
Oracle数据库提供了多种正则表达式函数,可以对文本数据进行匹配、替换等操作。REGEXP_LIKE: 判断字符串是否匹配指定的正则表达式。
e.g. 查询员工名字以"S"开头,以"n"结尾的记录:SELECT * FROM emp WHERE REGEXP_LIKE(emp_name, '^S.*n$');REGEXP_REPLACE: 替换字符串中的子串。
e.g. 将字符串"12345"中连续的三个数字替换成星号"*",输出
“*45”:SELECT REGEXP_REPLACE('12345', '\d{3}', '*') FROM dual;REGEXP_SUBSTR: 提取字符串中匹配指定正则表达式的子串。
e.g. 从字符串"abc 123 def"中提取出连续的数字"123":SELECT REGEXP_SUBSTR('abc 123 def', '\d+') FROM dual;REGEXP_INSTR: 返回字符串中匹配指定正则表达式的子串的位置。
e.g. 返回字符串"1ab2cd3ef"中第一个连续数字的起始位置,即1SELECT REGEXP_INSTR('1ab2cd3ef', '\d+') FROM dual;

正则函数:1.regexp_like(列名,'正则表达式'):功能类似于like关键字,但是比like功能强大--查询员工的姓名以S开头的员工信息SELECT * FROM emp WHERE ename LIKE 'S%';SELECT * FROM emp WHERE regexp_like(ename,'^S');--查询姓名以’T‘结尾的员工SELECT * FROM emp WHERE regexp_like(ename,'T$');--查询员工的姓名第一个字母必须是O,并且名字的长度必须是5的大写字母。SELECT * FROM emp WHERE regexp_like(ename,'^[A-Z]O[A-Z]{3}$')--查询出来由有效手机号的行SELECT * FROM regexp_t WHERE regexp_like(str,'1[356789]\d{9}');--过滤出来有效的日期,前后的符号必须要一致SELECT * FROM REGEXP_t WHERE regexp_like(str,'^\d{4}(-|\.|\/)\d{2}\1\d{2}$')--过滤出来有效的域名SELECT * FROM regexp_t WHERE regexp_like(str,'^[a-z]{6}\.[a-z]{3}$');2.regexp_instr(字符串,'正则表达式'[,i,j]):功能和instr类似,用来在一个字符串中查找正则表达式所描述的子字符串出现的位置i:代表开始查找的位置j:代表第几次出现--查找有效手机号的位置SELECT str,regexp_instr(str,'1[356789]\d{9}') FROM regexp_t;--查找数字第二次出现的位置SELECT regexp_instr('qwqweq223dssdgsdf547hbfb','\d+',1,2) FROM dual;			 3.regexp_substr(字符串,'正则表达式'[,i,j]):从字符串中截取正则表达式描述的子字符串--截取字符串中有效的手机号SELECT str,regexp_substr(str,'1[356789]\d{9}') FROM regexp_t;--qqqq,wwww,rrrr,tttt--截取字符串中以逗号分开的第二部分数据SELECT regexp_substr('qqqq,wwww,rrrr,tttt','[^,]+',1,2) FROM dual;4.regexp_replace(字符串,'正则表达式','新值'):将字符串中正则表达式描述的部分使用新的字符串替换。--将字符串中的空白符替换为*SELECT regexp_replace('qwe   qwe qw      ewr erwe   wer','\s+','*') FROM dual;SELECT replace('qwe   qwe qw      ewr erwe   wer',' ','*') FROM dual;--将字符串中的手机号替换为****SELECT str,regexp_replace(str,'1[356789]\d{9}','****') FROM regexp_t;--将字符串中的手机号中间四位替换为****SELECT str,regexp_replace(str,'(1[356789]\d)(\d{4})(\d{4})','+86 \1****\3') FROM regexp_t;5.regexp_count(字符串,'正则表达式'):统计正则表达式描述的字符串在字符串中出现的次数--统计逗号出现的次数SELECT regexp_count('qqqq,wwww,rrrr,tttt',',') FROM dual;--统计有效手机号出现的次数SELECT str,regexp_count(str,'1[356789]\d{9}') FROM regexp_t;

3.4 贪婪匹配 惰性匹配 零宽断言 后向引用 捕获组

贪婪匹配:  通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。比如这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。在正则表达式中,使用量词(如*+?{n,}等)时,默认会匹配尽可能多的字符。

惰性匹配: 也就是匹配尽可能少的字符。在能使整个匹配成功的前提下使用最少的重复,只要在它后面加上一个问号?即可

使用场景 :如果需要捕获的内容前后必须是特定内容,但又不捕获这些特定内容的时候,这个时候就可以使用零宽断言。

零宽断言: 零宽断言是一种零宽度的匹配,它匹配到的内容不会保存到匹配结果中去,最终匹配结果只是一个位置而已。
正则表达式中常用的断言元字符为:^和$,而零宽断言就是其他用正则表达式来定义的功能类似的断言。

后向引用: 指把匹配出来的组引用到表达式本身其它地方,比如,在匹配HTML的标记时,我们匹配出一个<a>,我们要把匹配出来的a引用出来,用来找到</a>,这个时候就要用到反向引用。

“H.{4}”表示大写字母H的后面跟随了4个任意字符,其中”.”表示任意单个字符

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/822877.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《教学管理与教育研究》简介及投稿邮箱

《教学管理与教育研究》简介及投稿邮箱 《教学管理与教育研究》是教育部主管、语文出版社主办的国家级教育类学术期刊,本刊面向全国学校教育的发展管理、教学研究、科研创新和师资培养等领域,展示我国学校教育科研领域的最新成果,交流教学管…

Docker安装xxl-job分布式任务调度平台

文章目录 Docker安装xxl-job分布式任务调度平台1.xxl-job介绍2. 初始化“调度数据库”3、docker挂载运行xxl-job容器3.1、在linux的opt目录下创建xxl_job文件夹,并在里面创建logs文件夹和application.properties文件3.2、配置application.properties文件&#xff0c…

基于springboot+vue+Mysql的校园新闻网站

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

分布式锁设计

一、为什么需要分布式锁 1.1 单体项目同步实现 在单进程(启动一个jvm)的系统中,当存在多个线程可以同时改变某个变量(可变共享变量)时,就需要对变量或代码块做同步,使其在修改这种变量时能够线…

关于Git的一些基础用法

关于Git的一些基础用法 1. 前言2. 使用GitHub/gitee创建项目2.1 创建账号2.2 创建项目2.3 下载仓库到本地2.4 提交代码到远端仓库2.5 查看日志2.6 同步远端仓库和本地仓库 1. 前言 首先说一个冷知识(好像也不是很冷),Linux和git的创始人是同…

客户关系管理(CRM)是什么?CRM 客户关系管理系统完整指南

通过本文,你将了解: CRM是什么样的软件呢? 企业CRM普遍存在哪些难题?又该怎样解决呢? CRM软件有什么样的功能? 未来CRM软件将朝什么方向发展呢? 以我们公司正在使用的CRM系统为例—— 简道云…

最佳实践:高并发之扩容思路

系统在业务平峰期间运行稳定、性能良好,但在大流量时就会出现各种各样的问题,例如接口时延变大,CPU占用率升高、频繁发生Full GC、代码中出现死锁等等。大流量意味着高并发,高并发也是很多开发人员所期望拥有的经验,一…

Wireshark TS | 再谈应用传输缓慢问题

问题背景 来自于朋友分享的一个案例,某某客户反馈电脑应用软件使用时打开很慢,并提供了一个慢时所捕获的数据包文件以及服务端 IP。以前也说过,所谓的慢有很多种现象,也会有很多原因引起,在没有更多输入条件的情况下&…

浅入浅出之nginx

目录 工作流程正向代理概念 反向代理概念 nginx反向代理配置文件介绍解释作用 参考文章Nginx 常用指令和操作启动 Nginx测试配置文件快速关闭 Nginx优雅关闭 Nginx重载配置文件查看版本查看编译时的参数查看进程配置用户访问日志配置错误日志设置 web 根目录配置 server 块配置…

LeetCode_1304.和为零的 N 个不同整数

题目: 题解: 题目说让我们返回一个由n个各不相同的整数组成的数组,相加为0。 这里的比较好的办法就是类似于 1 2 3 0 -3 -2 -1这样对称的数组。既满足要求,又好实现。 先calloc出一个容量为n的整型数组,定义两个变量…

解决java.lang.NoClassDefFoundError 问题

解决java.lang.NoClassDefFoundError 问题 一、背景二、分析三、解决 一、背景 项目运行成功之后,调用某个接口时报错,信息如下: 2024-04-17 14:59:23 [ERROR] --- [nio-8070-exec-1] c.c.c.e.LogExceptionHandleFilter : Handler dispatch failed; nest…

如何使用Git-Secrets防止将敏感信息意外上传至Git库

关于Git-Secrets Git-secrets是一款功能强大的开发安全工具,该工具可以防止开发人员意外将密码和其他敏感信息上传到Git库中。 Git-secrets首先会扫描提交的代码和说明,当与用户预先配置的正则表达式模式匹配时,便会阻止此次提交。该工具的优…

分布式光纤测温解决方案

安科瑞电气股份有限公司 祁洁 15000363176 一、方案介绍 分布式光纤测温(DTS)集光电信号检测、计算机技术等为一体,具有实时监测、测温精度高、测量距离长、可精确定位、采用光纤作为传感器和传输介质,具有抗电磁干扰、本征防…

项目文档维护(一) 快速生成项目结构图

IDEA快速生成项目树形结构图 1. 执行指令 在项目根目录下,进入cmd或terminal, 输入如下指令: tree . > tr.txt 只有文件夹 tree /f . > tr.txt 包括文件夹和文件注意尽量要使用idea, pycharm等ide, 其他工具需自己测试效果, 本人使用power …

详解网络通讯框架Netty原理,看这一篇就够了

NIO网络通信 网络通信BIONIOselectpollepollselect poll epoll对比 Netty原理Netty架构reactor响应式编程netty组件eventLoop 线程间交互Future接口Promise接口 Handler和PipelineByteBuf组成指针常用方法 网络通信 通过网络编程的基础可以知道,各设备通过I/O流写入…

如何阻止访问您的网站

本周有一个客户,购买Hostease的HK Basic Linux虚拟主机,询问我们的在线客服,如何阻止部分地区或IP段访问他的网站。我们为用户提供教程,用户很快完成了设置。在此,我们分享这个操作教程,希望可以对您有帮助…

Linux第88步_非阻塞IO实验

非阻塞IO是“应用程序”对“驱动设备”进行操作,若不能获取到设备资源,则非阻塞IO应用程序的线程不会被“挂起”,即线程不进入休眠,而是一直“轮询”,直到获取到设备资源为止,或者直接放弃。 非阻塞IO应用举…

本地部署运行大模型ollama

本地部署运行大模型ollama ollama模型下载地址 在我使用 vscode 开发时,使用 coplit 或 chatgpt 来辅助过于昂贵,于是我希望找到一个可以调用本地大模型的工具来辅助编程。 ollama 就是这样一个工具。 ollama使用 ollama 是一个可以将训练好的模型部署到…

1688店铺商品接口全攻略:一键获取商品信息,轻松玩转电商数据!

1688店铺所有商品接口技术详解 一、引言 随着电子商务的快速发展,越来越多的商家选择通过1688平台开展业务。为了方便商家获取店铺内所有商品的信息,1688平台提供了相应的API接口。本文将详细介绍如何使用这些接口获取店铺所有商品的信息,以…

GVRP协议与动态、静态vlan

一、GVRP协议使用场景 1、当实际组网复杂到网络管理员无法短时间内了解网络的拓扑结构,或者是整个网络的VLAN太多时,工作量会非常大,而且非常容易配置错误。在这种情况下,用户可以通过GVRP的VLAN自动注册功能完成VLAN的配置。 2、…