文章目录
- 质数
- 质数判定
- 质数筛选
- 质因数分解
- 互质判定
- 裴蜀定理
质数
首先回顾「质数」的定义:若一个正整数无法被除了 1 和它自身之外的任何自然数整除,则称该数为质数(或素数),否则称该正整数为合数。
根据上述定义,我们可以得知常见的质数有 2、3、5 等。另外,在整个自然数集合中,质数的分布也比较稀疏,对于一个足够大的整数 N,不超过 N 的质数大约有
N / ln ( N ) N/\ln(N) N/ln(N) 个。
质数判定
常见的判定质数的方式是「试除法」,假设自然数 N 不是质数,则一定存在一对数
x, y ,使得下述条件成立:
N = x ⋅ y 1 < x ≤ N ≤ y < N N = x · y \\ 1< x \leq \sqrt N \leq y < N N=x⋅y1<x≤N≤y<N
因此我们可以在 [ 2 , N ] [2, \sqrt N] [2,N] 的范围内枚举 x, 判断 x 是否存在。
如果 x 存在,则 N 为合数;否则 N 为质数。该算法时间复杂度为 O ( N ) O(\sqrt N) O(N)
,具体代码如下所示:
// c语言
bool judgePrime(int n) {for (int i = 2; i * i <= n; i++) {if (n % i == 0) return false;}return true;
}
def judgePrime(n):for i in range(2, int(n**0.5) + 1):if n % i == 0:return Falsereturn True
质数筛选
对于一个正整数 N,一次性求出 1~N 之间所有的质数,即为质数筛选。
显然根据上述「质数判定」的内容,我们可以通过枚举 1~N 的所有数,再依次使用「试除法」来判定其是否为质数,从而完成质数的筛选。但此种方法的时间复杂度过高,为 O ( N N ) O(N\sqrt N) O(NN) 。
此处将介绍经典的「Eratosthenes
筛法」,也被称为「埃式筛」。该算法基于一个基本判断:任意质数 x 的倍数 ( 2x,3x,… ) 均不是质数。
根据该基本判断,我们得到如下算法过程:
- 将 2~N中所有数标记为 0
- 从质数 2 开始从小到大遍历2 ~ N中所有自然数
- 如果遍历到一个标记为 0 的数 x ,则将其 2~N 中 x 的所有倍数标记为 1
根据上述过程,不难发现如果一个数 x 的标记为 0,则代表这个数不是 2~(x-1) 中任何数的倍数,即 x 为质数。
接下来我们以 2~10 为例,具体过程如下所示,最终标记为橙色的数为质数:
「Eratosthenes
筛法」的时间复杂度为 O ( N log ( log ( N ) ) ) O(N\log(\log(N))) O(Nlog(log(N))) ,并不是最快的素数筛法,但在绝大多数的「力扣数学题」中均已够用,且其实现代码较为简单,具体如下所示:
vector<int> primes, vis;
void get_primes(int n) {vis.resize(n + 1, 0);for(int i = 2; i <= n; i++) {if(vis[i] == 0) {primes.push_back(i);for(int j = i; j <= n; j += i) vis[j] = 1;}}
}
# Eratosthenes筛法def get_primes(n):"""获取n以内的所有素数"""if n < 2:return []primes = [True] * (n + 1)primes[0] = primes[1] = Falsefor i in range(2, int(n**0.5) + 1):if primes[i]:for j in range(i * i, n + 1, i):primes[j] = Falsereturn [i for i in range(n + 1) if primes[i]]print(get_primes(100))[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]
质因数分解
根据「唯一分解定理」,任何一个大于 1 的正整数都能唯一分解为有限个质数的乘积: N = p 1 c 1 p 2 c 2 … p m c m N = p_1^{c_1}p_2^{c_2}…p_m^{c_m} N=p1c1p2c2…pmcm
其中 c i c_i ci 均为正整数,而 p i p_i pi 均为质数,且满足 p 1 < p 2 < … < p m p_1 < p_2 < … < p_m p1<p2<…<pm 。
根据上述定理,我们只需要求出所有的 p i , c i p_i, c_i pi,ci ,即可完成对 N 的质因数分解。
那么如何求取 p i , c i p_i, c_i pi,ci 呢?首先我们考虑如何求 p 1 p_1 p1 和 c 1 c_1 c1 。
由于 p 1 < p 2 < … < p m p_1 < p_2 < … < p_m p1<p2<…<pm ,且 p 1 p_1 p1 为质数,因此不难发现, p 1 p_1 p1 是 N 所有因子中除 1 以外最小的数。
因此我们可以枚举 2 ~ N 2~\sqrt N 2~N中的所有数 x,如果 N 是 x 的倍数,则 x 为 p 1 p_1 p1。得到 p 1 p_1 p1 后,我们可以令 N 不断除以 p 1 p_1 p1 直至其不再为 p 1 p_1 p1 的倍数,则 c 1 c_1 c1 等于除以 p 1 p_1 p1 的总次数。
得到 p 1 p_1 p1 和 c 1 c_1 c1 后,N 去除了所有的 p 1 p_1 p1,因此 N 变为 p 2 c 2 … p m c m p_2^{c_2}…p_m^{c_m} p2c2…pmcm。又由于 p 1 < p 2 p_1 < p_2 p1<p2 ,因此我们继续枚举 x,如果再次出现 N 是 x 倍数的情况,则 x 为 p 2 p_2 p2 。
不断使用上述算法,直至循环结束。最后还需判断 N 是否为 1,如果 N 不为 1,则 p m = N , c m = 1 p_m = N, c_m = 1 pm=N,cm=1。
该算法的时间复杂度为 O ( l o g ( N ) ) O(log(N)) O(log(N)) ,具体代码如下所示,大家可以配合代码对该算法进行理解:
void divide(int n) {vector<int> p, c;for (int i = 2; i * i <= n; i++) {if (n % i == 0) {p.push_back(i);int num = 0;while(n % i == 0) num++, n /= i;c.push_back(num);}}if (n > 1) {p.push_back(n);c.push_back(1);}
}
# 质因数分解-唯一分解定理def divide(n):"""质因数分解"""i = 2factors = []while i * i <= n:print("i = ", i)print("n = ", n)if n % i:i += 1else:n //= ifactors.append(i)if n > 1:factors.append(n)return factorsprint("质因数分解-唯一分解定理")
print(divide(100)) # [2, 2, 5, 5]
互质判定
首先介绍一下「最大公约数」的概念。如果自然数 c 同时是自然数 a 和 b 的约数,即 a 和 b 同时是 c 的倍数,则 c 为 a 和 b 的公约数。
「最大公约数」就是 a 和 b 的所有公约数中最大的那一个,通常记为 g c d ( a , b ) gcd(a,b) gcd(a,b) 。
由此我们可以得到「互质」的判定条件,如果自然数 a,b 互质,则 g c d ( a , b ) = 1 gcd(a,b) = 1 gcd(a,b)=1 。
于是问题变为「如何求 g c d ( a , b ) gcd(a,b) gcd(a,b)?」
此处需要引入「欧几里得算法」,如下所示:
∀ a , b ∈ N , b ≠ 0 , g c d ( a , b ) = g c d ( b , a m o d b ) \forall a,b \in N, b \neq 0, gcd(a,b) = gcd(b, a \quad mod \quad b) ∀a,b∈N,b=0,gcd(a,b)=gcd(b,amodb)
根据上述算法,可以得到如下代码,其时间复杂度为 O ( l o g ( a , b ) ) O(log(a,b)) O(log(a,b)):
int gcd(int a, int b) {return b == 0 ? a : gcd(b, a % b);
}
裴蜀定理
若 a , b , x , y , m a, b, x, y, m a,b,x,y,m 是整数,则 a x + b y = m ax+by = m ax+by=m 有解当且仅当 m 是 g c d ( a , b ) gcd(a,b) gcd(a,b) 的倍数。
该定理有一个重要的推论:整数 a,b 互质的充要条件是存在整数 x,y 使 a x + b y = 1 ax+by=1 ax+by=1。