素数与合数的定义,见 数论基础

素数计数函数:小于或等于 的素数的个数,用 表示。随着 的增大,有这样的近似结果:

素性测试

素性测试(Primality test)可以用于判定所给自然数是否为素数。

素性测试有两种:

  1. 确定性测试:绝对确定一个数是否为素数。常见例子包括试除法、Lucas–Lehmer 测试和椭圆曲线素性证明。
  2. 概率性测试:通常比确定性测试快很多,但有可能(尽管概率很小)错误地将 合数 识别为质数(尽管反之则不会)。因此,通过概率素性测试的数字被称为 可能素数,直到它们的素数可以被确定性地证明。而通过测试但实际上是合数的数字则被称为 伪素数。有许多特定类型的伪素数,最常见的是费马伪素数,它们是满足费马小定理的合数。概率性测试的常见例子包括 Miller–Rabin 测试。

试除法

暴力做法自然可以枚举从小到大的每个数看是否能整除。

参考实现

[list2tab]

  • C++

    bool isPrime(int a) {
      if (a < 2) return false;
      for (int i = 2; i < a; ++i)
        if (a % i == 0) return false;
      return true;
    }
  • Python

    def isPrime(a):
        if a < 2:
            return False
        for i in range(2, a):
            if a % i == 0:
                return False
        return True

这样做是十分稳妥了,但是真的有必要每个数都去判断吗?

很容易发现这样一个事实:如果 的约数,那么 也是 的约数。

这个结论告诉我们,对于每一对 ,只检验其中的一个就足够了。为了方便起见,我们只考察每一对的较小数。不难发现,所有这些较小数都在 这个区间里。

由于 肯定是约数,所以不检验它。

参考实现

[list2tab]

  • C++

    bool isPrime(int a) {
      if (a < 2) return 0;
      for (int i = 2; (long long)i * i <= a; ++i)  // 防溢出
        if (a % i == 0) return 0;
      return 1;
    }
  • Python

    def isPrime(a):
        if a < 2:
            return False
        for i in range(2, int(sqrt(a)) + 1):
            if a % i == 0:
                return False
        return True

Fermat 素性测试

Fermat 素性检验 是最简单的概率性素性检验。

我们可以根据 费马小定理 得出一种检验素数的思路:

基本思想是不断地选取在 中的基底 ,并检验是否每次都有

参考实现

[list2tab]

  • C++

    bool fermat(int n) {
      if (n < 3) return n == 2;
      // test_time 为测试次数,建议设为不小于 8
      // 的整数以保证正确率,但也不宜过大,否则会影响效率
      for (int i = 1; i <= test_time; ++i) {
        int a = rand() % (n - 2) + 2;
        if (quickPow(a, n - 1, n) != 1) return false;
      }
      return true;
    }
  • Python

    def fermat(n):
        if n < 3:
            return n == 2
        # test_time 为测试次数,建议设为不小于 8
        # 的整数以保证正确率,但也不宜过大,否则会影响效率
        for i in range(1, test_time + 1):
            a = random.randint(0, 32767) % (n - 2) + 2
            if quickPow(a, n - 1, n) != 1:
                return False
        return True

如果 不是素数,则称 为以 为底的 Fermat 伪素数。我们在实践中观察到,如果 ,那么 通常是素数。但其实存在反例:对于 ,虽然有 ,但是 是合数。事实上,对于任何固定的基底 ,这样的反例都有无穷多个 1

既然对于单个基底,Fermat 素性测试无法保证正确性,一个自然的想法就是多检查几组基底。但是,即使检查了所有可能的与 互素的基底 ,依然无法保证 是素数。也就是说,费马小定理的逆命题并不成立:即使对于所有 ,都有 也不一定是素数。这样的数称为 Carmichael 数。它也有无穷多个。这迫使我们寻找更为严格的素性测试。

Miller–Rabin 素性测试

Miller–Rabin 素性测试(Miller–Rabin primality test)是更好的素数判定方法。它是由 Miller 和 Rabin 二人根据 Fermat 素性测试优化得到的。和其它概率性素数测试一样,它也只能检测出伪素数。要确保是素数,需要用慢得多的确定性算法。然而,实际上没有已知的数字通过了 Miller–Rabin 测试等高级概率性测试但实际上却是合数,因此我们可以放心使用。

在不考虑乘法的复杂度时,对数 进行 轮测试的时间复杂度是 。Miller–Rabin 素性测试常用于对高精度数进行测试,此时时间复杂度是 ,利用 FFT 等技术可以优化到

为了解决 Carmichael 数带来的挑战,Miller–Rabin 素性测试进一步考虑了素数的如下性质:

二次探测定理

如果 是奇素数,则 的解为 或者

将费马小定理和二次探测定理结合起来使用,就得到 Miller–Rabin 素性测试:

  1. 中的指数 分解为
  2. 在每轮测试中对随机出来的 先求出 ,之后对这个值执行最多 次平方操作;
  3. 在整个过程中,如果发现 的非平凡平方根(即除了 之外的其他根),就可以判断该数不是素数;
  4. 否则,再使用 Fermat 素性测试判断。

还有一些实现上的小细节:

  • 对于一轮测试,如果某一时刻 ,则之后的平方操作全都会得到 ,则可以直接通过本轮测试。
  • 如果找出了一个非平凡平方根 ,则之后的平方操作全都会得到 。可以选择直接返回 false,也可以放到 次平方操作后再返回 false

这样得到了较正确的 Miller Rabin:(来自 fjzzq2002)

参考实现

[list2tab]

  • C++

    bool millerRabin(int n) {
      if (n < 3 || n % 2 == 0) return n == 2;
      if (n % 3 == 0) return n == 3;
      int u = n - 1, t = 0;
      while (u % 2 == 0) u /= 2, ++t;
      // test_time 为测试次数,建议设为不小于 8
      // 的整数以保证正确率,但也不宜过大,否则会影响效率
      for (int i = 0; i < test_time; ++i) {
        // 0, 1, n-1 可以直接通过测试, a 取值范围 [2, n-2]
        int a = rand() % (n - 3) + 2, v = quickPow(a, u, n);
        if (v == 1) continue;
        int s;
        for (s = 0; s < t; ++s) {
          if (v == n - 1) break;  // 得到平凡平方根 n-1,通过此轮测试
          v = (long long)v * v % n;
        }
        // 如果找到了非平凡平方根,则会由于无法提前 break; 而运行到 s == t
        // 如果 Fermat 素性测试无法通过,则一直运行到 s == t 前 v 都不会等于 -1
        if (s == t) return 0;
      }
      return 1;
    }
  • Python

    def millerRabin(n):
        if n < 3 or n % 2 == 0:
            return n == 2
        if n % 3 == 0:
            return n == 3
        u, t = n - 1, 0
        while u % 2 == 0:
            u = u // 2
            t = t + 1
        # test_time 为测试次数,建议设为不小于 8
        # 的整数以保证正确率,但也不宜过大,否则会影响效率
        for i in range(test_time):
            # 0, 1, n-1 可以直接通过测试, a 取值范围 [2, n-2]
            a = random.randint(2, n - 2)
            v = pow(a, u, n)
            if v == 1:
                continue
            s = 0
            while s < t:
                if v == n - 1:
                    break
                v = v * v % n
                s = s + 1
            # 如果找到了非平凡平方根,则会由于无法提前 break; 而运行到 s == t
            # 如果 Fermat 素性测试无法通过,则一直运行到 s == t 前 v 都不会等于 -1
            if s == t:
                return False
        return True

可以证明 2,奇合数 通过随机选取的一个基底 的 Miller–Rabin 素性测试的概率至多为四分之一。因此,随机选取 个基底后,仍将合数误判为素数的概率不超过

另外,假设 广义 Riemann 猜想(generalized Riemann hypothesis, GRH)成立,则对数 最多只需要测试 中的全部整数即可 确定 的素性。3

而在 OI 范围内,通常都是对 范围内的数进行素性检验。对于 范围内的数,选取 三个数作为基底进行 Miller–Rabin 素性检验就可以确定素性;对于 范围内的数,选取 七个数作为基底进行 Miller–Rabin 素性检验就可以确定素性。4

也可以选取 (即前 个素数)检验 范围内的素数。

注意如果要使用上面的数列中的数 作为基底判断 的素性:

  • 所有的数都要取一遍,不能只选小于 的;
  • 换成
  • 如果 ,则直接通过该轮测试。

反素数

顾名思义,素数就是因子只有两个的数,那么反素数,就是因子最多的数(并且因子个数相同的时候值最小),所以反素数是相对于一个集合来说的。

一种符合直觉的反素数定义是:在一个正整数集合中,因子最多并且值最小的数,就是反素数。

反素数

对于某个正整数 ,如果任何小于 的正数的约数个数都小于 的约数个数,则称为是 反素数(anti-prime, a.k.a., highly compositive numbers)。

注意

注意区分 emirp,它表示的是逐位反转后是不同素数的素数(如 149 和 941 均为 emirp,101 不是 emirp)。

过程

那么,如何来求解反素数呢?

首先,既然要求因子数,首先要做的就是素因子分解。把 分解成 的形式,其中 是素数, 为他的指数。这样的话总因子个数就是

但是显然质因子分解的复杂度是很高的,并且前一个数的结果不能被后面利用。所以要换个方法。

我们来观察一下反素数的特点。

  1. 反素数肯定是从 开始的连续素数的幂次形式的乘积。

  2. 数值小的素数的幂次大于等于数值大的素数,即 中,有

解释:

  1. 如果不是从 开始的连续素数,那么如果幂次不变,把素数变成数值更小的素数,那么此时因子个数不变,但是 的数值变小了。交换到从 开始的连续素数的时候 值最小。

  2. 如果数值小的素数的幂次小于数值大的素数的幂,那么如果把这两个素数交换位置(幂次不变),那么所得的 因子数量不变,但是 的值变小。

另外还有两个问题,

  1. 对于给定的 ,要枚举到哪一个素数呢?

    最极端的情况大不了就是 ,所以只要连续素数连乘到刚好小于等于 就可以的呢。再大了,连全都一次幂,都用不了,当然就是用不到的啦!

  2. 我们要枚举到多少次幂呢?

    我们考虑一个极端情况,当我们最小的素数的某个幂次已经比所给的 (的最大值)大的话,那么展开成其他的形式,最大幂次一定小于这个幂次。unsigned long long 的最大值是 ,所以可以枚举到

细节有了,那么我们具体如何具体实现呢?

我们可以把当前走到每一个素数前面的时候列举成一棵树的根节点,然后一层层的去找。找到什么时候停止呢?

  1. 当前走到的数字已经大于我们想要的数字了;

  2. 当前枚举的因子已经用不到了;

  3. 当前因子大于我们想要的因子了;

  4. 当前因子正好是我们想要的因子(此时判断是否需要更新最小 )。

然后 dfs 里面不断一层一层枚举次数继续往下迭代可以。

例题

求具有给定除数个数的最小自然数。答案保证不超过

求不超过 的数中,除数最多的数。

参考资料与注释

  1. Rui-Juan Jing, Marc Moreno-Maza, Delaram Talaashrafi, “Complexity Estimates for Fourier-Motzkin Elimination”, Journal of Functional Programming 16:2 (2006) pp 197-217.
  2. 数论部分第一节:素数与素性测试
  3. Miller–Rabin 与 Pollard–Rho 学习笔记 - Bill Yang’s Blog
  4. Primality test - Wikipedia
  5. Fermat pseudoprime - Wikipedia
  6. 桃子的算法笔记——反素数详解(acm/OI)
  7. The Rabin-Miller Primality Test
  8. Highly composite number - Wikipedia

Footnotes

  1. Pomerance, Carl, John L. Selfridge, and Samuel S. Wagstaff. “The pseudoprimes to 25⋅ 10⁹.” Mathematics of Computation 35, no. 151 (1980): 1003-1026. 的定理 1 说明了,对于固定的基底 ,能够通过更强的 Miller–Rabin 素性测试的合数也是无穷多的。

  2. 本结论及其证明参考了 Crandall, Richard, and Carl Pomerance. Prime numbers: a computational perspective. New York, NY: Springer New York, 2005. 的第 3.5 节。

  3. Bach, Eric , “Explicit bounds for primality testing and related problems”, Mathematics of Computation, 55:191 (1990) pp 355–380.

  4. 更多类似的结果请参考 Deterministic variant of the Miller–Rabin primality test