首页 > 代码库 > 质因数分解的rho以及miller-rabin

质因数分解的rho以及miller-rabin

一、前言

   质因数分解,是一个在算法竞赛里老生常谈的经典问题。我们在解决许多问题的时候需要用到质因数分解来辅助运算,而且质因数分解牵扯到许许多多经典高效的算法,例如miller-rabin判断素数算法,rho启发式搜索质因数分解算法等。在此文里,我要介绍的就是miller-rabin算法以及rho启发式搜索分解算法。

二、算术基本定理

   首先,我们得知道,任意一个大于1的自然数都可以分解为有限个质数的乘积。这里因子均为质数,且为正整数。我们把这样的分解成为N的标准分解式。关于算数基本定理的应用有许多,例如可以证明素数无限,定义god,lcm等,在此不一一赘述。有了算数基本定理,我们可以发现计算数论函数,约数和等都是十分方便的,这大大的方便了我们的解题。接下来我们介绍如何来分解质因数。

三、质因数分解的算法

所谓质因数,是某自然数的因素而且这个因素还得是质数。

我们不难想到基本的枚举,即暴力枚举1~n所有数,判断是否能够被n整除且该数是否为质数。大概代码如下:

For i:=1 to n do 

  If n mod i=0 then 

   If check(i) then  //check为检验i是否为质数的子函数,返回值为boolean

    Writeln(i);

 

Function check(n:longint):boolean;

Var i:longint;

begin

   For i:=2 to n do 

If n mod i=0 then exit(false); //如果一旦有比它小的数除他为0,那么该数不为质数

     Exit(true); //否则显然为质数

End;

 

  这个是最朴素的方法,虽然代码简洁思路简单,但是时间复杂度实在是太高了。

于是我们有了优化1,我们发现判断一个数是否为素数只需枚举到sqrt(i),为何呢?因为一个数若不是素数,那么它必定是两个数的乘积,这两个数显然有一个小于等于sqrt(i),否则sqr(sqrt(i))=i,那么显然为质数。

Function check(n:longint):boolean;

Var i:longint;

Begin 

For i:=2 to sqrt(n) do  If n mod i=0 then exit(false);

Exit(true);

End;

但是我们发现时间复杂度还是比较高O(sqrt(n)*n)

于是我们有了优化2。我们不暴力判断n的每个因素,而是不断去试除。

何谓试除?设x是n的质因数,我们在分解的过程中每找到一个x就把它记录下来,并且让n:=n div x;那么我们在遇见x的倍数时,显然不可能会再有x的倍数了。那么我们就能通过“类似筛法”的思想,在O(sqrt(n))时间内,对n进行质因数分解,这也是现在比较常用的方法。

I:=2;

While n<>1 do 

Begin

While n mod i=0 do 

Begin

Writeln(i);

N:=n div i;

End;

Inc(i);

End;

我们在不断的div i中,我们把i的所有存在于n的因素里的倍数全部给丢掉了。

(即,n=12时,n=2*2*3=3*4 那么我们在i=2的时候,把4给筛掉了。)

在这里,我们发现每个i都会是质数,即i的变化总是2→3→5→7.......

于是我们有了优化3。如果我们能预先存储不大于sqrt(n)的所有质数,我们就可以快速调用了,不要小看这个优化,在n的质因数比较大的时候,O(n)的线性时间是我们耗费不起的。先来说下筛法(摘自百度百科)

用筛法求素数的基本思想是:把从1开始的、某一范围内的正整数从小到大顺序排列, 1不是素数,首先把它筛掉。剩下的数中选择最小的数是素数,然后去掉它的倍数。依次类推,直到筛子为空时结束。如有:

1 2 3 4 5 6 7 8 9 10

11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27 28 29 30

1不是素数,去掉。剩下的数中2最小,是素数,去掉2的倍数,余下的数是:

3 5 7 9 11 13 15 17 19 21 23 25 27 29

剩下的数中3最小,是素数,去掉3的倍数,如此下去直到所有的数都被筛完,求出的素数为:

2 3 5 7 11 13 17 19 23 29

 

procedure get(n:longint);  //Get函数为利用筛法求素数

var maxfactor,newp:longint;

begin

  maxfactor:=trunc(sqrt(n));

  fillchar(hash,sizeof(hash),true);

  for i:=2 to maxfactor do

    if hash[i] then

      begin

        newp:=i shl 1;  //等价于newp:=i*2;

        while newp<n do

           begin

             hash[newp]:=false;

             inc(newp,i);

           end;

      end;

    hash[1]:=false;

  for i:=2 to n do

    if hash[i] then

      begin

        inc(sushut);

        sushu[sushut]:=i;

      end;

end;

 

procedure solve(n:longint);   inline;

var i:longint;

begin

  i:=1;

  while sushu[i]<=n do

        begin

                tot:=0;

                if sushu[i]=0 then break;

                while n mod sushu[i]=0 do

                        begin

                          n:=n div sushu[i];

                          inc(tot);

                          if tot=1 then

                           begin

                              inc(ans);

                              sum[ans].number:=sushu[i];

                           end;

                          sum[ans].k:=tot;

                        end;

                if sushu[i]=2 then fuck:=tot;

                inc(i);

        end;

end;

 

可是这样的复杂度在n为超大整数类型且素因子十分大的时候也无能为力了,不仅会MLE,更会TLE。那么,我们来说一下这次的重头戏,也就是rho分解大法。

我们必须知道Fermat分解:

     首先,对于任意的一个偶数,我们都可以提取出一个2的质因子,如果结果仍为偶数,则可继续该操作,直至将其化为一个奇数和2的多少次幂的乘积,那么我们可以假定这个奇数可以被表示成2*N+1,如果这个数是合数,那么一定可以写成N=c*d的形式,不难发现,式中的c和d都是奇数,不妨设c>d,我们可以令a=(c+d)/2,b=(c-d)/2,那么的可以得到N=a*a-b*b,而这正是Fermat整数分解的基础;由不等式的关系,我们又可以得到a>=sqrt(c*d)=sqrt(N),那么,我们就可以枚举大于N的完全平方数a*a,计算a*a-N的值,判断计算的结果是否为一个完全平方数,如果是,那么a,b都是N的因子,我们就可以将算法递归的进行下去,知道求出N的所有质因子。容易看出,Fermat分解大数的效率其实并不高,但是比起试除法要好了很多;而且每次的计算都是计算出N的一个因子,更加降低了其效率。这就让我们想着去尝试新的算法,那就是Pollard rho算法。

      Pollard rho算法的原理就是通过某种方法得到两个整数a和b,而待分解的大整数为n,计算p=gcd(a-b,n),直到p不为1,或者a,b出现循环为止。然后再判断p是否为n,如果p=n成立,那么返回n是一个质数,否则返回p是n的一个因子,那么我们又可以递归的计算Pollard(p)和Pollard(n/p),这样,我们就可以求出n的所有质因子。

   具体操作中,我们通常使用函数x2=x1*x1+c来计算逐步迭代计算a和b的值,实践中,通常取c为1,即b=a*a+1,在下一次计算中,将b的值赋给a,再次使用上式来计算新的b的值,当a,b出现循环时,即可退出进行判断。

  在实际计算中,a和b的值最终肯定一出现一个循环,而将这些值用光滑的曲线连接起来的话,可以近似的看成是一个ρ型的。

     对于Pollard rho,它可以在O(sqrt(p))的时间复杂度内找到n的一个小因子p,可见效率还是可以的,但是对于一个因子很少、因子值很大的大整数n来说,Pollard rho算法的效率仍然不是很好,那么,我们还得寻找更加的方法了。

有了上述预备知识还不够,我们还得知道miller-robin素性检验。

根据费马小定理,

若n是一个奇素数,a是任何整数(1≤ a≤n-1) ,则 a^(n-1)≡1(mod n)。

miller-robin的理论基础:

如果n是一个奇素数, 将n-1表示成2^s*r的形式(r是奇 数),a 是和n互素的任何整数, 那么ar≡1(mod n) 或者对某个j(0≤j ≤s -1, j∈Z) 等式 a2jr ≡-1(mod n)成立。 这个理论是通过一个事实经由Fermat定理推导而来: n是一个奇素数,则方程x2 ≡ 1 mod n只有±1两个解。

注意,miller-rabin算法只是一种素性判断的概率算法,关于miller-rabin,pascal贴吧里应该有相关的帖子介绍,而miller-rabin的判断错误的概率是相当低的,(0.25)^t,t为素性测试的轮数。Miller-rabin算法在Int64范围内无法解决的强伪素数特殊判断一下即可。

接下来我们上代码:(我没找到Pas的,于是自己写了一份很丑的Pas代码,大神勿喷)

const count=10;

      pri:array [0..10] of longint=(2,3,5,7,11,13,17,19,23,29,31);

 

 

var n,total:int64;

    i:longint;

    ans:array [0..10000] of int64;

 

function multi(a,b,m:int64):int64;

//考虑到64位二进制数能表示的范围,只需取前9个素数为基

var ans:int64;

begin

  ans:=0;

  a:=a mod m;

  while b<>0 do

    begin

      if (b and 1)=1 then

        begin

          ans:=(ans+a) mod m;

          dec(b);

        end;

      b:=b>>1;

      a:=(a+a) mod m;

    end;

  exit(ans);

end;

 

function gcd(x,y:int64):int64;

begin

  if x mod y=0 then

    exit(y)

  else exit(gcd(y,x mod y));

end;

 

function quick_mod(a,b,m:int64):int64;

var ans:int64;

begin

        ans:=1; a:=a mod m;

        while b<>0 do

                begin

                        if (b and 1)=1 then

                                begin

                                        ans:=multi(ans,a,m);

                                        dec(b);

                                end;

                        b:=b>>1;

                        a:=multi(a,a,m);

                end;

        exit(ans);

end;

 

function prime(n:int64):boolean;

var m,k,a,x,y:int64; i,j:longint;

begin

  if n=2 then exit(true);

  if (n<2) or ((n and 1)=0) then exit(false);

  m:=n-1; k:=0;

  while (m and 1)=0 do

        begin

                inc(k);

                m:=m>>1;

        end;

  randomize;

  for i:=0 to count do

        begin

          a:=random(n) mod (n-1)+1;

          x:=quick_mod(a,m,n);

          y:=0;

          for j:=0 to k-1 do

                begin

                        y:=multi(x,x,n);

                        if (y=1) and (x<>1) and (x<>n-1) then exit(false);

                        x:=y;

                end;

          if y<>1 then exit(false);

        end;

  exit(true);

end;

 

 

function pollard_rho(n,c:int64):int64;

var i,k,x,y,d:int64;

begin

  i:=1; k:=2;

  randomize;

  x:=random(n) mod (n-1)+1;

  y:=x;

  while true do

    begin

      inc(i);

      x:=(multi(x,x,n)+c) mod n;

      d:=gcd(y-x,n);

      if (d>1) and (d<n) then exit(d);

      if (x=y) then exit(n);

      if (i=k) then

        begin

         y:=x;

         k:=k<<1;

        end;

    end;

end;

 

procedure find(n,c:int64);

var p,k:int64;

begin

  if n=1 then exit;

  if prime(n) then

    begin

      inc(total);

      ans[total]:=n;

      exit;

    end

  else

    begin

      p:=n;

      k:=c;

      randomize;

      while p>=n do

        begin

              p:=pollard_rho(p,c);

              dec(c);

        end;

      find(p,k);

      find(n div p,k);

    end;

end;

 

begin

  read(n);

  find(n,120);

  for i:=1 to total do

  writeln(ans[i]);

end.

 

至此,我们在Int64范围内解决了质因数分解的若干问题。

 

质因数分解的rho以及miller-rabin