其他分享
首页 > 其他分享> > 数学杂谈 #17

数学杂谈 #17

作者:互联网

FFT 的若干优化

针对 FFT 的计算优化的出发点一般都是充分利用虚部空间。因为没有优化的计算,通常而言仅仅是实部给出了最终结果;而如果我们可以用好虚部,理论上我们至多可以减少一半左右的 FFT 计算——从“一个一次”到“两个一次”。

「三次」变「两次」

这个优化常常用在单纯的多项式乘法当中。

假如我们要计算 \(F(x)G(x)\) 这样的卷积,普通的做法是用 FFT 计算 \(\operatorname{DFT}(F)\) 和 \(\operatorname{DFT}(G)\),然后再计算 \(\operatorname{IDFT}(\operatorname{DFT}(F)\cdot \operatorname{DFT}(G))\) 就得到了结果,这需要三次 FFT。

贯彻我们之前的思想,我们尝试将 \(\operatorname{DFT}(F)\) 和 \(\operatorname{DFT}(G)\) 塞进一次 FFT 里面。这还是比较简单的,只需要构造:

\[H(x)=F(x)+iG(x) \]

为了得到 \(F(x)G(x)\),我们不难想到计算 \(H^2(x)\):

\[H(x)=F^2(x)-G^2(x)+i(2F(x)G(x)) \]

因此提取 \(H^2(x)\) 的虚部就可以得到我们想要的结果辣!并且是两次 FFT!

需要注意的是,这个对于精度的要求比较非常高,所以如果系数稍微大一点,最好还是少用这个优化。

没办法,FFT 就这个毛病

「七次」变「四次」

这个优化常常用在拆系数 FFT,也就是 MTT 中。

考察一个比较简单的情况:我们只拆了一次系数,只需要做一次乘法,也就是需要求:

\[(T\cdot A(x)+B(x))(T\cdot C(x)+D(x)) \]

其中 \(T\) 是一个常数,姑且认为它比较小。

那么,我们直接拆开,也就是要求:

\[T^2\cdot A(x)C(x)+T(A(x)D(x)+B(x)C(x))+B(x)D(x) \]

粗算一下,哇噻,居然要用七次 FFT 耶!完蛋了!

还是沿用之前的想法,我们把两块多项式塞到一个里面去,诸如:

\[P(x)=A(x)+iB(x)\\ Q(x)=C(x)+iD(x) \]

仍然可以尝试乘法:

\[PQ=AC-BD+i(AD+BC) \]

我们最终的目的应该是尝试求出 \(AC,BD,AD+BC\),也就是至少需要三个方程。然而,这里只提供了两个。

注意到,每个方程为两个变量相加减的形式。如果能再添加几个同样形式的方程,我们很有可能可以直接加减算出来结果。调整正负号可以直接找共轭:

\[P\overline Q=AC+BD+i(-AD+BC) \]

这样我们甚至可以直接解出 4 个变量,还只需要用到五次 FFT,想来应该会快不少。

但是还不够!\(Q\) 和 \(\overline Q\) 的变化很少,我们能不能直接通过 \(\operatorname{DFT}(Q)\) 来求出 \(\operatorname{DFT}(\overline Q)\) 呢?

虽然不能只计算,但是 FFT 的过程已经算好了 \(\omega_n^k\) 和 \(\overline{\omega_n^k}\) 两处的点值。我们尝试通过这个信息来给出 \(\operatorname{DFT}(\overline Q)\)。

考察两个复数 \(z_1,z_2\) 的运算:

因此,可以得出结论 \(Q(\omega_n^k)=\overline{Q(\overline{\omega_n^k})}\)。这样就可以直接优化到四次 FFT!


另一种优化方法是,通过 \(\operatorname{DFT}(P),\operatorname{DFT}(Q)\) 直接得出 \(\operatorname{DFT}(A),\operatorname{DFT}(B),\operatorname{DFT}(C),\operatorname{DFT}(D)\),然后算出各项之后再 IDFT 回去。

这种方法的另一个关键在于,如何快速 IDFT。类似于 DFT 的加速方式,我们同样将两个需要 IDFT 的系数向量“塞到”同一个复数里面。比如,可以令:

\[\operatorname{DFT}(F)=\operatorname{DFT}(AC)+i\operatorname{DFT}(AD) \]

这样就有 \(F=AC+iAD\)。注意到 \(AC,AD\) 虚部为 0,因此可以分别提取两部得到结果。

小结

所以,优化 FFT 的关键在于:

  1. 将两个数压缩到同一个复数里面,提高空间利用率。

  2. 用好共轭等关系,生成尽可能多的方程,从而解出需要的变量。

标签:AC,17,cdot,DFT,FFT,杂谈,overline,数学,operatorname
来源: https://www.cnblogs.com/crashed/p/16216473.html