数字信号处理、图像处理以及偏微分方程(PDE)解算器中都使用傅立叶变换。针对基于英特尔® 架构的计算机,英特尔® 数学核心函数库(英特尔® MKL)中的快速傅立叶变换(FFT)函数得到了高度优化。
英特尔® MKL 还提供对分布式内存多处理器架构计算机(集群)的支持。
英特尔® MKL 快速傅立叶变换的特性包括:
- 高性能
- 出色的多处理器可伸缩性
- 多维支持(从 1 维至 7 维)
- 混合基数支持
- 先进易用的接口
- FFTW 2.x 和 3.x 接口
Fortran 和 C
Fortran 和 C 接口均可用于所有 FFT 函数。
先进的 FFT 接口
英特尔® MKL 提供了一个新型 FFT 接口,该接口经过专门设计,更加易于使用和维护。
FFTW 接口
英特尔® MKL 带有兼容 FFTW 2.x 和 3.x 的 API,使 FFTW 用户可以轻松集成英特尔® MKL。我们的目标是使 FFTW 用户轻松获得高性能、高质量的英特尔® MKL 快速傅立叶变换。FFTW 是 MIT 的一个可选 FFT 包。
更多信息 
英特尔® MKL 快速傅立叶变换已针对中型和大型变换进行了高度优化。下面的图表将英特尔® MKL 的性能与 FFTW (一种流行的 FFT 软件包)进行了比较。该图表主要说明了以下几点:
- 英特尔® MKL 提供出色的中型和大型变换性能。
- 英特尔® MKL 为多处理器系统提供出色的可伸缩性。
- 在中型和大型变换方面,英特尔® MKL 比 FFTW 更出色。
注: 对于下面所有的测试,均使用 FFTW_PATIENT 标志调用 fftw_plan_dft_xd() 函数,以确保实现 FFTW 的良好性能。
一维变换下面的一维变换图表显示了英特尔® MKL 如何提供比 FFTW 更出色的性能
§。
 点击放大
 点击放大
二维变换 二维变换的规模之大足以使其从多处理中大大获益。下列图表说明了英特尔® MKL 如何提供明显优于 FFTW 的线程性能。事实上,英特尔® MKL 单个线程的性能往往超出了 FFTW 的 2、4、8 线程性能§。  点击放大
 点击放大
三维变换 三维变换显示了与二维变换相同的行为。英特尔® MKL 在中型和大型变换方面提供出色的性能§  点击放大
 点击放大
|
英特尔® MKL 还提供对分布式内存多处理器架构计算机(集群)的支持。此支持还包括针对分布式内存并行性设计的 FFT。与共享内存并行系统相比,集群系统通常配置有更高水平的并行性,因此英特尔® MKL 扩展了问题大小和性能(特别是大型问题)的提升空间。 该图表主要说明了以下几点: - 英特尔® MKL 可为多种变换规模提供出色的性能。
- 随着问题的增大,英特尔® MKL 相对于 FFTW 的性能优势也越发明显。
 点击放大
 点击放大
 点击放大
 点击放大
|
英特尔® 数学核心函数库的快速傅立叶变换功能可为多种不同规模的问题提供出色的性能和可伸缩性,而这正是高性能计算社区所关注的。与 FFTW 不同,英特尔® MKL 在运行软件之前不需要进行耗时的预生产机器校准(“计划创建”)。英特尔® MKL 提供对分布式内存并行计算系统的 FFT 支持,并且提供了出色的性能提升空间,以用于处理更大规模的问题。英特尔® MKL 包括 FFTW 接口,通过该接口,开发人员能够轻松地比较性能,并只需对源代码稍做更改就能从 FFTW 转换到英特尔® MKL。
§性能测试和等级评定均使用特定的计算机系统和/或组件进行测量,反映了使用这些测试所测的英特尔产品的大致性能。系统设计或配置的任何不同均能影响实际性能。购买者应进行多方咨询,以评估他们考虑购买的系统或组件的性能。如欲了解更多关于英特尔产品性能和性能测试的信息,请访问
http://www.intel.com/cd/software/products/apac/zho/index.htm。