英特尔
® 
数学核心函数库 10.1 —— 概述
打印发送电子邮件告知好友支持新闻简报RSSDigg thisdel.icio.us
产品信息评估中心支持资源文档
概述BLAS/LAPACKScaLAPACK稀疏矩阵解算器快速傅立叶变换矢量数学矢量统计LINPACK


购买产品 ›

免费评估版软件 ›

非商业用途 Linux* 版免费下载 ›


概述

英特尔® 数学核心函数库(英特尔® MKL)提供经过高度优化和大量线程化处理的数学例程,面向性能要求极高的科学、工程及金融等领域的应用。

英特尔® MKL 为英特尔® C++ 和 Fortran 编译器专业版英特尔® 集群工具套件的组件,也可作为单独产品使用。

英特尔® MKL 提供了超前的高性能应用和出色的开发人员效率。英特尔® MKL 针对当前多核 x86 平台进行了深入而全面的优化,同时将不断针对未来平台进行优化,以确保应用能够从最新架构的进步中最大限度获益。

Microsoft Visual Studio* 开发人员: 利用 BLAS、LAPACK、FFT 和统计函数高速实施过程中的首选库(来自 Microsoft Visual Studio 2003、2005 和 2008),更高效地构建强大的技术应用。

产品简介  [PDF 462KB]

英特尔® 数学核心函数库 Flash 演示
观看下载

亮点
  • 10.1 版现已发布!
    有关全新特性和性能提升列表,请参见以下内容。
  • 点击此处获得所支持的操作系统、编译器和处理器列表。
  • 访问 WhatIf.intel.com  了解与英特尔® MKL 有关的新奇技术。
特性
英特尔® 处理器的卓越性能
利用专门针对英特尔® 至强®、英特尔® 酷睿™、英特尔® 安腾® 以及英特尔® 奔腾® 4 处理器系统高度优化的数学函数库,实现卓越性能。特别针对英特尔® 至强® 四核处理器和全新英特尔® 酷睿™ i7 四核处理器进行多线程性能优化。英特尔® MKL 的性能可与非英特尔处理器上的其他数学软件包相媲美。

面向多核
  • 多处理器系统上出色的可扩充性1
    使用英特尔® MKL 内置的并行处理机制在多核和多处理器(包括英特尔® 至强® 7400 处理器和最新的双核和四核系统)上自动获取出色的扩充性能。英特尔® MKL BLAS、快速傅立叶变换和矢量数学等例程使用 OpenMP* 进行线程处理。
  • 线程安全
    所有的英特尔® MKL 函数都是线程安全的。同时提供非线程化顺序型英特尔® MKL。

自动运行时处理器检测
执行运行时检查,从而可执行处理器专用优化代码,确保您的应用无论在哪种系统上执行都能实现最佳性能。

支持 C 和 Fortran 接口
英特尔® MKL 与那些要求您购买多款产品才能获得 C 和 Fortran 接口的数学库不同 —— 它将这两种接口都包含在内。

一个软件包支持所有的英特尔® 处理器
一个英特尔® MKL 包可同时支持英特尔® 至强®、英特尔® 酷睿™、英特尔® 奔腾® 4 和英特尔® 安腾® 架构。如果使用其它数学库,您需要购买多款产品来支持所有处理器。

无需支付版税,即可获得再发行权利
您可随软件不限量再分发英特尔® MKL 运行时库的副本。

英特尔® 卓越支持
购买英特尔® MKL 可获一年世界一流的技术支持。在这段时间内,您能够免费下载产品的升级包,包括发行的主要版本。如欲了解更多信息,请访问英特尔® 注册中心 。此外,用户论坛也能提供理想的社区支持。

用户论坛
与其它英特尔® MKL 用户在英特尔® MKL 论坛  交流经验。

功能:
线性代数 —— BLAS 和 LAPACK
利用已针对英特尔处理器进行高度优化的 BLAS 和 LAPACK 例程,获得显著高于同类实施的性能。英特尔® MKL 10.0 兼容全新推出的 LAPACK 3.1 版。

线性代数 —— ScaLAPACK
ScaLAPACK 的英特尔® MKL 实现提供的性能改善非常显著,远远超出标准 NETLIB 实现。

线性代数 —— 稀疏矩阵解算器
利用 PARDISO 直接稀疏矩阵解算器解算大型的稀疏线性方程组,该解算器获得了巴塞尔大学的授权,是一款易于使用、具备线程安全性、高性能的内存高效型软件库。英特尔® MKL 还包含共轭梯度解算器和 FGMRES 迭代稀疏矩阵解算器。

快速傅立叶变换(FFT)
充分利用带有易于使用的新型 C/Fortran 接口的多维 FFT 例程(从 1 维至 7 维)。英特尔® MKL 支持采用相同 API 的分布式内存集群,支持您将工作负载轻松地分布到大量处理器上,从而实现大幅的性能提升。英特尔® MKL 还兼容 FFTW 2.x 和 3.0 接口,从而支持当前的 FFTW 用户轻松将英特尔® MKL 集成到现有应用中。

矢量数学库
借助计算密集型核心数学函数(幂函数、三角函数、指数函数、双曲函数、对数函数等)的矢量实施提升应用性能。

矢量随机数生成器
利用我们的矢量随机数生成器加速模拟,与标量随机数生成器相比,它能够显著提升系统性能。

LINPACK 性能指标评测
英特尔通过免费提供由英特尔 MKL构建的 LINPACK 性能指标评测程序包,来帮您在基于英特尔® 架构的系统上获得最佳的性能指标评测结果。

返回页首


全新英特尔® MKL 10.1
该版本英特尔® 数学核心函数库(英特尔® MKL 10.1)为最新型英特尔® 处理器(英特尔® 至强® 7400 系列处理器、英特尔®
酷睿™ 处理器)提供了优化的多线程性能。英特尔® MKL 10.0 提供了全新“分层”架构,以更好地支持各种用户使用模式,同时将标准和集群版本结合为一个完整的程序包。

针对全新英特尔® 至强® 和英特尔® 酷睿™ 处理器的优化
如欲了解更多信息,请参见下文的“10.1 版本性能提升”部分。

“分层”架构包含在英特尔® MKL 10.0 内
在英特尔® MKL 10.0 中,我们将产品架构重新设计成提供多个层,从而使基本英特尔® MKL 软件包能够在一个软件包中支持多个接口、编译器和处理器的配置。许多其它函数库厂商都有一些必须根据您开发环境的特定配置来查找、下载、安装和测试的特定版本。全新的英特尔® MKL 架构旨在针对我们不同用户的独特需求提供最大限度的支持,同时尽可能地减少获取和利用英特尔® MKL 的高性能优势所需的工作。如欲了解更多信息,请参阅英特尔® MKL 用户指南的“使用英特尔® MKL 并行”部分。

计算层
该层构成了英特尔® MKL 的核心。执行运行时检查,以执行针对特定处理器优化的代码。用户可以构建自定义共享对象,以便仅将所需的特定代码包含在内,从而缩减该层的大小(如果存在大小问题)。

PARDISO 直接稀疏矩阵解算器
  • 用于解决 SMP 系统上更大问题的核外内存实施
  • 面向 DSS/PARDISO 的单独向后/向前替代支持。
  • 用于关闭 DSS 接口反复修改的新参数。
  • 为 PARDISO 接口加入用于检查稀疏矩阵结构的新参数。
  • 稀疏解算器功能目前集成在核心数学库内,且不必再链接单独的解算器库。
  • 现在可以动态链接稀疏解算器函数。
稀疏 BLAS
  • 用于计算压缩稀疏行格式内存储的两个稀疏阵列之和与乘积的新增例程
  • 用于在不同稀疏阵列格式间进行转换的新增例程。
  • 新增对所有数据类型(单精度、复数和双复数)的支持。
  • 新增稀疏零基索引。
  • 新增单精度支持。
  • 线程化级别 3 稀疏 BLAS 三角形矩阵解算器。
LAPACK
  • 已通过回调函数机制实现了对较长 LAPACK 计算过程进行跟踪和/或中断的功能。称为 mkl_progress 的函数可以在用户应用中定义,此函数将定期从 MKL LAPACK 例程的子集中调用。参考具体的函数描述,了解哪些 LAPACK 函数能够支持这一特性。
离散傅立叶变换界面(DFTI)
  • 新增 DftiCopyDescriptor 函数,方便对 FFT 的使用。
  • 调用 DFTI 的静态链接可执行程序的大小已被大幅降低。
  • 复杂存储目前也能支持实数对实数转换。
迭代解算器预解算子
  • 适用于英特尔® MKL RCI 迭代解算器的 ILUT 加速器/预解算子
矢量数学函数
  • 新增 Mul、Conj、MulbyConj、CIS、Abs 函数
  • 新增的“增强性能”模式(EP 模式)可用于数学函数准确性不会影响参数准确性的应用中,如 Monte Carlo 模拟和媒体应用等
  • 所有 VML 函数都已实现了线程化
  • 经过优化的累积正态分布函数(CdfNorm)及其反函数(CdfNormInv)和反余误差函数(ErfcInv)已增至矢量数学库。
用户指南
  • 我们已对《英特尔® MKL 用户指南》进行了极大改进。该指南是使用英特尔® MKL 不可或缺的工具。访问文档页面,以便下载或在线观看。
    编译器支持
  • 支持包括英特尔® 编译器 11.0 和 PGI 编译器在内的新型编译器。
英特尔® MKL 10.1 的性能改进
我们对库进行了全面的性能改进。以下是测量得到的一些具体的性能提升。在“性能提升”页面上列有以前版本的英特尔® MKL 的性能提升情况。性能提升情况具体到每个英特尔® MKL 产品领域(BLAS/LAPACK、FFT、VML、VSL 等)

  • BLAS
    • 32 位提升
      • (Z、C)GEMM 在使用四核英特尔® 至强® 5300 系列处理器时性能提升 50%
      • 所有(D、S、Z、C)GEMM 代码在运行于英特尔® 至强® 5400 系列处理器时性能提升 10%
    • 64 位提升
      • SGEMM 在运行于英特尔® 酷睿™ i7 处理器时性能提升 50%。
      • DTRSM 在运行于英特尔® 酷睿™ i7 处理器时右侧项性能提升 30%。
  • 直接稀疏矩阵解算器(DSS/PARDISO):
    • 核外 PARDISO 性能平均提升 35%。
  • VML 和 VSL
    • 针对英特尔® 酷睿™ i7 处理器的优化:
      • 下列 VML 函数性能提升达 17%: Asin、Asinh、Acos、Acosh、Atan、Atan2、Atanh、Cbrt、CIS、Cos、Cosh、Conj、Div、ErfInv、Exp、Hypot、Inv、InvCbrt、InvSqrt、Ln、Log10、MulByConj、Sin、SinCos、Sinh、Sqrt、Tanh。
      • 统一随机数生成性能提升 67%。
      • 基于 Wichmann-Hill、Sobol 和 Niederreiter BRNGs(64 位)的 VSL 分布生成器性能提升 10%。
10.0 版本的性能提升
BLAS
  • DGEMM 线程得到改善,实现了小型和中型的尺寸 —— 产品轮廓尺寸缩减 10%,平方尺寸缩减 80%
  • DGEMM/SGEMM 大面积尺寸和大产品轮廓尺寸在运行 1 条线程时缩减了 4-5%,在运行 8 条线程时缩减了 10-15%
  • DTRSM、DTRMM 和 DSYRK 性能提升了 5-30%
  • 其它级别 3 实函数的大尺寸缩减了 2-4%
LAPACK
  • 我们大幅改进了几种线性方程解算器的性能(spsv/hpsv/ppsv、pbsv/gbsv、gtsv/ptsv、sysv/hesv)。带状和压缩存储格式以及多右侧项情况的速度提升了高达 100 倍。
  • 三对角线例程(sytrd/hetrd)提速为原来 4 倍,因此所有的对称特征解算器(syev/syev、syevd/heevd、syevx/heevx、syevr/heevr)都得到了大幅改进。
  • 所有压缩存储中的对称 EigenSolver(spev/hpev、spevd/hpevd、spevx/hpevx)都实现了极大的性能提升,因为压缩存储中的三对角线例程(sptrd/hptrd)的速度实现了高达 3 倍的提升。
  • 一些应用正交矩阵/单一变换的例程(ormqr/unmqr、ormrq/unmrq、ormql/unmql、ormlq/unmlq)实现了两倍的性能提升。
FFT
  • 2 次幂尺寸的复数 1 维 FFT 性能在运行 1 条线程时实现了高达 1.8 倍的性能提升。
  • 在 64 位模式下运行的英特尔® 64 架构系统上,当英特尔® 安腾® 处理器运行 4 条线程时,数据大于 2^22 的单精度 1 维复数反向 FFT 速度提升达 2 倍;运行 8 条线程时,速度提升达 2.4 倍
VML/VSL
  • VSL 函数在非英特尔处理器上性能平均提升了大约 2 倍
  • VML vdExp、vdSin 和 vdCos 函数的性能在非英特尔处理器上平均提升了 18%
  • VSL 函数在 IA-32 和英特尔® 64 架构上的性能平均提升了 7%
兼容性
操作系统
英特尔® MKL 10.1 支持 Linux*、Windows*(包括 HPC Server 2008)和 Mac OS* X。Linux 系列中具体包括: Red Hat*、Suse*、Debian*、Ubuntu*、Asianux* 和其它 Linux Standard Base 3.1 类产品。如欲参阅完整列表,请访问系统要求页面。

开发环境
英特尔® MKL 可以与常用开发工具和环境轻松集成,如 Microsoft Visual Studio*、Xcode*、Eclipse* 和 GUN 编译器套装(GCC)。

处理器
英特尔® MKL 10.1 支持全部兼容英特尔® 架构的处理器,尤其适用于:

  • 英特尔® 至强® 处理器家族
  • 英特尔® 酷睿™ 处理器家族
  • 英特尔® 安腾® 处理器家族
  • 英特尔® 奔腾® 处理器家族
  • AMD Opteron* 和 Athlon* 处理器家族

如欲参阅完整列表,请访问系统要求页面。

技术支持
购买英特尔® 软件开发产品的所有用户均可获得一年的支持服务,在此期间他们可以访问英特尔® 卓越支持  和获得所有的产品更新。英特尔® 卓越支持允许您在线访问英特尔® MKL 论坛、技术说明、应用说明和文档。安装产品后进行注册即可获得支持和产品更新信息。

1性能测试和等级评定均使用特定的计算机系统和/或组件进行测量,反映了使用这些测试所测的英特尔产品的大致性能。系统设计或配置的任何不同均能影响实际性能。购买者应进行多方咨询,以评估他们考虑购买的系统或组件的性能。获取有关英特尔产品性能测试和性能的更多信息



英特尔® 软件   
网络
英特尔® 软件网络
  • 成员注册步骤简单且免费,马上 加入吧!