创新工作
创享娱乐
支持
英特尔中国
英特尔全球
搜索
英特尔® 软件网络
开发人员和英特尔工程师联系的纽带
社区
专业开发
集群开发
图形技术开发
可管理性软件开发
移动软件开发
开放源代码开发
多核软件开发
虚拟化技术开发
更多...
下载
开发工具
产品套件
编译器
VTune™ 分析器
性能库
线程分析工具
群集工具
SOA 产品
销售商中心
英特尔® 软件开发产品教育版定价
客户评价
平台管理
内容管理
论坛/博客
论坛
博客
合作与支持计划
英特尔软件合作伙伴计划
英特尔软件展望杂志
资源
英特尔出版社技术书籍
培训
知识库
Take Five 视频
酷软件
What If 软件
支持
首页
›
软件产品
›
VTune™ 分析器
›
英特尔
®
VTune™ 性能分析器 9.1 Linux* 版 - 特性
免费评估版软件 ›
非商业用途免费下载 ›
购买产品 ›
所有架构
大型企业和 HPC
安腾® 架构
所有架构:
低开销
精准确定程序将时间花费在什么地方。
采样
在系统范围内进行,其开销(通常小于 5%)可以忽略。
查找关键路径
使用
调用图
确定函数调用顺序并查找关键路径。
无需重新编译
与要求重新编译或修改生成脚本的传统测量档案器不同,只需使用生产可执行文件。
兼容性
VTune™ 性能分析器支持最新的
英特尔® 处理器
(基于英特尔® 64 架构的处理器、英特尔® 安腾® 处理器、多核处理器等),以及多种
Linux* 产品
。
独立于编程语言与编译器
VTune 分析器支持符合行业标准(ELF、STABS、DWARF)的所有编译器。
混合的 Java* 代码和本地代码
与只能调试 Java* 代码的分析器不同,VTune 分析器可调试混合的 Java 代码和本地代码
1
。
最小的内存占用量
通过在独立的系统上运行用户界面,远程评测可使目标系统受到的性能影响降到最低。
命令行功能
自动进行批处理操作。
轻松处理大型应用程序
即便是处理大型可执行文件
2
,VTune 分析器也是一个强大、稳定的解决方案。如果您的大型应用程序有几十万个函数,让 VTune 分析器来处理它吧。
听取编译器的建议
只需您稍作提示,优化编译器就可以表现得更好。我们
将英特尔® 编译器与 VTune 分析器相集成
,从而使得这一操作过程简单而高效。
“英特尔 VTune 性能分析器将需要原来花费几天时间的工作变为在一天之内就可完成的任务。”
Randy Camp
MUSICMATCH Inc.
软件研发部副总裁
其他用户的评价...
“VTune 分析器优化的命令行界面和新的数据自动导出功能大大简化了我们的日常开发工作。”
Nick Monyatovsky
ABAQUS Inc.
“VTune 分析器 Linux 版真是太棒了。它可以快速轻松地获取有用数据。我对此深有感触。我从未见过如此出色的工具,它能够更轻松地获取您所需要的基本信息。”
Bradley Sergeant
SergArt Software
软件架构师(亲身体验 VTune™ 分析器 1 小时之后)
大型企业和 HPC 系统:
通过将采样数据存储到本地 CPU 内存中,
最大限度减少非一致内存体系结构(NuMA)系统中的流量
。为了避免互连总线达到饱和状态,以及避免降低正在测试的系统的速度,这一点至关重要。
针对高性能计算而设计
VTune 分析器对大型“高性能计算”(HPC)系统的独特要求提供支持。
多个用户可以共享一个大型系统,以便同时进行调用图性能分析。
支持在配有 128 个或更多
3
处理器(每个 CPU 都有一个本地缓冲区,以便最大限度地降低节点间争用)的系统上进行采样。为了对所采集的数据量加以限制,建议最多选择 64 个 CPU,以便同时进行数据采集。
返回页首
“我们的应用程序分析师利用 VTune 分析器的代码级功能,在几个主要的 ISV HPC 应用程序中隔离并更正应用程序性能瓶颈。我们定期使用 VTune 来调试和优化应用程序。”
Donny Cooper
NEC Solutions (America) Inc.
高级技术计算中心
高级系统分析师
英特尔® 安腾® 架构:
基于 Eclipse* 的图形用户界面
现在已将 VTune 分析器中易于使用的
基于 Eclipse* 的图形用户界面
内置于安腾® 架构中。
通过指令筛选事件准确定位瓶颈位置
隔离如预提取不当和内存对齐不当等问题。有时只选择一个事件在选择性上是不够的,因为事件可能在关键时刻发生,也可能在非关键时刻发生。在英特尔安腾架构上,使用指令筛选,您可以仅收集随指定的操作码发生的事件。
通过 CPU 选择最大程度地减少数据收集
仅收集所需数据。CPU 选择可以使您确切地控制收集数据的位置,即,是从所有处理器收集、仅从分配的那些处理器收集,还是仅从指定的处理器收集。这可以大大减少需要收集的数据量。
返回页首
1
仅采样。
2
可处理大型应用程序!例如,如果一个大型应用程序包含的多个工具和预定义库要求执行构建(但不是构建自身),该程序的源分发树约为 1.85 GB 并含有 62,700 多个文件。执行树自身约为 870 MB 并含有 8,200 多个文件。
3
由于支持大型系统有独特的要求,如果要在超过 128 个内核的系统上使用软件,请在购买之前与我们联系,以便做特殊安排。
简体中文
English
日本語
한국어
Русский
英特尔® 软件
网络
成员注册步骤简单且免费,马上
加入
吧!