• 其他语言



英特尔
® 
图形媒体加速器分析器 v2.1
页面和feed选项
打印
收藏此页
Digg此页 | 添加到您的del.icio.us帐号
目录

使用英特尔® 图形媒体加速器分析器
IGMAP 与英特尔 900 系列集成图形主板的芯片组架构对接,通过这种对接,可以收集通常不可用的统计信息:

  • 每秒和每帧进入硬件 Binner1 的多边形数目。
  • 每秒和每帧进入渲染器的多边形数目
  • 每秒和每帧渲染的像素总数
  • 每秒和每帧的像素着色器负载
要了解进入硬件 Binner 的多边形(PEHB)值的含义,必须首先了解图形引擎将多边形入库的方式。多边形(表示为下图左上角的大三角形)首先被传入负责将多边形入库的硬件 Binner 中。入库过程包括断定每个多边形所包括的先前确定的屏幕区域,并将每个多边形的实例置于相应的 BPL 中。如果多边形包含多个屏幕区域,则它将被置于这些区域中的每个 BPL 中。如图 1 所示,第一个 BPL 与屏幕左上角的区域对应,最后一个 BPL 与屏幕右下角的区域对应。每个多边形都被置于其对应的 BPL 中,其他多边形仅被置于对应多边形列表的结尾。PEHB 只是发送到渲染器中的多边形计数。

图 1. 常规 900 系列集成图形管线。
同样,为了了解进入渲染器的多边形(PER),必须了解图形引擎渲染多边形的方式。将所有的多边形入库后,会将 BPL 发送到渲染器,该渲染器将执行渲染过程并在屏幕上显示结果。渲染过程包含确定在同一屏幕区域中哪些多边形应位于其他多边形的顶部。PER 只是发送出去以进入渲染器的多边形计数。

“渲染的像素总数”对话框显示了自上次更新以来 900 系列集成图形硬件渲染的像素数目。请注意,并不是所有渲染的像素都会实际出现在屏幕上。

英特尔 900 系列集成图形硬件支持 Pixel Shader 2.0;像素着色器是由运行中的图形程序加载的小程序,用于处理图形加速器上的像素。像素着色器允许出现矩阵调色贴皮和凹凸反射贴图等情况。每次加载新像素着色器程序的第一条指令时,像素着色器计数器都将递增。

为补充在英特尔 900 系列集成图形芯片组内监控的硬件信息,IGMAP 还挂接并监控以下驱动程序(软件)的计数器:

  • 程序是否位于硬件渲染区域2 中。
  • 清除总数以及快速清除数与清除总数的比率。
  • Z-Evict 的数目。
  • 中途场景刷新(MSF)数目及原因
  • 总视频/材质内存。
  • 每秒帧数(FPS)。
  • 帧缓冲的方向
硬件区域渲染采用瓦片纹理渲染系统,该系统可减少内存带宽,实现最佳的渲染性能。这对于实现英特尔 900 系列图形引擎的最佳性能是非常关键的。当指示灯为绿或重叠显示中的“区域渲染”屏幕文本为绿时,表示硬件区域渲染处于激活状态,且图形引擎正在最佳渲染状态下运行。指示灯为红或重叠显示中的“区域渲染”屏幕文本为红时,表示该引擎已退回到传统的渲染模式,而且可能存在需要解决的编码问题(有关硬件区域渲染的潜在性能限制因素,请参阅“分析器帮助”或《915G/GM 软件开发人员指南》)。

IGMAP 密切监控有意或无意对图形硬件执行的 Z-Eviction 数和清除次数(即 Stencil 和 Z)。它还监控在场景中执行的管线刷新(这可能会对任何瓦片纹理渲染器的性能产生不利影响)及其原因:

  • 3D 相关操作——MSF 由对资源的操作触发,该资源当前与 3D 命令相关(即 BLT 或对激活的 3D 纹理的锁定)。

  • 内存不足——MSF 由内存不足的状况触发(即纹理、顶点缓冲、命令缓冲)。

  • 设置渲染目标——MSF 由当前渲染目标的交换触发。

  • 设置深度缓冲——MSF 由当前深度缓冲的交换触发。

  • 内部——MSF 由某些其他内部事件或非典型事件触发
在理想情况下,这些值都为零;但是,通常必须使用导致上述某个事件发生的函数或调用。优化代码的最佳方式是创建代码使这些事件在不需要时不会发生,并且将这类“需要”事件的数目限制到尽可能少。

除了“每秒帧数”指示器以外,该分析器还指示了视频和纹理的内存使用情况。最后,“方向”统计信息反映了帧缓冲的当前方向;有时,帧缓冲旋转是有意的,但如果不是有意的,则最好将缓冲改回来,因为循环模式比较慢。

图 2. 英特尔® 图形媒体加速器分析器图形用户界面
上述统计信息还可在屏幕左上角显示(请参见图 4),而且还可采用 Microsoft Excel* 电子表格格式3 进行记录。

该图形用户界面以设定的一秒时间间隔显示其数据采样,因而不是系统性能限制因素。要获取基于帧的采样,建议将 Microsoft PIX 工具与该分析器结合使用。

图 3. 英特尔® 图形媒体加速器分析器配置界面
在用户的计算机上安装 IGMAP 后,借助英特尔® VTune™ 分析器,该用户还可以跟踪所有上述变量,直到它们出现的代码行;只需启动英特尔® VTune™ 分析器并在计数器-监视器向导部分中查找 IGMAP 计数器即可。如前所述,该分析器还可与 Microsoft PIX 及 Microsoft PerfMon 进行集成。该工具扩展后,除了可执行基于时间的采样以外,还可监控基于帧的性能。

该分析器将在任何英特尔 900 系列计算机(带集成的图形)上工作,只要该计算机具有最新的英特尔® 图形驱动程序即可,这些驱动程序可以在安装时从 http://support.intel.com/support/graphics/intel915g  下载。



图 4. 英特尔 图形媒体加速器分析器全屏4 显示示例。
1 硬件 Binner 是英特尔® 瓦片纹理渲染引擎的核心硬件组件。
2 注意:不再进行硬件区域渲染是英特尔 900 系列集成图形硬件的一个最大的性能限制因素。
3 注意:当前版本仅记录基于时间(而不是基于帧)的数据采样。
4 图片来自《虚幻竞技场 2004》演示。《虚幻竞技场》(Unreal Tournament)归 Epic Games 公司所有。

上一部分1  2  3  4  5  下一部分

第 2 页, 共 5 页