 |  | 
|
Профилирование производительности для JavaScript и Flash.
Новая функция поддержки профилирования в новых браузерах и других продуктах, ориентированных на сценарии, дает возможности анализа кода разработчикам, использующим новые технологии JavaScript* или Flash* JIT. Используйте анализатор VTune для оптимизации масштабируемой производительности такого кода в ОС Windows* и Linux*, чтобы пользователям было максимально удобно работать с вашим приложением. Анализатор VTune поддерживает профилирование кода JIT при наличии обязательной поддержки в браузере. Эта возможность позволяет проводить подробный анализ производительности следующих дополнительных языков: - JavaScript / AJAX
- Flash (Action Script)
Уточните у поставщиков браузеров, когда эти возможности будут включены в их браузеры. Профилирование динамически генерируемого кода.
Сегодня многие приложения используют код, генерируемый во время исполнения (JIT). Новые прикладные интерфейсы профилирования в анализаторе VTune позволяют анализировать производительность динамического кода и позволяют просматривать аннотации к исходному коду прямо из результатов анализа. Доступ к открытой модели данных VTune Analyzer.
Анализатор VTune теперь поддерживает много разных программных платформ с возможностью анализа производительности на базе образцов. Используйте новые прикладные интерфейсы открытой модели данных для сочетания возможностей графического интерфейса анализатора VTune в Windows* или Linux* с данными, собираемыми собственными средствами, для анализа производительности любого приложения на разнообразных платформах. - Собирайте данные по операционным системам, не поддерживаемым анализатором VTune.
- Поддерживаемые операционные системы семейства Windows*
- Перечень поддерживаемых версий ОС Linux*
- Сбор данных по встраиваемым платформам на базе продукции Intel
Доступ к новейшим экспериментальным технологиям.
В анализаторе VTune используются новейшие экспериментальные технологии отладки производительности корпорации Intel. На сайте whatif.intel.com вы можете загрузить программы Intel® Performance Tuning Utility и Intel® Platform Modeling with Machine Learning, включающие следующие полезные функции. - Дерево статистических вызовов - профили с низким уровнем системных издержек для обнаружения затрат времени приложением
- Анализ базовых блоков - отображает узкие места с разделением на базовые блоки и генерирует график потоков управления для расширенного анализа приложения даже при отсутствии исходного кода
- Профилирование доступа к данным - позволяет определять узкие места памяти и сопоставлять их с участками кода
- Графики зависимостей - визуализация связей между показателями
- Ранжирование событий - список лучших предикторов производительности, использующий системы машинного обучения
Отображение отчётов, подготовленных компилятором
Работа оптимизирующего компилятора будет намного более удачной, если вы обеспечите его необходимой информацией. Поэтому мы интегрировали компиляторы Intel® с анализатором производительности Intel® VTune™. В отчётах, подготовленных компиляторами Intel, содержится много сведений, на которые следует обратить внимание перед началом оптимизации приложения. Анализатор производительности Intel VTune определяет так называемые активные точки кода, на выполнение которых уходит значительная часть процессорного времени, а затем отфильтровывает отчёт компилятора, чтобы вывести только те сведения, которые относятся к целевым разделам кода. Ознакомившись с отчётом, вы узнаете, какие разделы были оптимизированы компилятором, и сможете добавить в код прагмы, если требуется оптимизировать другие разделы. Допустим, из отчёта вы узнали, что компилятор не оптимизировал какой-то критический цикл, поскольку предположил наличие векторной зависимости. Если вы уверены, что такая зависимость отсутствует, вы можете вставить в код прагму, которая сообщит компилятору, что оптимизация данного раздела возможна. В настоящее время фильтрация отчёта об оптимизации доступна только в компиляторах Intel® C++ и Intel® Fortran версий 9.1 и выше, однако в ней используется стандартный формат, подходящий для обработки и другими компиляторами. |
 Увеличить
После того, как с помощью анализатора производительности Intel® VTune™ вы нашли активные точки кода, выберите строки кода в окне источника и нажмите эту кнопку, чтобы просмотреть отчёт компилятора.
|
Реализация новых эффективных методов настройки приложений
Учёт простоев конвейера, предоставляющий разработчику информацию о возможных проблемах (например, о неудачных обращениях к кэш-памяти), существенно облегчает настройку кода. Анализ программного кода осуществляется за более короткое время благодаря оптимизации под процессоры Core™2 Duo и Core™2 Quad, в которых реализована возможность учёта простоев конвейера и поддержка дополнительных событий, а также усовершенствованы алгоритмы обработки событий. Новые методы оптимизации ПО под многоядерные процессоры Intel®
Новые события, поддержка которых реализована в современных процессорах Intel®, подходят для анализа степени распараллеливания кода, оценки использования системной шины и кэш-памяти ядрами процессора, исследования обмена данными между потоками. Эти сведения необходимы для оптимизации многопоточности, настройки использования системной шины и кэш-памяти ядрами процессора, оптимизации записи в кэш-память. Перечень новых дистрибутив Linux
Более подробную информацию вы можете найти в перечне поддерживаемых версий. Ускоренное построение графа вызова функций за счёт избирательного оснащения смешанного кода средствами измерения
Для повышения производительности вы можете оснастить средствами измерения только нативный код или только разделы Java*. Если анализ осуществляется только для тех модулей, которые необходимо настроить, снижаются системные издержки и сокращается время выполнения приложения. Поддержка современных процессоров Intel®
В анализаторе производительности Intel VTune реализована поддержка современных четырёхъядерных процессоров Intel. Подробнее > | Многофункциональный усовершенствованный интерфейс пользователя |
Настройка встроенных функций
Оптимизируйте встроенный код с помощью специальных счётчиков событий в окнах просмотра исходного кода и адресов памяти. Производительность будет меняться в зависимости от различных обстоятельств, например, от порядка вызовов функций. Анализатор производительности учтёт все вызовы для каждой встроенной функции. Поддержка компиляторов Intel и GNU - Компилятор ICC версии 8.1 или более поздней
- Компилятор GCC версии 3.2 или более поздней **
Переход между активными точками одним щелчком мыши
Рядом с каждой строкой исходного кода отображается счётчик событий, облегчающий поиск активных точек. Вы спрашиваете, как найти самую активную точку в объёмном исходном коде или как перейти к следующей активной точке, которая может находиться в совсем другом разделе? Ответ: просто щёлкните по столбцу событий, которые вы решили использовать в качестве критерия, и воспользуйтесь кнопками "Min" (Минимум), "Max" (Максимум), "Next" (Следующая) и "Previous" (Предыдущая) для перехода между активными точками. Простая навигация по ветвлениям и вызовам
Для перехода по ветвлениям вызовите меню в окне дизассемблирования и выберите команду "Go to target" ("Переход"). Создание меток для событий
Предположим, вы создали новые события, используя совмещение основных событий. Чтобы не забыть, что означают новые события, вы можете создать для них метку, которую анализатор производительности VTune будет использовать во всех окнах событий. |  Увеличить
   Нажмите кнопку "Max", чтобы перейти к самой активной точке в окне просмотра исходного кода. Для быстрого перехода между активными точками используйте кнопки "Next", "Previous" и "Min". Для выбора критерия, по которому определяются активные точки, щёлкните на нужном столбце.
|
| Мощные рабочие станции предприятия и высокопроизводительные вычислительные системы |
Минимизация трафика в системах с неоднородной архитектурой памяти (NuMA)
за счёт хранения данных в локальной памяти процессора предотвращает перегрузку коммуникационной сети и снижение производительности тестируемой системы.
| Новые функциональные возможности для архитектур Intel® Itanium® |
Графический интерфейс пользователя на основе среды Eclipse*
Простой графический интерфейс на основе среды Eclipse* используется при работе с анализатором производительности VTune в системах на базе архитектуры Itanium®. Фильтрация событий для точного определения узких мест Эксклюзивно для архитектуры Itanium®!
Обеспечивается идентификация таких проблем, как неоптимальная предварительная загрузка данных и некорректное размещение данных в памяти. Подсчёт всех событий не всегда полезен, поскольку они могут происходить как в критические, так и в некритические моменты времени. В системах с архитектурой Intel® Itanium® используется фильтрация, обеспечивающая подсчёт только тех событий, которые происходят в определённом разделе кода. Сокращение объема сбора данных посредством определения процессоров Эксклюзивно для архитектуры Itanium®!
Осуществляйте сбор только тех данных, которые действительно необходимы. Выборка процессоров позволит вам конкретно определить, где должен осуществляться сбор данных. Со всех процессоров, с процессоров в вашей системе или только с определённой группы процессоров. Таким образом вы сможете существенно снизить объём данных для обработки. | Простой графический интерфейс на основе среды Eclipse* используется при работе в системах на базе архитектуры Itanium®.
 Увеличить
 Увеличить
|
Примечание: Новые характеристики являются новыми в сравнении с версией 8.0. Некоторые из них были введены ранее в мелких обновлениях и бета-версиях. **Компилятор GCC использует устаревший формат Dwarf2. Если данных, необходимых для точного сопоставления вызова встроенной функции со строкой исходного кода, недостаточно, анализатор производительности VTune подберёт строку, которая подходит больше всего. При этом может возникнуть несогласование событий в окнах просмотра исходного кода и функций. Эта проблема полностью устранена в компиляторе ICC версии 8.1, использующем новый формат Dwarf3 и однозначно определяющем соответствие между вызовами встроенных функций и строками исходного кода. Несмотря на то, что в компиляторе GCC версии 4.0.2 реализована частичная поддержка формата Dwarf3, он не обеспечивает полноценного решения озвученной проблемы. |  |
|
英特尔® 软件
网络
|  | |
| | |
|