Хотя существует множество факторов, которые могут повлиять на принятие решений о покупке ПК, производительность по-прежнему остается главной проблемой для компаний любого размера. Многие компании обращаются к тестам производительности, чтобы определить, какая система лучше всего соответствует их потребностям. Тем не менее, эти тесты могут не дать полной картины производительности. Основаны ли они на профессиональных приложениях или в основном на потребительских нагрузках? Какие были условия окружающей среды? В этой статье мы рассмотрим некоторые ключевые моменты использования тестов для оценки производительности современных ПК для бизнеса, а также то, как выбрать правильную систему для текущих и будущих потребностей.
Содержание статьи
- 1 Старый метод измерения производительности ПК
- 2 Оценка производительности с помощью реальных тестов
- 3 Что является хорошим эталоном?
- 4 Не все тесты на основе приложений равны
- 5 Оценка потенциала производительности платформы
- 6 Многозадачность — сложная задача
- 7 Другие важные соображения
- 8 Остерегайтесь ошибки измерения
- 9 Заключение
Старый метод измерения производительности ПК
Традиционно компании использовали различные физические характеристики, такие как частота процессора и размер кэш-памяти, чтобы установить базовый уровень для ПК спектакль. У этого подхода есть две проблемы. Во-первых, у вас может быть два процессора, которые работают с одной и той же частотой, и вы увидите резко разную производительность из-за эффективности их базовых реализаций, что измеряется как «количество инструкций за такт» (IPC). Вторая проблема заключается в том, что для большинства современных процессоров частота не является постоянной величиной. Это особенно актуально для процессоров в портативных компьютерах, где частота ограничена тепловыми соображениями. Частота также будет сильно различаться в зависимости от типа выполняемой задачи, продолжительности задачи, количества используемых ядер и т. Д.
Оценка производительности с помощью реальных тестов
Современные приложения очень сложны и включают различные базовые алгоритмы и шаблоны доступа к данным. В результате измеренная эффективность процессора, то есть его IPC, часто будет существенно различаться между приложениями и даже между рабочими нагрузками. Многие приложения включают функции, которые включают отображение графики на экране, чтение данных из хранилища или даже из сети; для этих рабочих нагрузок производительность ЦП, хотя и важна, не единственный фактор, который следует учитывать.
Один из лучших способов оценить производительность нового ПК — это провести реальный тест. Другими словами, заставьте реальных пользователей выполнять свои повседневные задачи в рабочей среде, используя реальные данные. Опыт этих пользователей, вероятно, будет лучше коррелировать с их будущим удовлетворением и будет более точным, чем любой опубликованный эталонный тест. Однако у этого подхода есть и недостатки, в том числе время, необходимое для выполнения оценки, сложность принятия решения о том, какие рабочие нагрузки следует измерять, и проблема измерения производительности последовательным, надежным и непредвзятым образом.
Для индивидуального пользовательского тестирования следующим лучшим подходом будет использование штатными разработчиками входных данных от пользователей и создание «индивидуальных» сценариев для измерения производительности приложений в соответствии с приоритетами этих пользователей. Такой подход может улучшить согласованность измерений производительности и обеспечить повторяемость результатов. Тем не менее, это все еще сложная задача, и ее может быть трудно поддерживать между разными поколениями ПК.
Вместо этого большинство компаний полагаются на результаты стандартных тестов ПК для оценки производительности системы. Вместо того, чтобы просто использовать один эталонный тест, компании могут получить более широкую картину производительности, построив совокупный балл по нескольким тестам.
На рисунке 1 сравниваются три различных подхода к оценке производительности ПК — тесты, сценарии приложений и оценки пользователей. и показывает, как результаты имеют разные уровни актуальности для бизнеса.
Рисунок 1. Стратегия оценки ПК
Что является хорошим эталоном?
Для оценки производительности ПК обычно используются два типа тестов: «синтетические» и «прикладные». Оба типа могут быть полезны в процессе принятия решений, хотя отдельные тесты часто могут иметь нежелательные атрибуты. Это можно смягчить, следуя общему принципу совместного использования нескольких тестов для получения более широкой и надежной картины производительности.
Хороший тест должен быть максимально прозрачным с четким описанием того, что это за тест тестирование и методы его тестирования. В случае тестов на основе приложений это позволяет покупателям понять, соответствуют ли используемые рабочие нагрузки использованию в их организации. Без достаточной прозрачности также может возникнуть вопрос о том, выбраны ли тесты для выделения одной конкретной архитектуры над другой.
Не все тесты на основе приложений равны
Тесты в ориентированных на приложение тестах должны представлять рабочие нагрузки, наиболее актуальные для организации. Например, если 30–50% результатов теста получены из приложений, которые редко используются в коммерческих целях, то этот результат, вероятно, не имеет значения. Рассмотрим тест на рисунке 2, который основан в основном на рабочих нагрузках потребительского типа и имеет низкий процент использования офисных приложений. Таким образом, этот тест, скорее всего, не будет полезен для большинства коммерческих организаций.
Рис. 2. Состав теста, не подходящий для коммерческих сред
Некоторые тесты производительности приложений измеряют производительность готовых приложений, но они могут не отражать версию приложения, развернутую в организации, или включать последние оптимизации производительности от поставщиков программного обеспечения. Вот здесь-то и появляются синтетические тесты.
Оценка потенциала производительности платформы
В отличие от тестов на основе приложений, синтетические тесты измеряют общий потенциал производительности конкретной платформы. Хотя тесты приложений показывают, насколько хорошо платформа оптимизирована для определенных версий определенных приложений, они не всегда являются хорошим показателем производительности новых приложений. Например, многие решения для видеоконференцсвязи используют несколько ядер ЦП для выполнения таких функций, как использование виртуального фона. Синтетические тесты, которые измеряют многопоточные возможности платформы, могут использоваться для прогнозирования того, насколько хорошо платформа может предоставить эту новую функциональность.
В синтетических тестах важно избегать использования узких критериев производительности. Отдельные процессоры, даже в одном семействе, могут различаться по способу обработки даже небольшого фрагмента кода. Оценка синтетического эталонного теста должна включать несколько отдельных тестов, выполняющих больше строк кода, выполняющих различные рабочие нагрузки. Это дает гораздо более широкое представление о производительности платформы.
Многозадачность — сложная задача
Тестам приложений сложно имитировать рабочую нагрузку рабочего стола современного многозадачного офисного работника. Причина этого в том, что одновременный запуск нескольких приложений может увеличить погрешность тестирования, чем простое тестирование одного приложения за раз. Синтетические приложения, которые измеряют чистую многопоточную вычислительную мощность платформы, являются хорошим показателем для требований современных многозадачных пользователей.
Лучшая практика — рассматривать результаты тестов как на основе приложений, так и на синтетических тестах. Комбинируя оценки с использованием среднего геометрического, вы можете учесть различные шкалы оценок в разных тестах. Это дает наилучшую картину производительности для конкретной платформы с учетом приложений, используемых сегодня, и обеспечения будущего.
Другие важные соображения
Тесты производительности являются важной частью системная оценка. Однако эти мощные инструменты могут иметь некоторые ключевые ограничения:
- Измеренная производительность тестов может варьироваться в зависимости от операционной системы (ОС) и версии приложения — убедитесь, что эти версии соответствуют тому, что используется в вашей среде.
- На оценки могут влиять другие условия, например фоновые задачи, температура в помещении и функции ОС, такие как включение безопасности на основе виртуализации (VBS). Опять же, убедитесь, что условия такие же и соответствуют вашим развертываниям.
- Некоторые пользователи могут использовать относительно нишевые приложения и функции, не охваченные тестами. Подумайте о том, чтобы дополнить результаты тестов измерениями пользователей и сопоставить их с результатами синтетических тестов.
Остерегайтесь ошибки измерения
Любое измерение будет иметь предел «погрешности измерения», то есть насколько она может варьироваться от одного теста к другому. Большинство тестов имеют общую ошибку измерения в диапазоне 3-5%, вызванную множеством факторов, включая ограничения времени измерения, «эффект бабочки» незначительных изменений в фоновых задачах ОС и т. Д. Один из способов преодоления этой ошибки — измерять результаты пять раз, отбрасывать самые высокие и самые низкие оценки и брать среднее из трех оставшихся оценок.
Важно учитывать погрешность измерения при установке требований в заявках на закупку. Если оценка X хорошо коррелирует с удовлетворенностью пользователя, то в заявке должно быть указано, что оценки должны находиться в пределах [X-Epsilon, Epsilon]где эпсилон — это известная ошибка измерения. Когда эпсилон неизвестен, разумно предположить, что он находится в диапазоне 3-5% от целевого показателя.
Заключение
Правильная оценка производительности не является одномерная задача. Есть несколько методов, которые могут использоваться организацией, чтобы определить, какая система лучше всего соответствует их потребностям. Использование узкой оценки производительности может привести к неверным выводам, в то время как лучшая общая картина производительности получается при просмотре широкого диапазона тестов как для приложений, так и для синтетических тестов.
Последний и лучший шаг в любой оценке — это позволяют группам пользователей «тестировать» системы в их реальной рабочей среде. Независимо от того, насколько хорошо система показывает результаты тестов или скриптов приложений, пользователи должны быть довольны своим опытом. Независимо от того, используете ли вы тесты, сценарии приложений или организационные испытания для измерения производительности, процессоры AMD Ryzen PRO 4000 обеспечивают новый уровень скорости и эффективности, порадуя современных пользователей. Узнайте, как получить производительность ноутбука, отвечающую современным требованиям к вычислительной технике, а также мощность для удовлетворения будущих потребностей бизнеса.
Для получения дополнительной информации о том, как процессоры AMD Ryzen PRO могут удовлетворить потребности вашей организации в производительности, посетите: https://www.amd.com/en/processors/laptop-processors-for-business или https://www.amd.com/en/ryzen-pro
Авторские права © 2020 IDG Communications, Inc.