Производительность четырёхъядерных процессоровна базе микроархитектур Sandy Bridge и Lynnfieldв максимально равных условиях

0

Первое тестирование процессоров на новой микроархитектуре Sandy Bridge оставило в целом благоприятное впечатление, однако дав нам представление о сравнительной производительности различных условно «старых» и «новых» процессоров, не дало прямого ответа на достаточно интересный вопрос: как же изменилась производительность собственно архитектуры — в чистом, так сказать, виде? И хотя в тестировании присутствовали процессоры с одинаковой тактовой частотой, всё равно, вмешательство технологии Turbo Boost (которая в Sandy Bridge и Lynnfiled к тому же работает по разным схемам), неизбежно «смазывало» картину. Поэтому мы решили провести ещё одно тестирование, в котором нас в первую очередь интересовало бы сравнение не конкретных продуктов, а, так сказать «архитектурной производительности». Для этих целей мы взяли два процессора прошлого и нынешнего поколений, уравняли по возможности все характеристики, и отключили технологию Turbo Boost. Получилось у нас следующее:

Процессор
Core i5-760Core i5-2500K
Кодовое наименование ядра
LynnfieldSandy Bridge
Количество ядер
44
Hyper-Threading
Turbo Boost
−¹−¹
Тактовая частота
2,8 ГГц2,8¹ ГГц
L1 (I+D, на ядро)
64 КБ64 КБ
L2 (на ядро)
256 КБ256 КБ
L3 (общий для всех ядер)
8 МБ6 МБ
Расширения команд
SSE 4.2SSE 4.2 + AVX
¹ — Параметр принудительно изменён с помощью соответствующих установок BIOS

Как видите, процессоры действительно поставлены в максимально возможно равные условия, не удалось уравнять только то, над чем BIOS бессилен: объём L3-кэша (а этот параметр, кстати, не в пользу Sandy Bridge) и поддержку дополнительного набора команд AVX (но о нём программное обеспечение образца 2010 года, по идее, всё равно ничего знать не должно). Посмотрим теперь на результаты тестов.

Трёхмерные пакеты: интерактивная работа

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
3ds max
14817619%
Lightwave
14718123%
Maya
13416523%
UGS NX 6
9316274%
Pro/ENGINEER
12615221%
SolidWorks
1071157%
Средний балл
12615926%

Сразу обращает на себя внимание воистину фантастический прирост в пакете UGS NX 6 (забегая вперёд: этот пакет с различными результатами участвует сразу в двух группах тестов, и во второй группе результат пусть и менее, но всё равно столь же ошеломляющий). Понятно, что имея дело с двумя «чёрными ящиками», одним — в виде процессора, другим — в виде ПО с закрытыми исходниками, мы не можем выдвинуть ни одной гипотезы, которая была бы подтверждена какими-либо аргументами: потому что аргументы можно было бы почерпнуть только «раскрыв» хотя бы один из чёрных ящиков, что нам по определению недоступно. Однако логика и здравый смысл подсказывают, что подобная «сверхоптимизация» в ядре Sandy Bridge скорее всего явилась следствием не глобального прорыва в инженерной мысли сотрудников R&D Intel, а наоборот — устранения какого-то досадного, уже известного им на этапе разработки Sandy Bridge недостатка в ядре Lynnfield. Впрочем, это всего лишь догадки, не более.

Однако показатели прочих пакетов всё равно впечатляют, пусть и не настолько сильно. Средний прирост — 26%! То есть, если рассуждать совсем примитивно, то получается, что для того, чтобы догнать в данной группе тестов Sandy Bridge, работающий на частоте 2,8 ГГц, Lynnfield понадобилось бы работать на частоте порядка 3,5 ГГц!

Трёхмерные пакеты: рендеринг

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
3ds max
1671734%
Lightwave
12014622%
Maya
13114813%
Средний балл
13915612%

Здесь прежде всего обращает на себя внимание совершенно разная реакция различных пакетов: весьма скромный (особенно если сравнивать с предыдущей подгруппой) 4% прирост в 3ds max, уже более существенные 13% прироста в Maya, и снова более чем внушительный 22% прирост в Lightwave. И снова хотелось бы дать какие-то объяснения, но... скажем честно: объяснений в этом материале будет мало. «Чёрные ящики»... Нам остаётся просто наблюдать картину изменений, и пытаться делать выводы разве что накапливая статистику.

Научно-инженерные вычисления

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Maya
13014310%
UGS NX 6
9514856%
Pro/ENGINEER
12714716%
SolidWorks
12215729%
MAPLE
1311439%
Mathematica
13516019%
MATLAB
14816310%
Средний балл
12715220%

Про UGS NX 6 мы уже писали раньше, поэтому сосредоточимся на результатах других пакетов. Но всё равно никакой общей картины не складывается. Подтесты Maya, Pro/ENGINEER и Maple в данной подгруппе в значительной мере «однопроцессорные» — и вроде бы прирост относительно скромен. Но SolidWorks тоже не умеет толком задействовать более одного CPU — а в этом пакете прирост почти 30%! Mathematica и MATLAB более одного ядра задействовать умеют — а прирост совершенно разный. Картинка рассыпается на куски, потому что мы понятия не имеем (во всяком случае, пока), какие блоки Sandy Bridge стали быстрее Lynnfield (и насколько), и, в равной степени — понятия не имеем, какие команды более часто используются в каком из тестируемых пакетов.

Графические редакторы

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
ACDSee
13316524%
Paintshop
14216315%
Photoimpact
15517010%
Photoshop
13616320%
Средний балл
14216516%

Здесь можно было бы как-то притянуть за уши гипотезу о том, что чем выше многопоточная оптимизация, тем выше и прирост, но... сопоставление результатов ACDSee и Adobe Photoshop не оставляют от этой гипотезы камня на камне. Всё просто случайно. По крайней мере, внешне, и с нашим нынешним уровнем знаний о микроархитектуре Sandy Bridge (да и Lynnfiled, в общем-то, тоже...)

Архиваторы

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
7-zip
1341340%
RAR
15718618%
Unpack (RAR)
15217113%
Средний балл
14816411%

Группа архиваторов, по крайней мере, добавляет один факт в нашу копилочку знаний о новом ядре: бывает и так, что никакого преимущества Sandy Bridge не демонстрирует вообще (подтест 7-Zip).

Компиляция

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Средний балл
1361446%

Отлично многопоточно оптимизированный тест — и довольно скромный (особенно на фоне предыдущих достижений) прирост.

Java

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Средний балл
12414215%

Ещё один отлично многопоточно оптимизированный тест — и в 2,5 раза больший прирост. Лотерея, просто лотерея... Применительно к конкретному приложению, мы не можем как-то предсказать, насколько быстрее окажется Sandy Bridge. Правда, накопленная на данном этапе статистика позволяет с уверенностью предполагать хотя бы одно: скорее всего, какой-то прирост будет.

Интернет-браузеры

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Google V8
14616714%
Sun Spider
19622515%
Средний балл
17119615%

Достаточно средние для данного тестирования цифры.

Кодирование аудио

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Apple Lossless
11312712%
FLAC
12414114%
Monkey's Audio
12714413%
MP3 (LAME)
13515616%
Nero AAC
13014814%
Ogg Vorbis
13615715%
Средний балл
12814614%

Здесь, может быть, следует обратить внимание на то, что прирост плавает в диапазоне 12-16% (не такой уж широкий диапазон для этого тестирования), несмотря на то, что кодеки используются самые разные, закрытые и открытые, все от различных разработчиков, не имеющих точек пересечения. Быть может, дело в том, что это — один из самых хорошо многопоточно оптимизированных тестов в нашей методике? Тогда получается такое предположение: «фантастические» цифры прироста у Sandy Bridge получаются только на одно- (или мало-) поточном ПО.

Кодирование видео

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
DivX
1281388%
Mainconcept (VC-1)
13114611%
Premiere
1371499%
Vegas
22825813%
x264
13214510%
XviD
13715715%
Средний балл
14916611%

В принципе, результаты данной группы можно считать косвенным подтверждением нашей гипотезы.

Игры

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Batman
1241283%
Borderlands
1261346%
DiRT 2
10011111%
Far Cry 2
1761929%
Fritz Chess
1341361%
GTA IV
1561560%
Resident Evil
1221307%
S.T.A.L.K.E.R.
1041073%
UT3
1461503%
Crysis: Warhead
1221328%
World in Conflict
1541689%
Средний балл
1331405%

И снова полнейшая неразбериха, не позволяющая отследить даже самой завалящей тенденции. :) Впрочем, снова два факта в копилочку знаний: GTA IV оказалась ещё одним приложением, в котором Sandy Bridge не продемонстрировал никакого прироста вообще, а игровая группа в целом продемонстрировала самый низкий средний прирост из всех групп тестов.

Заключение

Core i5-760 (TB Off)Core i5-2500K @2,8 ГГц (TB Off)Δ
Средний балл
13815714%

Честно говоря, никто изначально не надеялся, что подобный тест принесёт нам какие-то немыслимой глубины «откровения», и мы сразу всё поймём в новой архитектуре, её достоинствах и недостатках. Поэтому, пожалуй, не будем пытаться разводить глубокую философию на мелких местах. Статья про микроархитектуру Sandy Bridge вовсю готовится, и вот из неё-то мы и узнаем много нового и интересного (уж поверьте: автор подглядывал краем глаза...). Кстати, и результаты низкоуровневых микроархитектурных тестов там тоже будут, и тоже очень, очень интересные. Ну а пока...

Пока мы можем сформулировать несколько более-менее логичных предположений, на которые нас навело сегодняшнее тестирование:

  • Микроархитектура Sandy Bridge была сильно переделана. Мы пока не можем судить о том, насколько глубоко, но по факту она существенно более эффективна: при прочих равных параметрах и при на четверть урезанном L3-кэше, она практически везде демонстрирует прирост, и в среднем его значение равно 14% (а уж какие пиковые «всплески» встречаются...)
  • Даже зная более-менее детально микроархитектуру нового ядра, вряд ли можно делать какие-то обоснованные предположения относительно изменений в производительности конкретных (и ещё не протестированных) приложений. Даже сейчас, глядя на результаты пяти десятков различных тестов, мы можем констатировать одно: ни в какую общую картину они не складываются. Единственная «общая картина» — это те самые 14% прироста в среднем.
  • Несмотря на более чем внушительное количество тестов, мы не обнаружили ни одного случая, когда ядро Sandy Bridge, работающее на одной частоте с Lynnfield, оказалось бы медленнее.
  • Очень осторожно, можно обратить внимание на следующую закономерность: в рамках нашей методики тестирования, самый большой (выше 20%) прирост Sandy Bridge демонстрирует чаще всего на достаточно слабо многопоточно оптимизированном ПО.
  • Ну а если уж совсем «зажигать» в рамках непроверенных смелых гипотез, то можно попытаться как-то увязать предыдущий факт с уменьшившимся объёмом L3 — чисто теоретически, эффективность работы нового ядра с большим количеством параллельно исполняемых потоков, может упираться в объём общего для всех них кэша.

В целом, можно сделать один достаточно банальный (на фоне результатов тестов) вывод: Sandy Bridge существенно лучше предыдущего ядра. Может, не настолько, насколько Core 2 (Conroe) был лучше Pentium 4 — но на архитектурном уровне это уж точно это более существенный шаг вперёд, чем Nehalem на фоне последних инкарнаций того же Core 2.

Процессоры Intel Core i5-760 и Core i5-2500K
предоставила на тестирование компания



Станислав Гарматюк
0 комментариев
Комментировать
Согласен с правилами
Комментировать