7970 энергопотребление. Видеокарты

Вид на область VRM.

Был ШИМ-контроллер Volterra, а стал Chill. И в том, и в другом случаях доступна программная регулировка напряжения Vgpu.

Как я уже говорил, пять фаз Tahiti прилично разогреваются в нагрузке, а у Cayman, наоборот, пусть не столь крепкие на вид, зато прохладные, и боюсь, что с лучшим КПД.

реклама

  • Подробный вид фазы GPU HD 7970.

  • Аналогичный вид фаз HD 6970.

С обратной стороны расположена логика фаз питания, состоящая из семи элементов, поскольку для памяти и графического процессора используются идентичные компоненты.

реклама

Идентифицировать производителя весьма трудно.

На HD 6970 элементы были различны, одни для питания GPU, другие для памяти.

Система охлаждения

Обе турбины систем охлаждения выполнены в одном ключе. Но ради улучшения эффективности и повышения количества проходящего через радиатор воздуха AMD переработала профиль и длину лопастей. Они стали тоньше и длиннее, а круглая поверхность основания уменьшилась в диаметре. Данные методы значительно повлияли на расход, впрочем, и на шумность тоже.

Избавившись от второго DVI порта, задняя панель получила дополнительное место для вывода нагретого воздуха. Боковое сопло в кожухе теперь глухое, а сам он изнутри не препятствует прохождению воздушного потока. Диаметр отверстия под крыльчатку турбины увеличился на несколько миллиметров вслед за изменившимся профилем.

Габариты радиатора выросли в ширину и длину. Соответственно изменился в большую сторону и объём испарительной камеры.

Алюминиевая пластина, охлаждающая элементы питания и памяти, видоизменилась с приходом иного дизайна размещения элементов.

реклама

Увеличилось число пластин радиатора, но расстояние между ними осталось прежним.

На снимке хорошо видно, насколько выросла длина радиатора, а также можно заметить отверстие крепления кожуха. Он стал легко съёмным. Достаточно открутить несколько винтов и перед вами как на ладони внутренности системы охлаждения. Можно продуть и почистить радиатор.

В угоду плотной компоновке современных системных блоков AMD решила разумно изменить стиль кожуха системы охлаждения. Так, чтобы воздух все же поступал в нормальном объёме к турбине, а не стопорился на подходе, как было с предыдущим дизайном крышки.

реклама


Видно, как эффективно и рационально сделаны обводы турбины, общая высота пространства над ней, в сравнении со старой системой охлаждения, выросла до 4-5 мм.

Тестовый стенд

В тестировании Radeon HD 7970 принимали участие следующие комплектующие:

  • Материнская плата: MSI Z68A-GD80 B3;
  • Процессор: Intel Core i7-2600К 4500 МГц (100 МГц х 45 1.44 В) или 1600 МГц во время замера шумности системы охлаждения;
  • Система охлаждения: система водяного охлаждения;
  • Термоинтерфейс: Arctic Cooling МХ-2;
  • Оперативная память: Corsair DDR3 1600 МГц, 4 Гбайта х 2 модуля (7-8-7-20-1T, 1.65 В);
  • Жёсткий диск: Crucial M4 128 Гбайт;
  • Блок питания: Tagan TG1100-U95 1100 Вт;
  • Аудиокарта: ASUS Xonar HDAV 1.3;
  • Операционная система: Microsoft Windows 7 x64 SP1;
  • Версия драйверов: для ATi/AMD Catalyst 12.1b, NVIDIA - nforce 290.xx.

Перечень используемых измерительно-контрольных приборов и инструментов

  • Шумомер: Center 320;
  • Мультиметр: Fluke 289;
  • Тарификатор электроэнергии: E305EMG;
  • Микрофон: Philips SBC ME570.

реклама

Инструментарий и методика тестирования

Для корректного замера температуры и шума использовались нижеследующие условия. Помещение, внутри которого располагается система автоматической поддержки климатических условий. В данном случае уровень температуры был установлен на отметке 26°C +/-1°C. За точностью соблюдения заданных параметров наблюдало четыре датчика, один из которых находился в 5 см от вентилятора системы охлаждения видеокарты и был ведущим. По нему происходила основная коррекция температуры в помещении.

Шум измерялся на расстоянии 50 см от видеокарты. Фоновый уровень составлял 22 дБА. В качестве жёсткого диска использовался SSD, а блок питания, помпа, радиатор с вентиляторами во время замера находились за пределами комнаты. На стенде отсутствовали иные комплектующие, издающие какие-либо шумы.

Звукозапись системы охлаждения производилась на расстоянии 10 см от вентилятора. Первые 10-20 секунд без нагрузки в режиме простоя, далее включалась 100% нагрузка с помощью программы Furmark. Наибольший уровень шума достигается в конце аудиозаписи. Заранее определялся температурный режим и шум, чтобы в процессе записи аудиодорожки вы смогли услышать именно максимальный шум.

Уровень потребления электричества (ватт) в простое оценивался по показаниям тарификатора E305EMG сразу после загрузки операционной системы. Значения, отображаемые в графике, соответствуют минимально достигнутым цифрам с прибора. Под нагрузкой видеокарты тестировались программой Unigine Heaven 2.5, разрешение, как и все настройки - максимальные. После 10-15 минут температура и обороты вентилятора достигали своего теоретического максимума, после чего данные заносились в таблицу.

реклама

Исследование потенциала системы охлаждения

Пояснения к графикам:

  • Красная линия – максимальная температура.
  • Синяя - в режиме простоя.
  • Чёрная линия показывает уровень издаваемого шума, при определённых оборотах вентилятора.

Пунктирная линия указывает на диапазон регулировки в автоматическом режиме вентилятора. В процентах указана скорость вентилятора/ов, выставленная в MSI Afterburner. Таким образом, чтобы понять, насколько нагреется видеокарта, и как сильно она будет шуметь, скажем, при 50% скорости вентилятора, достаточно провести вертикальную линию через отметку 50%.В местах пересечения получаем три значения: с красной линией – максимальную температуру в нагрузке, с синей линией – температуру в простое, с чёрной линией – шум.

Температурный режим, уровень шума и потребляемого электричества

реклама

Рабочие температуры

Градусы, °C

Порог активной фазы охлаждения у Tahiti наступает в диапазоне 80 градусов, после пересечения этой границы обороты вентилятора существенно увеличиваются. Ранее для обоих производителей отметка была смещена к 90°C. Вот в этом и заключен секрет низкой температуры HD 7970.

реклама

В тесте принимают участие видеокарты, выполненные на основе референсного дизайна.

Уровень шума


Включите JavaScript, чтобы видеть графики

Обновленная система охлаждения едва ли тише предыдущего решения. Возросшее число транзисторов приходится соответственно охлаждать, поэтому шум вентилятора практически равен уровню предыдущей видеокарты HD 6970, что, согласитесь, немалая заслуга увеличившегося радиатора с тепловой камерой. И все же Tahiti самая громкая видеокарта из трех: GTX 580, HD 6970, HD 7970. В режиме простоя предпочтение на стороне GTX 580, пусть и ценой чуть больших температур печатной платы.

В тесте принимают участие видеокарты, выполненные на основе референсного дизайна.

реклама

Потребление электричества


Включите JavaScript, чтобы видеть графики

В нагрузке видеокарты тестировались программой Unigine Heaven 2.5 и значения существенно отличаются от тех, что были приведены в режиме разгона. GTX 580 постоянно поддерживал штатные частоты, а HD 6970 местами сваливался до 575-615 МГц. HD 7970 нормально воспринял нагрузки данной программы и продемонстрировал даже меньшие значения, чем бывший лидер HD 6970. Но посмотрите, как эффективно расходует электричество GTX 580. Уровень его энергопотребления стабилизируется на 345 ваттах и остаётся неизменным на протяжении всего времени тестирования.

Послушать систему охлаждения:

И сравнить:

Разгон

Нагрузка создаётся запуском программы Furmark 1.9.1 с максимально экстремальными настройками. Мониторинг вентиляторов, температуры GPU осуществляется программой MSI Afterburner. Данные на диаграмму заносятся после фиксации оборотов вентилятора при достижении максимальной температуры.

Потенциал графического ядра в зависимости от подаваемого на него напряжения.

Графические ядра 40 нм быстро «истощаются» в плане разгона. GF110 начинает противиться на отметке ~900 МГц, Cayman ушел не так уж и далеко, всего до 950 МГц. Но не забывайте, что добрые две трети графического ядра NVIDIA работают на удвоенной частоте. А 28 нм Tahiti равнодушны к любой доступной частоте. И 1125 МГц для него не предел, я просто столкнулся с обыденной для новой видеокарты проблемой отсутствия понимающего её программного обеспечения.

Не думаю, что для ядра Tahiti частоты порядка 1.2 ГГц окажутся проблемными, больше похоже на то, что перед нами весьма склонный к разгону графический процессор. Ведь для достижения 1.1 ГГц мне не потребовалось менять ни одной настройки, ни напряжения, ни скорости вращения вентилятора. Просто сдвинул ползунок в драйверах и забыл обо всем. Не скрою и тот факт, что все больше компаний анонсируют заведомо разогнанные версии HD 7970, где частоты 1.1 ГГц - просто детский лепет. Там фигурируют числа 1.2-1.3 ГГц и это на воздушном охлаждении!

Энергопотребление в зависимости от разгона.

Энергопотребление новой видеокарты находится в умеренной зоне, но все же выше, чем у предыдущего поколения. Смею предположить, что AMD перестраховалась так, чтобы большое количество GPU поместилось в максимальное требуемое число – 250 Ватт. Рост частот едва ли сказывается на росте потребления электричества.

Cayman резко сдаёт позиции у отметки 950 МГц, а еще он активно сопротивляется разгону, существенно снижая частоту вплоть до 400-500 МГц. Поэтому считать разгон полноценным вряд ли можно, GTX 580 и вовсе сложно вписать или, лучше сказать, «подружить» с FurMark. Современные драйвера NVIDIA безупречно распознают программу и снижают не только частоты, но и потребление видеокарты. А экран ваттметра постоянно прыгает в диапазоне +/-50-70 ватт. Поэтому, с точки зрения энтузиаста, HD 7970 самая «правильная» карта из трёх.

Температура графического процессора в зависимости от его частоты.

Рост размеров испарительной камеры благоприятно сказался на температуре графического ядра. Так как энергопотребление поднималось не слишком круто, то и нагрев был умеренным. Снижение температуры у HD 6970 в районе 900-950 МГц вызвано сильным снижением частоты в 3D. Температура GTX 580 равномерно растет, несмотря на все попытки алгоритма, встроенного и в физическом виде на видеокарте, и в логическом виде в драйверах, снизить частоты GPU.

Температура VRM в зависимости от частоты GPU.

И все же силовые цепи, основанные на элементах Volterra, обладают гораздо лучшим КПД преобразования электричества. Но не забывайте, что уровень энергопотребления HD 7970 все же выше, а количество фаз меньше, чем у HD 6970.

Наши французские коллеги любезно предоставили фотографии в термокамере всех трех видеокарт.

  • GTX 580 под нагрузкой.

  • HD 6970 под нагрузкой.

  • HD 7970 под нагрузкой.

Как и следовало ожидать, менее громкий и оборотистый вентилятор позволяет прогреваться графическому ядру Cayman до больших значений. Но цепи питания едва ли набирают половинную величину температуры ядра. У GTX 580 поверхность под зоной VRM и GPU равномерно нагревается, не в последнюю очередь из-за меньших оборотов вентилятора. Но обратите внимание, зона VRM нагревается именно равномерно, по всей поверхности, без явных очагов перегрева.

HD 7970 лучше охлаждается массивным радиатором с тепловой камерой, но пятифазная система VRM создаёт локальную точку, в которой нагрев сосредоточен на небольшой площади. Дополнительные микросхемы памяти добавляют жару в общую картину нагрева. С точки зрения потребителя, HD 6970 выглядит предпочтительнее всех =).

  • GTX 580 в простое.

  • HD 6970 в простое.

  • HD 7970 в простое.

Как и следовало ожидать, наиболее холодной видеокартой стала HD 6970, в ней нагревается исключительно графическое ядро, а остальная поверхность остается прохладной. Худшей стал GTX 580, отчасти по причине приличного нагрева VRM. Непонятно, почему именно в простое зона так активно выделяет тепло. Формально, ситуацию можно списать на менее качественные элементы, обладающие меньшим КПД по сравнению с компонентами, используемыми в видеокартах AMD.

Обороты вентилятора (управление происходит в автоматическом режиме).

Объяснение холодного нрава графического ядра Tahiti кроется в данном графике. Вентилятор на HD 7970 агрессивнее раскручивается, но все же стоит отдать должное - система охлаждения справляется с 1.1 Ггц как с легким летним коктейлем.

Разгон продолжался до тех пор, пока не достигалось одно из условий: критическая температура больше 100°C, выставлен максимальный уровень напряжения в программе MSI Afterburner, частота ядра не повышается даже после очередного поднятия напряжения.

NVIDIA GTX 580

AMD HD 6970

Частота GPU, ГГц 0.875 0.900 0.915 0.930 0.950 0.975 1.000
1.175 1.175 1.175 1.175 1.175 1.225 1.300
Напряжение, мультиметр, В 1.234 1.235 1.235 1.235 1.235 1.290 1.372
Дельта, В 0.059 0.06 0.06 0.06 0.06 0.065 0.072
Температура GPU, °C 90 90 90 89 89 91 92
Температура VRM, °C 48 49 50 49 49 49 50
2350 2550 2550 2350 2350 2750 2950
407 408 409 408 407 437 480

AMD HD 7970

Частота GPU, ГГц 0.875 0.900 0.915 0.930 0.950 0.975 1.000 1.015 1.030 1.045 1.060 1.075 1.100 1.125
Напряжение, MSI Afterburner, В 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170 1.170
Напряжение, мультиметр, В 1.143 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139 1.139
Дельта, В -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03 -0.03
Температура GPU, °C 82 82 82 82 82 82 83 83 83 83 83 83 83 83
Температура VRM, °C 51 52 52 52 52 52 52 52 52 52 52 52 53 53
Обороты вентилятора max, об/мин 2625 2625 2625 2625 2625 2625 2725 2725 2725 2725 2725 2725 2725 2725
Энергопотребление Furmark, Вт 425 426 426 427 428 428 429 429 429 430 430 430 430 430

  • Часть 2 — Практическое знакомство
  • Часть 3 — Результаты игровых тестов (производительность)

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

  • GPU: Radeon HD 7970 (Tahiti)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 925 МГц (номинал — 925 МГц)
  • Частота работы памяти (физическая (эффективная)): 1375 (5500) МГц (номинал — 1375 (5500) МГц)
  • Ширина шины обмена с памятью: 384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 32/925 МГц (номинал — 32/925 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2048
  • Число блоков текстурирования: 128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 285×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 215/70/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon HD 7970 3072 МБ 384-битной GDDR5 PCI-E

Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой сторонe PCB.

За неимением собственных синтетических тестов DirectX 11 мы снова воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, известный специалист по 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7970 HD 7970 )
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990 )
  • Radeon HD 6970 со стандартными параметрами (далее HD 6970 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 590 со стандартными параметрами (далее GTX 590 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )

Для сравнения результатов новейшей видеокарты Radeon HD 7970 именно эти модели были выбраны по разным причинам. Radeon HD 6970 была взята, как прямой предшественник топового сегмента, HD 6990 — как сильнейшее (пусть и двухчиповое) решение на GPU предыдущей архитектуры, HD 5870 мы добавили, чтобы оценить прирост между двумя разными обновлениями архитектур и как GPU ровно вдвое меньшей сложности, чем Tahiti.

Выбранные решения Nvidia взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель этой компании, основанная на GPU последнего поколения. Хотя она не является конкурентом представленной видеокарты AMD по цене, её результаты интересны как максимальные для нынешних одночиповых решений Nvidia. А двухчиповая GTX 590 является экстремальным вариантом этой компании с более высокой ценой. В тестах DirectX 11 мы использовали ещё и Geforce GTX 560 Ti, которая нужна для того, чтобы оценить увеличенную геометрическую производительность нового графического процессора AMD.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В нашем устаревшем тесте фильтрации 32-битных текстур из RightMark большинство видеокарт показывает цифры, далёкие от теоретически возможных. Вот и результаты текстурной синтетики в случае видеоплаты Radeon HD 7970 не дотянули до пикового значения, поэтому мы ещё раз рассмотрим скорость текстурирования по цифрам из теста 3DMark Vantage, в котором всегда получаются более реалистичные цифры.

У нас же получилось, что HD 7970 выбирает лишь до 80 текселей за такт из 32-битных текстур при билинейной фильтрации, что значительно ниже теоретической цифры в 128 отфильтрованных текселей. В остальном, всё получилось предсказуемо — все платы производства AMD показали более высокую производительность и опережают видеокарты компании Nvidia. Ведь даже топовая одночиповая Geforce GTX 580 имеет лишь 64 TMU и поэтому сильно уступает модели на базе чипа Tahiti, имеющем 128 TMU, работающих на более высокой частоте. Поэтому и разница более чем двукратная. Ну а двухчиповый GTX 590 в этом тесте показывает явно неадекватный результат.

Вариант платы на двух GPU от компании AMD также явно некорректно работает в нашем тесте, ведь HD 7970 обгоняет почти всегда даже его. Ну а своего предшественника новая модель обогнала примерно на 30%, что чуть хуже теоретически возможного значений. Впрочем, в случаях с малым количеством текстур, когда больше всего сказывается пропускная способность памяти, результат ещё ниже — порядка 25%.

Рассмотрим эти же результаты в тесте филлрейта:

Цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат почти всегда остаётся за новой топовой видеокартой из семейства Radeon HD 7900. Она имеет рекордное количество TMU, работающих на более высокой частоте и более эффективных в нашем синтетическом тесте. Переходим к текстам простых пиксельных шейдеров.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты слишком просты для современных GPU и в основном ограничены производительностью текстурирования и иногда филлрейтом. Поэтому они показывают далеко не все возможности современных видеочипов, но интересны с точки зрения устаревших игровых приложений. В двух самых простых тестах новый Radeon HD 7970 почти догнал даже двухчиповый HD 6990, но в более сложных занял позицию между HD 6990 и HD 6970. Интересно, как отличается поведение тестов на GPU разных архитектур. И тут Tahiti несколько ближе к GF110, чем к предшественнику. Естественно, не по абсолютным цифрам, разница в них весьма велика — от полутора до двух раз.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, поэтому новый Radeon HD 7970 получился быстрее предшествующего HD 6970 примерно на 30-40%, что соответствует теории. Все платы AMD опережают обе топовые модели Geforce, разве что в сравнении HD 5870 и GTX 590 всё не так однозначно. В неудачах Nvidia в этих тестах явно виноват недостаток скорости текстурирования. Но даже пиксельный шейдер освещения тремя источниками по Фонгу, больше зависящий от математической производительности GPU, при запуске на GF110 сильно уступает и Cayman и уж тем более Tahiti.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Вот и в этот раз получилось примерно то же самое, HD 7970 расположился примерно между одночиповой и двухчиповой моделями на базе Cayman из серии HD 6900. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков, и Tahiti тут не исключение.

Интересно, что в этом тесте HD 5870 обгоняет HD 6970, и похоже, что так получилось из-за худшей эффективности исполнения этого шейдера на более новом чипе с VLIW4 архитектурой. Так что, хотя новый Radeon HD 7970 и обошёл HD 6970, он оказался быстрее HD 5870 в этом тесте лишь на 20%.

Во втором, сильнее зависящем от скорости текстурирования, тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте у решений компании AMD всегда всё прекрасно, и HD 7970 обеспечивает очень хороший результат, хотя и хуже, чем у двухчиповой HD 6990, но гораздо лучший, чем у предшественника на Cayman. Топовая одночиповая плата Nvidia отстала более чем в 2,5 раза!

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа, а также эффективность исполнения сложных программ. И производительность новой видеокарты AMD в тесте «Frozen Glass» оказалась не просто хорошей, но отличной! Вот что значит повышенная эффективность нового GPU. Radeon HD 7970 в первом тесте оказалась заметно быстрее даже чем двухчиповая HD 6990. А даже двухчиповая плата Nvidia осталась далеко позади, не говоря уже о Geforce GTX 580.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немного лучше, и GTX 580 почти достаёт HD 6970. А вот до представленной сегодня HD 7970 очень далеко — новинка AMD опережает лучшую плату Nvidia на 80%, что явно говорит о влиянии и математических расчётов и скорости текстурирования. Интересно, что совсем старая HD 5870 снова быстрее, чем HD 6970. Да и новая HD 7970 обогнала предшественницу на 60%, что явно не оправдать сухими теоретическими цифрами. Тут сказалась заметно большая эффективность скалярной архитектуры, по сравнению с VLIW.

Впрочем, в случае видеокарт AMD всё очень сложно из-за PowerTune. Ведь синтетические тесты очень сильно «грузят» GPU расчётами и энергопотребление плат с поддержкой PowerTune в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота GPU, а вместе с ней и результаты будут показаны ниже, чем ожидалось. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для обеих видеоплат Nvidia ситуация стала ещё печальнее, так как со скоростью текстурирования у всех современных чипов AMD всё намного лучше, и в этих тестах они лишь наращивают своё бесспорное преимущество. Даже двухчиповая GTX 590 не может соперничать с одночиповым HD 6970 в обоих тестах с упором на текстурирование, не говоря о GTX 580. Ну а представленная сегодня плата из семейства Radeon HD 7900 оказалась быстрейшей среди одночиповых карт, уступив только HD 6990. Разница между HD 7970 и HD 6970 оказалась равна 26-28%, что хорошо объяснимо теоретически, так как разница в скорости текстурирования у новинки немногим больше.

Но это были устаревшие задачи, в основном с упором в текстурирование, и иногда в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В самых сложных DX9-тестах из RightMark видеокарты производства Nvidia всегда выступают очень сильно, в противоположность всем предыдущим испытаниям нашего обзора. Эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения шейдерного кода. И ранее Radeon HD 6970 явно улучшил позиции AMD в данном тесте, увеличив эффективность при переходе от архитектуры VLIW5 к VLIW4.

Ну а сегодня мы увидели очередной скачок в производительности решений компании, Radeon HD 7970 поднял их на недосягаемый уровень — новая одночиповая видеоплата обошла даже двухчиповый HD 6990 в обоих тестах! Эти задачи — отличный пример улучшения реальной производительности сложных вычислений при переходе от VLIW к скалярному исполнению.

Итак, в тестах сложных пиксельных шейдеров версии 3.0 новая топовая видеокарта AMD смогла не только догнать конкурентов, но и опередить со значительным запасом, чего не было очень давно. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется и архитектура Nvidia и новейшая скалярная архитектура AMD. Эти тесты одни из первых, где мы отмечаем явное улучшение эффективности и наибольшую положительную разницу между предыдущей и новейшей архитектурами компании AMD по скорости.

Но приведём цифры, чтобы не быть голословными. Представленная новинка Radeon HD 7970 быстрее предшественницы более чем вдвое, и на 60-70% быстрее Geforce GTX 580, о чём совсем недавно мы даже и подумать бы не решились. Ведь решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, но видеокарты на Cayman смогли к ним приблизиться, а быстрейший из Tahiti наконец-то опередил конкурента.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, и от эффективности выполнения сложных программ. В варианте без суперсэмплинга дополнительное влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории, но для быстрейших решений разница несколько ниже.

Ранее в тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia были заметно сильнее, но начиная с предыдущего поколения компании AMD, разница начала сокращаться. Что же получилось у Radeon HD 7970? Отличный результат — новинка AMD снова оказалась быстрее двухчиповой платы предыдущего поколения, а одночиповая HD 6970 отстала вдвое, что явно говорит об увеличении эффективности новой архитектуры Southern Islands. Да и решения компании Nvidia остались позади, даже двухчиповая GTX 590 уступила представленной сегодня топовой модели Radeon HD 7970.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia всегда падают, по сравнению с показателями видеокарт AMD. Теперь разница в эффективности выполнения данной задачи ещё более очевидна, и новая модель HD 7970 быстрее HD 6970 в 2,5 раза! Примерно столько же новинке уступила и Geforce GTX 580. Вполне естественно, что даже HD 6990 осталась далеко позади, а новая плата укрепила лидерство, да какое…

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Эта диаграмма похожа на предыдущую без включения SSAA, но позиции Nvidia ещё немного ослабли, да и Radeon HD 6990 почти догнала представленную сегодня модель. В обновленном D3D10-варианте теста без суперсэмплинга HD 7970 показывает отличный результат, значительно опережая и HD 6970 и GTX 580 и даже GTX 590. Лидерство делят HD 7970 и HD 6990, а две старые видеокарты производства AMD показывают схожие результаты и сильно (в два и более раза медленнее новой модели) отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD улучшили свои показатели относительно решений Nvidia.

И теперь Radeon HD 7970 снова становится единоличным лидером сравнения, показывая результаты выше, чем у HD 6990. Более старые одночиповые платы компании далеко позади, вместе с ними и Geforce GTX 580. И лишь более дорогие двухчиповые варианты от AMD и Nvidia способны хоть как-то приблизиться к свежей видеоплате. В общем, по двум шейдерным D3D10 тестам можно сделать вывод, что новая архитектура AMD и её представитель на чипе Tahiti великолепно справляется с «шейдерными» задачами, даже лучше традиционно сильных в них конкурентов от Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно соответствуют разнице в частотах и количестве исполнительных блоков, но с некоторым влиянием разной эффективности их использования. Все последние архитектуры AMD в таких случаях имеют подавляющее преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD снова оказываются значительно более производительными.

Решения расположились примерно соответственно теории, но за некоторыми исключениями. На практике открылись некоторые нюансы, связанные с различной эффективностью. Теоретически, Geforce GTX 580 должна быть более чем вдвое (2,4 раза) медленнее, чем новая модель Radeon HD 7970, на практике же разница составляет лишь 80%, что значительно меньше. Да и при сравнении с HD 6970 возникают вопросы оптимизации новой архитектуры и драйверов для неё к этому тесту. При теоретическом превосходстве по вычислениям в 40%, новая плата AMD лишь на 28% быстрее предыдущей — HD 6970, а ещё меньше дистанция между ней и совсем старой HD 5870, основанной на VLIW5-архитектуре. То ли тест действительно лучше подходит для VLIW (особенно для VLIW5), то ли виноваты ещё сырые драйверы.

Есть и ещё одно объяснение — возможно, на результаты плат HD 7970 HD 6970 в этом тесте повлияла технология PowerTune, снизившая частоты при достижении предела энергопотребления. Впрочем, всё это мало что меняет при сравнении с конкурентом, ведь даже дорогущая двухчиповая плата Geforce GTX 590 лишь достигла уровня HD 6970 и HD 5870. А уж одночиповая GTX 580 так и вовсе далеко позади.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Мы видим почти идентичную предыдущей диаграмму, за исключением абсолютных цифр. В этот раз все GPU остались примерно на тех же позициях, ну разве что видеоплаты на базе Cayman и Cypress поменялись местами — теперь чуть-чуть быстрее более новая модель, но совсем незначительно. Хотя строгого соответствия теоретическим цифрам пиковой производительности всё так же нет, но их результаты всё-таки близки к сухой теории. Разница между HD 7990 и HD 6970 немного увеличилась.

В остальном, мы не нашли на графике ничего нового. Скорость рендеринга в этом тесте ограничена исключительно производительностью шейдерных блоков и их эффективностью, поэтому двухчиповая HD 6990 снова стала явным лидером, а за ней на приличном отдалении следует сегодняшняя новинка от AMD. Обе платы Geforce уступают даже устаревшей модели из семейства Radeon HD 5800, но и в этот раз преимущество решений AMD остаётся несколько меньшим, чем при сравнении теоретических цифр, и это снова говорит о худшей оптимизации или влиянии PowerTune.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не слишком сложная, и производительность ограничена в основном скоростью обработки геометрии, но ещё и пропускной способностью памяти/филлрейтом (в рамках решений одного производителя).

В этом тесте должны были проявиться улучшенные возможности Southern Islands по обработке геометрии, вот они и проявились. Новая видеокарта AMD действительно гораздо быстрее выполняет геометрические расчёты, по сравнению со всеми предыдущими решениями компании. Хотя AMD дала цифры прироста до 4 раз, но в этом тесте геометрическая производительность выросла примерно в 1,5-2 раза. В итоге, одночиповая видеокарта оказалась примерно на том же уровне, что и двухчиповая модель Radeon HD 6990 на GPU предыдущего поколения.

Столь значительное улучшение привело к тому, что Tahiti практически догнала топовую видеокарту Nvidia, хотя выполнение геометрических шейдеров у той в некоторых условиях должно быть ещё эффективнее. Ранее видеокарты Nvidia справлялись с работой примерно вдвое быстрее аналогичных видеокарт конкурента, а теперь разницы совсем нет. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились для решений Nvidia и большинства плат AMD. Лишь новая видеокарта из семейства HD 7900 в данном тесте слабо отреагировала на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Поэтому плата показала результат чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, и новая архитектура от компании AMD показывает себя просто отлично, даже немного обгоняя конкурента в лице Geforce GTX 580! Обе двухчиповые платы тут показали некорректные результаты, поэтому с ними сравнения не получится. Зато HD 7970 на 40-50% быстрее своей предшественницы — модели HD 6970, что явно объясняется архитектурными изменениями в GPU. Отличные результаты карты на Tahiti явно свидетельствуют о проведённой оптимизаций в блоках обработки геометрических данных в новом чипе.

Цифры должны сильно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот тут рекорда у Radeon HD 7970 не получилось, всё-таки разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с Tahiti с двумя растеризаторами) и чипами с архитектурой Fermi, имеющей распараллеленную обработку геометрии, хорошо заметна. И результаты Geforce GTX 580, имеющей в своей основе чип GF110, хороши настолько, что она обгоняет лучшее из решений компании AMD (а это анонсированная сегодня модель) на 35-40%.

Хотя возможности новенького топового чипа AMD по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с предыдущими видеокартами компании, и первое решение на чипе Tahiti показывают в этих тестах результаты на 22-28% выше, чем решения на базе Cayman. Вероятно, инженеры AMD решили, что такой оптимизации блоков установки треугольников и обработки геометрии будет вполне достаточно.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет сразу многое: и скорость текстурирования и пропускная способность памяти. И результаты видеокарт часто ограничены некоей преградой — посмотрите хотя бы на сравнение двухчиповой GTX 590 и одночипового аналога — между ними почти нет разницы. Хотя HD 6990 вдвое быстрее HD 6970.

Да и новая плата AMD из семейства Radeon HD 7970 показала очень хорошие результаты, почти догнав лидирующую HD 6990. Что касается одночиповых конкурентов, то она лучшая во всех трёх режимах. Преимущество над HD 6970 составило от 25% до 75%, в зависимости от режима. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

А вот в этот раз взаимное расположение карт на диаграмме заметно изменилось, и особенно это касается тяжёлого режима. При малом количестве полигонов скорость рендеринга в этом тесте упирается в ПСП, поэтому платы AMD и были так сильны на предыдущей диаграмме.

А вот в тяжёлых режимах разница между одночиповой картой Nvidia и новинкой AMD сократилась, и они соперничают между собой в довольно плотной борьбе. Старшая двухчиповая видеокарта семейства Radeon HD 6900 обгоняет все остальные решения и является лучшей в сравнении, хотя в тяжёлом режиме к ней подбирается и Geforce GTX 590. Новая же одночиповая HD 7970 выигрывает у предшественницы снова до 70%, что может говорить о сильном влиянии ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» абсолютно не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте видеокарты AMD и Nvidia, кроме HD 6990 и HD 7970, показывают очень близкие результаты, что снова можно списать на ограничение пропускной способностью видеопамяти, так как этот показатель у всех представленных видеокарт близок.

А вот новая модель из семейства Southern Islands смогла выделиться, в сложных условиях сравнения почти догнав двухчиповую HD 6990, которая стала лучшей среди всех видеокарт. Разница между картами на базе графических процессоров Cayman и Tahiti снова составила 25-70% в пользу более нового решения. Рассмотрим второй вариант этого же теста:

И тут произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а большинство решений AMD — сразу во всех. Впрочем, это не позволило платам калифорнийской компании догнать новинку семейства Radeon 7900. Которая, кстати, обогнала всех в среднем и тяжёлом режимах, уступив двухчиповой HD 6990 только один раз.

В режиме с малым количеством полигонов разница между решениями не такая большая, а вот в среднем и тяжёлом старые решения AMD уступают, затем идут платы Nvidia (двухчиповая лишь немного быстрее одночиповой GTX 580), HD 6990 и HD 7970. Анонсированная сегодня плата семейства HD 7900 в тестах вершинных выборок показала себя отлично, с запасом обогнав и конкурирующие видеокарты Nvidia и предшественников от того же производителя.

3DMark Vantage: тесты Feature

Как всегда, синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших. При анализе результатов новой видеокарты Radeon HD 7970 в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя тест компании Futuremark всё так же не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность видеокарт и AMD и Nvidia в нём заметно выше, чем в нашем из RightMark. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов, которое ближе к истине.

Первая видеокарта из нового семейства компании AMD показывает результат, близкий к соответствующему теоретическому параметру, и она справляется с работой эффективнее предыдущего поколения. Radeon HD 7970 опережает HD 6970 более чем на 50%, хотя по теории разница составляет лишь 40%. Вероятнее всего, текстурные модули Tahiti используются эффективнее из-за улучшений в системе памяти и кэширования, что и вызвало повышенный результат.

Конечно, новая одночиповая модель не дотянула до лидера — двухчиповой HD 6990, но это и не ожидалось. И всё же, хорошо видно, что текстурная производительность графического чипа Tahiti заметно выросла по сравнению с Cayman. Ну а GTX 580 проигрывает новинке по скорости текстурирования целых 2,3 раза. Даже двухчиповая карта Nvidia догоняет лишь HD 6970.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Ситуация в тесте производительности блоков ROP серьёзно отличается от теста текстурирования. Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP, но с влиянием величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»). И тут новая модель HD 7970 показывает отличный результат, отстав лишь от двух топовых видеокарт AMD и Nvidia из предыдущих поколений, имеющих по два GPU на борту.

А что же с эффективностью использования блоков ROP, которой хвалились AMD? Действительно, лишь 32 блока ROP в новом чипе Tahiti совсем не ограничивают скорость рендеринга даже в специализированном тесте. И мы отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новой видеокарты компании AMD по сравнению со старыми моделями. Разница между HD 7970 и HD 6970 более чем 50%, что явно говорит о большем влиянии уже ПСП, а не чистой производительности блоков ROP.

Что касается сравнения с Nvidia, то и тут разница по скорости (35%) соответствует теоретической разнице в ПСП (36%), а не чистой скорости блоков ROP. Получается, что 32 таких блока в Cayman просто были лишними и их возможности никогда не использовались полностью.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. Для достижения высокой скорости тут важен баланс блоков GPU, также весьма заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме в целом похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage, кроме того, что новый Radeon HD 7970 явно эффективнее и в этой задаче, ведь он снова почти догнал двухчиповую HD 6990 — отличный результат! Платы Nvidia в данном случае получили некоторое увеличение производительности, что подтверждает вывод о том, что не только текстурная производительность влияет на результаты этого теста.

Итак, новая модель компании AMD отлично выступила, совсем немного уступив двухчиповой плате на базе двух Cayman. Одночипового предшественника она обогнала на 66%. Эта цифра не соответствует ускорению от Cayman к Tahiti ни по одному из теоретических параметров и может означать улучшение эффективности исполнения сложных вычислений с ветвлениями. Даже считавшийся ранее неплохим результат Geforce GTX 580 вдвое хуже, чем у новинки AMD. Собственно, все видеокарты этого производителя оказались быстрее топовой модели линейки Geforce GTX 500 на базе одного чипа.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит от многих параметров, но уже других. Основными факторами тут являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Так что вполне логично, что именно видеокарты производства Nvidia чувствуют себя в этом приложении отлично, значительно опережая конкурентов.

И даже представленная сегодня Radeon HD 7970, несмотря на явное улучшение производительности, по сравнению с HD 6970, не смогла тут составить конкуренцию одночиповой Geforce GTX 580 и немного уступила ей. Это один из тех геометрических тестов, в которых видно преимущество у недавно видеокарт HD 6900 перед предыдущими линейками, в которых увеличили скорость обработки геометрии и выполнения геометрических шейдеров. Radeon HD 7970 улучшила результат ещё на 35%, но этого оказалось мало — решения Nvidia продолжают лидировать в этом тесте. Хотя отметим, что новая модель всё же значительно улучшила позиции компании AMD в геометрических тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но скорость обработки геометрии в нём стала ещё важнее. И поэтому видеокарты Nvidia вывались вперёд ещё дальше, оставив позади даже двухчипового монстра — Radeon HD 6990. Увы, но это факт — даже GTX 580 обогнала все платы AMD, в том числе и новёхонькую модель на базе графического процессора Tahiti.

Увы, но хотя плата, основанная на новом чипе, и показала более сильный результат, по сравнению с решениями на базе Cayman и Cypress, но от Geforce отстало. Разница между HD 7970 и HD 6970 в этом сравнении составила чуть больше 30%, что указывает на явное влияние скорости ALU. В синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, решения AMD продолжают отставать от конкурирующих видеокарт соперника, имеющих весьма высокую скорость обработки геометрии.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

Интересно, что в математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели совершенно иную картину, по сравнению с аналогичными тестами из нашего тестового пакета. Показанная на диаграмме производительность решений лишь очень примерно соответствует тому, что должно получаться по теории, а также расходится и с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0. Например, явно видно, что новая видеокарта в этом тесте подобралась гораздо ближе к теоретической скорости, по сравнению с картами на GPU с VLIW-архитектурой.

Давайте разберёмся в причинах. В своё время, HD 6970 не усилила пиковую производительность математических вычислений по сравнению с HD 5870, но одним этим отставания Cayman не объяснить. Причиной могла быть как меньшая эффективность архитектуры VLIW4, так и умная система управления питанием, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Но ведь на HD 7970 она не сказалась. Скорее всего, причина как раз в скалярной архитектуре нового чипа. Потому что соотношение цифр производительности в тесте и теоретических на это явно указывает. По теории, HD 6970 обладает 0,7 математической мощи новой карты, но по этому тесту получилось лишь 0,56. Примерно такая же разница получилась и для других плат AMD. А вот при сравнении GTX 580 и HD 7970, имеющих скалярные архитектуры, теоретическое соотношение равно 0,42 (Tahiti более чем вдвое быстрее), и практическое тоже 0,42. То есть, эффективность использования имеющихся ALU у этих чипов разных производителей абсолютно одинаковая! В отличие от Cayman и Cypress, имеющих VLIW архитектуру.

В любом случае, обеих своих конкурентов от Nvidia новая плата AMD обходит с огромным запасом, и Nvidia явно нужно резко усилить математическую мощь в будущих решениях. А пока что получается привычная картина — видеокарты Geforce показывают низкие результаты в таких случаях, когда простая и интенсивная математика выполняется на платах Radeon значительно быстрее. И выход Southern Island только усугубил ситуацию.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, это и не самый удачный пример для вычислительных шейдеров, но разницу в производительности показывает довольно чётко. Разницы между расчётами в вычислительном и пиксельном шейдерах для видеокарт AMD почти нет, а на Nvidia немного быстрее выполняется пиксельный.

AMD Radeon HD 6970 оказалась быстрее предшественницы HD 5870, и выступила на уровне Geforce GTX 580, но представленная сегодня модель HD 7970 значительно опережает их все и становится лидером (двухчиповые видеокарты в этой синтетике мы решили не использовать). GTX 560 Ti взята в основном для тестов геометрии, ну и для того, чтобы оценить разницу между решениями из разных ценовых сегментов.

Итак, анонсированные плата на новом чипе Tahiti опережает аналог на базе Cayman на 40%, что полностью соответствует разнице в теоретической производительности вычислительных блоков. В свою очередь, преимущество над конкурирующей GTX 580 равно 30-40% (в зависимости от типа шейдерной программы), что явно ниже теоретически возможного. GTX 560 Ti отстаёт очень сильно, более чем вдвое.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Результаты в этом тесте весьма необычные, для устаревших решений AMD похожие на цифры из математического теста 3DMark Vantage — Cypress оказался быстрее Cayman. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта AMD — представленная сегодня новинка Radeon HD 7970 — лишь на 21% опережает топовое решение Nvidia. И даже GTX 560 Ti не так уж сильно отстаёт. Старые модели семейств HD 6900 и HD 5800 показывают результаты, близкие к показателям Geforce GTX 580.

Больше всего нам интересна разница между результатами решений на Cayman и Tahiti, и в этом случае мы видим преимущество свежей модели, равное 36%. Это чуть меньше теоретической разницы между данными моделями, но всё-таки близко к ней. Почему же обе карты не очень ярко выступили на фоне очень старой HD 5870? Возможно, виновата сниженная PowerTune частота или недостаток оптимизации драйверов под новую архитектуру. Посмотрим, может в тестах тесселяции Tahiti наконец-то покажет значительное ускорение.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Интересно, что parallax occlusion mapping (средние столбики на диаграмме) на видеокартах от обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то давайте рассмотрим сначала попиксельные техники. В тесте простого бампмаппинга лидирует новая видеокарта AMD, она опережает и HD 6970 и GTX 580 на 27% и 36% соответственно. А вот в подтесте сложных попиксельных расчётов (вспоминаем тесты parallax mapping выше по тексту) до выхода Cayman видеокарты Geforce были быстрее решений AMD, равно как и при включенной тесселяции. С выходом Radeon HD 6970 в подтесте с тесселяцией оказались заметно быстрее HD 5870, и в тесте с небольшим коэффициентом разбиения треугольников HD 6970 обогнала даже GTX 580.

Гораздо интереснее то, что мы увидели на графике с меткой Radeon HD 7970. Тесселяция тут не слишком сложная, поэтому новая видеокарта выиграла у предшествующей модели не так уж много — около 30%. Другое дело — тест POM. В этом подтесте новая HD 7970 просто разорвала все остальные решения в клочья. Преимущество перед HD 6970 и GTX 580 лишь немного не дотягивает до двукратного. Очередной суперрезультат в тесте parallax mapping, говорящий о высокой эффективности исполнения сложных шейдерных программ.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

А вот в этом примере мы видим уже полноценное сравнение геометрической мощи решений AMD и Nvidia в разных условиях. И оно получилось весьма интересным, на наш взгляд. Сильно выделяется графическая архитектура Fermi, да и чип новой архитектуры Tahiti от AMD. Конечно, это чисто синтетический тест и экстремальные коэффициенты разбиения вряд ли будут использоваться в играх ближайшего времени, особенно учитывая тотальную мультиплатформенность. Нам интересен архитектурный потенциал, для чего и нужна «синтетика».

Если в лёгких условиях новая Radeon HD 7970 успешно конкурирует с Geforce GTX 580, опережая её в самых лёгких режимах и идёт наравне в третьем, но в самых тяжёлых условиях с очень большим количеством треугольников с видеокартой Nvidia Geforce на чипе GF110 конкурировать просто невозможно — в задачах экстремальной тесселяции она значительно быстрее даже неоднократно улучшенных чипов AMD. Новый GPU хотя и ещё раз сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко. И даже GF114 при максимальном коэффициенте разбиения оказался быстрее Tahiti.

Тем не менее, несмотря на проигрыш в наиболее суровых условиях с максимальным коэффициентом разбиения, в остальном HD 7970 на базе Tahiti выступила просто отлично, особенно по сравнению с Cayman и Cypress. Новая модель компании AMD в режимах лёгкой и средней нагрузки показывает впечатляющий прирост в скорости, и разница по сравнению с и так не медленной HD 6970 достигает 2,8 раза. Но такой прирост мы видим только в экстремальном случае, а чаще всего получается от 30 до 70%. Обещанной четырёхкратной разницы мы не увидели, по крайней мере пока.

Но максимальная разница между решениями компаний достигается в условиях экстремальной тесселяции, которых не будет в играх и приближённых к ним бенчмарках. Поэтому мы ожидаем, что Tahiti заметно улучшит позиции компании AMD в существующих тестах с применением тесселяции, вроде 3DMark11 и Heaven.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, и такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU, а не только геометрические, как в предыдущем бенчмарке.

Мы также протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. И если при самом низком коэффициенте разбиения впереди оказываются все видеокарты компании AMD, то при усложнении работы платы на основе чипов от Nvidia начинают вырываться вперёд. И при увеличении коэффициента разбиения и сложности сцены производительность абсолютно всех Radeon падает сильно, в отличие от конкурирующих решений.

Поведение Radeon HD 7970 в тесте любопытное. Сразу видно, что никаких кардинальных изменений в геометрическом конвейере сделано не было (в общем, это и не обещалось, так что никаких претензий). Если в самом лёгком режиме новая карта быстрее HD 6970 на 35%, а GTX 580 — на 64%, то уже при настройке LOD в значение 25 производительность новинки падает до уровня скорости GTX 560 Ti. Дальше — больше. При максимальном коэффициенте LOD разница между скоростью Geforce GTX 580 и Radeon HD 7970 достигла 3,5 раз!

Проверим, получили ли мы обещанную четырёхкратную разницу между HD 7970 и HD 6970. Нет, максимальное отставание графического процессора Cayman составило менее чем два раза. А чаще всего и вовсе лишь полтора. В общем, нам не очень понятно, где искать четырёхкратное ускорение тесселяции, остаётся верить на слово, что где-то оно есть. Пока же констатируем очередную победу видеочипов от Nvidia — уж очень они хороши в геометрических тестах.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новейшей видеокарты Radeon HD 7970, основанной на графическом процессоре Tahiti из семейства Southern Islands, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинка определённо станет лидером среди одночиповых решений, доступных на рынке. Это просто отличное продолжение удачных линеек Radeon HD 5800 и HD 6900, которое должно серьёзно укрепить позиции компании AMD в ближайшие месяцы.

Графический процессор Tahiti выполнен на основе новой архитектуры с применением самого современного техпроцесса 28 нм, и он очень сильно отличается от всех предыдущих чипов компании. Хотя количество некоторых исполнительных блоков в нём выросло не так значительно (вычислительные блоки ALU и блоки ROP), но новый GPU отличается важными архитектурными изменениями, направленными на увеличение эффективности вычислений на GPU, а также на улучшение позиций в производительности обработки геометрических данных. Многие из наших синтетических тестов показали, что эффективность вычислений в сложных задачах и скорость тесселяции и выполнения геометрических шейдеров серьёзно выросли, хотя и не всегда настолько, насколько нами ожидалось.

С видеочипами AMD случилось то, что обязано было случиться. То самое, что Nvidia уже прошла чуть раньше. При переносе акцента с графических вычислений на вычисления общего назначения, и соответствующем переходе от VLIW к скалярным архитектурам, а также добавлении других важных для GPGPU функций, вроде продвинутого кэширования и добавления планировщиков в каждый вычислительный блок, рост сложности чипа обязательно превысит рост пиковых показателей производительности. То есть, чисто фактически получается, что предыдущие решения могут быть эффективнее — хотя они менее производительны, но достигается это меньшими силами (в виде сложности чипа).

Поясним это на примере. Преимущество Radeon HD 7970 перед тем же Radeon HD 5870 в некоторых синтетических тестах было далеким от разницы в сложности GPU — ведь Cypress имеет ровно вдвое меньше транзисторов (2,15 против 4,3 млрд), а в тестах очень редко отстаёт настолько же сильно. Получается, что старый чип эффективнее нового? Да, но только для устаревающих чисто графических задач! В случае же неграфических вычислений, да и многих сложных 3D-расчётов, Tahiti оказался даже более чем вдвое мощнее Cypress, и это подтверждается соответствующей синтетикой. За GPGPU будущее, и задачи видеочипов будут усложняться и далее, поэтому иного пути у AMD просто не было.

Зато, благодаря архитектурным изменениям и своим характеристикам, видеокарта новой серии во многих синтетических тестах, которые ранее были «ахиллесовой пятой» решений AMD, стала более чем конкурентоспособной, особенно по сравнению с прямым конкурентом Geforce GTX 580, даже с учётом большей цены. Это отлично видно почти во всех синтетических тестах пакетов RightMark, Vantage, да и примерах из различных SDK.

Но нашлись и потенциально… ну, не то, чтобы слабые, но недостаточно сильные стороны нового GPU. К таким относится не слишком большой рост производительности в некоторых математических тестах, да и по геометрическим возникают вопросы (например, где обещанное четырёхкратное ускорение?). Несмотря на бо́льшую сложность и площадь чипа по сравнению с тем же Cayman, результаты модели HD 7970 иногда ниже ожидаемых, что не всегда можно легко объяснить. Мы предполагаем, что в этом может быть виноват недостаток оптимизации драйверов, ведь для AMD эта архитектура абсолютно новая и требует тщательной и длительной шлифовки. В некоторых тестах могла подвести и система управления питанием PowerTune, которая могла понизить тактовые частоты при достижении максимального энергопотребления в наиболее требовательных синтетических тестах, не позволяя карте показать ожидаемую производительность, исходя из числа исполнительных блоков и их тактовой частоты.

Хотя в целом результаты в синтетике были показаны весьма неплохие, и особенно приятно то, что инженеры AMD подтянули некоторые из своих слабых мест. К сожалению, в текущих играх гораздо сложнее будет добиться столь впечатляющих приростов, по сравнению с продвинутой синтетикой. Сразу по нескольким причинам. Даже просто потому, что производительность в игровых приложениях редко ограничена какой-то одной характеристикой видеокарты, в отличие от синтетики, а при такой радикальной смене графической архитектуры драйверы ещё нужно оптимизировать и оптимизировать. Кроме того, даже современные игры редко используют все возможности топовых видеокарт для ПК. Они часто упираются в скорость текстурных выборок и эффективный филлрейт (пропускную способность видеопамяти), а в таких условиях полностью раскрыться столь сложные чипы не могут. Придётся ждать или мощных ПК-эксклюзивов или следующего поколения игровых консолей.

Предполагаем, что результаты Radeon HD 7970 в синтетических тестах будут подтверждены соответствующими цифрами и в «игровой» части нашего материала. В играх новая HD 7970 должна выступить сильнее всех конкурентов и опередить Geforce GTX 580 хотя бы на 30%, а то и больше. Вероятно, получится как обычно — в некоторых тестах преимущество будет больше, а в других — его почти не будет. В любом случае, HD 7970 обязана стать лучшей среди всех одночиповых моделей AMD и Nvidia, по крайней мере, все предпосылки к этому мы нашли. Так давайте же перейдём к следующей части материала — исследованию скорости в играх.

Методика тестирования

Настройки AMD Catalyst Control Center
Antialiasing Use application settings
Anisotropic Filtering Use application settings
Tesselation Use application settings
Catalyst A.I., Texture Filtering Quality Quality, Enable Surface Format Optimization
Mipmap Detail Level Quality
Wait for V-Sync Off, unless application specifies
Anti-Aliasing Mode Multi-sample AA
Direct3D Settings, Enable Geomery Instancing On
Triple buffernig Off
Настройки NVIDIA Control Panel
Ambient Occlusion Off
Anisotropic Filtering Application-controlled
Antialiasing — Gamma correction On
Antialiasing — Mode Application-controlled
Antialiasing — Settings Application-controlled
Antialiasing — Transparency Off
CUDA — GPUs All
Maximum pre-rendered frames 3
Multi-display/mixed-GPU acceleration Multiple display performance mode
Power management mode Adaptive
Texture filtering — Anisitropic sample optimization Off
Texture filtering — Negative LOD bias Allow
Texture filtering — Quality Quality
Texture filtering — Trilinear optimization On
Threaded optimization Auto
Triple buffering Off
Vertical sync Use the 3D application settings
Набор бенчмарков
Программа API Настройки Режим тестирования Разрешение
3DMark 2011 DirectX 11 Профили Performance, Extreme

Unigine Heaven 2 DirectX 11 Макс. качество, DirectX 11, тесселяция в режиме Extreme AF 16x, MSAA 4x 1920х1080 / 2560х1440
Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 Frost flythrough. Макс. настройки, DirectX 10. AF 16x, MSAA 4x 1920х1080 / 2560х1440
Metro 2033 + Metro 2033 Benchmark DirectX 11 Макс. настройки, DirectX 11, DOF, тесселяция, NVIDIA PhysX выкл. AF 16x, MSAA 4x 1920х1080 / 2560х1440
DiRT 3 + Adrenaline Racing Benchmark Tool DirectX 11 Aspen, 8 машин. Макс. качество, DirectX 11 AF, AA 4х 1920х1080 / 2560х1440
Crysis 2 + Adrenaline Crysis 2 Benchmark Tool DirectX 11 Central Park. Макс. качество, DirectX 11, текстуры высокого разрешения AF 16x, Post MSAA + Edge AA 1920х1080 / 2560х1440
Battlefield 3 + FRAPS DirectX 11 Начало миссии Going Hunting. Макс. качество AF 16x, MSAA 4x 1920х1080 / 2560х1440
Batman: Arkham City. Встроенный бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920х1080 / 2560х1440
The Elder Scrolls 5: Skyrim + FRAPS DirectX 9 Город Whiterun. Макс. качество AF 16x, MSAA 4x 1920х1080 / 2560х1440
Call of Duty: Modern Warfare 3 + FRAPS DirectX 9 Миссия Return to Sender. Макс. качество AF, MSAA 4x 1920х1080 / 2560х1440

В качестве соперников Radeon HD 7970 GHz Editon в тестировании приняли участие следующие видеокарты:

  • AMD Radeon HD 7970 (925/5500 МГц, 3 Гбайт)
  • NVIDIA GeForce GTX 680 (1006/6008 МГц, 2 Гбайт)
  • NVIDIA GeForce GTX 670 (915/6008 МГц, 2 Гбайт)
  • NVIDIA GeForce GTX 590 (607/3414 МГц, 3 Гбайт)
  • AMD Radeon HD 6990 (880/5000 МГц, 4 Гбайт)

Дабы оба участника сегодняшней интриги, Radeon HD 7970 GHz Edition и GeForce GTX 680, выступили во всеоружии, в тестировании использовались новейшие бета-версии драйверов от NVIDIA (304.48 Beta) и AMD (Catalyst 12.7 Beta). К тому же для GTX 680 был активирован режим PCI-E 3.0, который официально не поддерживается на платформе Intel X79.

⇡ Разгон, температура, энергопотребление

Так как в наблюдаемых тактовых частотах PowerTune себя не проявляет, отправной точкой для разгона стала частота Boost Clock — 1050 МГц. С напряжением питания GPU все не так просто. Дело в том, что настройка напряжения в MSI Afterburner (возможно, что с другими утилитами происходит то же самое, мы не пробовали) больше не оказывает никакого эффекта на наблюдаемое напряжение. Чтобы его увеличить, нужно попытаться выставить более высокое постоянное напряжение с помощью соответствующей опции. Но, как бы странно это ни выглядело, от этого напряжение не перестает колебаться, просто наблюдаемые значения смещаются вверх. Таким образом, мы не можем зафиксировать напряжение, но можем сместить диапазон, в пределах которого оно изменяется. В результате если вручную установить напряжение 1,3 В, то диапазон колебаний будет около 1,227 — 1,252 В.

Надо отметить, что в некоторых случаях при игре с разными утилитами разгона и мониторинга напряжение все-таки фиксировалось на 1,3 В, но тогда, видимо, Power Tune сходила с ума, и на экране в 3D возникали сильные артефакты независимо от частоты GPU. Похоже, что не стоит пытаться побороть Power Tune, тем более что она и так хорошо делает свое дело.

Если рассматривать Boost Clock нового адаптера как стандартную частоту GPU в других «Радеонах» (а с точки зрения принципов работы Power Tune так оно и есть), HD 7970 GHz Edition разогнался даже лучше, чем обычный HD 7970: до 1240 МГц по процессору и 7320 (1830) МГц по памяти. Если отнять от 1240 МГц диапазон Power Tune Boost в 50 МГц, то получим ту частоту, которой достигают многие экземпляры стандартного HD 7970. Видимо, более длинная таблица частот позволяет разогнанному GPU достигать более высоких пиковых значений, при этом откатываясь к прежнему нижнему порогу в тяжелых задачах. Впрочем, не факт, что карта реально когда-либо достигает этих 1240 МГц, а не находится постоянно в троттлинге. Пока утилиты мониторинга не получат доступ к потрохам Power Tune, это останется загадкой.

А вот фантастический разгон памяти — это просто заслуга отличных контроллеров чипа Tahiti и чипов памяти, по-видимому, немного превосходящих те, которыми комплектуются стандартные HD 7970.

HD 7970 GHz Edition греется несколько сильнее стандартной версии — примерно так же, как GeForce GTX 680. Система охлаждения, включенная на полные обороты, позволяет при сильном разгоне сохранить такие же температуры, как и в штатном режиме, но только ценой колоссального шума. Признаем, что и при автоматическом контроле вентилятора HD 7970 GHz Edition шумит заметно сильнее, чем GeForce GTX 680.

Максимальное зарегистрированное энергопотребление карты, как и ожидалось, все-таки немного выросло по сравнению с оным у обычного HD 7970. Не думаем, что AMD обманывает, утверждая, что TDP обеих версий HD 7970 не различается. Видимо, HD 7970 GHz Edition просто более активно его осваивает. При разгоне, знамо дело, энергопотребление выстреливает в потолок. Не помешает мощный блок питания.

⇡ Radeon HD 7970 GHz Edition против GeForce GTX 680

Вот и те результаты, ради которых все затевалось. Так что же, удалось ли AMD вернуть ускользнувшее лидерство?

GeForce GTX 680 без разгона по-прежнему показывает больший результат, чем HD 7970, но среди разогнанных карт Radeon быстрее.

Игровые тесты + Unigine Heaven

При разрешении 1920х1080 в трех из девяти игровых бенчмарков (Crysis Warhead, DiRT 3, Metro 2033) Radeon HD 7970 GHz Edition оказывается впереди. В трех других побеждает GeForce GTX 680 (Unigine Heaven 2, Battlefield 3, Skyrim). В остальных играх значимых различий между соперниками нет. Идеальная ничья. В режиме 2560х1440 ситуация перевешивает в пользу HD 7970. Только в CoD 3 и Unigine Heaven GTX 680 сохраняет превосходство.

Разгон дается карте AMD лучше, чем GTX 680: прирост производительности заметно выше, и в результате HD 7970 GHz Edition берет реванш даже в 1920х1080.

⇡ Radeon HD 7970 GHz Edition против всех

  • Прискорбно для AMD, но в 3DMark 2011 Radeon HD 7970 GHz Edition уступает не только GeForce GTX 680, но и GTX 670.
  • Преимущество GHz Edition над стандартной версией заметно.

Unigine Heaven 2

  • GHz Edition прибавил несколько FPS по сравнению с обычным HD 7970.
  • В режиме 2560x1440 GeForce GTX 670 и GTX 680 имеют минимальное преимущество, но в 1920х1080 HD 7970 GHz Edition уже заметно отстает.
  • Разогнанный GHz Edition побивает Radeon HD 6990 и сравнивается с GTX 670 и GTZ 680.

Crysis Warhead (DirectX 10)

  • В этом тесте даже обычный HD 7970 легко побеждает GeForce GTX 680 за счет большей пропускной способности памяти.
  • HD 7970 GHz Edition даже немного хуже, чем GeForce GTX 590, а разогнанный GHz Edition сравнялся с Radeon HD 6990.

Metro 2033 (DirectX 11)

  • Преимущество HD 7970 GHz Edition перед обычной версией невелико.
  • HD 7970 GHz Edition заметно быстрее, чем GeForce GTX 680.
  • В разгоне GHz Edition достигает уровня GeForce GTX 590 и Radeon HD 6990.

DiRT 3 (DirectX 11)

  • HD 7970 GHz Edition изрядно превосходит стандартную версию.
  • GHz Edition также заметно быстрее, чем GTX 680, сравним по производительности с Radeon HD 6990 и GeForce GTX 590.

Crysis 2 (DirectX 11)

  • В режиме 2560х1440 налицо заметный прирост производительности по сравнению с обычным HD 7970.
  • В 2560х1440 HD 7970 GHz Edition также опережает GeForce GTX 680, а разогнанная карта оставила позади GTX 590 и сравнялась с Radeon HD 6990.
  • В режиме 1920х1080 участники теста упираются в предел 100 FPS, установленный в Crysis 2.

Battlefield 3 (DirectX 11)

  • И снова HD 7970 GHz Edition заметно прибавил FPS по сравнению со стандартным HD 7970.
  • Новинка идет примерно на одном уровне с GTX 670 и GTX 680.
  • Разогнанный HD 7970 GHz Edition не по зубам даже GTX 590.

Batman: Arkham City (DirectX 11)

  • Магическое словосочетание GHz Edition вновь дает HD 7970 хороший прирост FPS.
  • В режиме 1920х1080 карта идет на одном уровне с GTX 680, а в 2560х1440 превосходит его.

The Elder Scrolls 5: Skyrim (DirectX 9)

  • О какой-либо значимой разнице между HD 7970, HD 7970 GHz Edition и GeForce GTX 680 в этой игре говорить не приходится: после определенного предела движок Skyrim уже не может использовать дополнительные вычислительные мощности.

Call of Duty: Modern Warfare 3 (DirectX 9)

  • По сравнению со штатной версией HD 7970 у GHz Edition налицо большой прирост фреймрейта.
  • Тем не менее равным соперником для новинки является только GeForce GTX 670, а не GTX 680.

⇡ Выводы

Для AMD впервые с давно минувших времен Radeon X1950 XTX настал такой момент, когда топовая видеокарта по меньшей мере не уступает в производительности флагману NVIDIA того же поколения. HD 7970 GHz Edition в целом даже немного быстрее GeForce GTX 680 в тяжелых графических режимах (таких как 2560х1440) — спасибо 384-битной шине памяти. Кроме того, после фабричного разгона у него еще остается значительный запас частот. Обновленная технология Power Tune благотворно повлияла на оверклокерский потенциал GPU, да и память стала разгоняться куда лучше. В будущих картах как от NVIDIA, так и от AMD мы наверняка увидим бурный расцвет технологий динамического контроля за частотой и напряжением, как это уже произошло с CPU.

На самом деле, и в оригинальной версии HD 7970 — весьма мощная карта, и большинство экземпляров легко достигают таких частот, на которых можно догнать и перегнать GeForce GTX 680. GHz Edition — это по большей части имиджевый продукт как для владельца, так и для производителя. AMD разогнала HD 7970 ровно настолько, чтобы установить паритет с GTX 680 и при этом остаться в рамках прежнего TDP. Наши тесты энергопотребления наглядно показывают, что получилось бы в том случае, если бы разработчики поставили своей целью безоговорочную победу над флагманом NVIDIA.

Увы, AMD и так потеряла особенное преимущество над картами NVIDIA в сегменте High-End, которым пользовалась в последние годы, — энергопотребление. Если раньше топовые Radeon не могли победить GeForce GTX 480 и GTX 580 по производительности, зато гораздо меньше потребляли и нагревались, то теперь в бенчмарках наблюдается ничья, но TDP Radeon HD 7970 GHz Edition на целых 55 Вт выше, чем у GTX 680.

И еще одни вопрос. Существование в линейке Radeon двух физически идентичных карт с различным ПО уже выглядит некрасиво. За что платят покупатели HD 7970 GHz Edition, если почти того же самого можно достичь легким разгоном стандартного HD 7970, и почему владельцам последнего не досталась новая прошивка? Коль скоро BIOS видеокарт нельзя обновлять так же легко, как драйверы, было бы лучше, если бы HD 7970 GHz Edition полностью заменил своего предшественника. Ну чисто с точки зрения мировой гармонии.

Выход новой AMD Radeon HD 7970 GHz Edition не стал неожиданностью ни для кого, ведь с самого анонса Radeon HD 7970 (и даже до него) и знакомства с великолепным оверклокерским потенциалом графического процессора «Tahiti» циркулировали слухи о возможности выпуска ещё более быстрой видеокарты. Так оно, собственно, и произошло, пусть и не сразу после появления главного конкурента – NVIDIA GeForce GTX 680. По всей видимости, трёхмесячная задержка появления форсированной Radeon HD 7970 вызвана не только отладкой нового 28-нм техпроцесса, но и стремлением AMD одновременно с этим снизить цены на новую линейку своих видеокарт. Теперь новая Radeon HD 7970 GHz Edition стоит 499 долларов США, что на 50 долларов США дешевле анонсированной более полугода назад Radeon HD 7970, которая сейчас рекомендуется в продажу за 429 долларов США:

Давайте изучим новинку, её особенности, и ответим на вопрос, смогла ли с выходом Radeon HD 7970 GHz Edition компания AMD стать единоличным лидером среди однопроцессорных видеокарт?

Технические характеристики

Технические характеристики AMD Radeon HD 7970 GHz Edition приведены в таблице в сравнении с характеристиками эталонных видеокарт AMD Radeon HD 7970 и NVIDIA GeForce GTX 680:

Конструктивные особенности

Внешне в сравнении с AMD Radeon HD 7970 новая эталонная Radeon HD 7970 GHz Edition совершенно не отличима:




Естественно, в плане размеров видеокарты никаких изменений не произошло – её длина составляет 278 мм, высота и толщина – 100 и 38 мм, соответственно.

В плане выходов также нет никаких изменений, видеокарта оснащена одним DVI-I с поддержкой высоких разрешений (Dual Link), одним HDMI версии 1.4а и двумя DisplayPort версии 1.2:


С учётом такой тенденции, нужно ли говорить, что в плане разъёмов питания, MIO и двойного BIOS также ничего не изменилось: Radeon HD 7970 GHz Edition оснащена восьми- и шестиконтактными разъёмами для подключения дополнительного питания, двумя разъёмами MIO для создания CrossFireX-связок и маленьким переключателем выбора BIOS:


Несмотря на повышенные частоты, энергопотребление новой видеокарты заявлено на прежнем уровне: в 3D-режиме это пиковые 250 Вт, а в 2D Radeon HD 7970 GHz Edition потребление может снижаться вплоть до 3 Вт (при выключении монитора). Напомним и про отключение всех остальных видеокарт, кроме первой, в режиме CrossFireX при выходе из 3D-режима. Эта безусловно полезная особенность новых Radeon HD 79xx никуда не исчезла.

По внешнему виду печатной платы и расположению элементов никаких изменений в сравнении с обычной Radeon HD 7970 нами не выявлено:


Как и на эталонном Radeon HD 7970, форсированная версия видеокарты оснащена схемой питания «5+1», где пять фаз приходятся на графический процессор и одна – на цепи питания видеопамяти:


За управление ими по-прежнему отвечает контроллер CHiL Semiconductor CHL8228G, установленный в задней части лицевой стороны PCB:


28-нм графический процессор нашего экземпляра видеокарты AMD Radeon HD 7970 GHz Edition выглядит следующим образом:


Как вы уже могли видеть по таблице характеристик, никаких функциональных изменений у него нет: 2048 унифицированных шейдерных процессора, 32 блока растеризации и 128 текстурных блоков. Единственное, что AMD сделала – это повысила его частоту с прежних 925 МГц до 1000 МГц, а также ввела новый так называемый boost-режим, в котором частота графического процессора при высокой нагрузке может повышаться вплоть до 1050 МГц. Таким образом, можно сказать, что частота GPU AMD Radeon HD 7970 GHz Edition на 13,5% выше частоты обычной Radeon HD 7970. По данным мониторинга, напряжение графического процессора в 3D-режиме равно 1,256 В, а в 2D, когда частота снижается до 300 МГц, напряжение опускается до 0,949 В.

ASIC-качество кристалла GPU оказалось очень низким – всего 56,3%:


Как и у обычной Radeon HD 7970, три гигабайта видеопамяти стандарта GDDR5 расположены в 12 микросхемах FCFBGA-микросхемах на лицевой стороне печатной платы. Чипы выпущены компанией Hynix Semiconductor Inc. и имеют маркировку H5GQ2H24AFR R0C :


Теоретическая эффективная частота таких микросхем в 3D-режиме составляет 6000 МГц, на которых память AMD Radeon HD 7970 GHz Edition и функционирует, в отличие от 5500 МГц на Radeon HD 7970 (+9,1%). При ширине шины обмена с памятью видеокарты равной 384 бит пропускная способность памяти достигает рекордных 288 Гбайт/сек. В 2D-режиме частота снижается до 600 эффективных мегагерц.

Больше никаких изменений у эталонной AMD Radeon HD 7970 GHz Edition нет:


Считанный с помощью утилиты GPU-Z и сохранённый BIOS вы можете скачать из файлового архива.

Система охлаждения и её эффективность

Как вы уже поняли, все отличия AMD Radeon HD 7970 GHz Edition от обычной Radeon HD 7970 можно сосчитать по двум пальцам одной руки, так как они не коснулись и системы охлаждения видеокарты, которая состоит из радиатора с медной испарительной камерой в основании, медной основы, турбины и пластикового кожуха:


Ни единого изменения мы не выявили и при разборе этого кулера и снятии его радиального вентилятора:




По данным мониторинга скорость вращения этой турбины может изменяться в диапазоне от 1050 до 5400 об/мин, а максимальное энергопотребление не должно превышать 20 ватт.

Для проверки температурного режима работы видеокарты в качестве нагрузки мы использовали пять циклов теста весьма ресурсоёмкой игры Aliens vs. Predator (2010) при максимальном качестве графики в разрешении 2560х1440 пикселей с анизотропной фильтрацией уровня 16х и с использованием MSAA-сглаживания степени 4x:



Для мониторинга температур и прочих параметров применялись программа MSI Afterburner версии 2.2.2 и утилита GPU-Z версии 0.6.3 . Все тесты проводились в закрытом корпусе системного блока, конфигурацию которого вы сможете увидеть в следующем разделе статьи, при комнатной температуре 25 градусов Цельсия. Тестирование эффективности системы охлаждения видеокарты было проведено до её разборки с использованием штатного термоинтерфейса.

Посмотрим, справится ли кулер эталонной AMD Radeon HD 7970 GHz Edition с её повышенными частотами:


Автоматический режимМаксимальная мощность


Да справился он, конечно, только вот температурный режим работы видеокарты при автоматической регулировке скорости вращения вентилятора оставляет желать лучшего, ведь графический процессор прогрелся почти до 90 градусов Цельсия, а радиальный вентилятор разогнался до 3200 об/мин, что очень шумно. На максимальных 5400 об/мин находиться в одной комнате с такой ревущей видеокартой весьма сложно, зато столь высокие обороты позволяют отыграть сразу 18 градусов Цельсия по температуре графического процессора в пике нагрузки на него.

Оверклокерский потенциал

Может быть, из-за низкокачественного GPU, а может быть просто из-за невезения, но оверклокерский потенциал предоставленного нам на тестирование образца AMD Radeon HD 7970 GHz Edition оказался средним. Без повышения напряжения на ядре его удалось разогнать только до 1180 МГц:


Память также поскромничала с разгоном остановившись лишь на 6680 МГц. В результате частоты нашего экземпляра видеокарты составили 1180 МГц (+12,4%) по графическому процессору и 6680 МГц (+11,3%) по видеопамяти:


Ладно хоть температурный режим работы разогнанной видеокарты при автоматической регулировке скорости вращения вентилятора практически не изменился:


Немного расстроившись, мы решили выжать «все соки» и, вставив беруши и выставив скорость вентилятора на максимум, проверили потенциал графического процессора при повышенном до 1,3 В напряжении. Итог – 1250 МГц, что не так уж и плохо:




Температурный режим разогнанной с повышением напряжения видеокарты оказался следующим:


Пиковая температура графического процессора достигла 77 градусов Цельсия (напомним – при максимальных 5400 об/мин турбины). Надеемся, что серийные видеокарты «GHz Edition» с оригинальными и высокоэффективными кулерами смогут порадовать нас не только более низкими температурами, но и умеренным уровнем шума.

Энергопотребление

Измерение энергопотребления системы с различными видеокартами осуществлялось с помощью многофункциональной панели Zalman ZM-MFC3 , которая показывает потребление системы «от розетки» в целом (без учёта монитора). Измерение было проведено в 2D-режиме, при обычной работе в Microsoft Word или интернет-«сёрфинге», а также в 3D-режиме, нагрузка в котором создавалась с помощью трёхкратного теста из игры Metro 2033: The Last Refuge в разрешении 2560х1440 при максимальных настройках качества графики.

Давайте посмотрим на результаты:



Очевидно, что для нашей тестовой системы с разогнанным шестиядерным процессором и любой из тестируемых сегодня видеокарт будет достаточно качественного блока питания мощностью 550 ватт. Что касается новой AMD Radeon HD 7970 GHz Edition, то на номинальных частотах система с ней потребляет на 20 ватт больше электроэнергии, чем система с обычной Radeon HD 7970, и примерно на 80 ватт больше системы с не разогнанной GeForce GTX 680. Отметим, что при разгоне видеокарт энергопотребление систем в пике нагрузки возрастает несущественно, даже при повышении напряжения на графических процессорах. В режиме бездействия показатели потребления электроэнергии практически одинаковы.

Тестовая конфигурация, инструментарий и методика тестирования

Тестирование видеокарт было проведено на системе следующей конфигурации:

Системная плата: Intel Siler DX79SI (Intel X79 Express, LGA 2011, BIOS 0525 от 09.07.2012);
Центральный процессор: Intel Core i7-3960X Extreme Edition 3,3 ГГц (Sandy Bridge-E, C1, 1,2 В, 6x256 Kбайт L2, 15 Мбайт L3);
Система охлаждения CPU: Phanteks PH-TC14PЕ (2x135 мм, 900 об/мин);
Термоинтерфейс: ARCTIC MX-4 ;
Оперативная память: DDR3 4x4 Гбайт Mushkin Redline (2133 МГц, 9-10-10-28, 1,65 В);
Видеокарты:

AMD Radeon HD 7970 GHz Edition 3 Гбайт 384 бит GDDR5, 1050/6000 и 1250/6680 МГц при 1,3 В;
Sapphire Radeon HD 7970 OC Dual-X 3 Гбайт 384 бит GDDR5, 925/5500 МГц;
ASUS GeForce GTX 680 DirectCU II TOP 2 Гбайт 256 бит GDDR5, 1006/6008, 1137/6008 и 1217/7168 МГц;

Системный диск: SSD 256 Гбайт Crucial m4 (SATA-III, CT256M4SSD2, BIOS v0009);
Диск для программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
Корпус: Antec Twelve Hundred (передняя стенка – три Noiseblocker NB-Multiframe S-Series MF12-S2 на 1020 об/мин; задняя – два Noiseblocker NB-BlackSilentPRO PL-1 на 1020 об/мин; верхняя – штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC3 ;
Блок питания: Xigmatek «No Rules Power» NRP-HC1501 (1500 Вт), 140-мм вентилятор;
Монитор: 27" Samsung S27A850D (DVI-I, 2560х1440, 60 Гц).

Для сравнения с AMD Radeon HD 7970 GHz Edition мы включили в тесты видеокарту Sapphire Radeon HD 7970 OC Dual-X 3 Гбайт :


Так как оба её BIOS имеют повышенные частоты, то мы вручную снизили частоту графического процессора и памяти видеокарты до номинальных для Radeon HD 7970 –925/5500 МГц, хотя GPU-Z нам упорно демонстрировала слегка повышенные частоты:


Со стороны NVIDIA мы включили в тестирование лучшую GeForce GTX 680, из побывавших в нашей Лаборатории. Это видеокарта ASUS GeForce GTX 680 DirectCU II TOP 2 Гбайт :


Её производительность была проверена на номинальных для ASUS частотах – 1137/6008 МГц, номинальных для эталонной NVIDIA GeForce GTX 680 частотах – 1006/6008 МГц, и при максимально возможном для этого экземпляра видеокарты разгоне 1217/7168 МГц:


Для снижения зависимости производительности видеокарт от скорости платформы, 32-нм шестиядерный процессор при множителе 37, опорной частоте 125 МГц и активированной функции «Load-Line Calibration» был разогнан до 4,625 ГГц при повышении напряжения в BIOS материнской платы до 1,47 В:



Технология «Hyper-Threading» активирована. При этом 16 Гбайт оперативной памяти функционировали на частоте 2 ГГц с таймингами 9-10-10-28 при напряжении 1,65 В.

Тестирование, начатое 30 июля 2012 года, было проведено под управлением операционной системы Microsoft Windows 7 Ultimate x64 SP1 со всеми критическими обновлениями на указанную дату и с установкой следующих драйверов:

чипсет материнской платы Intel Chipset Drivers – 9.3.0.1020 WHQL от 26.01.2012 ;
библиотеки DirectX End-User Runtimes, дата выпуска – 30 ноября 2010 года ;
драйверы видеокарт на графических процессорах AMD – Catalyst 12.x (8.982.0.0 RC1) от 19.07.2012 + Catalyst Application Profiles 12.7 (CAP1);
драйверы видеокарт на графических процессорах NVIDIA – GeForce 304.79 beta от 03.07.2012 .

Производительность видеокарт была проверена в двух разрешениях: 1920х1080 и 2560х1440 пикселей. Для тестов были использованы два режима качества графики: «Quality + AF16x» – качество текстур в драйверах по-умолчанию с включением анизотропной фильтрации уровня 16х, и «Quality + AF16x + MSAA 4х(8х)» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если данные настройки в играх отсутствовали, то параметры изменялись в панелях управления драйверов Catalyst и GeForce. Там же была отключена вертикальная синхронизация. Больше никаких изменений в настройки драйверов не вносились.

Cписок тестовых приложений состоит из двух полусинтетических пакетов, одного техно-демо и 13 игр, обновлённых до последних версий (на дату начала тестов):

3DMark Vantage (DirectX 10) – версия 1.0.2.1, профили настроек «Performance» и «Extreme» (тестировались только основные тесты);
3DMark 2011 (DirectX 11) – версия 1.0.3.0, профили настроек «Performance» и «Extreme»;
Unigine Heaven Demo (DirectX 11) – версия 3.0, максимальные настройки качества, тесселляция на уровне «extreme», AF16x, разрешение 1280х1024 без MSAA и 1920х1080 с MSAA 8x;
(DirectX 11) – версия 1.6.02, профиль настроек «Улучшенное динамическое освещение DX11» с дополнительным выставлением вручную всех параметров на максимум, тестировалась собственная демо-запись «cop03» на уровне «Затон»;
Metro 2033: The Last Refuge (DirectX 10/11) – версия 1.2, использовался официальный тест, настройки качества «Very High», тесселляция, DOF включено, использовалось ААА-сглаживание, двойной последовательный проход сцены «Frontline»;
Just Cause 2 (DirectX DX10.1) – версия 1.0.0.2, максимальные настройки качества, методики «Размытие фона» и Симуляция воды GPU» деактивированы, двойной последовательный проход демо-записи «Тёмная башня»;
Aliens vs. Predator (2010) (DirectX 11) – «Texture Quality» в режиме «Very High», «Shadow Quality» в режиме «High», технология SSAO включена, два цикла теста в каждом разрешении;
Lost Planet 2 (DirectX 11) – версия игры 1.0, максимальные настройки качества графики, размытие движения включено, использовался тест производительности «В»;
Sid Meier"s Civilization V (DirectX 11) – версия игры 1.0.1.348, максимальные настройки качества графики, двойной прогон «дипломатического» теста из пяти самых тяжёлых сцен;
Total War: Shogun 2 (DirectX 11) – версия 2.0, встроенный тест (битва при Sekigahara) на максимальных настройках качества графики и использовании в одном из режимов MSAA 4x;
Crysis 2 (DirectX 11) – версия 1.9, использовался Adrenaline Crysis 2 Benchmark Tool v1.0.1.14 BETA , профиль настроек качества графики «Ultra High», текстуры высокого разрешения активированы, двукратный цикл демо-записи на сцене «Times Square»;
Hard Reset Demo (DirectX 9) – встроенный в демо-версию тест при Ultra-качестве графики, один проход тестовой сцены;
Batman: Arkham City (DirectX 11) – версия 1.2, максимальные настройки качества графики, физика отключена, двойной последовательный проход встроенного в игру теста;
Battlefield 3 (DirectX 11) – версия 1.4, все настройки качества графики на «Ultra», двойной последовательный проход заскриптованной сцены из начала миссии «На охоту» продолжительностью 110 секунд;
DiRT Showdown (DirectX 11) – версия 1.0, встроенный тест на трассе «Nevada» при максимальных настройках качества графики («Ultra» preset);
Sniper Elite V2 Benchmark (DirectX 11) – версия 1.05, использовался Adrenaline Sniper Elite V2 Benchmark Tool v1.0.0.2 BETA максимальные настройки качества графики («Ultra»), Advanced Shadows: HIGH, Ambient Occlusion: ON, Stereo 3D: OFF, двойной последовательный прогон теста;

Более подробное описание методик тестирования видеокарт и графических настроек в некоторых из перечисленных играх вы можете найти в специально для этого созданной ветке нашей конференции , а также поучаствовать в обсуждении и совершенствовании этих методик.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1%. Если отклонения прогонов тестов превышали 1%, то тестирование повторялось ещё, как минимум, один раз, чтобы получить достоверный результат.

Результаты тестов производительности и их анализ

3DMark Vantage



Первый полусинтетический тест 3DMark Vantage продемонстрировал нам довольно интересную картину. Если в режиме без использования сглаживания новая AMD Radeon HD 7970 GHz Edition по-прежнему заметно проигрывает GeForce GTX 680, то в более ресурсоёмком режиме настроек «Extreme» разница сокращается до минимума. При разгоне обеих видеокарт картина не меняется, NVIDIA здесь немного быстрее AMD. В целом Radeon HD 7970 GHz Edition на 6,5-10,6% превзошла свою предшественницу.

3DMark 2011



В 3DMark 2011 расстановка сил не изменилась, но лидерство GeForce GTX 680 здесь более уверенное. AMD Radeon HD 7970 GHz Edition опережает обычную HD 7970 примерно на 9%.

Unigine Heaven Demo



Картина повторяется: в «лёгком» графическом режиме GeForce GTX 680 демонстрирует более высокую скорость, чем обе вариации Radeon HD 7970, а в разрешении 1920х1080 и при активации сглаживания производительность видеокарт практически равна. Новая Radeon HD 7970 GHz Edition опережает обычную HD 7970 на 10,5-12%.

S.T.A.L.K.E.R.: Call of Pripyat


Как видим по результатам обычной Radeon HD 7970, в S.T.A.L.K.E.R.: Call of Pripyat топовые видеокарты AMD и ранее не проигрывали, а с выходом Radeon HD 7970 GHz Edition стали опережать конкурента в лице GeForce GTX 680 на 7,5-11%. Справедливости ради, отметим, что при разгоне двух этих видеокарт их производительность практически равна, в том числе и в режимах с использованием сглаживания.

Metro 2033: The Last Refuge


В Metro 2033: The Last Refuge простая Radeon HD 7970 уже была чуточку быстрее GeForce GTX 680, а новая GHz Edition смогла увеличить этот отрыв, так как за счёт более высоких частот опережает обычную HD 7970 на 4-6%. Правда, комфортно играть в Metro 2033 на этих видеокартах можно только в разрешении 1920х1080 пикселей и ниже.

Just Cause 2


Just Cause 2 продемонстрировала нам с вами необходимость разгона Radeon HD 7970 и превращения её в GHz Edition для конкуренции с GeForce GTX 680. Если прежний флагман AMD отставал от прямого конкурента, то форсированная версия идёт уже вровень с ним в этой игре.

Aliens vs. Predator (2010)


В игре Aliens vs. Predator (2010) Radeon HD 7970 и прежде выглядела предпочтительнее, чем GeForce GTX 680, а с выходом GHz Edition версии этой видеокарты смогла нарастить своё преимущество вплоть до 44% в наиболее ресурсоёмком режиме.

Lost Planet 2

А вот в Lost Planet 2 повышенные частоты AMD Radeon HD 7970 GHz Edition не помогают ей в борьбе с GeForce GTX 680:


Разрыв сокращается, но не более того. Лидируют в этой игре по-прежнему видеокарты на графических процессорах NVIDIA.

Sid Meier"s Civilization V


У поклонников серии игр Sid Meier"s Civilization V выбор, в общем-то, один – видеокарты на графических процессорах AMD, которые опережают конкурента на величину вплоть до 67%.

Total War: Shogun 2

Вплоть до последнего обновления игры Total War: Shogun 2, устанавливаемого системой Steam автоматически, видеокарты NVIDIA могли успешно конкурировать с видеокартами AMD, но теперь ситуация серьёзно изменилась:


Так уже было пару-тройку месяцев назад, и NVIDIA смогла исправить ситуацию в этой игре, выпустив новую версию драйверов. Будет ли так на этот раз – время покажет, а пока GeForce GTX 680 здесь лишь в роли догоняющей.

Crysis 2


Если ранее Radeon HD 7970 и GeForce GTX 680 были примерно равны в Crysis 2, то с выходом Radeon HD 7970 GHz Edition чаша весов склонилась в пользу AMD. Пусть и с небольшим преимуществом, но новинка лидирует в этом тесте. При максимальном разгоне обеих видеокарт их производительность не отличается.

Hard Reset Demo


Здесь новая AMD Radeon HD 7970 GHz Edition опережает обычную Radeon HD 7970 на величину вплоть до 16% и за счёт этого проигрыш GeForce GTX 680 сменяется победой над ней. Впрочем, последняя при разгоне получает более высокую отдачу в Hard Reset, чем Radeon HD 7970 GHz Edition, и легко возвращает себе лидерство.

Batman: Arkham City


C переменным успехом выступает AMD Radeon HD 7970 GHz Edition в игре Batman: Arkham City: если в режимах без сглаживания GeForce GTX 680 весьма быстра, то при включении MSAA 8x пальма первенства переходит к новой видеокарте AMD, которая опережает обычную Radeon HD 7970 на 7-9%.

Battlefield 3


Уместными оказались повышенные частоты новой Radeon и в игре Battlefield 3: там, где ранее GeForce GTX 680 лидировала, теперь HD 7970 GHz Edition, как минимум, не уступает, а в режимах со сглаживанием даже чуть-чуть обходит конкурента.

DiRT Showdown


Ну, тут всё понятно и без комментариев, с движком DiRT Showdown архитектура NVIDIA работает менее эффективно, поэтому терпит в этой игре полное фиаско на фоне высоких результатов видеокарт AMD.

Sniper Elite V2 Benchmark


Похожим образом, но всё же не столь ярко, складывается ситуация и в новом тесте Sniper Elite V2. Преимущество AMD Radeon HD 7970 GHz Edition над GeForce GTX 680 достигает здесь впечатляющих 54%.

Традиционно, прикладываем к диаграммам и графикам итоговую , и переходим к сводным диаграммам.

Сводные диаграммы

Первая пара сводных диаграмм покажет нам с вами преимущество AMD Radeon HD 7970 GHz Edition с частотами 1050/6000 МГц над обычной Radeon HD 7970 с частотами 925/5500 МГц:



В среднем по всем тестам увеличение частоты графического процессора на 13,5% и видеопамяти на 9,1% принесли Radeon HD 7970 прирост производительности 9,3-9,6% в разрешении 1920х1080 пикселей и 9,9-10% в разрешении 2560х1440 пикселей. Максимальный прирост был достигнут в таких играх, как Aliens vs. Predator (2010) и Lost Planet 2, а минимальный в Metro 2033: The Last Refuge.

Теперь посмотрим на противостояние AMD Radeon HD 7970 GHz Edition 3 Гбайт и GeForce GTX 680 2 Гбайт на их номинальных частотах:



GeForce GTX 680 по-прежнему быстрее в полусинтетических тестах, игре Lost Planet 2, а также отдельных режимах Just Cause 2, Hard Reset, Batman: Arkham City и Battlefield 3. В остальных тестах преимущество на стороне новой AMD Radeon HD 7970 GHz Edition, причём в таких играх, как Aliens vs. Predator (2010), Sid Meier"s Civilization V, Total War: Shogun 2, DiRT Showdown и Sniper Elite V2 оно весьма приличное. Впрочем, не будем забывать, что сегодня многое зависит от конкретной игры и её движка, а не только от производительности самой видеокарты. К примеру, по собственному опыту скажу, что в ранее исключённых из нашего тестового списка StarCraft II: Wings of Liberty (из-за чрезмерной процессорозависимости) и Tom Clancy"s H.A.W.X. 2 (ввиду неактуальности) лидировала бы GeForce GTX 680. Так что всё относительно.

Напоследок сравним производительность разогнанных AMD Radeon HD 7970 GHz Edition на частотах 1250/6680 МГц и ASUS GeForce GTX 680 TOP на частотах 1217/7168 МГц:



Нельзя сказать, что ситуация изменилась кардинальным образом, тем не менее GeForce GTX 680 за счёт более высокого разгона (в процентном выражении) удалось сократить отставание от Radeon HD 7970 GHz Edition там, где она выигрывала, и нарастить там, где проигрывала.

Заключение

Сказать, что новая AMD Radeon HD 7970 GHz Edition теперь является самой быстрой однопроцессорной видеокартой было бы не совсем корректно, так как её тотального превосходства над эталонной NVIDIA GeForce GTX 680 мы не выявили. Тем не менее, повышенные частоты позволили этому графическому решению на 10% превзойти уровень производительности прежней Hi-End видеокарты AMD и в большинстве случаев всё же опередить конкурента из NVIDIA. Однако, на наш взгляд, выход AMD Radeon HD 7970 GHz Edition оказался несколько «смазанным», ведь сегодня свободно предлагается добрая дюжина заводских Radeon HD 7970 с повышенными частотами, а порой и с частотами выше уровня «GHz Edition». То есть своей производительностью новинка, в общем-то, никого не удивила и уж точно не впечатлила. Пожалуй, наибольшие надежды на неё возлагали любители разгона, ожидая нового степпинга ядра «Tahiti XT», его пониженного напряжения и, как следствие, высокого оверклокерского потенциала. В сегодняшней статье это, увы, не подтвердилось. Надеемся, серийные видеокарты будут в этом плане более привлекательными. Время покажет.

Перейдём к результатам измерений:

Энергопотребление всей системы в режиме бездействия, Вт.

Благодаря оптимизациям техпроцесса и снижению напряжения в режиме бездействия, энергопотребление уменьшилось почти на три ватта по сравнению с первой версией Radeon HD 7970. Впрочем, никаких революционных сдвигов мы здесь не ждали. Видеокарты AMD уже давно успешно показывают себя с технологией ZeroCore Power.

Энергопотребление всей системы под нагрузкой, Вт.

Под нагрузкой Radeon HD 7970 GHz Edition потребляет чуть больше энергии, чем предшествующая модель. Как можно предположить, это связано с более высокими тактовыми частотами, поскольку AMD явно пожелала выжать максимум производительности от новых оптимизаций чипа. Впрочем, увеличение энергопотребления на шесть ватт вряд ли отразится на общем счёте за электроэнергию.

Температура в режиме бездействия, градусы Цельсия.

Мы с нетерпением ожидали результатов теста температур. Из-за меньшего напряжения можно было ожидать снижения температуры в режиме бездействия. Но, увы, мы не зафиксировали изменений.

Температура под нагрузкой, градусы Цельсия.

Что интересно, мы получили разницу между двумя видеокартами под нагрузкой. Модель Radeon HD 7970 нагревалась до 74 °C, но GHz Edition при тех же условиях - до 72 °C. Возможно, подобный потенциал стал возможным благодаря оптимизациям, внесённым при производстве GPU.

Уровень шума в режиме бездействия, дБ(А).

В режиме бездействия мы не получаем почти никакой разницы по уровню шума. Поскольку температуры одинаковы, то вентилятору нет необходимости вращаться быстрее или медленнее.

Уровень шума под нагрузкой, дБ(А).

Под нагрузкой разница по уровню шума стала более существенной. "Старая" видеокарта Radeon HD 7970 работает более чем на один децибел громче, чем GHz Edition. Возможно это связано с меньшей температурой GPU, позволяющей вентилятору вращаться чуть медленнее.