Дебют архитектуры Turing - часть 2

Благодаря трассировке лучей в реальном времени архитектура Turing имеет огромный потенциал и без сомнения продемонстрирует все свои преимущества в новых проектах. Но при беспрецедентно высоких ценах, установленных компанией NVIDIA, новым видеокартам придется доказать свою актуальность здесь и сейчас, в существующих играх.

В предыдущей части обзора мы изучили особенности семейства графических процессоров Turing и модельный ряд видеокарт GeForce RTX 20. По масштабу архитектурных изменений и возможностям, которые открывает в играх трассировка лучей в реальном времени (а также специализированные тензорные ядра для задач машинного обучения), Turing представляет собой чрезвычайно амбициозный и многообещающий проект, а по техническим характеристикам эти GPU не имеют даже близких соперников на потребительском рынке.

Но не будем упускать из виду, что на данный момент ни одна игра еще не может задействовать новые функции GPU, а цены новинок беспрецедентно велики. Прежде чем потенциал архитектуры Turing раскроется в играх с эффектами, основанными на трассировке лучей, новые видеокарты должны проявить себя в бенчмарках, актуальных на данный момент, и в противостоянии с куда более дешевыми соперниками — как собственными продуктами NVIDIA поколения Pascal, так и Radeon RX Vega от AMD.

Технические характеристики

Производитель NVIDIA
Модель GeForce GTX 1070 GeForce GTX 1080 GeForce GTX 1080 Ti GeForce RTX 2070 GeForce RTX 2080 GeForce RTX 2080 Ti
Графический процессор
Название GP104 GP104 GP102 TU106 TU104 TU102
Микроархитектура Pascal Pascal Pascal Turing Turing Turing
Техпроцесс, нм 16 нм FinFET 16 нм FinFET 16 нм FinFET 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 7 200 7 200 12 000 10 800 13 600 18 600
Тактовая частота, МГц: Base Clock / Boost Clock 1 506 / 1 683 1 607 / 1 733 1 480 / 1 582 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) 1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU 1 920 2 560 3 584 2304 2944 4352
Число блоков наложения текстур 120 160 224 144 184 272
Число ROP 64 64 88 64 64 88
Оперативная память
Разрядность шины, бит 256 256 352 256 256 352
Тип микросхем GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (8 000) 1 250 (10 000) 1 376,25 (11 010) 1 750 (14 000) 1 750 (14 000) 1 750 (14 000)
Объем, Мбайт 8 192 8 192 11 264 8 192 8 192 11 264
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 6 463 8 873 11 340 7 465 / 7 880 (Founders Edition) 10 069 / 10 598 (Founders Edition) 13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32 1/32
Пропускная способность оперативной памяти, Гбайт/с 256 320 484 448 448 616
Вывод изображения
Интерфейсы вывода изображения DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b
TDP, Вт 150 180 250 175/185 (Founders Edition) 215/225 (Founders Edition) 250/260 (Founders Edition)
Розничная цена (США, без налога), $ 349 (рекомендованная) / 399 (Founders Edition, nvidia.com) 499 (рекомендованная) / 549 (Founders Edition, nvidia.com) НД (рекомендованная) / 699 (Founders Edition, nvidia.com) 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб. НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru) НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru) НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)


Конструкция

В первой части обзора мы уже прокомментировали характеристики видеокарт серии GeForce RTX 20 и сегодня уделим внимание устройствам, которые NVIDIA распространяет под собственной маркой Founders Edition. Запуск архитектуры Turing прошел необычно во многих отношениях, и одна из отличительных черт нового поколения — это доступность видеокарт оригинального дизайна с первого дня продаж. Как следствие, NVIDIA не нуждается в референсных платах, чтобы насытить первую волну поставок GeForce RTX 20. Формально говоря, модели Founders Edition еще в прошлом поколении не считались референсными, хотя имели полностью референсные характеристики частот и энергопотребления. Но в этот раз особенный статус Founders Edition подчеркивают повышенные частоты и TDP, трехлетняя гарантия, а также увеличенный зазор между ценой FE и рекомендованными розничными значениями, который достигает $200 в случае GeForce RTX 2080 Ti.

Founders Edition поставлены в один ряд с «премиальными» моделями сторонних производителей, и инженеры NVIDIA хорошо подготовились к такой конкуренции. Главное, что отличает GeForce RTX 20 FE от прошлого поколения — открытая система охлаждения. У «турбинного» кулера есть свои преимущества, и GeForce GTX 1080 Ti был одним из лучших образцов подобного дизайна, но открытая СО при прочих равных условиях работает эффективнее и тише.

GeForce RTX 2080 Ti снабжен двумя 13-лопастными вентиляторами с диаметром крыльчатки 85 мм, а под ними — радиатор с испарительной камерой, покрывающей всю площадь платы. Обратная сторона PCB, как и в Founders Edition поколения Pascal, защищена массивной алюминиевой пластиной. NVIDIA сообщает, что благодаря новому кулеру RTX 2080 Ti в пять раз тише шумит под нагрузкой с разгоном по сравнению с GTX 1080 Ti.

Плата

Помимо охлаждения, NVIDIA усовершенствовала систему питания Founders Edition. Преобразователь напряжения GeForce RTX 2080 Ti включает 13 фаз для питания GPU и три фазы для чипов GDDR6 (в отличие от схемы 7 + 2 в GeForce GTX 1080 Ti FE). Кроме того, ШИМ-контроллер обеспечивает более точное управление, мониторинг напряжения, и, что наиболее важно, позволяет динамически регулировать число задействованных фаз в зависимости от нагрузки — таким образом поддерживается стабильный КПД во всем диапазоне потребляемой мощности.

Тестовый стенд, методика тестирования

Конфигурация тестого стенда
CPU Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ Intel SSD 760p 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Crimson ReLive Edition 18.9.1 (Tesselation: Use application settings)
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 411.51
Бенчмарки: синтетические
Тест API Разрешение Полноэкранное сглаживание
3DMark Fire Strike DirectX 11 (feature level 11_0) 1920 × 1080 Выкл.
3DMark Fire Strike Extreme 2560 × 1440
3DMark Fire Strike Ultra 3840 × 2160
3DMark Time Spy DirectX 12 (feature level 11_0) 2560 × 1440
Бенчмарки: игры
Игра (в порядке даты выхода) API Настройки, метод тестирования Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
GTA V DirectX 11 Макс. качество. Встроенный бенчмарк MSAA 4x + FXAA + Reflection MSAA 4x Выкл.
The Witcher 3: Wild Hunt DirectX 11 Макс. качество. FRAPS, локация Caer Morhen TAA + HairWorks AA 4x
Tom Clancy's The Division DirectX 12 Макс. качество, HFTS выкл. Встроенный бенчмарк SMAA 1x Ultra + TAA: Supersampling TAA: Stabilization
DOOM Vulkan Макс. качество. Миссия Foundry TSSAA 8TX Выкл.
Deus Ex: Mankind Divided DirectX 12 Макс. качество. Встроенный бенчмарк MSAA 4x
Battlefield 1 DirectX 12 Макс. качество. OCAT, начало миссии Over the Top TAA
Ashes of the Singularity: Escalation Vulkan Макс. качество. Встроенный бенчмарк MSAA 4x + TAA 4x
Total War: WARHAMMER II, встроенный бенчмарк DirectX 12 Макс. качество. Встроенный бенчмарк (Battle Benchmark) MSAA 4x
Far Cry 5 DirectX 11 Макс. качество. Встроенный бенчмарк TAA
F1 2018 DirectX 11 Макс. качество. Встроенный бенчмарк TAA
Shadow of the Tomb Raider DirectX 12 Макс. качество. Встроенный бенчмарк SMAA 4x
Бенчмарки: декодирование видео, вычисления
Программа Настройки
Blender 2.78b + Blenchmark 1.0.7
DXVA Checker, Decode Benchmark, H.264 Файлы 1920 × 1080 (High Profile, L4.1), 3840 × 2160 (High Profile, L5.1). Microsoft H264 Video Decoder
DXVA Checker, Decode Benchmark, H.265 Файлы 1920 × 1080 (Main Profile, L4.0), 3840 × 2160 (Main Profile, L5.0). Microsoft HEVC Video Extensions
DXVA Checker, Decode Benchmark, VP9 Файлы 1920 × 1080, 3840 × 2160. Microsoft WebM MF VP8 Decoder
LuxMark 3.1 x64 Сцена Hotel Lobby (Complex Benchmark)
SiSoftware Sandra Titanium (2018), GPGPU Scientific Analysis OpenCL, FP16/FP32
CompuBench 2.0, Ocean Surface Simulation
CompuBench 2.0, N-Body Simulation 1024K

Мощность видеокарт мы измеряем отдельно от CPU и прочих компонентов ПК. Для этого применяется жесткий райзер PCI Express x16, в котором линии +12 В и земли, идущие от материнской платы, разорваны и выведены на отдельный шестиконтактный разъем питания. Блок питания Corsair AX1200i с помощью утилиты Corsair Link 4 позволяет регистрировать общий ток, проходящий по разъемам дополнительного питания видеокарты и райзеру, с периодом 1 с, а мощность вычисляется путем умножения величины тока на величину напряжения 12 В в каждый момент времени.

В качестве тестовой нагрузки используется FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x) и Crysis 3 (максимальное качество графики, разрешение 3840 × 2160, MSAA 4x). Замеры мощности выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. Также во время теста мы регистрируем ряд других переменных с помощью ПО MSI Afterburner: тактовую частоту, напряжение питания и температуру графического процессора, скорость вращения вентиляторов системы охлаждения.

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт);
  • NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт).

Тактовые частоты, энергопотребление, температура, разгон

В серии GeForce RTX NVIDIA изменила взаимодействие видеокарты с оверклокерским ПО. В рамках предыдущей, третьей версии GPU Boost алгоритмы, управляющие частотой процессора в зависимости от его температуры и мощности карты, были скрыты внутри драйвера. В GPU Boost 4.0 разработчики предоставили к ним ограниченный доступ со стороны утилит для разгона.

Первое преимущество нового алгоритма заключается в возможности изменять форму температурной функции. В ускорителях Pascal для разгона имеет значение только целевая температура: в ее пределах частота GPU не ограничена, при достижении целевой температуры GPU сбрасывает частоту до базового уровня.

GPU Boost 3.0

В Turing кривая температуры/частоты задана несколькими точками таким образом, что существуют несколько промежуточных значений температуры, последовательно ограничивающих тактовую частоту. Образуется дополнительная зона, в которой GPU работает на сравнительно высокой частоте и одновременно разрешается превышать целевую температуру. С помощью сторонних утилит пользователь может раздвинуть эту зону за счет более высоких частот или более высоких температур.

Другое изменение в GPU Boost — это функция автоматизированного разгона на основе индивидуальных характеристик видеокарты. Известно, что стандартная функция, задающая позиции тактовой частоты в диапазоне значений питающего напряжения, соответствует среднестатистическому кристаллу GPU и дает определенный резерв стабильности. Исчерпать резерв тактовой частоты — и есть задача оверклокера, только GPU Boost 4.0 позволяет сделать это в автоматическом режиме.

GPU Boost 4.0

Тестовая сборка EVGA Precision X1 показывает, как работает алгоритм авторазгона. Кнопка Scan запускает тестовую нагрузку, невидимую для пользователя, и утилита стремится поднять отдельные точки кривой тактовой частоты до того момента, когда появятся ошибки в расчетах. Наш экземпляр GeForce RTX 2080 Ti при штатных регулировках температуры и энергопотребления в результате относительно быстрого (16 мин) теста набрал 151 «балл», что, по всей видимости, означает максимальный прирост тактовой частоты. Однако наибольший разгон произошел в среднем диапазоне частот, пиковые значения алгоритм не затронул. Мы рассчитывали, что в более комфортных условиях (термопакет, увеличенный на 23%, максимальная скорость вращения вентиляторов и модифицированная кривая температуры) разгон окажется сильнее, а получилось наоборот: есть небольшой сдвиг пиковой частоты, но в зоне средних частот результаты только ухудшились.

Похоже, что авторазгон в GPU Boost 4.0 не рассчитан на квалифицированных оверклокеров и оставляет большой резерв тактовой частоты для стабильности, ведь стандартным путем мы добились большего от RTX 2080 Ti. В штатном режиме пиковая частота GPU составляет 1950 МГц, а устойчивое значение под нагрузкой в Crysis 3 — 1707 МГц. При TDP 123% и максимальной скорости вращения вентиляторов ускоритель допускает простой сдвиг кривой тактовой частоты на 140 МГц вверх — вплоть до 2090 МГц в пике, а под нагрузкой GPU работает на средней частоте 1995 МГц. Скорее всего, и это не предел, поскольку EVGA Precision X1 пока не позволяет регулировать напряжение питания. Память GDDR6 также превосходно разогналась, позволив увеличить эффективную тактовую частоту с 14 до 15,5 ГГц.

  Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн.
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)   1707 1740 0,938 1,037 2087
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт) +23% TDP, 100% RPM 1995 1995 1,012 1,043 3700
NVIDIA GeForce GTX 1080 FE (1607/10008 МГц, 8 Гбайт)   1634 1683 0,878 0,925 2187 (55%)
NVIDIA GeForce GTX 1080 Ti FE (1480/11010 МГц, 11 Гбайт)   1481 1481 0,812 0,893 2878 (60%)
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) WattMan: Balanced 1382 1492 0,965 1,150 2392 (49%)


Прим.: измерение всех параметров проводится после в игре Crysis 3 (максимальное качество графики, 3840 × 2160, MSAA 4x) после прогрева GPU.

По резерву мощности, как показывает FurMark, GeForce RTX 2080 Ti примерно соответствует GeForce GTX 1080 Ti и Radeon RX Vega 64, невзирая на огромную разницу в размере соответствующих GPU. В стресс-тесте видеокартам приходится работать на частотах, близких к базовым, в силу исчерпания TDP. В играх, напротив, главным сдерживающим фактором выступает температура, поэтому референсные образцы GTX 1080 Ti и Vega 64, оснащенные закрытыми кулерами, хронически недогружены и RTX 2080 Ti стал наиболее мощной видеокартой среди участников тестирования за счет эффективной СО открытого типа.

Производительность: 3DMark

В синтетических тестах GeForce RTX 2080 Ti получил на 33% больше очков по сравнению с GeForce GTX 1080 Ti и на 66% больше по сравнению с GTX 1080. Разгон, пусть и неплохой в абсолютных значениях для столь массивного GPU без программного вольтмода, увеличил быстродействие в 3DMark лишь на 7%.

3DMark (Graphics Score)
  Разрешение NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Fire Strike 1920 × 1080 34 515 36 236 21 702 26 977 23 228
Fire Strike Extreme 2560 × 1440 16 517 17 800 10 224 12 957 10 840
Fire Strike Ultra 3840 × 2160 7 965 8 644 5 017 6 502 5 481
Time Spy 2560 × 1440 13 392 14 275 6 866 8 461 7 285
Макс.     +9% −37% −18% −31%
Средн.     +7% −40% −25% −36%
Мин.     +5% −49% −37% −46%

Производительностьигры (1920 × 1080, 2560 × 1440)

Играм в разрешении 1080p на столь мощных GPU явно недостаточно производительности центрального процессора, даже если это восьмиядерный CPU, работающий на частоте 4 ГГц. По средней частоте смены кадров GeForce RTX 2080 Ti лишь на 22% превосходит GeForce GTX 1080 Ti и на 43% — GTX 1080.

Потенциал новой архитектуры начинает раскрываться только при разрешении 1440p. Здесь прирост быстродействия по сравнению с GeForce GTX 1080 Ti и GTX 1080 достиг 33 и 64% соответственно.

Разгон флагмана 20-й серии в обоих режимах принес ничтожные 3–5% кадровой частоты.

1920 × 1080
  Полноэкранное сглаживание NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 65 66 39 49 42
Battlefield 1 TAA 153 151 125 140 131
Deus Ex: Mankind Divided MSAA 4x 67 72 38 51 41
DOOM TSSAA 8TX 200 200 200 200 200
F1 2018 TAA 190 192 112 134 123
Far Cry 5 TAA 111 110 99 108 100
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 95 93 85 92 69
Shadow of the Tomb Raider SMAA 4x 99 103 55 67 55
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 130 142 78 98 86
Total War: WARHAMMER II MSAA 4x 62 65 39 50 43
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 149 161 88 106 80
Макс.     +9% +0% +0% +0%
Средн.     +3% −30% −18% −29%
Мин.     −2% −44% −32% −46%
2560 × 1440
  Полноэкранное сглаживание NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation MSAA 4x + TAA 4x 54 55 32 40 35
Battlefield 1 TAA 148 148 95 107 104
Deus Ex: Mankind Divided MSAA 4x 44 48 25 31 25
DOOM TSSAA 8TX 200 200 142 167 154
F1 2018 TAA 151 159 85 104 91
Far Cry 5 TAA 105 107 69 90 85
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 88 89 64 79 51
Shadow of the Tomb Raider SMAA 4x 67 72 36 44 36
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 94 102 55 70 61
Total War: WARHAMMER II MSAA 4x 45 47 28 35 29
The Witcher 3: Wild Hunt TAA + HairWorks AA 4x 117 128 66 80 62
Макс.     +9% −27% −11% −19%
Средн.     +5% −39% −25% −36%
Мин.     +0% −46% −34% −47%


Производительностьигры (3840 × 2160)

Только в режиме 4K можно по достоинству оценить вычислительную мощность GeForce RTX 2080 Ti. Здесь разница между флагманскими видеокартами двух поколений достигла 39%, а по сравнению с GeForce GTX 1080 новинка быстрее на 72%. Даже разгон стал играть заметную роль, увеличив средний результат на 8%.

Быстродействие RTX 2080 Ti в 4К впечатляет и по абсолютным показателям. Только в двух из одиннадцати тестовых игр средняя кадровая частота оказалась ниже 60 FPS, да и то за счет неэкономичных режимов полноэкранного сглаживания (MSAA 4x в Deus Ex: Mankind Divided и Total War: WARHAMMER II).

3840 × 2160
  Полноэкранное сглаживание NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт) NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation Выкл. 67 71 43 53 47
Battlefield 1 101 106 59 67 63
Deus Ex: Mankind Divided 47 52 27 33 29
DOOM 137 147 78 97 81
F1 2018 99 108 55 68 57
Far Cry 5 73 78 41 55 48
GTA V 81 84 53 68 48
Shadow of the Tomb Raider 59 63 31 38 32
Tom Clancy's The Division TAA: Stabilization 57 62 31 41 35
Total War: WARHAMMER II Выкл. 40 44 24 32 26
The Witcher 3: Wild Hunt 79 86 48 50 40
Макс.     +11% −34% −16% −30%
Средн.     +8% −42% −28% −39%
Мин.     +4% −47% −37% −49%

 

Производительность: DLSS, трассировка лучей

В завершение игровых тестов у нас появилась возможность протестировать технологию DLSS с помощью двух задач — технической демки Infiltrator на основе Unreal Engine 4 и бенчмарка Final Fantasy XV Windows Edition. Напомним, что алгоритм DLSS (Deep Learning Super Sampling) позволяет выполнять рендеринг игры в сниженном разрешении, а заранее подготовленная нейросеть восстанавливает изображение до целевого разрешения экрана и одновременно дает эффект полноэкранного сглаживания. Подробнее принципы работы DLSS описаны в первой части обзора GeForce RTX 2080 Ti.

В данных примерах сравнивается частота смены кадров при целевом разрешении 3840 × 2160 с применением полноэкранного сглаживания TAA и DLSS. Как видим, в Infiltrator метод DLSS повысил быстродействие GeForce RTX 2080 Ti на 25, а в Final Fantasy XV — на 39%.

Что касается качества изображения, то движущуюся картину трудно оценить в Infiltraror из-за обильного Motion Blur. В сценах теста Final Fantasy XV можно обнаружить ошибки рендеринга — а именно, на границах сложных объектов вроде волос персонажей в сочетании с размытием заднего фона (Depth of Field) есть артефакты, и DLSS их усугубляет. В остальном заметных глазу различий между TAA и DLSS мы не нашли. То есть, DLSS будет практически бесплатно увеличивать частоту смены кадров в тех играх, которые получат поддержку этой технологии. Но напомним, DLSS необходимы тензорные ядра. Применять ее на GPU предыдущих поколений запрещено, и в любом случае это было бы чрезвычайно непрактично с точки зрения быстродействия.

Судя по тому, как много проектов уже объявили о поддержке DLSS, разработчикам относительно легко интегрировать эту технологию в игровой движок. Другое дело — трассировка лучей. Однако уже сейчас возможность увидеть Ray Tracing на GeForce RTX своими глазами дают несколько демонстрационных анимаций. Насколько мы знаем, Epic и NVIDIA не собираются выкладывать в публичный доступ нашумевшую демку Reflections, но мы можем смело использовать ее в качестве бенчмарка для GeForce RTX и будущих устройств, совместимых с раcширением DXR для Direct3D 12.

Сборка теста, предложенная NVIDIA, работает в разрешениях 1440p и 2160p с применением DLSS, и нам неизвестно, какое разрешение в действительности используется для масштабирования за счет нейросети. Как бы то ни было, GeForce RTX 2080 Ti справляется с рендерингом этой абсолютно фотореалистичной сцены при частоте смены кадров 56 и 33 FPS соответственно.


Производительность: декодирование видео

Помимо фундаментальных архитектурных изменений, описанных в первой части обзора GeForce RTX 2080 Ti, чипы семейства Turing получили обновленный мультимедийный блок. Декодер видеопотока способен обрабатывать HEVC с форматом цвета YUV444 и глубиной 10/12 бит на частоте 30 кадров/с. Поддержка 10/12-битной глубины цвета также реализована в декодировании VP9, а разрешение H.264 увеличено до 8К.

К сожалению, в тестовой версии драйвера для Turing есть ошибка, из-за которой GPU работает на сниженной частоте (300 МГц) при декодировании видео силами выделенного блока. Как следствие, результаты бенчмарков не отражают реального быстродействия в соответствующих задачах, хотя обратите внимание: даже на низкой частоте RTX 2080 Ti не уступает GTX 1080 в декодировании HEVC разрешения 1080p.

Производительность: вычисления

Часть бенчмарков GP-GPU, которые мы используем для тестирования видеокарт, пока не могут работать с архитектурой Turing. В частности, пришлось отказаться от Blender и CompuBench, а в SiSoftware Sandra невозможно проверить пропускную способность операций FP16.

Тем не менее в оставшемся тесте трассировки лучей (LuxMark) GeForce RTX 2080 Ti продемонстрировал выдающийся результат, закончив рендеринг кадра на 66% быстрее по сравнению с GeForce GTX 1080 Ti. В этом тесте не используются RT-ядра архитектуры Turing, но огромную роль сыграл увеличенный объем кешей GPU.

Не столь велик прирост быстродействия в операциях GEMM и FFT, согласно бенчмарку SiSoftware Sandra. Здесь лидерство по-прежнему принадлежит ускорителю Radeon RX Vega 64.

Выводы

Подготовка к запуску на потребительский рынок видеокарт серии GeForce RTX 20 прошла в режиме максимальной секретности, и NVIDIA сделала все, чтобы до последнего момента сохранить в тайне быстродействие архитектуры Turing в практических задачах. Если учесть, как дорого стоят видеокарты нового поколения, и тот факт, что PR-кампания GeForce RTX полностью сосредоточена на новых функциях рендеринга, эффективность Turing в существующих играх без поддержки Ray Tracing и алгоритмов машинного обучения оказалась под сомнением для всех, кто не имел раннего доступа к железу и, быть может, успел оформить предзаказ на GeForce RTX 2080/2080 Ti.

Спешим развеять худшие опасения: в сухом остатке RTX 2080 Ti обеспечивает частоту кадров на 39% выше по сравнению с GTX 1080 Ti при разрешении 4К. По сути, это единственный режим, в котором современные CPU позволяют раскрыться столь мощным графическим процессорам. И между прочим, вот еще один аргумент в пользу скорейшего перехода игровых движков на гибридную модель рендеринга.

Достижения GeForce RTX 2080 Ti не столь велики, если сопоставить с тем увеличением вычислительной мощности, которое предложил GeForce GTX 1080 Ti в качестве замены GTX 980 Ti (вплоть до 67%), а до того — GeForce GTX 680 по сравнению с GTX 580. Но не будем забывать, что смена флагманских ускорителей в тех эпизодах сопровождалась переходом на новый узел фотолитографии, в то время как преимущество GeForce RTX 20 основано на чистом размере GPU и оптимизациях логики. Таким образом, Turing совершенно не выбивается из ряда предшествующих итераций архитектуры NVIDIA, а предсказания фиаско в современных играх оказались далеки от истины.

Вместе с тем ни GTX 980 Ti, ни GTX 1080 Ti не были дороже своих предшественников, а рекордная цена нового флагмана совершенно не оправдана в свете межпоколенческого прогресса, который мы уже привыкли считать должным. С этим придется смириться, ведь конкурентов у GeForce RTX 2080 Ti — и по быстродействию в современных играх, и тем более по принципиально новым возможностям — на рынке нет и не предвидится в ближайшем будущем.

Автор: Валерий Косихин