Обзор видеоускорителя Nvidia GeForce RTX 3070: очень привлекательное по цене младшее решение из топового семейства Nvidia Ampere

Также очень важно, что новые видеокарты GeForce RTX 30 умеют захватывать и записывать видео в 8K-разрешении для стриминга при помощи GeForce Experience и функции Shadowplay, которая поддерживает запись видео в форматы вплоть до 8K HDR с 30 FPS. GeForce RTX 3070 не только обеспечивает производительность топовой видеокарты недавнего времени, но и поддерживает все новые технологии. Здесь мы рекомендуем несколько видеокарт, более или менее близких по производительности к рассмотренной. Общая производительность GeForce RTX 3070 Ti по сравнению с ближайшими конкурентами среди десктопных видеокарт. Все тесты широко используют объемное освещение и тесселяцию, и, несмотря на то, что выполняются в разрешении 1280×720, являются относительно тяжелыми. Это результаты тестов GeForce RTX 3070 Ti на производительность рендеринга в неигровых бенчмарках.

Конечно, здесь не обошлось без оптимизаций различного рода, которые относятся к парадным функциям графических процессоров NVIDIA — трассировке лучей и машинному обучению.
Мы уже рассмотрели две дорогие, основанные на разных модификациях чипа GA102, а сегодня у нас в обзоре, пожалуй, самая интересная видеокарта из анонсированных — RTX 3070, имеющая самую доступную цену.
Как ни крути, CUDA-ядра FP32 конкурируют за кеш и такты обслуживающей логики с массой других вычислительных блоков SM, а если речь именно об играх, то сама NVIDIA акцентировала востребованность целочисленных расчетов в шейдерах наряду с FP32, но в этом плане никакого удвоения производительности Ampere не сулит.
Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения.

Вообще, именно OLED-телевизоры производства LG идеально подходят для нового семейства видеокарт Nvidia, они имеют очень низкие задержки и высокую отзывчивость в игровых режимах, поддерживают адаптивную частоту обновления G-SYNC Compatible, а также 4K- и 8K-разрешение с HDR. И если для игры в таком разрешении вам нужна GeForce RTX 3090, то уж видеоролики смотреть можно и при помощи RTX 3070. Так, совместная работа с LG позволила получить поддержку технологии G-SYNC в 8K-разрешении на соответствующих OLED-телевизорах корейской компании. Но применение этого режима позволяет в 4K-разрешении получить отзывчивость, аналогичную разрешению 2560×1440 в обычном режиме, а в 2560×1440 задержки будут аналогичны тому, что обычно получаются в Full HD.

В самой ожидаемой игре года будет применяться трассировка лучей для рендеринга отражений, теней, глобального затенения и рассеянного освещения, также заявлена и поддержка DLSS. Пожалуй, мы бы хотели еще более активного их внедрения в игры, но это тормозится как парком старых GPU в существующих игровых системах, так и отсутствием поддержки трассировки в консолях нынешнего поколения. Мы еще раз отметим набор технологий RTX IO, который в будущем обеспечит быструю передачу и распаковку ресурсов на GPU, и повысит производительность системы ввода-вывода в десятки раз, по сравнению с привычными HDD и традиционными API. Улучшенные тензорные ядра хоть и не удвоили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности.

Тестирование: игровые тесты

Сравнивать новинку с условными конкурентами компании AMD сложно, можно разве что отметить высокую скорость текстурирования у Radeon VII — так получается из-за большого количества текстурных блоков у этой модели. Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. В качестве полусинтетического теста у нас также используется и довольно популярный 3DMark Time Spy, а также некоторые другие — например, DLSS как инфляция влияет на сбережения граждан и RTX.

Предварительные данные о производительности новинки говорят о том, что целью Nvidia было получение производительности топового решения GeForce RTX 2080 Ti из предыдущего поколения, но в ином ценовом сегменте. Но производительности тех GPU порой не хватало, а в этом году стали доступны новые технологии производства полупроводников, что позволило улучшить в архитектуре Ampere именно производительность, хотя и некоторые новые возможности также появились. Мы продолжаем рассматривать модели видеокарт нового семейства GeForce RTX 30, основанные на архитектуре Ampere, которые компания Nvidia представила в этом году. В нем используется DirectX 11 feature level 9 для отображения битвы между двумя космическими флотами вблизи замерзшей планеты в разрешении 1280×720. Ice Storm использовался для измерения производительности ноутбуков начального уровня и планшетов на базе Windows. Cloud Gate – это устаревший бенчмарк, использующий DirectX 11 feature level 10, применявшийся для тестирования домашних ПК и недорогих ноутбуков.

Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.
И модель RTX 3070 ничего не изменила, естественно, так как дело в драйверах, которые одинаковы для всех GPU.
BIOS видеокарты позволяет увеличить TBP всего лишь на 9 %, а попытки разгона GPU не прибавили больше 50 МГц к номинальной тактовой частоте и 42 МГц к реальной частоте под нагрузкой.
А вот дистанция между GeForce RTX 3070 и более слабыми видеокартами начинает расти вместе с разрешением экрана.
Посмотрим, что с количеством и возможностями TMU сделают в архитектуре RDNA2, но Radeon всегда имели сравнительно большое количество блоков текстурирования и с такими задачами обычно справляются несколько лучше видеокарт конкурента того же ценового позиционирования.

Совокупная оценка производительности

В любом случае это видеокарта не для энтузиастов, а в первую очередь для тех, кто ценит тишину, эстетику или собирает игровой компьютер в компактном корпусе. Так что мы в очередной раз советуем читателям отложить апгрейд и дождаться схватки видеокарт 30-й серии с грядущими предложениями AMD. После знакомства со старшими моделями 30-й серии мы прониклись скепсисом к обещаниям NVIDIA о производительности GeForce RTX 3070. Так, видео 8К с кадровой частотой 30 FPS загружает восьмиядерный CPU тестового стенда на 50 %, когда файл воспроизводится с локального хранилища, и на 60 % через браузер.

Nvidia считает, что Ampere дает скачок производительности даже еще больший, по сравнению с Turing. Что касается скорости нового GPU, то при FP32-вычислениях он обеспечивает производительность более 20 терафлопс, а это больше, чем у RTX 2080 Ti. При этом GA104 сохранил все ключевые особенности старшего чипа GA102, и RTX 3070 отличается от RTX 3080 и RTX 3090 разве что применением типа памяти GDDR6, а не нового GDDR6X. Мы уже рассмотрели две дорогие, основанные на разных модификациях чипа GA102, а сегодня у нас в обзоре, пожалуй, самая интересная видеокарта из анонсированных — RTX 3070, имеющая самую доступную цену. Еще одна важная характеристика нового семейства GeForce RTX 30 — приемлемые цены, принесшие значительное улучшение соотношения цены и производительности по сравнению с предыдущим семейством GeForce RTX 20. Благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения архитектуры Ampere примерно в 1,5-1,7 раза быстрее аналогичных Turing в традиционных задачах растеризации и до 2 раз быстрее при трассировке лучей.

Mark 11 Performance GPU

Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Первым тестом стал Boundary — один из китайских игровых проектов с поддержкой RTX. В целом же, новинка показывает чуть более высокие результаты, по сравнению с RTX 2080 Ti, что соответствует нашим ожиданиям и настраивает на позитивный лад перед игровыми тестами. Если в первом подтесте RTX 3070 чуть быстрее, то во втором уже уступила, хоть и также совсем немного — разница во всех случаях не достигает даже 2 FPS. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Если рассматривать RTX 3070 по сравнению с топовым решением из предыдущего поколения Turing, то разница в этот раз в пользу RTX 2080 Ti. Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU.

График соотношения производительности и цены

Кроме того, часть количественных подвижек в производительности 70-й позиции модельного ряда NVIDIA принимает качественный характер даже при разрешении 1080p, когда дело доходит до самых требовательных современных тайтлов. А ведь наш экземпляр Founders Edition комплектуется чипами GDDR6 точно такого же номинала, как предполагают спецификации видеокарты. BIOS видеокарты позволяет увеличить TBP всего лишь на 9 %, а попытки разгона GPU не прибавили больше 50 МГц к номинальной тактовой частоте и 42 МГц к реальной частоте под нагрузкой. Также стоит обратить внимание на то, что RTX 3070 находится фактически в одной категории потребляемой мощности с Radeon RX 5700 XT (213 Вт у референсной модели), но это лучше характеризует кремний Navi первого поколения, перегретый завышенным напряжением, чем новинку NVIDIA.

GeForce RTX 3070 Ti: технические характеристики и тесты

Параметры установленной на GeForce RTX 3070 Ti памяти – тип, объем, шина, частота и пропускная способность. На ней установлено 8 Гб памяти GDDR6X на частоте 1.19 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 608.3 Гб/с. Это топовая десктопная видеокарта на архитектуре Ampere и техпроцессе 8 нм, в первую очередь рассчитанная на геймеров.

⇡#Производительность на ватт и площадь GPU

Видеокарта модели GeForce RTX 3070 в теории должна появиться в продаже в ближайшие дни, но в связи с возможным недостаточным объемом производства, огромным спросом и дефицитом старших видеокарт семейства GeForce RTX 30, достоверно что-то утверждать сложно. При создании этой модели Founders Edition, инженеры компании хорошо поработали над компактностью печатной платы — как и в старших видеокартах, это сделано для того, чтобы второй вентилятор продувал воздух через радиатор напрямую, без препятствий. Такие видеокарты предлагают любопытные системы охлаждения и строгий дизайн, которого не найти у большинства производителей видеокарт, гонящихся за количеством и размером вентиляторов, а также разноцветной подсветкой.

Разумеется, в разрешении 2.5К эта видеокарта легко потянет игры с максимальным качеством графики с трассировкой лучей даже без DLSS! Вероятно, так получается из-за того, что в 4K-разрешении основным фактором, ограничивающим производительность, является трассировка лучей, с которой Ampere справляется несколько лучше. Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. В 4K-разрешении вообще только старшие видеокарты линейки RTX 30 обеспечили приемлемую частоту кадров, хотя и ниже 60 FPS, но в реальных условиях можно использовать менее качественный вариант DLSS.

Сегодняшняя новинка GeForce RTX 3070, основанная на лишь слегка урезанной версии графического процессора GA104, показала приличный результат, немного уступила RTX 3080, и на четверть превзошла по производительности RTX 2080 Ti. Рассматриваемая сегодня GeForce RTX 3070 справилась с задачей совсем чуть медленнее RTX 3080, но опередила топовую RTX 2080 Ti из предыдущего поколения Turing. Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу. Новая видеокарта GeForce RTX 3070 показала равный с RTX 2080 Ti результат, что более-менее близко к теории.

⇡#Результаты игровых тестов с трассировкой лучей

Поэтому, несмотря на то, что GA104 и TU104 сообщаются с VRAM 256-битной шиной, общее количество ROP на чипе нового поколение в полтора раза выше — 96 против 64, — что положительно сказывается на производительности в режиме высокого разрешения. Блоки операций растеризации (ROP) Ampere больше не привязаны к контроллерам оперативной памяти и стали компонентами GPC. Конечно, здесь не обошлось без оптимизаций различного рода, которые относятся к парадным функциям графических процессоров NVIDIA — трассировке лучей и машинному обучению.

Результаты тестов с включенной аппаратной трассировкой лучей и DLSS в разрешениях 1920×1200, 2560×1440 и 3840×2160

RTX 3080 и RTX 3090 FE — это своего рода рекламная акция NVIDIA, и других видеокарт с настолько качественной оснасткой вы просто не сможете купить за такие деньги. Чтобы достигнуть такого уровня производительности, который демонстрируют GeForce RTX 3080 и RTX 3090, NVIDIA пришлось смириться с громадным ростом потребляемой мощности, и эта тенденция распространяется вниз на GeForce RTX 3070. Или, напротив, 4-гигабайтные ускорители Radeon R9 Fury (X) и GTX 980 того же периода, которые сошли с дистанции раньше, чем исчерпали ресурс производительности своих графических процессоров. Кроме того, у RTX 3070 столько же блоков операций растеризации (96), как у TITAN RTX на базе полностью активированного чипа TU102, так что новинка должна хорошо выдерживать нагрузку при рендеринге в высоком разрешении. NVIDIA утверждает, что при благоприятных условиях (то есть в играх с трассировкой лучей) новинка обеспечивает на 60 % более высокую частоту смены кадров, чем RTX 2070, и это (опять не удержимся от спойлера) близко к истинному положению дел. Как ни крути, CUDA-ядра FP32 конкурируют за кеш и такты обслуживающей логики с массой других вычислительных блоков SM, а если речь именно об играх, то сама NVIDIA акцентировала востребованность целочисленных расчетов в шейдерах наряду с FP32, но в этом плане никакого удвоения производительности Ampere не сулит.

Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Половина ребер, ближайшая к монтажной пластине видеокарты, ориентирована таким образом, чтобы поток воздуха от вентилятора диаметром 85 мм (точно такие же применяются в RTX 3080 FE) шел в перпендикулярном направлении от материнской платы и одновременно наружу из корпуса ПК.