Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Inno3D разработала первый в мире водоблок для графических карт NVIDIA FermiКомпания Inno3D представила с поколением GeForce RTX несколько видеокарт. Линейка iChill X3 с инновационным воздушным охлаждением должна скоро появиться в магазинах. Версия ICHILL GeForce RTX 2080 Ti Black, побывавшая в нашей тестовой лаборатории, благодаря водяному охлаждению почти достигает 2 ГГц в штатном режиме.

Новая линейка ICHILL Frostbite будет оснащаться водоблоком с полным покрытием. В качестве производителя водоблоков была выбрана компания Alphacool.

Видеокарты в линейке ICHILL Frostbite можно интегрировать в существующий контур СВО.

Inno3D устанавливает медный водоблок с никелированным покрытием, в области GPU у него нанесены тонкие канальцы размером всего 0,6 мм, улучшающие передачу тепла жидкости. Также вода проходит и через другие области водоблока.

Поскольку водоблок не специализирован, Inno3D использует эталонную PCB, но берет на себя установку водоблока, продавая готовое решение под собственным брендом. К преимуществам можно отнести встроенную RGB-подсветку.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

На данный момент Inno3D не упоминает технические спецификации новых видеокарт. Кроме тактовой частоты Boost будет весьма интересно узнать тепловой пакет, именно от него зависят тактовые частоты на практике. Благодаря водяному охлаждению потенциал здесь выше, чем у видеокарт с воздушным кулером. Как только мы получим дополнительную информацию от Inno3D, то обязательно поделимся с читателями.

Конечно, покупатель видеокарты GeForce RTX может установить подобный водоблок и самостоятельно, если дизайн PCB позволяет. Данный процесс не самый сложный, но многие пользователи все равно предпочитают с ним не связываться, именно они и станут покупателями новинки.

Видеокарты в линейке ICHILL Frostbite должны скоро появиться на прилавках магазинов. Но Inno3D не называет точную дату, как и цену.

Обзор и тест видеокарты Inno3D iChill GeForce GTX 1080 Ti X3 Ultra (C108T3-1SDN-Q6MNX)

Свершилось! Теперь при наличии 4К монитора и достаточной суммы в денежном эквиваленте можно в полной мере насладиться современными играми. И появляется такая возможность…

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Свершилось!Теперьпри наличии 4К монитора и достаточной суммы в денежном эквивалентеможно в полной мере насладиться современными играми. И появляетсятакаявозможность благодарявыходу новейшего3D ускорителяот компании NVIDIA, который является слегка «урезанным» аналогом TITAN X.

Желанной новинку делает соотношение цена/производительность, а также тот факт, что это самая быстрая одночиповая видеокарта на нашем рынке. Но есть и еще одно преимущество у GTX 1080 Ti перед TITAN X, обусловленное наличием версий с альтернативной системой охлаждения.

Как раз об одной из таких видеокарт мы сегодня и поговорим, давайте поприветствуем Inno3D iChill GeForce GTX 1080 Ti X3 Ultra.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Спецификация

  • Бренд: Inno3D;
  • Модель: iChill GeForce GTX 1080 Ti X3 Ultra;
  • Графический процессор: GP102;
  • Техпроцесс: 16 нм;
  • Частота GPU: 1607 МГц/турбо режим 1721 МГц;
  • Кол-во шейдерных процессоров: 3584;
  • Видеопамять: 11 Гб;
  • Тип видеопамяти: GDDR5X;
  • Разрядность шины видеопамяти: 352 бит;
  • Частота видеопамяти: 2852 МГц (11.4 ГГц QDR);
  • Поддержка SLI: есть;
  • Поддержка HDCP: есть (1080p);
  • Порты: 3x DisplayPort 1.4, HDMI 2.0b, Dual-link DVI-D;
  • Макс. кол-во подключаемых мониторов: 4 (до 3-х для 3D Vision Surround);
  • Разъем дополнительного питания: 8-pin + 6-pin;
  • Уровень потребления: 250 Вт;
  • Длина: 302.5 мм;
  • Цена: 52000 руб.

Позиционирование

GTX 1080 Ti позиционируется как самая доступная видеокарта для получения достаточной производительности на 4К дисплеях.

Пригодится такой ускоритель и тем, кто является счастливым обладателем 120/144 Гц монитора с поддержкой G-Sync, так как в этом случае он обеспечит наиболее плавную картинку и требуемую скорость обработки.

Не забываем и про немногочисленных владельцев VR-гарнитур, где вычислительная мощность также в приоритете. В общем, до выхода новой серии графических ускорителей NVIDIAGTX 1080 Ti будет оставаться востребованной.

А теперь поговорим о цене. Начнём с того, что альтернативы GTX 1080 Ti со стороны AMD пока не наблюдается, что оказывает пагубное влияние на конкуренцию. TITAN X за счёт высокого ценника, малой доступности, отсутствия версий с альтернативной системой охлаждения и слабым отличием в производительностистановится крайне невыгоден для приобретения.

Чуть ниже расположилась GTX 1080, которая также не способна как-то потеснить нынешнего «Короля». Здесь можно даже сказать, что NVIDIA подстраховалась перед грядущим выходом VEGA и заранее снизила стоимость на GTX 1080 Ti. Т.е., если бы не VEGA, то ценник с большой долей вероятности был бы выше.

Так что стоимость GTX 1080 Ti можно считать вполне обоснованной.

Упаковка и комплектация

Видеокарта поставляется в крупной коробке, на передней части которой изображён рисунок, напоминающий, как по форме, так и смыслу, логотип компании Silverstone. Чуть ниже указываетсяналичие дополнительных аксессуаров в комплекте.

  • Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi
  • С противоположнойстороны на различных языках упоминаются отличительные характеристики и поддержка фирменных технологий NVIDIA.
  • Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Наиболее полезным из дополнительных аксессуаров будет тряпичный коврик с символикой компании. С другой стороны, многих порадует лицензионный ключ для 3DMark. Кроме тоговнутри вы найдёте документацию и шестигранник.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Внешний вид изделия

Спереди видим три массивных вентилятора, которые частично прикрыты чёрной металлической рамкой. Видеокарта с таким дизайном отлично впишется в большинство конфигураций, так как в оформлении используется только указанный вышецвет. Можно с лёгкостьюпредставить моддинг проект на тематику «Batman: The Dark Knight» с применением iChill GeForce GTX 1080 Ti X3 Ultra.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

На другой стороне радует наличие металлической пластины, которая защищает печатную плату, а также положительно влияет на стилистику. Для улучшения отвода тепла данный элемент снабжён перфорацией.

Немного портит впечатление обилие всевозможных наклеек с указанием серийного номера, даты производства и другой информацией.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Длина видеокарты достигает 303 мм, что отрицательно скажется на совместимости с компактными или старыми корпусами. Более того, из-за массивной системы охлаждения устройство занимает 2,5 слота при установке в материнскую плату.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Важно отметить, что имеется поддержка SLI, но в данном случае две видеокарты займут 6 слотов, и вам потребуется длинный соединительный мостик.

Для питания системы и видеокарты рекомендуется использовать блок мощностью от 600 Вт с коннекторами на 8 и 6-пин. К сожалению, разъемы ориентированы фиксаторами вниз и отсоединить провода становится крайне затруднительно, что можно отнести к минусам.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Основной каркас кожуха выполнен из пластиковых элементов, но усиливается при помощи металлических рамок.

На переднем торце видно, как выходят четыре тепловые трубки из пластины. Также отметим, что длина печатной платы меньше длины СО.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Если на референсной плате 3x DisplayPort 1.4 и один HDMI 2.0b, то в нашем случае добавлен интерфейс Dual-link DVI-D.

Особенностью iChill GeForce GTX 1080 Ti X3 Ultra является то, что панель раскрашенав чёрный цвет, чего не встретишь на других моделях.

Система охлаждения

При выборе видеокарты определяющую роль играет альтернативная система охлаждения, которая значительно превосходит по параметрам референсную версию. Более того, решения от партнёров компании NVIDIA работают тише и обычно снабжены заводским разгоном.

Важной особенностью ускорителей Inno3D является отсутствие блокирующих пломб на шурупах. Таким образом, можно легко демонтировать систему охлаждения, заменить термопасту, продуть радиатор от пыли или установить на печатную плату водоблок.

Чтобы снять радиатор с платы потребуется открутить шесть шурупов и отсоединить пару коннекторов. Так как провода длинные, затруднений при разборе не возникает.

Отметим, что, несмотря на огромный радиатор, память охлаждается отдельной металлической пластиной. В местах контакта с чипами используются термопрокладки.

Бэкплейт фиксируется на печатной плате дополнительными шурупами с другой стороны.Поэтомуснять его можно только после демонтажа системы охлаждения.

Дальнейший разбор затруднителен в виду того, что каркассостоит из пластика, тогда как рамки металлические. Крепится это дело к друг другу на пластиковые защёлки, которые при чрезмерном усилии можно повредить. Поэтомудальнейший разбор не производился.

За активную часть охлаждения отвечают три вентилятора Colorful CF-12915S с параметрами 12В 0.35А, построенные на подшипнике скольжения. Здесь мы видим одиннадцать лопастей стандартной формыбез применения каких-либо оптимизаций.

Здоровенный радиатор поделён на два отсека, расстояние между пластинами составляет 1 мм. Правая часть отводит тепло только от графического процессора.Контакт обеспечивает медная никелированная пластина и термопаста.

Через пластины проходит пять тепловых трубок:две — 8 мм и три — 6 мм. Левая часть охлаждает подсистему питания.Контакт обеспечивает металлическая пластина и термопрокладки.

В этой части мы видим четыре тепловые трубки:две — на 8 мм и две — на 6 мм.

Печатная плата

  1. Плата соответствует эталонному вариантус той лишь разницей, что здесь распаян интерфейс Dual-link DVI-D.
  2. Вокруг кристалла расположена защитная металлическая рамка, предотвращающая его повреждениев процессе установки системы охлаждения.

  3. Графический чип GP102 изготовлен по техпроцессу 16 нм и несет на борту 3584 шейдерных процессора, 224 блока текстурирования и 88 блоков растеризации.
Читайте также:  Вас угораздило купить компьютер со «смартфонным» разъёмом USB-C: что теперь к нему подключать

Вокруг GPU распаяно 11 модулей памяти типа GDDR5X объемом по 1024 ГБ каждый.

Производитель — компания Micron, наименование — MT58K256M321JA-110. Разрядность шины памяти — 352 бита.

Питание выполнено по схеме 7+1+2 (GPU/PLL/MEM). Семь фаз отведено для нужд графического чипа и две фазы на память. На каждую фазу приходится по два N-канальных полевых транзистора AOE6932 и по одному драйверу 53603A.

  • За управление питанием отвечает ШИМ-контроллер uP9511P с программной регулировкой напряжения и возможностью подключения до семи фаз.

Конфигурация тестового стенда

  • Процессор: Intel Core i7 7700K
  • Материнская плата: ASUS Z270F Gaming
  • СЖО: Thermaltake Pacific RL360
  • Термоинтерфейс: Cryorig CP5
  • Память: 2 x 8 Гбайт DDR4 3000 Patriot Viper 4
  • Видеокарта: Inno3D iChill GeForce GTX 1080 Ti X3 Ultra
  • HDD: WD2000FYYZ, WD7500BPVT
  • БП: SeaSonic Snow Silent-1050 1050W
  • Корпус: Thermaltake Core P3 Snow
  • Монитор: SAMSUNG U32E850R
  • Операционная система: Windows 10 Pro 64-bit
  • Драйвера: GeForce 382.05.

В качестве центрального процессора использовался Intel Core i7-7700K.При этомчастота процессора была номинальной. Роль платформы выполняла материнская плата ASUS Z270F Gaming. Память функционировала на частоте 2133 МГц с таймингами 15-15-15-36.

  1. Рассматриваемый экземпляр GTX 1080 Ti отличается от Founders Edition альтернативной системой охлаждения, заводским разгоном и наличием подсветки.
  2. На момент тестирования термоинтерфейс соответствовал заводскому.

Синтетические тесты

  • Для оценки производительности в синтетике использовались тесты Valley Benchmark, Heaven Benchmark и 3DMark13.

Игровые тесты

Перейдем к игровым приложениям и остановимся на методике тестирования. Измерение FPS проводилось с помощью утилиты FRAPS.

Все игры были протестированы в трех наиболее актуальных разрешениях: 1920х1080, 2560х1440 и 3840х2160. При этомдля каждого разрешения указаны результаты с включенным сглаживанием (SSAA).

Вертикальная синхронизация (VSync) была отключена вручную. Все остальные настройки были установлены на максимально возможные (Ultra).

Как видно из результатов, рассматриваемая видеокарта отлично справляется с поставленной задачей и гарантирует высокий уровень FPS в самых актуальных разрешениях.

Однако, при включении сглаживания наблюдается недостаток производительности в таких играх, как Assassin's Creed Syndicate, Deus Ex — Mankind Divided, Watch Dogs 2. И это с учётом того, что сглаживание было установлено не на максимальную величину.

Поэтомупри запуске ресурсоёмких игровых тайтлов в 4Ксглаживание следует отключать. Если же игра не слишком требовательна, то можно не обращать внимание на этот параметр.

Фирменное ПО и подсветка

Inno3D TuneIT OC Utilityявляется фирменной утилитой для разгона видеокарт Inno3D. Стартовый интерфейс выполнен в виде приборной панели со спидометрами, на которых отображается текущая частота GPU и памяти. Чуть ниже расположен мониторинг температуры.

  1. Центральная часть включает четыре кнопки с подменю.
  2. GPU Information – базовая информация об устройстве, включая указание версии BIOS и дублирование мониторинга параметров основной панели.
  3. Setting – возможность сохранить или прошить файл BIOS, а такжедобавление утилиты в автозагрузку.
  4. Easy Mode – упрощенный режим для разгона видеокарты, увеличивает производительность на 2-5-10%.
  5. Advanced Mode – открывает доступ к параметрам для разгона вручную, включая повышение питающего напряжения, частоты ядра/памяти и установку скорости вращения вентиляторов.

Как и положено современной игровой видеокарте, Inno3D iChill GeForce GTX 1080 Ti X3 Ultra снабжена подсветкой. К сожалению, онанерегулируемая и у вас не будет возможности выставить нужный цвет.

Всего здесь две зоны с подсветкой, одна из которых является индикатором уровня нагрузки. Надпись iChill горит синим при отсутствии нагрузки, зелёным — при слабой загрузке и красным — при полной нагрузке.

Вторая зона подсвечивает белым цветом вентиляторы.

Температура и разгон

Тестирование происходило в открытом корпусе при комнатной температуре в 25 градусов. В режиме бездействия частота GPU и памяти снижается до 278/405 МГц, что напрямую сказывается на энергоэффективности и улучшает температурные показатели.

В режиме покоя температура опустилась до 39°С, а под нагрузкой не превысила 71°С. Что же до уровня шума, то при малой загруженности видеокарта останавливает вентиляторы и не издаёт ни звука. Под нагрузкой появляется шум, но особого дискомфорта это не вызывает.

В общем и целом, система охлаждения хорошо справляется с поставленной задачей и не допускает перегрева.

Разгон с повышением питающего напряжения осуществлялся при помощи последней версии утилиты MSI Afterburner.

  • Частоту графического процессора удалось повысить на 25 МГц, что в итоговом варианте составило 1632 МГц. Однакос учетом GPU Boost искомое значение выросло до 1746 МГц.
  • Частота памяти была увеличена на 84 МГц (672МГц QDR) и достигла значения 1510 МГц (12 ГГц QDR), получилась хорошая прибавка.
  • Предлагаемознакомиться с возросшими показателями Fire Strike Extreme и Fire Strike Ultra:

Также приведем возросшие показатели в разгоне при майнинге ZCash. По умолчанию можно рассчитывать на 720 sol/s, а при разгоне результат увеличивается до 750 sol/s.

Заключение

По итогам у Inno3D получилась достойная версия GTX 1080 Ti на базе референсной печатной платы.

К плюсам можно отнести эффективную систему охлаждения, низкий уровень шума при слабой нагрузке за счёт наличия полупассивного режима работы, заводской разгон графического ядра и памяти, хорошую производительность в играх, наличие подсветки, расширенную комплектацию, необычный дизайн и поддержку фирменного ПО.

Среди негативных моментов стоит отметитьгабариты видеокарты, а такженеудобную ориентацию коннекторов для дополнительного питания.

Плюсы:

  • Дизайн;
  • Комплектация;
  • Производительность;
  • Заводской разгон графического ядра и памяти;
  • Хороший результат при разгоне памяти;
  • Наличие подсветки;
  • Эффективность системы охлаждения;
  • Тихая в простое;
  • Поддержка фирменного ПО TuneIT OC.

Минусы:

  • Габариты – занимает 2,5 слота при длине, превышающей 300 мм;
  • Неудобная ориентация коннекторов дополнительного питания.

Видеокарту Inno3D GeForce RTX 3090 iChill Frostbite оснастили водоблоком

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Inno3D выпустила видеокарты линейки GeForce RTX 30 iChill Frostbite, оснащённые водоблоком для охлаждения.

Водоблок с полным покрытием отводит тепло от графического процессора, микросхем памяти и регуляторов напряжения в подсистеме питания. Медное основание водоблока никелировано.

Прозрачная крышка является рассеивателем для RGB-подсветки, которой украшен водоблок. С обратной стороны печатной платы установлена металлическая пластина, распределяющая механические и тепловые нагрузки.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Графический процессор видеокарты Inno3D GeForce RTX 3080 iChill Frostbite с 8704 ядрами CUDA работает на частоте до 1770 МГц. Посредством 320-разрядной шины он связан с 10 ГБ памяти GDDR6X, работающей со скоростью 19 Гбит/с.

В случае Inno3D GeForce RTX 3090 iChill Frostbite графический процессор с 10496 ядрами CUDA работает на частоте до 1755 МГц. Шина памяти у этой карты — 384-разрядная, а объем памяти GDDR6X, работающей со скоростью 19,5 Гбит/с, равен 24 ГБ.

Inno3D разработала первый в мире водоблок для графических карт NVIDIA Fermi

Каждая карта оснащена одним выходом HDMI 2.1 и тремя выходами DisplayPort 1.4a. Размеры обеих моделей совпадают: длина равна 226 мм, высота — 135 мм, а корпусе любая из карт занимает два слота. Цены производитель не называет.

История потоковых мультипроцессоров Nvidia

Последние выходные я потратил на освоение программирования CUDA и SIMT. Это плодотворно проведённое время закончилось почти 700-кратным ускорением моего «рейтрейсера на визитке» [1] — с 101 секунд до 150 мс. Такой приятный опыт стал хорошим предлогом для дальнейшего изучения темы и эволюции архитектуры Nvidia. Благодаря огромному объёму документации, опубликованному за долгие годы «зелёной» командой, мне удалось вернуться назад во времени и вкратце пройтись по удивительной эволюции её потоковых мультипроцессоров. В этой статье мы рассмотрим: Год Поколение Серия Кристалл Техпроцесс Самая мощная карта
===========================================================================
2006 Tesla GeForce 8 G80 90 nm 8800 GTX
2010 Fermi GeForce 400 GF100 40 nm GTX 480
2012 Kepler GeForce 600 GK104 28 nm GTX 680
2014 Maxwell GeForce 900 GM204 28 nm GTX 980 Ti
2016 Pascal GeForce 10 GP102 16 nm GTX 1080 Ti
2018 Turing GeForce 20 TU102 12 nm RTX 2080 Ti

Тупик

Вплоть до 2006 года архитектура GPU компании NVidia коррелировала с логическими этапами API рендеринга[2].

GeForce 7900 GTX, управлявшаяся кристаллом G71, состояла из трёх частей, занимавшихся обработкой вершин (8 блоков), генерацией фрагментов (24 блоков), и объединением фрагментов (16 блоков). Кристалл G71. Обратите внимание на оптимизацию Z-Cull, отбрасывающую фрагмент, не прошедший бы Z-тест. Эта корреляция заставила проектировщиков угадывать расположение «узких места» конвейера для правильной балансировки каждого из слоёв. С появлением в DirectX 10 ещё одного этапа — геометрического шейдера, инженеры Nvidia столкнулись со сложной задачей балансировки кристалла без знания того, насколько активно будет использоваться этот этап. Настало время для перемен.

Читайте также:  Ирригатор полости рта какой лучше выбрать и как правильно пользоваться, отзывы

Tesla

Nvidia решила проблему роста сложности при помощи «объединённой» архитектуры Tesla, выпущенной в 2006 году. В кристалле G80 больше не было различий между слоями. Благодаря возможности выполнения вершинного, фрагментного и геометрического «ядра», потоковый мультипроцессор (Stream Multiprocessor, SM) заменил все существовавшие ранее блоки. Уравновешивание нагрузки выполнялось автоматически, благодаря замене выполняемого каждым SM «ядра» в зависимости от требований конвейера. «Фактически, мы выбросили всю шейдерную архитектуру NV30/NV40 и с нуля создали новую, с новой общей архитектурой универсальных процессоров (SIMT), в которой также были введены новые методологии проектирования процессоров».

Джона Албен (интервью extremetech.com)

Больше не имеющие возможности выполнять инструкции SIMD «блоки шейдеров» превратились в «ядра», способные выполнять по одной целочисленной инструкции или по одной инструкции с float32 за такт. SM получает потоки в группах по 32 потока, называемых warp. В идеале все потоки одного warp выполняют одновременно одну и ту же инструкцию, только для разных данных (отсюда и название SIMT). Многопотоковый блок инструкций (Multi-threaded Instruction Unit, MT) занимается включением/отключением потоков в warp-е в случае, если их указатель инструкций (Instruction Pointer, IP) сходится/отклоняется. Два блока SFU помогают выполнять сложные математические вычисления, например, обратный квадратный корень, sin, cos, exp и rcp. Эти блоки также способны выполнять по одной инструкции за такт, но поскольку их только два, скорость выполнения warp-а делится на четыре. Аппаратная поддержка float64 отсутствует, вычисления выполняются программно, что сильно влияет на скорость выполнения. SM реализует свой максимальный потенциал, когда способен скрывать задержки памяти благодаря постоянному наличию диспетчеризируемых warp-ов, но также когда поток в warp-е не отклоняется (управляющая логика удерживает его на одном пути выполнения инструкций). Состояния потоков хранятся в 4-килобайтных файлах регистров (Register File, RF). Потоки, занимающие слишком большое пространство в стеке, снижают количество возможных потоков, которые могут выполняться одновременно, понижая при этом производительность.

Кристаллом-флагманом поколения Tesla был 90-нанометровый G80, представленный в GeForce 8800 GTX. Два SM объединены в кластер обработки текстур (Texture Processor Cluster, TPC) вместе с текстурным блоком (Texture Unit) и кешем Tex L1.

Обещалось, что G80 с 8 TPC и 128 ядрами генерирует 345,6 гигафлопс[3]. Карта 8800 GTX была в своё время чрезвычайно популярна, она получила замечательные отзывы и полюбилась тем, кто мог себе её позволить.

Она оказалась таким превосходным продуктом, что спустя тринадцать месяцев после выпуска оставалась одним из самых быстрых GPU на рынке.

G80, установленный в 8800 GTX. Render Output Units (ROP) занимаются выполнением сглаживания. Вместе с Tesla компания Nvidia представила язык программирования C для Compute Unified Device Architecture (CUDA) — надмножество языка C99. Это понравилось энтузиастам GPGPU, приветствовавшим альтернативу обмана GPU при помощи текстур и шейдеров GLSL. Хотя в этом разделе я в основном рассказываю о SM, это была только одна половина системы. В SM необходимо передавать инструкции и данные, хранящиеся в памяти GPU. Чтобы избежать простоев, GPU не пытаются минимизировать переходы в память при помощи больших кешей и прогнозирования, как это делают CPU. GPU пользуются задержкой, насыщая шину памяти для удовлетворения потребностей ввода-вывода тысяч потоков. Для этого кристалл (например, G80) реализует высокую пропускную способность памяти при помощи шести двусторонних шин памяти DRAM. GPU пользуются задержками памяти, в то время как CPU скрывают их при помощи огромного кеша и логике прогнозирования.

Fermi

Tesla была рискованным ходом, оказавшимся очень успешным. Она была настолько успешной, что стала фундаментом для GPU компании NVidia на следующие два десятка лет. «Хотя с тех пор мы, конечно же, внесли серьёзные архитектурные изменения (Fermi была серьёзным изменением архитектуры системы, а Maxwell стал ещё одним крупным изменением в проектировании процессоров), фундаментальная архитектура, представленная нами в G80, и сегодня осталась такой же [Pascal]».

Джона Албен (интервью extremetech.com)

В 2010 году Nvidia выпустила GF100, основанный на совершенно новой архитектуре Fermi. Внутренности её последнего чипа подробно описаны в технической документации Fermi[4]. Модель выполнения по-прежнему основана на warp-ах из 32 потоков, диспетчеризируемых в SM. NVidia удалось удвоить/учетверить все показатели только благодаря 40-нанометровому техпроцессу. Благодаря двум массивам из 16 ядер CUDA, SM теперь мог одновременно диспетчеризировать два полу-warp-а (по 16 потоков). При том, что каждое ядро выполняло по одной инструкции за такт, SM по сути был способен исключать по одной инструкции warp за такт (в четыре раза больше, чем у SM архитектуры Tesla). Количество SFU также увеличилось, однако не так сильно — мощность всего лишь удвоилась. Можно прийти к выводу, что инструкции такого типа использовались не очень активно. Присутствует полуаппаратная поддержка float64, при которой комбинируются операции, выполняемые двумя ядрами CUDA. Благодаря 32-битном АЛУ (в Tesla оно было 24-битным) GF100 может выполнять целочисленное умножение за один такт, а из-за перехода от IEEE 754-1985 к IEEE 754-2008 имеет повышенную точность при работе с конвейером float32 при помощи Fused Multiply-Add (FMA) (более точного, чем используемое в Tesla MAD). С точки зрения программирования, объединённая система памяти Fermi позволила дополнить CUDA C такими возможностями C++, как объект, виртуальные методы и исключения.

Благодаря тому, что текстурные блоки стали теперь SM, от концепции TPC отказались. Она была заменена кластерами Graphics Processor Clusters (GPC), имеющими по четыре SM.

И последнее — SM теперь одарён Polymorph Engine, занимающимся получением вершин, преобразованием окна обзора и тесселяцией.

Карта-флагман GeForce GTX 480 на основе GF100 рекламировалась, как содержащая 512 ядер и способная обеспечить 1 345 гигафлопс[5].

GF100, установленный в GeForce GTX 480. Обратите внимание на шесть контроллеров памяти, обслуживающих GPC.

Kepler

В 2012 году Nvidia выпустила архитектуру Kepler, названную в честь астролога, наиболее известного открытием законов движения планет. Как обычно, взглянуть внутрь нам позволила техническая документация GK104[6]. В Kepler компания Nvidia значительно улучшила энергоэффективность кристалла, снизив тактовую частоту и объединив частоту ядер с частотой карты (ранее их частота различалась вдвое). Такие изменения должны были привести к снижению производительности. Однако благодаря вдвое уменьшившемуся техпроцессу (28 нанометров) и замене аппаратного диспетчера на программный, Nvidia смогла не только разместить на чипе больше SM, но и улучшить их конструкцию. Next Generation Streaming Multiprocessor (SMX) — это монстр, почти все показатели которого были удвоены или утроены. Благодаря четырём диспетчерам warp-ов, способным на обработку целого warp-а за один такт (Fermi мог обрабатывать только половину warp-а), SMX теперь содержал 196 ядер. Каждый диспетчер имел двойную диспетчеризацию, позволявшую выполнять вторую инструкцию в warp-е, если она была независима от текущей исполняемой инструкции. Двойная диспетчеризация была не всегда возможна, потому что один столбец из 32 ядер был общим для двух операций диспетчеризации. Такая схема усложнила логику диспетчеризации (к этому мы ещё вернёмся), но благодаря выполнению до шести инструкций warp-ов за такт SMX обеспечивал удвоенную производительность по сравнению с SM архитектуры Fermi.

Заявлялось, что флагманская NVIDIA GeForce GTX 680 с кристаллом GK104 и восемью SMX имеет 1536 ядер, достигающими 3 250 гигафлопс[7]. Элементы кристалла стали настолько запутанными, что мне пришлось убрать со схемы все подписи.

GK104, установленный в GeForce GTX 680. Обратите внимание на полностью переделанные подсистемы памяти, работающие с захватывающей дух частотой 6 ГГц. Они позволили снизить количество контроллеров памяти с шести до четырёх.

Maxwell

В 2014 году Nvidia выпустила GPU десятого поколения под названием Maxwell. Как говорится в технической документации GM107[8], девизом первого поколения архитектуры стали «Максимальная энергоэффективность и чрезвычайная производительность на каждый потреблённый ватт».

Карты позиционировались для «ограниченных в мощности сред, таких как ноутбуки и PC с малым форм-фактором (small form factor, SFF)». Важнейшим решением стал отказ от структуры Kepler с количеством ядер CUDA в SM, не являющимся степенью двойки: некоторые ядра стали общими и вернулись в работе в режиме половины warp-ов.

Впервые за всю историю архитектуры SMM имел меньше ядер, чем его предшественник: «всего» 128 ядер. Согласование количества ядер и размера warp-ов улучшило сегментацию кристалла, что привело к экономии площади и энергии. Один SMM 2014 года имел столько же ядер (128), сколько вся карта GTX 8800 в 2006 году.

Читайте также:  Как пройти тестирование способностей детей для помощи родителям в выборе вида спорта

Второе поколение Maxwell (описанное в технической документации GM200[9]) значительно повысило производительность, сохранив при этом энергоэффективность первого поколения.

Техпроцесс оставался на уровне 28 нанометров, поэтому инженеры Nvidia не могли для повышения производительности прибегнуть к простой миниатюризации. Однако уменьшение количества ядер SMM снизило их размер, благодаря чему на кристалле удалось разместить больше SMM. По сравнению с Kepler, второе поколение Maxwell удвоило количество SMM, при этом всего на 25% увеличив площадь кристалла. В списке усовершенствований также можно найти упрощённую логику диспетчеризации, позволившую снизить количество избыточных повторных вычислений диспетчеризации и задержку вычислений, что обеспечило повышение оптимальности использования warp-ов. Также на 15% была увеличена частота памяти.

Изучение структурной схемы Maxwell GM200 уже начинает напрягать глаза. Но мы всё равно внимательно его исследуем. Флагманская карта NVIDIA GeForce GTX 980 Ti с кристаллом GM200 и 24 SMM обещала 3072 ядер и 6 060 гигафлопс[10].

GM200, установленный в GeForce GTX 980 Ti.

Pascal

В 2016 году Nvidia представила Pascal. Техническая документация GP104[11] оставляет ощущение дежавю, потому что Pascal SM выглядит точно так же, как Maxwell SMM. Отсутствие изменений SM не привело к стагнации производительности, потому что 16-нанометровый техпроцесс позволил разместить больше SM и снова удвоить количество гигафлопс.

Среди других серьёзных улучшений была система памяти, основанная на совершенно новой GDDR5X. 256-битный интерфейс памяти благодаря восьми контроллерам памяти обеспечивал скорости передачи в 10 гигафлопс, увеличив на 43% пропускную способность памяти и снизив время простоя warp-ов.

Флагман NVIDIA GeForce GTX 1080 Ti с кристаллом GP102 и 28 TSM обещал 3584 ядер и 11 340 гигафлопс[12].

GP104, установленный в GeForce GTX 1080.

Turing

Выпуском в 2018 году Turing компания Nvidia произвела свой «крупнейший за десять лет архитектурный шаг вперёд»[13]. В «Turing SM» появились не только специализированные ядра Tensor с искусственным интеллектом, но и ядра для трассировки лучей (rautracing, RT).

Такая фрагментированная структура напоминает мне многослойную архитектуру, существовавшую до Tesla, и это ещё раз доказывает, что история любит повторения. Кроме новых ядер, в Turing появилось три важные особенности.

Во-первых, ядро CUDA теперь стало суперскалярным, что позволяет параллельно выполнять инструкции с целыми числами и с числами с плавающей запятой. Если вы застали 1996 год, то это может напомнить вам об «инновационной» архитектуре Pentium компании Intel.

Во-вторых, новая подсистема памяти на GDDR6X, поддерживаемая 16 контроллерами, способна теперь обеспечивать 14 гигафлопс. В-третьих, потоки теперь не имеют общих указателей инструкций (IP) в warp-е. Благодаря появившейся в Volta диспетчеризации Independent Thread Scheduling, каждый поток имеет собственный IP.

В результате этого SM способны гибче настраивать диспетчеризацию потоков в warp-е без необходимости как можно более быстрого их схождения.

Флагманская карта NVIDIA GeForce GTX 2080 Ti с кристаллом TU102 и 68 TSM имеет 4352 и достигает 13 45 гигафлопс[14]. Я не стал рисовать структурную схему, потому что она выглядела бы как размытое зелёное пятно.

Что ждёт нас дальше

По слухам, следующая архитектура под кодовым названием Ampere будет объявлена в 2020 году.

Так как Intel доказала на примере Ice Lake, что по-прежнему существует потенциал миниатюризации при помощи 7-нанометрового техпроцесса, почти нет сомнения в том, что Nvidia использует его для дальнейшего уменьшения SM и удвоения производительности.

Терафлопс/с для каждого кристалла/карты Nvidia (источник данных: techpowerup.com). Интересно будет посмотреть, как Nvidia продолжит эволюцию идеи кристаллов, имеющих три типа ядер, выполняющих разные задачи. Увидим ли мы кристаллы, целиком состояние из Tensor-ядер или RT-ядер? Любопытно.

Справочные материалы

[ 1] Источник: Revisiting the Business Card Raytracer [ 2] Источник: Fermi: The First Complete GPU Computing Architecture [ 3] Источник: NVIDIA GeForce 8800 GTX (techpowerup.com) [ 4] Источник: Fermi (GF100) whitepaper [ 5] Источник: NVIDIA GeForce GTX 480 [ 6] Источник: Kepler (GK104) whitepaper [ 7] Источник: NVIDIA GeForce GTX 680 [ 8] Источник: Maxwell Gen1 (GM107) whitepaper [ 9] Источник: Maxwell Gen2 (GM200) whitepaper [10] Источник: NVIDIA GeForce GTX 980 Ti [11] Источник: Pascal (GP102) whitepaper [12] Источник: NVIDIA GeForce GTX 1080 Ti [13] Источник: Turing (TU102) whitepaper [14] Источник: NVIDIA GeForce GTX 2080 Ti

Какой производитель видеокарт лучше?

Сегодня мы узнаем, какой из производителей видеокарт лучше? Asus, Palit, MSI, GIGABYTE, Inno3D.

Друзья, попрошу у вас помощи, моему каналу немного не хватает «дочитываний» для включения монетизации, пожалуйста дочитайте до конца. А если статья вам понравится, не забудьте поставить «нравится» . Заранее спасибо.

Для тех кто не знал, все перечисленные фирмы являются «Вендорами», то есть эти компании могут выпускать одну и ту же видеокарту, допустим nVidia GeForce 1050 ti, только в своём стиле, со своей ценой и неймингом.

Пример: 1 карта от MSI, 2 карта от ASUS.Пример: 1 карта от MSI, 2 карта от ASUS.

Данные компании, имеют одну и ту же основу создания видеокарт, но имею разный дизайн, систему охлаждения и другие компоненты.

ASUS

Asus отличаются тем, что их цены на видеокарты не самые большие среди их конкурентов. Данный вендор занимает среднеценовой сегмент.

Но для достижения таких цен, приходится на чем-то экономить, исходя из этого, не чем особенным видеокарты похвастаться не могут, однако отлично справляются со своей работой.

Топовые модели оснащены отличной системной охлаждения. Пользователи видеокарт от ASUS, отмечают, отсутствие шума и проблем перегреваниями.

1060 Dual.

MSI

Компания MSI является одним из самых крупнейших производителей видеокарт на рынке.

Однако, они не имеют огромного успеха со стороны пользователей, так как зачастую имеют завышенную цену, относительно других вендеров, а также пользователи отмечают, шумность и проблемы с перегреванием.

Но иногда в магазинах встречаются модели определенных видеокарт, с большой скидкой или ценой ниже, чем у остальных производителей. Советую скептически отнестить к таким предложениям. Отдельно от себя бы отметил, что из всех вендеров у них самая красивая стилистика.

1050 ti

Palit

На данный момент, встретить модели Radeon от Palit не получиться, так как в 2009 году их выпуск был прекращён, и сейчас производятся только GeForce.

Что можно сказать о технической части Palit, лично я, не отдаю этому вендеру свою предпочтение, так как некоторые модели имеют проблемы перегреванием, а также пользователи отмечают что они достаточно шумные.

Если вы всё же остановились на Palit то рекомендую ознакомится с отзывами покупателей.

1050 ti. Я считаю им стоит пересмотреть главного дизайнера по стилистике. (некрасиво)1050 ti. Я считаю им стоит пересмотреть главного дизайнера по стилистике. (некрасиво)

Gigabyte

Компания Gigabyte выпускает несколько линеек видеокарт, имеющие разные характеристики. Имеют у себя на борту модели Mini ITX с одним вентилятором (никогда не видел в них смысла, два явно внушительнее смотрятся),для небольших корпусов. Большинство моделей все же оборудованы двумя вентиляторами.

Также у данной компании есть модели с тремя вентиляторами. «Гига» считается одной из самых лучших компании по охлаждению. А также, они занимаются заводским разгоном своих графических адаптеров, что повышает их мощность примерно на 15% от стоковой, такие как Extreme Gaming и некоторые из Gaming G1.

Имеют свой уникальный стиль с использованием черного и оранжевого цвета.

GTX 1070

Inno3D

Сам лично, с такими фирмами не сталкивался, но отзывы у них достаточно хорошие. Данные вендор отлично подойдёт тем людям которые желают приобрести массивную видеокарту с отличным охлаждением, так как имеются модели с 3 и даже с 4 вентиляторами.

По русски говоря, выглядит внатури внушительно. Модель GTX 1070По русски говоря, выглядит внатури внушительно. Модель GTX 1070

Я бы отдал 1 место компании Asus. 2 Msi, 3 разделил бы между Inno3D и Gigabyte, последнее место Palit, оценки пользователей ниже чем у его соперников, а дизайн мне лично вообще не нравится. А вам огромное спасибо что дочитали до конца, если согласен ставь нравится, если нет пиши комментарий обсудим. До скорых встреч.

Ссылка на основную публикацию
Adblock
detector