NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

В прошлой части статьи были подробно разобраны и протестированы 4 видеоконвертера, использующих технологию CUDA. Но не было самого главного – сравнения со скоростью кодирования на центральном процессоре. Сегодня я постараюсь исправить данное недоразумение, а так же к результатам тестов добавились еще 2 конвертера – Xilisoft Video Converter Ultimate 6 и MediaCoder.

Тестовая конфигурация:
Процессор: i5 760@4.0 + XSPC Delta V2
Материнская плата: ASRock P55 Deluxe
Видеокарта: Asus GTX 260 GL+ + Koolance GPU-200
Видеокарта: Point of view GTX 470, референс
Оперативная память: Kingmax 2x2gb 1520MHz, 9-9-9-24 Жесткий диск: Seagate 7200.12 1 Тб БП: Gigabyte Odin GT 550 Wt Laing DDC + XSPC top 2х240 Magicool UV Шланг: XSPC 10/16 UV Red Корпус: TT Mozart TX
Как можно заметить, добавилась GTX 470 – ее мне любезно предоставила для тестов компания 3logic.
В тестировании использовалось 3 различных видеофайла:

*История создания фильма Аватар — 1920×1080, MPEG4, h.264.

*Серия Lie to me — 1280х720, MPEG4, h.264.

*Серия В Филадельфии всегда солнечно — 624х464, xvid.

Контейнер и размер первых двух файлов был .mkv и 1,55 гб, а последнего — .avi и 272 мб.

Прежде всего, стоит отметить, что Movavi Video Converter подвергся повторному тестированию, т.к. разработчик дополнительно объяснил нюансы использования данного видеоконвертера, использовалась последняя лицензионная версия + плагин Turbo.

Стоимость программы составляет 699 рублей, а плагина — $20. Movavi позиционирует свой продукт как «видеоконвертер с базовыми возможности редактирования видео». И действительно, можно выбрать необходимый отрезок видео для кодирования, настроить яркость, контрастность, насыщенность.

Данная возможность выгодно отличает Movavi от других более простых видеоконвертеров.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Методика тестирования не изменилась, разве что теперь добавились результаты кодирования на процессоре, в случае с Movavi еще и с плагином Turbo.

Первый тест – кодирование видео с сохранением разрешения и качества.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Сразу же бросается в глаза огромная польза от CUDA – в 3-5 раз быстрее. А вот польза от замены GTX 260 на GTX 470 не столь существенна, но это подтверждают сами разработчики и Nvidia. (информация из переписки с директором отдела разработки Movavi).

Перейдем к конвертированию видео с понижением разрешения и битрейта.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

И опять же картина схожая – видеокарты лидируют с огромным отрывом. Неожиданный рывок совершил плагин Turbo при кодировании из 1920х1080 в 720х404, результат проверялся несколько раз, все верно.

Перейдем к кодированию видео для мобильных устройств, этот тест как и в первой части статьи носит название «Для iPhone», т.к. за эталон был выбран соответствующий профиль в Badaboom.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

И опять же – нет никакой ошибки, результаты многократно перепроверялись. Из видео с разрешением 1920х1080 в разрешение 480х270 и битрейт 1 мбит/с быстрее всего кодирует процессор с участием плагина Turbo. Видеокарты и процессор без плагина прилично отстают. В целом, такие особенности конвертирования видео высокого разрешения прослеживаются и в других тестах Movavi.

Стоит отметить тот факт, что зарегистрированная программа работает быстрее, чем триальная. Существует мнение, что разность в скорости кодированию обусловлена накладыванием водяного знака в триальной версией. В целом, учитывая хорошую скидку на цену Movavi, а так же неплохие результаты даже на CPU, продукт вполне достойный.

Отнесем сюда же и базовые возможности по редактированию видео, которых иногда не хватает в совсем уж простых конвертерах. Плагин Turbo действительно работает, максимальное ускорение составило более чем в 2 раза, что впечатляет.

Разработчики обещают ускорение до 4-ех раз по сравнению с кодированием без плагина, что я думаю вполне реально при некоторых условиях.

Перейдем к Xilisoft Video Converter Ultimate 6. Данный конвертер – брат-близнец ImTOO HD Video Converter 6. Более того, на официальном сайте в названии последнего тоже присутствует слово Ultimate.

Стоит они одинаково — $59.90. Из необычных особенностей стоит отметить возможность задействовать любое количество ядер процессора для кодирования. Тесты на процессоре будут для двух и четырех ядер процессора.

Отмечу, что оба конвертера показали идентичные результаты.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Как и Movavi, эти конвертеры позволяют выбрать необходимый отрезок для кодирования, наложить простые фильтры, настроить якрость, контрастность и насыщенность. Так же можно прицепить к файлу субтитры.

Посмотрим на результаты первого теста:

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Результаты менее впечатляющие, чем у Movavi. Зато видно огромную разницу между скоростью кодирования на видеокарте и CPU. А вот разница между 2-мя и 4-мя ядрами в реальности не такая огромная.

Проверялось по диспетчеру задач – загрузка была только двух ядер, остальные 2 простаивали, все честно. Причина в том, что при использовании 4-ех ядер они не загружаются полностью, как это происходит с двумя.

Проще говоря — нынешние видеоконвертеры до конца еще не научились полностью использовать все 4 ядра.

Перейдем ко второму тесту.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

И вновь можно наблюдать всего лишь небольшую разницу между 2-мя и 4-мя ядрами. С другой стороны, разница между 36 fps и 67 fps – это почти час времени при кодировании двухчасового фильма.

Перейдем к тесту по конвертации видео для мобильных устройств.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

И вновь для высокого разрешения результаты выходят довольно плотные. Но с уменьшением качества начального видео растет преимущество CUDA.

Xilisoft Video Converter Ultimate 6 оставил весьма приятные впечатления. Правда учитывая проигрыш по скорости кодирования продукту от Movavi, а так же цену почти вдвое выше, покупка данного конвертера (и его брата от ImTOO тоже) не оправдана.

А теперь перейдем к единственному среди наших тестов бесплатному видеоконвертеру – MediaCoder. И хоть он бесплатный, но рекламы в нем хоть отбавляй. Новые версии выходят довольно оперативно.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Интерфейс MediaCoder на первый взгляд запутанный, но разобраться в нем не составит труда. Сразу же стоит отметить изобилие всевозможных настроек, которые зачастую рядовому пользователю не всегда нужны. На выбор предоставляется множество энкодеров, нас же интересует CUDA encoder. Тесты для процессора производились при использовании x264 encoder.

Никакой ошибки нет. Более того, непосредственно во время кодирования показывают еще более впечатляющие результаты (почти 400 fps на GTX 470 для SD файла), но в конце тратиться довольно длительное время на сохранение видео, что и отразилось на итоговых результатах. Однако все равно результаты лучшие среди всех.

Перейдем ко второму тесту.
В данном тесте можно заметить пользу от GTX 470 при кодировании 1080p в SD разрешение.
И перейдем к конвертированию для мобильных устройств.

NVIDIA CUDA можно использовать на ускорителях Intel, но пока лишь в Geekbench

Использование графических ускорителей для задач, выходящих за рамки простого рендеринга 3D-графики — та отрасль, которая принесла NVIDIA миллиарды в секторе центров обработки данных (а теперь — и в майнинге). Её собственная платформа CUDA и API с самого начала были эксклюзивными для видеокарт компании. Но теперь технология доступна и на ускорителях Intel.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Конечно, и раньше существовали инструменты для переноса приложений CUDA на широко поддерживаемые языки вроде OpenCL. Однако даже полуавтоматические инструменты, такие как HIPCL, требовали вмешательства разработчика.

А вот новая библиотека ZLUDA обещает запускать приложения CUDA непосредственно на графических процессорах Intel без каких-либо изменений. ZLUDA использует Intel oneAPI Level Zero для трансляции или эмуляции команд CUDA.

Разработчики ZLUDA описывают своё детище как прямую замену CUDA на системах с графическими процессорами Intel, используемыми в процессорах Skylake и более поздних. Новейшая версия поддерживает как Windows, так и Linux с графикой 9-го поколения или более новой.

По словам разработчиков, ZLUDA способна достигать почти той же производительности, как если бы код был скомпилирован напрямую. Но пока есть и большие ограничения: поддерживаемая функциональность существенно ограничена.

По сути, в настоящее время библиотека реально работает только в Geekbench, а потенциальных пользователей предупреждают, что не следует полагаться на неё при разработке важного ПО.

Использование ZLUDA в Windows кажется достаточно простым. Для этого нужно загрузить последнюю сборку со страницы ZLUDA в GitHub.

Скачанный архив включает в себя «оболочку» для запуска любого приложения с поддержкой CUDA и необходимую библиотеку.

Затем следует просто запустить оболочку из командной строки с приложением в качестве аргумента (zluda_with — geekbench5 —compute CUDA). Впрочем, у журналистов Hot Hardware этот способ выдал ошибку.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

В Linux автор ZLUDA смог прогнать тесты для Core i5-8700K, набрав 6333 балла с CUDA с использованием встроенной графики UHD 630 против 6482 баллов при исполнении через OpenCL.

Это небольшое общее снижение производительности, но есть любопытные нюансы.

Некоторые тесты Geekbench оказались значительно медленнее, но, например, тест Stereo Matching был примерно на 50 % быстрее с использованием ZLUDA, чем с OpenCL.

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Сравнение результатов тестов в Geekbench через ZLUDA и OpenCL

Другими словами, у создателей ZLUDA впереди ещё долгий путь — библиотека прошла только через выход второй крупной сборки. Тем не менее, это интересный проект.

Видеокарты Intel DG1 уже выпущены для OEM-производителей, и кажется, что более быстрые DG2 не за горами.

Хотя интегрированная графика служит интересным доказательством концепции, нет никаких сомнений в том, что дискретная графика Intel куда интереснее в перспективе для ZLUDA.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

NVIDIA «Fermi»: архитектура CUDA GPU нового поколения

Компания NVIDIA представила архитектуру нового поколения CUDA GPU под кодовым названием «Fermi». Созданная с нуля архитектура Fermi служит основой для первых в мире графических процессоров (GPU), предназначенных в первую очередь для вычислений, знаменуя прорыв в области графики и вычислений на GPU.

«NVIDIA и команда Fermi сделали огромный шаг на пути к применению GPU для еще более широкого класса программ», — сказал Дэйв Паттерсон (Dave Patterson), директор Parallel Computing Research Laboratory, U.C. Berkeley и соавтор работы «Компьютерная архитектура: количественный подход. «Я считаю, что Fermi оставит значимый след в истории».

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Представленная на конференции по GPU технологиям в Сан-Хосе, Калифорния, архитектура Fermi предоставляет возможности для повышения производительности в самом широком спектре вычислительных приложений.

На конференции NVIDIA также выступила Национальная Лаборатория Окриджа (Oak Ridge National Laboratory), которая объявила о планах по выпуску нового суперкомпьютера на базе NVIDIA GPU и архитектуры Fermi.

Fermi также получила поддержку ведущих организаций, включая Bloomberg, Cray, Dell, HP, IBM и Microsoft.

«Нет сомнений, что GPU превратился в параллельный вычислительный процессор общего назначения с потрясающей графикой, это не просто графический чип, как раньше», — сказал Дженсен Хуанг (Jen-Hsun Huang), соучредитель и президент NVIDIA.

«Архитектура Fermi, встроенные инструменты, библиотеки и подсистемы являются прямым результатом сотрудничества с тысячами разработчиков CUDA по всему миру. Скоро мы оглянемся назад и убедимся в том, что Fermi создала новую GPU-индустрию».

NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

Будучи основой семейства графических процессоров нового поколения NVIDIA, а именно GeForce, Quadro и Tesla, «Fermi» включает целый набор новых технологий, необходимых для вычислительной среды:- C++, в дополнение к поддержке C, Fortran, Java, Python, OpenCL и DirectCompute;- ECC, важный компонент для ЦОД и супервычислительных центров, широко использующих GPU;- 512 ядер CUDA с новым стандартом IEEE 754-2008, превосходящие даже самые передовые CPU;- 8-кратное повышение производительности арифметических вычислений двойной точности по сравнению с предыдущим поколением NVIDIA GPU. Двойная точность крайне важна для высокопроизводительных вычислений (HPC), например, в линейной алгебре, численном моделировании и квантовой химии;- NVIDIA Parallel DataCache — первая в мире иерархия кэшей в GPU, которая ускоряет такие алгоритмы, как расчет физики, трассировка лучей и умножение разреженных матриц, где адреса данных заранее неизвестны;- Движок NVIDIA GigaThread с поддержкой одновременного исполнения кернелов, когда различные кернелы одного и того же приложения могут могут исполняться на GPU одновременно (например, PhysX для симуляции жидкостей и твердых тел);
— Nexus — первая в мире полностью интегрированная вычислительная среда разработки приложений в Microsoft Visual Studio.

NVidia выпустила новую версию CUDA с поддержкой платформ ARM

18 Июня 2013 15:06 18 Июн 2013 15:06 |

Компания NVidia объявила о доступности новой версии платформы параллельных вычислений и модели программирования NVidia CUDA, впервые получившей поддержку платформ на базе архитектуры ARM.

По словам разработчиков, доступная бесплатно версия CUDA 5.5, доступная бесплатно на странице, обеспечивает мощь GPU-ускоряемых вычислений ARM-платформам — самой быстрорастущей процессорной экосистеме, которая примерно в 10 раз больше рынка процессоров x86-архитектуры.

Новая версия CUDA предоставляет программистам простую в использовании платформу для разработки передовых научных, инженерных, мобильных и высокопроизводительных (HPC) приложений на системах на базе ARMи x86 CPU.

«С 2006 года, когда разработчики перешли на CUDA, экспоненциально растущая мощь одного за другим поколений графических процессоров CUDA значительно повысила скорость работы приложений на x86 системах, — рассказал CNews Иан Бак (Ian Buck), директор по разработке вычислительного ПО в NVidia. — С поддержкой ARM новая версия CUDA позволяет разработчикам очень быстро добавлять ускорение GPU в приложения для широкого спектра HPC-платформ нового поколения».

Сочетание высокопроизводительных графических ускорителей CUDA с экономичными системами-на-чипе ARM позволяет применять системы на базе архитектуры ARM на новых рынках, предъявляющих высокие требования к энергоэффективности вычислений, включая решения для оборонной промышленности, автомобилестроение, поиск источников энергии, мобильные вычисления, робототехнику, научные исследования, HPC и другие, отметили в NVidia.

Импортозамещение, Азия или «серый» импорт: где брать серверное оборудование

Импортозамещение NVIDIA выпускает новую версию инструментария CUDA с поддержкой Fermi

В дополнение к поддержке ARM-платформ новая версия CUDA 5.

5 включает ряд улучшений, касающихся производительности и продуктивности, в том числе: поддержку Hyper-Q — теперь поддерживается для нескольких MPI-процессов на всех системах Linux; приоритет MPI-нагрузки — позволяет разработчикам приложений назначать приоритет потокам CUDA на критических участках для оптимизации общего время выполнения программы; новый направляемый анализ производительности — теперь утилиты Visual Profiler и Nsight Eclipse Edition позволяют разработчикам шаг за шагом выявлять узкие места в производительности и выполнять оптимизации; быструю кросс-компиляцию на x86 — сокращает время разработки для больших приложений, позволяя разработчикам компилировать ARM-код на быстрых x86-процессорах и передавать скомпилированные приложения на ARM.

Кроме того, версия CUDA 5.5 включает: полный набор инструментов программирования — для компилирования, отладки и анализа производительности CUDA; GPU-ускоряемые математические библиотеки — FFT, RNG, BLAS, операции с разреженной матрицей и почти 5 тыс.

примитивов обработки сигналов и изображений в библиотеке NVidia Performance Primitives (NPP); документацию по платформам x86 и ARM — полное руководство, примеры кодов и многое другое (помогают разработчикам быстро научиться использовать преимущества GPU-ускоряемых вычислений).

Саммит дизайн-центров электроники

Татьяна Короткова

Подписаться на новости Короткая ссылка

О технологии cuda, использующейся в видеокартах nvidia

Видеокарты производства компании Nvidia пользуются заслуженной славой в области проведения надежных высокопроизводительных вычислений. Благодаря наличию аппаратных возможностей технологии CUDA, «зеленые карты» показывают отличные результаты и при майнинге на большинстве алгоритмов консенсуса PoW.

Рассмотрим подробнее некоторые особенности CUDA.

Что такое технология CUDA?

CUDA (Compute Unified Device Architecture) — это технология многопотоковых компьютерных вычислений, созданная компанией NVIDIA. Она позволяет значительно увеличить производительность при проведении сложных расчетов за счет распараллеливания на множестве вычислительных ядер.

Приложения CUDA используются для обработки видео и аудио, моделирования физических эффектов, в процессе разведки месторождений нефти и газа, проектировании различных изделий, медицинской визуализации и научных исследованиях, в разработке вакцин от болезней, в том числе COVID-19, физическом моделировании и других областях.

CUDA ™ — это архитектура параллельных вычислений общего назначения, которая позволяет решать сложные вычислительные задачи с помощью GPU. CUDA поддерживает операционные системы Linux и Windows. Чем больше ядер CUDA имеет видеокарта и чем больше частота их работы, тем большую производительность она может обеспечить.

Каждая дополнительна единица вычислительной мощности требует соответствующего количества потребленной электроэнергии.

Чем меньший технологический процесс используется при производстве вычислительных ядер, тем меньшие напряжения используются для их питания и, соответственно снижается потребление.

Поэтому, даже если видеокарты разных поколений имеют одинаковую теоретическую вычислительную мощность в TFlops, их эффективность кардинально отличается по КПД, в значительной мере зависящему от потребления полупроводниковых элементов, из которых состоят ядра видеопроцессоров.

Архитектура CUDA упрощенно включает набор исполняемых команд и аппаратный механизм проведения параллельных вычислений внутри графического процессора. Разработчики программного обеспечения, в том числе майнеров, для работы с CUDA обычно используют языки программирования высокого уровня (C, Фортран).

В будущем в CUDA планируется добавление полноценной поддержки C ++, Java и Python. Продвинутые программисты дополнительно улучшают эффективность майнеров с помощью оптимизации кода майнеров на языке более низкого (машинного) уровня – Ассемблере.

В качестве примера в этом контексте можно привести Клеймор дуал майнер, который показывает высочайшую эффективность на зеленых видеокартах.

В технологии CUDA есть три важных элемента: библиотеки разработчика, среда выполнения и драйвера. Все они прямо влияют на производительность и надежность работы приложений.

Драйвер — это уровень абстракции устройств с поддержкой CUDA, который обеспечивает интерфейс доступа для аппаратных устройств. С помощью среды выполнения через этот уровень реализуется выполнение различных функций по проведению сложных вычислений.

Таблица версий CUDA, поддерживающихся в драйверах NVIDIA разных версий:

Версия CUDA
Linux x86_64
Windows x86_64

CUDA 11.1	>=455.23	>=456.38
CUDA 11.0.3 Update 1	>= 450.51.06	>= 451.82
CUDA 11.0.2 GA	>= 450.51.05	>= 451.48
CUDA 11.0.1 RC	>= 450.36.06	>= 451.22
CUDA 10.2.89	>= 440.33	>= 441.22
CUDA 10.1 (10.1.105)	>= 418.39	>= 418.96

Какие драйвера лучше для майнинга у AMD и NVIDIA — советы по выбору

Какие драйвера лучше выбрать для майнинга? Может быть существуют «специальные» драйвера для добычи криптовалют? В этой статье мы развеем эти мифы.

Лучший драйвер для майнинга на AMD

Для AMD никаких «специальных» или секретных драйверов для майнинга не требуется. Это было актуально в 2017-2018 годах. Тогда зарождался майнинг и AMD выпустила первый Radeon Software Crimson Blockchain Driver для RX и R9 линейки. Однако в 2022 году драйверы уже компилируются с учетом потребностей майнинга.

У AMD предусмотрен вычислительный режим для программного обеспечения, называемый «Adrenalin».

Именно поэтому с выходом версии Adrenalin Edition, версию Beta Blockchain Driver от 2017 года больше использовать не нужно. К тому же раньше приходилось применять патч для работы прошитых видеокарт с этим драйвером. Таким образом, для AMD самым лучшим и стабильным драйверов в сообществе майнеров считается версия AMD Adrenalin 21.11.3.

Radeon Software Adrenalin 21.11.3 совместим со следующими продуктами AMD Radeon

Видеокарта Radeon ™ RX 6900/6800/6700/6600 Series

Видеокарта Radeon ™ RX 5700/5600/5500/5300 Series

Radeon ™ VII

Видеокарта Radeon ™ RX Vega Series

AMD Radeon™ Pro Duo

Видеокарта Radeon ™ RX 500/570/580

Видеокарта Radeon ™ RX 400/470

У Nvidia дела обстоят иначе. Компания все еще борется с майнерами, потому что они хотят продавать отдельные линейки GPU для майнеров. Однако антимайнинговую защиту в Nvidia удалось полностью обойти. Для обхода LHR блокировки ничего делать не нужно – лучшие программы для майнинга уже имеют встроенный механизм снятия ограничений.

Если больше не существует специальных драйверов для майнинга (по крайней мере в публичном доступе), то почему некоторые из драйверов работают лучше, чем другие? Попробуем разобраться в этом.

Определение лучшего драйвера для Nvidia

Чтобы раскрыть весь потенциал видеокарты в майнинге Эфириума необходимо опытным путем подобрать лучший драйвер именно для вашей майнинг фермы.

По какому принципу следует искать лучший драйвер?

Самые новые – не всегда значит лучшие

Падение хешрейта может быть связано с тем, что самые последние драйвера еще не поддерживаются теми программами для майнинга, которые вы используете. Некоторые из видеокарт 3000 серии испытывают падение хешрейта на Ethereum с последними драйверами от Nvidia.

Делом в том, что новые драйвера обычно заточены для повышения производительности (FPS) именно в играх. В тоже время операционная система по умолчанию настроена так, чтобы обновлять драйвера до самых последних.

В тоже время разработчики ПО для майнинга тоже не сидят на месте и со временем оптимизируют свои программы под новые версии драйверов.

Просто взгляните на список исправлений, представленных в выпуске драйверов. Вы увидите, насколько важным может быть получение последних версий — обновление драйверов иногда действительно имеет значение.

Вывод: нужно читать заметки разработчиков программного обеспечения для майнинга о том, что они добавили поддержку последних драйверов и только после этого обновлять драйвера в своей системе.

По отзывам пользователей, лучшими и стабильными драйверами для Nvidia принято считать версии 472.12 и 466.

Выбор версии драйвера: Game Ready, DCH и Studio

Для загрузки драйверов обычно есть три варианта на выбор:

игровой драйвер (Game Ready),
драйвер DCH и
драйверы Studio.

Game Ready драйвер для майнинга

Для майнинга рекомендуется использовать Game Ready драйвера. Они наиболее стабильны. Драйверы DCH или Studio могут (хотя и не всегда) вызвать проблемы.

Studio драйвер

Линейка драйверов NVIDIA Studio не подходит для майнинга. Они всегда тестируются и оптимизируется для творческих приложений, таких как Autodesk Maya, 3ds Max или DaVinci Resolve, что приводит к меньшему количеству сбоев и сокращению времени рендеринга.

DCH драйвер

DCH версия не всегда совместима с майнерами криптовалют. DCH драйвер – это урезанная версия стандартного драйвера. Эта версия некорректно работает с некоторым ПО для майнинга. Например с Nicehash. Об этом свидетельствует запись в их официальном блоге — NiceHash QuickMiner.

Общая рекомендация для нахождения стабильного и лучшего драйвера Nvidia: просто устанавливайте предпоследнюю версию драйвера Game Ready. Сам со себе драйвер должен работать стабильно.

Помните, что за интенсивность майнинга отвечает не драйвер а разгон ядра, памяти и power limit, применяемый через Msi Afterburner. Уменьшите ограничение мощности и тактовую частоту ядра и увеличьте скорость памяти для достижения наилучших результатов для добычи Ethereum.

ЧИТАЙТЕ:
как майнинг убивает видеокарту: есть ли вредное влияние?

Как проверить драйвер?

Чтобы узнать, какой драйвер видеокарты у вас установлен, мы рекомендуем использовать инструмент под названием GPU-Z. Когда вы запустите эту программу, в ней будут перечислены все спецификации вашей видеокарты.

Проверьте поле версии для текущего установленного драйвера.

Как удалить и переустановить дайвер?

Если вам нужно удалить текущий и переустановить правильный драйвер, вы должны использовать бесплатный инструмент под названием Display Driver Uninstaller (DDU).

DDU -это программа, которая полностью удаляет старый драйвер. Чтобы использовать этот инструмент, вам нужно загрузиться в безопасном режиме без подключения к сети, чтобы Windows 10 не пыталась переустановить драйверы самостоятельно.

Чтобы загрузиться в безопасном режиме, просто удерживайте нажатой клавишу Shift на клавиатуре, одновременно щелкая левой кнопкой мыши кнопку перезагрузки. При появлении запроса выберите «Устранение неполадок», затем «Дополнительные параметры», «Параметры запуска» и нажмите кнопку перезагрузки.

Когда система перезапустится, она предоставит вам список параметров, выберите вариант 4, чтобы включить безопасный режим без подключения к сети.

После входа в безопасный режим запустите приложение DDU. В раскрывающемся списке выберите GPU, а затем нажмите кнопку с надписью «Clean and restart». Программа выполнит шаги по удалению текущих драйверов видеокарты и очистке. Когда это будет сделано, компьютер перезагрузится и запустится обратно в обычном режиме.

Мы рекомендуем отключить сетевой кабель или Wi-Fi перед перезагрузкой, чтобы при входе в систему обновление Windows не пыталось установить универсальный драйвер самостоятельно.
После входа в систему вы можете продолжить и установить драйвер видеокарты, который вы скачали ранее.

Убедитесь, что вы выполняете чистую установка драйвера. Для этого выберите пункт «выборочная установка» и отметьте галочку «perform a clean installation».

После установки драйвера вы можете снова запустить инструмент GPU-Z, чтобы убедиться, что у вас установлен хороший драйвер.

CUDA и матрица архитектуры

Архитектура	Возможности CUDA	Первая поддержка CUDA Toolkit	Последняя поддержка CUDA Toolkit	Поддержка последнего драйвера
Ферми	2.0	CUDA 3.0	CUDA 8.0	R390
Кеплер	3.0/3,2	CUDA 6.0	CUDA 10.2	R470
Кеплер	3.5/3,7	CUDA 6.0	CUDA 11.x	R470
Максвелл	5.0/5.2/5,3	CUDA 6.5	Текущая
Паскаль	6.0/6.1	CUDA 8.0	Текущая	Текущая
Вольта	7.0	CUDA 9.0	Текущая	Текущая
Тьюринг	7,5	CUDA 10.0	Текущая	Текущая
Ампер	8.0/8,6	CUDA 11.0	Текущая	Текущая

Удобная таблица со списком эквивалентных версий Windows® Store и внутренних драйверов для каждой версии драйвера Radeon ™ Software Adrenalin

Adrenalin Release	WHQL	Внутренний драйвер	Версия магазина драйверов Windows ®
21.12.2001	Опционально

Руководство по установке NVIDIA CUDA и настройка графического процессора DeepLearning4J в Ubuntu 18.04 — Русские Блоги

Для получения дополнительной информации поспешите и обратите внимание на официальный аккаунт выше!

Каталог статей

1.1 Введение

CUDA — это платформа параллельных вычислений и модель программирования, разработанная NVIDIA. Она значительно улучшает производительность вычислений за счет использования мощных функций графического процессора (GPU). При разработке GPU учитывал следующие цели:

Предоставьте небольшой набор расширений для стандартных языков программирования (например, языка C) для поддержки прямой реализации параллельных алгоритмов. Используя CUDAC / c ++, программисты могут сосредоточиться на распараллеливании алгоритма вместо того, чтобы тратить время на реализацию алгоритма.
Поддерживает гетерогенные вычисления, в которых для приложений используются как ЦП, так и ГП.Последовательная часть приложения выполняется на ЦП, а параллельная часть — на ГП. Точно так же CUDA можно постепенно применять к существующим приложениям. CPU и GPU рассматриваются как независимые устройства со своим собственным пространством памяти. Эта конфигурация также позволяет одновременные вычисления на CPU и GPU без конкуренции за ресурсы памяти.

Графические процессоры, поддерживающие CUDA, имеют сотни ядер и могут одновременно запускать тысячи вычислительных потоков. Эти ядра совместно используют ресурсы, включая файлы регистров и общую память.

Общая память на кристалле позволяет параллельным задачам, выполняющимся на этих ядрах, обмениваться данными без отправки данных через шину системной памяти.

В этом руководстве рассказывается, как установить и проверить правильность работы инструментов разработки CUDA.

1.1.1 Системные требования

Чтобы использовать CUDA в вашей системе, вам необходимо установить следующее программное обеспечение:

Среда разработки CUDA основана на тесной интеграции со средой разработки хоста, включая хост-компилятор и библиотеку времени выполнения C, поэтому поддерживается только окончательная версия этой версии инструментария CUDA.

Таблица 1 Локальные дистрибутивы Linux, поддерживаемые CUDA 10.1

(*) Чтобы узнать о специальной версии ядра, поддерживаемой Red Hat Enterprise Linux, посетитеhttps://access.redhat.com/articles/3078. Чтобы просмотреть список версий ядра, включая дату выпуска SUSE Linux Enterprise Server, посетитеhttps://wiki.microfocus.com/index.php/SUSE/SLES/Kernel_versions。

(**) Для версии долгосрочной поддержки Ubuntu x86-64 (LTS) CUDA 10.1 поддерживает аппаратные (HWE) ядра (например, 4.13.x для 16.04) и серверные ядра LTS (например, 4.4 для 16.04. Икс). Для получения дополнительной информации, пожалуйста, посетитеhttps://wiki.ubuntu.com/Kernel/Support。

(***) На процессоре POWER8 только графический процессор Tesla GP100 поддерживает CUDA 10.1.

(****) На процессоре POWER9 только графический процессор Tesla GV100 поддерживает CUDA 10.1.

Таблица 2 Набор инструментов CUDA и совместимая версия драйвера

1.1.2 Описание документа

Этот документ предназначен для читателей, знакомых со средой Linux и компилирующих программы на языке C из командной строки. Вам не обязательно иметь опыт работы с CUDA или параллельными вычислениями. Примечание. Это руководство подразумевает установку только в системах с установленной XWindows.

Примечание: для многих команд в этом документе могут потребоваться привилегии суперпользователя. В большинстве дистрибутивов Linux для этого потребуется войти в систему как root. Для систем, в которых включен пакет sudo, все необходимые команды должны использовать префикс sudo.

1.2 Подготовка к установке

Чтобы установить набор инструментов и драйвер CUDA в Linux, необходимы следующие приготовления:

Убедитесь, что в системе есть графический процессор, поддерживаемый CUDA.
Убедитесь, что в системе работает поддерживаемая версия Linux.
Убедитесь, что в системе установлен gcc.
Убедитесь, что в системе установлены правильные файлы заголовков ядра и пакеты разработки.
Загрузите набор инструментов NVIDIA CUDA.
Обработка конфликтующих методов установки.

Примечание. Вы можете отменить проверку предварительных требований во время установки, запустив программу установки с флагом -override. Имейте в виду, что использование инструментария NVIDIA CUDA по-прежнему должно соответствовать предварительным условиям.

1.2.1 Проверить, поддерживает ли CUDA графический процессор

Чтобы проверить, поддерживается ли CUDA графический процессор, вы можете просмотреть его в свойствах системы или ввести следующий код в командную строку:

$ lspci | grep -i nvidia

Если вы не видите никаких параметров после выполнения вышеуказанного кода, обновите базу данных оборудования PCI, поддерживаемую Linux, набрав update-pciids (обычно в / sbin) в командной строке, а затем вернитесь для выполнения команды lspci.

Если видеокарта NVIDIA и указана вhttps://developer.nvidia.com/cuda-gpusIn это означает, что графический процессор поддерживает CUDA.

1.2.2 Убедитесь, что версия Linux поддерживает

Инструменты разработки CUDA поддерживают только некоторые определенные версии Linux, которые перечислены в описании версии набора инструментов CUDA.

Чтобы определить, какую версию и номер выпуска вы используете, вы можете использовать следующую команду в командной строке:

$ uname -m && cat /etc/*release

1.2.3 Убедитесь, что в системе установлен gcc

Компилятор gcc требуется для разработки с использованием набора инструментов CUDA, но gcc не требуется для запуска приложений CUDA. В обычных условиях в Linux по умолчанию установлен gcc, и в основном все gcc, установленные в поддерживаемых версиях Linux, могут нормально работать.

Чтобы проверить версию gcc, установленную в системе, вы можете ввести в командной строке:

$ gcc —version

Убедитесь, что в системе установлены правильные файлы заголовков ядра и пакеты разработки.

CuPy не работает на Ubuntu 18.04 с CUDA 9.0

Условия:

CuPy версия 7.0.0
ОС / платформа Ubuntu 18.04
CUDA версия 9.0
cuDNN / NCCL версия 7.6.5 (для cuda 9.0)
GPU NVIDIA GTX580
Версия драйвера 390.116

Код 1:

import cupy as cp
x = cp.arange(6).reshape(2, 3).astype('f')

Сообщение об ошибке 1:

NVRTC compilation error: nvrtc: error: invalid value for —gpu-architecture (-arch)

——
Name:
Options: -I/home/liu/.local/lib/python2.7/site-packages/cupy/core/include -I /usr/local/cuda-9.0/include -ftz=true -arch=compute_20
CUDA source:
1
——
Traceback (most recent call last):
File «», line 1, in
File «/home/liu/.local/lib/python2.7/site-packages/cupy/creation/ranges.py», line 57, in arange
_arange_ufunc(typ(start), typ(step), ret, dtype=dtype)
File «cupy/core/_kernel.pyx», line 864, in cupy.core._kernel.ufunc.__call__
File «cupy/core/_kernel.pyx», line 876, in cupy.core._kernel.ufunc._get_ufunc_kernel
File «cupy/core/_kernel.pyx», line 638, in cupy.core._kernel._get_ufunc_kernel
File «cupy/core/_kernel.pyx», line 60, in cupy.core._kernel._get_simple_elementwise_kernel
File «cupy/core/carray.pxi», line 166, in cupy.core.core.compile_with_cache
File «/home/liu/.local/lib/python2.7/site-packages/cupy/cuda/compiler.py», line 136, in compile_with_cache
base = _preprocess('', options, arch)
File «/home/liu/.local/lib/python2.7/site-packages/cupy/cuda/compiler.py», line 97, in _preprocess
result = prog.compile(options)
File «/home/liu/.local/lib/python2.7/site-packages/cupy/cuda/compiler.py», line 250, in compile
raise CompileException(log, self.src, self.name, options)
cupy.cuda.compiler.CompileException: nvrtc: error: invalid value for —gpu-architecture (-arch)

Код 2:

import cupy as cp
cp.random.random_sample(10)

Сообщение об ошибке 2:

Traceback (most recent call last):
File «», line 1, in
File «/home/liu/.local/lib/python3.6/site-packages/cupy/random/sample.py», line 161, in random_sample
return rs.random_sample(size=size, dtype=dtype)
File «/home/liu/.local/lib/python3.6/site-packages/cupy/random/generator.py», line 540, in random_sample
out = self._random_sample_raw(size, dtype)
File «/home/liu/.local/lib/python3.6/site-packages/cupy/random/generator.py», line 528, in _random_sample_raw
func(self._generator, out.data.ptr, out.size)
File «cupy/cuda/curand.pyx», line 158, in cupy.cuda.curand.generateUniformDouble
File «cupy/cuda/curand.pyx», line 162, in cupy.cuda.curand.generateUniformDouble
File «cupy/cuda/curand.pyx», line 86, in cupy.cuda.curand.check_status
cupy.cuda.curand.CURANDError: CURAND_STATUS_LAUNCH_FAILURE