Для большинства из нас компьютер, вероятно, кажется достаточно быстрым, если он может воспроизводить видео 8K или последнюю версию Far Cry со скоростью 60 кадров в секунду без замедления. Однако есть много сложных задач, которые требуют миллиардов вычислений в секунду, чего не может сделать настольный компьютер с процессором i9.
Вот где суперкомпьютеры пригодятся. Они предлагают высокий уровень производительности, который позволяет правительствам и организациям решать проблемы, которые были бы невозможны с обычными компьютерами.
Современные суперкомпьютеры строятся с учетом рабочих нагрузок ИИ (искусственного интеллекта). В дополнение к прогнозированию погоды, климатическим исследованиям, физическому моделированию и разведке нефти и газа, суперкомпьютеры помогают ученым открывать более устойчивые строительные материалы и изучать белки человека и клеточные системы с экстремальным уровнем детализации.
Обычно производительность суперкомпьютера измеряется в операциях с плавающей запятой в секунду (флопы). В области научных вычислений флоп — это более точная цифра, чем измерительные инструкции в секунду.
Первый суперкомпьютер — Livermore Atomic Research Computer — был построен для Центра исследований и разработок ВМС США в 1960 году.
Чтобы показать вам, как далеко мы продвинулись с тех пор, мы составили подробный список самых быстрых суперкомпьютеров в мире. Все они являются нераспределенными компьютерными системами, работающими на Linux.
12. Суперкомпьютер Секвойя
Скорость: 17,1 петафлопс
Ядра: 1,572,864
Поставщик: IBM.
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Sequoia использует серверы IBM BlueGene/Q для достижения теоретической пиковой производительности в 20 петафлопсов. Он имеет 123% больше ядер и является на 37% более энергоэффективным, чем его предшественник компьютер K.
Хотя машина в основном используется для моделирования ядерного оружия, она также доступна для многих научных целей, таких как изменение климата и анализ генома человека. Он также продемонстрировал свою большую масштабируемость с помощью 3D-моделирования электрофизиологии человеческого сердца.
11. Суперкомпьютер ПАНГЕЯ III
- Скорость: 17.8 петафлопс
Ядра: 291,024 - Поставщик: IBM
Расположение: Центр технических и научных исследований CSTJF в Пау, Франция.
Pangea III опирается на высокопроизводительную архитектуру IBM, оптимизированную для искусственного интеллекта. IBM и NVIDIA работали вместе над созданием единственного в отрасли соединения между процессорами и графическими процессорами NVLink, которое обеспечивает более чем в 5 раз более высокую пропускную способность памяти между процессорами IBM POWER9 и NVIDIA Tesla V100 Tensor Core, чем традиционные системы на базе x86.
Архитектура не только повышает производительность вычислений, но и повышает энергоэффективность. Новая система использует менее 10% потребления энергии на петафлоп, как и ее предшественница, Pangea I и II.
Pangea III имеет различные применения, особенно в трех различных областях — разведка и разработка сейсмических изображений, модели разработки и добычи, а также оценка и селективность активов.
10. Суперкомпьютер Lassen
Скорость: 18.2 петафлопс
Ядра: 288,288
Поставщик: IBM
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Лассен предназначен для несекретной симуляции и анализа. Он устанавливается в той же лаборатории и использует те же компоненты здания, что и Sierra (самый быстрый суперкомпьютер № 2).
Несмотря на то, что Sierra — большая система, Lassen сам по себе имеет приличный размер: он составляет ровно 1/6 от размера старшего брата. Система Lassen содержится в 40 стойках, в то время как Sierra поднимается на 240 стоек.
Процессоры IBM Power9 и 253 терабайта оперативной памяти помогают Лассену достигать невероятной производительности в 23 петафлопс.
9. Суперкомпьютер SuperMUC-NG
- Скорость: 19.4 петафлопс
Ядра: 305,856 - Поставщик: Lenovo
Расположение: Суперкомпьютерный центр Лейбница, Германия
SuperMUC-NG имеет 6400 вычислительных узлов Lenovo ThinkSystem SD650 с непосредственным водяным охлаждением и более 700 терабайт основной памяти и 70 петабайт дискового пространства.
Он подключен к мощным системам визуализации, которые содержат большой 4K стереоскопический сетевой экран и 5-стороннюю среду искусственной виртуальной реальности CAVE.
Суперкомпьютер обслуживает европейских ученых во многих областях, включая анализ генома, гидродинамику, квантовую хромодинамику, науки о жизни, медицину и астрофизику.
8. Облачная инфраструктура AI Bridging
- Скорость: 19.8 петафлопс
Ядра: 391,680 - Поставщик: Fujitsu
Расположение: Национальный институт передовых промышленных наук и технологий, Япония.
Это первая в мире крупномасштабная вычислительная инфраструктура с открытым ИИ, которая обеспечивает 32,577 петафлопс пиковой производительности. Она насчитывает 1088 узлов, каждый из которых содержит 2 золотых процессора Intel Xenon Gold Scalable, 4 GPU NVIDIA Tesla V100, 2 HCA InfiniBand EDR и 1 твердотельный накопитель NVMe.
Fujitsu Limited утверждает, что суперкомпьютер может достичь 20-кратной тепловой плотности обычных центров обработки данных и охлаждающей способности стойки мощностью 70 кВт с использованием горячей воды и воздушного охлаждения.
7. Суперкомпьютер Trinity
- Скорость: 21.2 петафлопс
Ядра: 979,072 - Продавец: Cray
Расположение: Лос-Аламосская национальная лаборатория, США
Trinity построен для обеспечения экстраординарных вычислительных возможностей для предприятия по ядерной безопасности NNSA. Он направлен на повышение геометрических и физических достоверностей в коде моделирования ядерного оружия, обеспечивая при этом безопасность, надежность и эффективность ядерного арсенала.
Суперкомпьютер разрабатывался в два этапа: на первом этапе использовался процессор Intel Xeon Haswell, а на втором — значительное повышение производительности с использованием процессора Intel Xeon Phi Knights Landing. Он может обеспечить максимальную производительность более 41 петафлопс.
6. Суперкомпьютер Piz Daint
- Скорость: 21.2 петафлопс
Ядра: 387,872 - Продавец: Cray
Расположение: Швейцарский национальный суперкомпьютерный центр, Швейцария - Этот суперкомпьютер, названный в честь горы Piz Daint в швейцарских Альпах, работает на микропроцессоре Intel Xeon E5-26xx и NVIDIA Tesla P100.
Piz Daint использует DataWarp в «режиме импульсного буфера», чтобы увеличить эффективную полосу пропускания для устройств хранения и обратно. Это ускоряет скорость ввода / вывода данных, облегчая анализ миллионов небольших неструктурированных файлов.
В дополнение к своим ежедневным задачам, он может выполнять анализ данных некоторых из самых интенсивных проектов в мире, таких как данные, полученные в результате экспериментов на Большом адронном коллайдере.
5. Суперкомпьютер Frontera
- Скорость: 23.5 петафлопс
Ядра: 448,448 - Поставщик: Dell EMC
Расположение: Техасский вычислительный центр, США - Frontera открывает новые возможности в разработке и исследованиях, предоставляя обширные вычислительные ресурсы, которые облегчают ученым решение многих сложных задач в широком диапазоне областей.
Frontera имеет две вычислительные подсистемы: первая ориентирована на производительность с двойной точностью, а вторая — на потоковую память одинарной точности. Он также имеет облачные интерфейсы и несколько узлов приложений для размещения виртуальных серверов.
4. Суперкомпьютер Tianhe-2A
- Скорость: 61.4 петафлопс
Ядра: 4,981,760 - Поставщик: NUDT
Расположение: Национальный суперкомпьютерный центр в Гуанчжоу, Китай
Обладая более чем 16 000 компьютерными узлами, Tianhe-2A представляет собой крупнейшую в мире установку процессоров Intel Ivy Bridge и Xeon Phi. Хотя каждый узел имеет 88 гигабайт памяти, общая память (процессор+сопроцессор) составляет 1375 тебибайт.
Китай потратил 2,4 миллиарда юаней (390 миллионов долларов США) на строительство этого суперкомпьютера. В настоящее время он в основном используется в приложениях моделирования, анализа и государственной безопасности.
3. Суперкомпьютер Sunway TaihuLight
- Скорость: 93 петафлопса
Ядра: 10,649,600 - Поставщик: NRCPC
Расположение: Национальный суперкомпьютерный центр в Уси, Китай - Вычислительная мощность TaihuLight исходит от собственного многоядерного процессора SW26010, который включает в себя как элементы вычислительной обработки, так и элементы управления обработкой.
Один SW26010 обеспечивает пиковую производительность более 3 терафлопс благодаря 260 вычислительным элементам (интегрированным в один процессор). Каждый вычислительный обрабатывающий элемент имеет скрэтчпад-память, которая служит кэш-памятью, управляемой пользователем, что значительно уменьшает узкие места в памяти в большинстве приложений.
В дополнение к наукам о жизни и фармацевтическим исследованиям, TaihuLight используется для моделирования Вселенной с 10 триллионами цифровых частиц. Однако Китай пытается достичь гораздо большего: страна уже заявила о своей цели стать лидером в области искусственного интеллекта к 2030 году.
2. Суперкомпьютер Sierra
Скорость: 94.6 петафлопс
Ядра: 1.572.480
Поставщик: IBM.
Расположение: Ливерморская национальная лаборатория им. Лоуренса, США.
Sierra предлагает до 6 раз устойчивую производительность и в 7 раз производительность рабочей нагрузки своего предшественника Sequoia. Он сочетает в себе два типа процессорных чипов: процессоры IBM Power 9 и графические процессоры Nvidia Volta.
Sierra специально предназначена для оценки эффективности систем ядерного оружия. Он используется для прогнозных применений в управлении запасами, американской программе испытаний надежности и технического обслуживания ядерного оружия без каких-либо ядерных испытаний.
1. Суперкомпьютер Summit
Скорость: 148,6 петафлопс
Ядра: 2,414,592
Поставщик: IBM.
Расположение: Национальная лаборатория Ок-Риджа, США.
Summit является самым быстрым суперкомпьютером в мире, который может обеспечить 200 петафлопс в пике. Это эквивалентно 200 квадриллионам операций с плавающей запятой в секунду.
Это также третий по величине энергосберегающий суперкомпьютер в мире с зарегистрированной эффективностью энергопотребления 14,66 гигафлопс на ватт.
На 4600+ серверах Summit, занимающих два баскетбольных поля, размещено более 9 200 процессоров IBM Power9 и более 27 600 графических процессоров NVIDIA Tesla V100. Система соединена волоконно-оптическим кабелем длиной 298 км и потребляет достаточно энергии для работы 8 100 домов.
В 2018 году Summit стал первым суперкомпьютером, преодолевшим эксафлопный барьер. Анализируя геномные данные, он достиг пиковой пропускной способности в 1,88 эксафлопс, что составляет почти 2 миллиарда миллиардов вычислений в секунду.
10 самых мощных суперкомпьютеров мира
Два раза в год специалисты из Национальной лаборатории имени Лоуренса в Беркли и Университета Теннесси публикуют Top-500, в котором предлагают список самых производительных суперкомпьютеров мира.
В качестве ключевого критерия в этом рейтинге используется характеристика, которая уже давно считается одной из наиболее объективных в оценке мощности суперкомпьютеров – флопс, или число операций с плавающей точкой в секунду.
Немного забегая вперед, предлагаем вам заранее попробовать на вкус эти цифры: производительность представителей первого десятка топа измеряется десятками квадриллионов флопс.
Для сравнения: ЭНИАК, первый компьютер в истории, обладал мощностью в 500 флопс; сейчас средний персональный компьютер имеет мощность в сотни гигафлопс (миллиардов флопс), iPhone 6 обладает производительностью приблизительно в 172 гигафлопса, а игровая приставка PS4 – в 1,84 терафлопса (триллиона флопс).
Вооружившись последним «Топ-500» от ноября 2014 года, редакция Naked Science решила разобраться, что из себя представляют 10 самых мощных суперкомпьютеров мира, и для решения каких задач требуется столь грандиозная вычислительная мощь.
10. Cray CS-Storm
Местоположение: СШАПроизводительность: 3,57 петафлопсТеоретический максимум производительности: 6,13 петафлопсМощность: 1,4 МВт
Как и практически все современные суперкомпьютеры, включая каждый из представленных в данной статье, CS-Storm состоит из множества процессоров, объединенных в единую вычислительную сеть по принципу массово-параллельной архитектуры. В реальности эта система представляет собой множество стоек («шкафов») с электроникой (узлами, состоящими из многоядерных процессоров), которые образуют целые коридоры.
Cray CS-Storm – это целая серия суперкомпьютерных кластеров, однако один из них все же выделяется на фоне остальных. В частности, это загадочный CS-Storm, который использует правительство США для неизвестных целей и в неизвестном месте.
Известно лишь то, что американские чиновники купили крайне эффективный с точки зрения потребления энергии (2386 мегафлопс на 1 Ватт) CS-Storm с общим количеством ядер почти в 79 тысяч у американской компании Cray.
На сайте производителя, впрочем, сказано, что кластеры CS-Storm подходят для высокопроизводительных вычислений в области кибербезопасности, геопространственной разведки, распознавания образов, обработки сейсмических данных, рендеринга и машинного обучения. Где-то в этом ряду, вероятно, и обосновалось применение правительственного CS-Storm.
CRAY CS-STORM / © Cray
9. Vulcan – Blue Gene/Q
Местоположение: СШАПроизводительность: 4,29 петафлопсТеоретический максимум производительности: 5,03 петафлопсМощность: 1,9 МВт
«Вулкан» разработан американской компанией IBM, относится к семейству Blue Gene и находится в Ливерморской национальной лаборатории имени Э. Лоуренса. Принадлежащий Министерству энергетики США суперкомпьютер состоит из 24 стоек. Функционировать кластер начал в 2013 году.
В отличие уже упомянутого CS-Storm, сфера применения «Вулкана» хорошо известна – это различные научные исследования, в том числе в области энергетики, вроде моделирования природных явлений и анализа большого количества данных.
Различные научные группы и компании могут получить доступ к суперкомпьютеру по заявке, которую нужно отправить в Центр инноваций в области высокопроизводительных вычислений (HPC Innovation Centre), базирующийся в той же Ливерморской национальной лаборатории.
Суперкомпьютер Vulcan / © Laura Schulz and Meg Epperly/LLNL
8. Juqueen – Blue Gene/Q
Местоположение: ГерманияПроизводительность: 5 петафлопсТеоретический максимум производительности: 5,87 петафлопсМощность: 2,3 МВт
С момента запуска в 2012 году Juqueen является вторым по мощности суперкомпьютером в Европе и первым – в Германии. Как и «Вулкан», этот суперкомпьютерный кластер разработан компанией IBM в рамках проекта Blue Gene, причем относится к тому же поколению Q.
Находится суперкомпьютер в одном из крупнейших исследовательских центров Европы в Юлихе. Используется соответственно – для высокопроизводительных вычислений в различных научных исследованиях.
Суперкомпьютер Juqueen / © J?lich Supercomputing Centre (JSC)
Местоположение: СШАПроизводительность: 5,16 петафлопсТеоретический максимум производительности: 8,52 петафлопсМощность: 4,5 МВт
Находящийся в Техасе Stampede является единственным в первой десятке Top-500 кластером, который был разработан американской компанией Dell. Суперкомпьютер состоит из 160 стоек.
Этот суперкомпьютер является мощнейшим в мире среди тех, которые применяются исключительно в исследовательских целях. Доступ к мощностям Stampede открыт научным группам. Используется кластер в самом широком спектре научных областей – от точнейшей томографии человеческого мозга и предсказания землетрясений до выявления паттернов в музыке и языковых конструкциях.
Суперкомпьютер Stampede / © Texas Advanced Computing Center
6. Piz Daint – Cray XC30
Местоположение: ШвейцарияПроизводительность: 6,27 петафлопсТеоретический максимум производительности: 7,78 петафлопсМощность: 2,3 МВт
Швейцарский национальный суперкомпьютерный центр (CSCS) может похвастаться мощнейшим суперкомпьютером в Европе. Piz Daint, названный так в честь альпийской горы, был разработан компанией Cray и принадлежит к семейству XC30, в рамках которого является наиболее производительным.
Piz Daint применяется для различных исследовательских целей вроде компьютерного моделирования в области физики высоких энергий.
Суперкомпьютер Piz Daint / © blogs.nvidia.com
5. Mira – Blue Gene/Q
Местоположение: СШАПроизводительность: 8,56 петафлопсТеоретический максимум производительности: 10,06 петафлопсМощность: 3,9 МВт
Суперкомпьютер «Мира» был разработан компанией IBM в рамках проекта Blue Gene в 2012 году.
Отделение высокопроизводительных вычислений Аргонской национальной лаборатории, в котором располагается кластер, было создано при помощи государственного финансирования.
Считается, что рост интереса к суперкомпьютерным технологиям со стороны Вашингтона в конце 2000-х и начале 2010-х годов объясняется соперничеством в этой области с Китаем.
Расположенный на 48 стойках Mira используется в научных целях. К примеру, суперкомпьютер применяется для климатического и сейсмического моделирования, что позволяет получать более точные данные по предсказанию землетрясений и изменений климата.
Суперкомпьютер Mira / © Flickr
4. K Computer
Местоположение: ЯпонияПроизводительность: 10,51 петафлопсТеоретический максимум производительности: 11,28 петафлопсМощность: 12,6 МВт
Разработанный компанией Fujitsu и расположенный в Институте физико-химических исследований в городе Кобе K Сomputer является единственным японским суперкомпьютером, присутствующим в первой десятке Top-500.
В свое время (июнь 2011) этот кластер занял в рейтинге первую позицию, на один год став самым производительным компьютером в мире. А в ноябре 2011 года K Computer стал первым в истории, которому удалось достичь мощности выше 10 петафлопс.
Суперкомпьютер используется в ряде исследовательских задач. К примеру, для прогнозирования природных бедствий (что актуально для Японии из-за повышенной сейсмической активности региона и высокой уязвимости страны в случае цунами) и компьютерного моделирования в области медицины.
Суперкомпьютер K / © Fujitsu
3. Sequoia – Blue Gene/Q
Местоположение: СШАПроизводительность: 17,17 петафлопсТеоретический максимум производительности: 20,13 петафлопсМощность: 7,8 МВт
Мощнейший из четверки суперкомпьютеров семейства Blue Gene/Q, попавших в первую десятку рейтинга, расположен в США в Ливерморской национальной лаборатории. IBM разработали Sequoia для Национальной администрации ядерной безопасности (NNSA), которой требовался высокопроизводительный компьютер для вполне конкретной цели – моделирования ядерных взрывов.
Стоит упомянуть, что реальные ядерные испытания запрещены еще с 1963 года, и компьютерная симуляция является одним из наиболее приемлемых вариантов для продолжения исследований в этой области.
Однако мощности суперкомпьютера использовались для решения и других, куда более благородных задач. К примеру, кластеру удалось поставить рекорды производительности в космологическом моделировании, а также при создании электрофизиологической модели человеческого сердца.
Суперкомпьютер Sequoia / © Bob Hirschfeld/LLNL
2. Titan – Cray XK7
Местоположение: СШАПроизводительность: 17,59 петафлопсТеоретический максимум производительности: 27,11 петафлопсМощность: 8,2 МВт
Наиболее производительный из когда-либо созданных на Западе суперкомпьютеров, а также самый мощный компьютерный кластер под маркой компании Cray находится в США в Национальной лаборатории Оук-Ридж.
Несмотря на то, что находящийся в распоряжении американского Министерства энергетики суперкомпьютер официально доступен для любых научных исследований, в октябре 2012 года, когда Titan был запущен, количество заявок превысило всякие пределы.
Из-за этого в Оукриджской лаборатории была созвана специальная комиссия, которая из 50 заявок отобрала лишь 6 наиболее «передовых» проектов. Среди них, к примеру, моделирование поведения нейтронов в самом сердце ядерного реактора, а также прогнозирование глобальных климатических изменений на ближайшие 1-5 лет.
Несмотря на свою вычислительную мощь и впечатляющие габариты (404 квадратных метра), Titan недолго продержался на пьедестале. Уже через полгода после триумфа в ноябре 2012 года гордость американцев в области высокопроизводительных вычислений неожиданно потеснил выходец с Востока, беспрецедентно обогнав предыдущих лидеров рейтинга.
Суперкомпьютер Titan / © olcf.ornl.gov
1. Tianhe-2 / Млечный путь-2
Местоположение: КитайПроизводительность: 33,86 петафлопсТеоретический максимум производительности: 54,9 петафлопсМощность: 17,6 МВт
С момента своего первого запуска «Тяньхэ-2», или «Млечный-путь-2», вот уже около двух лет является лидером Top-500. Этот монстр почти в два раза превосходит по производительности №2 в рейтинге – суперкомпьютер TITAN.
Разработанный Оборонным научно-техническим университетом Народно-освободительной армии КНР и компанией Inspur «Тяньхэ-2» состоит из 16 тысяч узлов с общим количеством ядер в 3,12 миллиона. Оперативная память всей это колоссальной конструкции, занимающей 720 квадратных метров, составляет 1,4 петабайт, а запоминающего устройства – 12,4 петабайт.
«Млечный путь-2» был сконструирован по инициативе китайского правительства, поэтому нет ничего удивительного в том, что его беспрецедентная мощь служит, судя по всему, нуждам государства. Официально было заявлено, что суперкомпьютер занимается различными моделированиями, анализом огромного количества данных, а также обеспечением государственной безопасности Китая.
Учитывая секретность, свойственную военным проектам КНР, остается лишь догадываться, какое именно применение время от времени получает «Млечный путь-2» в руках китайской армии.
Титан – как устроен самый быстрый в мире компьютер | Компьютерра
16 ноября 2012 года завершилась проходившая в Солт-Лейк-Сити двадцать пятая конференция по высокопроизводительным вычислениям Supercomputing 2012 (SC12). Обсуждаемые в отрасли изменения нашли отражение в обновлённом рейтинге суперкомпьютеров TOP500. Вновь изменилась расстановка сил, и укрепились наметившиеся в июне тенденции.
Пять мест в десятке лидеров (включая первые два) и 251 суперкомпьютер среди пятисот самых быстрых в мире установлены в США. Второе место по числу высокопроизводительных систем (72 из топовых 500) занял Китай, сместив Японию на третье место.
Основной вклад в вычислительную мощь Европы примерно в равных долях вносят Великобритания, Франция и Германия. На их территории расположены 65 из 500 лучших суперкомпьютеров.
Победители TOP500
За прошедшие пять месяцев список претерпел существенные изменения, что лишний раз демонстрирует скорость развития данной отрасли. Прежний лидер – система Sequoia Ливерморской национальной лаборатории имени Лоуренса, покорившая в июне планку в 16,32 петафлопс, оказалась на втором месте.
Суперкомпьютер IBM Sequoia (BlueGene/Q) — второе место в ноябрьском рейтинге TOP500 2012 (фото: IBM)
На третьем месте с результатом 10.51 петафлопс в бенчмарке LINPACK находится созданный компанией Fujitsu японский суперкомпьютер K Computer, установленный в Институте физико-химических исследований RIKEN (г. Кобе).
Суперкомпьютер Fujitsu K Computer — третье место (фото: Fujitsu)
Пятое и шестое место принадлежат Германии. Разработанные в IBM суперкомпьютеры JUQUEEN (самый быстрый в Европе) и SuperMUC продемонстрировали производительность на уровне 4,14 и и 2.89 петафлопс соответственно.
Китайский суперкомпьютер Tianhe-1A, созданный в оборонном научно-техническом университете города Тяньцзинь, переместился на восьмое место рейтинга с результатом 2,57 петафлопс.
Суперкомпьютер Tianhe-1A (фото: National Supercomputing Center of Tianjin)
Девятое место занимает итальянский Fermi (1,73 петафлопс), а десятое – DARPA Trial Subset (1,52 петафлопс).
Самый быстрый российский суперкомпьютер «Ломоносов», принадлежащий МГУ, оказался на 26 месте с результатом 0,9 петафлопс.
Суперкомпьютер «Ломоносов» (фото: «Т-Платформы»)
Возглавляющий список Titan (Cray XK7) расположен в Национальной Лаборатории Окриджа – ведущем вычислительном центре министерства энергетики США. Он стал не просто самым быстрым суперкомпьютером. Его архитектура и оригинальные технические решения заслуживают самого пристального внимания.
Titan
«Титан» состоит из 18 688 вычислительных узлов. Каждый узел включает в себя 16-ядерный процессор AMD Opteron 6274/6276 с четырёхканальным контроллером оперативной памяти, 32 ГБ ОЗУ DDR3 (registered ECC) и главный козырь – графический ускоритель NVIDIA Tesla K20X с 2688 ядрами CUDA и 6 ГБ собственной памяти GDDR5.
Суперкомпьютер Titan (Cray XK7) — лидер ноябрьского рейтинга TOP500 2012 (фото: Oak Ridge National Laboratory)
Вычислительные узлы «Титана» объединяются по 8 штук в блоки и далее соединяются в отдельно стоящие модули при помощи сетевого интерфейса Gemini с пропускной способностью 160 ГБ/с на чип.
Вычислительный блок суперкомпьютера Titan (фото: Oak Ridge National Laboratory)
Внешне модули напоминают стандартные 19” шкафы 42U, однако фактические размеры одного модуля составляют 236 x 144 x 57 см, а масса – около 725 кг без учёта системы водяного охлаждения. На момент составления рейтинга «Титан» состоял из 208 таких модулей. Пиковая потребляемая мощность одного модуля составляет немногим более 54 кВт.
В сумме 18688 узлов обеспечивают 299008 ядер архитектуры x86 с частотой 2,2 – 3,2 ГГц и 50 233 344 ядер CUDA в 261 632 SMX блоках. В качестве общего количества вычислительных ядер суперкомпьютера Titan указывается сумма всех ядер архитектуры x86 и SMX блоков – 560 640.
Используемые процессоры AMD серии Opteron 6200 (Interlagos) стали первым серверным решением на базе архитектуры Bulldozer с энергоэффективностью 4,375 Вт на ядро.
Последнее обстоятельство и применение графических ускорителей позволило «Титану» занять также третье место в рейтинге Green500. Помимо статуса самого быстрого он стал ещё и одним из самых энергоэффективных суперкомпьютеров с результатом 2142,77 мегафлопс на Ватт потребляемой энергии.
По разным оценкам ускорители Nvidia обеспечивают порядка 85% – 90% всей вычислительной мощности. Отказ от них в пользу наращивания числа процессоров потребовал бы увеличения занимаемой площади примерно в 4 раза и во столько же увеличил бы энергопотребление. Использование графических ускорителей прочно «вошло в моду», что хорошо заметно на графике ниже.
Динамика роста использования графических ускорителей (фото: Nvidia)
Сейчас «Титану» требуется для размещения 404 квадратных метра, а усреднённое значение его потребляемой мощности составляет 8,2 МВт.
Разработка «Титана» не велась с нуля. Он был создан в процессе обновления предыдущего суперкомпьютера – Jaguar (Cray XT5). В 2008 году «Ягуар» стал первым компьютером, преодолевшим рубеж в 1 петафлопс, а в 2009 году возглавил список TOP500.
Модернизация «Ягуара» и его превращение в «Титана» заняла около года. Помимо добавления графических ускорителей Nvidia Tesla K20 она включала установку оперативной памяти суммарным объёмом 710 144 ГБ.
По оценкам Cray, дальнейшая модернизация и масштабирование позволит ей наращивать производительность до 50 петафлопс, удерживая престиж лидера ценой минимально возможных вложений.
Работает «Титан» в программной среде Cray Linux Environment на основе SUSE Linux Enterprise Server 11. Примечательно, что он открыт для свободных научных исследований.
С его помощью учёные надеются значительно ускорить процессы моделирования и визуализации в самых разных областях, включая астрономию, геологию, океанологию, квантовую химию, физику элементарных частиц, генетику и многие другие.
Jaguar (суперкомпьютер) | это… Что такое Jaguar (суперкомпьютер)?
Внешний вид суперкомпьютера Jaguar
Jaguar — суперкомпьютер класса массово-параллельных систем. Размещён в Национальном центре вычислительных наук в Оук-Ридже, штат Теннеси (National Center for Computational Sciences, NCCS, Национальная лаборатория Оук-Ридж).
Архитектура и устройство
Суперкомпьютер имеет массово-параллельную архитектуру, то есть состоит из множества автономных ячеек (англ. nodes). Все ячейки делятся на два раздела (англ. partitions): XT5 и XT4 моделей Cray XT5 и XT4, соответственно.[1].
Раздел XT5 содержит 18 688 вычислительных ячеек, а также вспомогательные ячейки для входа пользователей и обслуживания.
Каждая вычислительная ячейка содержит 2 четырёхъядерных процессора AMD Opteron 2356 (Barcelona) с внутренней частотой 2,3 ГГц, 16 ГБ памяти DDR2-800, и роутер SeaStar 2+.
Всего раздел содержит 149 504 вычислительных ядер, более 300 ТБ памяти, более 6 ПБ дискового пространства и пиковую производительность 1,38 петафлопс.[1]
Раздел XT4 содержит 7832 вычислительных ячеек плюс вспомогательные ячейки для входа пользователей и обслуживания.
Ячейка содержит 4-ядерный процессор AMD Opteron 1354 (Budapest) с внутренней частотой 2,1 ГГц, 8 ГБ памяти DDR2-800 (в некоторых ячейках — DDR2-667) и маршрутизатор SeaStar2.
Всего раздел содержит 31 328 вычислительных ядер, более 62 ТБ памяти, более 600 ТБ дискового пространства и пиковую производительность 263 TFLOPS.[1]
Роутер SeaStar2+ имеет пиковую пропускную способность 57,6 ГБ/с, роутер SeaStar2 — 45,6 ГБ/с. Роутеры соединены в топологию «трехмерный тор»([1]).[1]
Управляющая сетевая операционная система для Jaguar — Cray Linux Environment. Она состоит из полноценных версий Linux в управляющих ячейках и микроядер Compute Node Linux в вычислительных. Микроядра разработаны с целью минимизировать накладные расходы на взаимодействие между ячейками.[1]
В период с июля по ноябрь 2009 года происходил апгрейд ячеек раздела XT5: процессоры Opteron заменяются с 4-ядерных на 6-ядерные. Апгрейд планировалось произвести в пять этапов, каждый раз отсоединяя и модернизируя часть ячеек[2].
В рейтинге суперкомпьютеров TOP500, опубликованном в ноябре 2009 года, Cray XT5 (Jaguar) стал самой производительной в мире компьютерной системой, опередив IBM Roadrunner из Лос-Аламосской национальной лаборатории в Нью-Мексико[3][4].
В рейтинге TOP500, опубликованном в июне 2012 года, Cray XT5 (Jaguar) занимает 6-е место среди самых производительных в мире компьютерных систем[5]. В рейтинге за ноябрь 2012 года Jaguar отсутствует, так как он был преобразован в суперкомпьютер Titan[6].
От Jaguar-а к Titan-у
Основная статья: Titan (суперкомпьютер)
Внешний вид нового суперкомпьютера Titan
Осенью 2012 года начался последний этап апгрейда Jaguar-а до более мощного суперкомпьютера, которому дано новое название Titan. Titan будет в 10 раз мощнее своего прародителя — суперкомпьютера Jaguar. После апгрейда пиковая вычислительная мощность Titan-а составит более 20 петафлопс, т.е.
20 тысяч триллионов (20 квадриллионов) операций с плавающей точкой в секунду. Размер общей системной памяти достигнет 710 терабайт. Titan имеет гибридную архитектуру — помимо более мощных 16-ядерных процессоров AMD Opteron 6274 в каждый из 18.
688 узлов суперкомпьютерной системы установлен графический процессор общего назначения NVIDIA Tesla K20 (архитектура Kepler). Таким образом общее число ядер компьютера возрастет до 299.008.
Компилятор, специально разработанный для Titan-а, будет автоматически распараллеливать исполнение кода между центральным и графическим процессорами.
Примечания
История суперкомпьютеров Cray
Самый быстрый суперкомпьютер на сегодняшний день, Fugaku от Fujitsu, имеет скорость 415 петафлопс (Pflops).
Но поверите ли вы, что первый суперкомпьютер медленнее iPhone? CDC 6600, который считается первым суперкомпьютером, работал со скоростью 3 мегафлопса (Mflops) и был самым быстрым суперкомпьютером с 1964 по 1969 год.
[2] Позже его обогнал его преемник, CDC 7600, разработанный тем же самым. человек, стоящий за CDC 6600, Сеймур Крей.
Анатомия Крея
Сеймур Крей был американским инженером и архитектором суперкомпьютеров, который большую часть своей жизни посвятил проектированию суперкомпьютеров и получил признание как человек, создавший индустрию суперкомпьютеров.
Широко известный как «отец суперкомпьютеров», он сначала был служащим, а затем стал бизнесменом.
Он получил диплом электротехники в Университете Миннесоты в 1949 году и получил степень магистра прикладной математики в том же учреждении в 1951 году.
От ERA к CDC
В 1950 году, еще не окончив степень магистра, Крей присоединился к Engineering Research Associate (ERA), новой местной компании в Сент-Поле, штат Миннесота.
Его опыт в цифровых компьютерных технологиях привел его к его самому первому проекту, ERA 1103, широко известному как UNIVAC 1103, который затем стал первым научным компьютером.
Когда ERA была приобретена Remington Rand и слита с ее отделом UNIVAC, многие из ее основателей ушли, чтобы сформировать Control Data Corporation (CDC). В 1958 году Крей покинул ERA и присоединился к своим коллегам из CDC.
Находясь в CDC, Крей организовал лабораторию в своем собственном доме в Чиппева-Фоллс, штат Висконсин, где он сконструировал первый суперкомпьютер, CDC 6600. Он был выпущен в 1964 году и доминировал на рынке в течение пяти лет, продав 200 единиц по цене. 9 миллионов долларов каждый.
В 1968 году, благодаря бесчисленным техническим инновациям, Cray завершил разработку CDC 7600. CDC 7600 значительно быстрее, чем CDC 6600, может обрабатывать данные со скоростью 36,4 Mflops. CDC снова доминировала в индустрии суперкомпьютеров с выпуском CDC 7600.
Успех первых двух серий суперкомпьютеров CDC побудил Cray к работе над своей третьей серией, CDC 8600. Однако он застопорился, когда CDC столкнулась с некоторыми финансовыми трудностями и уделил первоочередное внимание другому суперкомпьютерному проекту, STAR 100.
Это не подходило для Cray, и поэтому он решил покинуть CDC, чтобы основать свою собственную компанию.
Запуск
В том же году, когда он покинул CDC, Крей основал свою собственную компанию Cray Research Inc (CRI).
С некоторыми сомнениями и все еще не зная о своей репутации, он обратился к Уолл-стрит за стартовым капиталом.
К его удивлению, инвесторы выстроились в очередь, чтобы поддержать его, и он с удобством приобрел средства, необходимые для создания компании, которая десятилетиями поставляла самые быстрые суперкомпьютеры в мире.
Через два года после его ухода из CDC они выпустили STAR-100, который был в три раза быстрее, чем CDC 7600, и был одним из первых компьютеров, использующих векторную обработку, где регистры и память расположены так, чтобы ускорить обработку одной операции на большой набор данных. [7] Однако плохая реализация концепции привела к ее плохой работе и, в конечном итоге, к ее провалу.
Обладая знаниями и опытом в области электроники и цифровых компьютерных технологий, Крей использовал другой подход к векторной обработке и заменил транзисторы интегральными схемами. Благодаря этому и другим усовершенствованиям в конструкции Cray преодолел ограничения своих конкурентов, и в 1976 году CRI выпустила свой первый векторный суперкомпьютер Cray-1.
Обеспечивая тактовую частоту процессора 80 МГц и скорость 160 Мфлопс, Cray-1 превосходил по скорости любой другой компьютер того времени. Первая система была приобретена Лос-Аламосской национальной лабораторией после победы в тендере на сумму 8,8 миллиона долларов. В последующие годы Cray-1 был продан более 80 систем и стал одним из самых успешных суперкомпьютеров в истории.
Успех в конечном итоге сделал Крея знаменитостью.
После успеха Cray-1 команда Cray Research во главе с главным дизайнером Стивом Ченом разработала Cray X-MP. Это был первый суперкомпьютер Cray Research, в котором использовалось несколько процессоров. Cray X-MP имеет тактовую частоту процессора 105 МГц и скорость 800 Мфлопс. С 1983 по 1985 год он стал самым быстрым суперкомпьютером в мире.
Тем временем Сеймур Крей начал работать над Cray-2 и с тактовой частотой процессора 244 МГц и производительностью системы 1,9 гигафлопс (Гфлопс) занял место Cray X-MP как самый быстрый суперкомпьютер CRI в 1985 году. Российская M13, работающая со скоростью 2,4 Гфлопс, первая преодолела барьер гигафлопс.
В 1988 году Cray Research представила преемника Cray X-MP, Cray Y-MP. Еще одна многопроцессорная машина и улучшение Cray X-MP, она может обрабатывать до 8 процессоров с максимальной скоростью 2,667 Гфлопс.
Кроме того, у него более высокая пропускная способность памяти, чем у Cray X-MP.
Три года спустя компания Cray Research начала выпуск серии Cray C90, еще одного многопроцессорного суперкомпьютера, который имеет вдвое большую емкость и скорость, чем Cray Y-MP.
Читать Продажа подержанного iPhone. Основные этапы подготовки
Спин-офф
Пока Cray Y-MP разрабатывался, Сеймур Крей одновременно разрабатывал Cray-3. Стремясь достичь в 12 раз большей скорости, чем Cray 2, он исследовал использование арсенида галлия в качестве полупроводников для новой машины.
Поскольку Cray Y-MP идет полным ходом, и поскольку продажи Cray 2 были ниже, чем Cray X-MP, компания решила приостановить разработку. Неустрашимый Крей покинул CRI и в 1988 году основал другую компанию, Cray Computer Corporation (CCC), в Колорадо-Спрингс, штат Колорадо, и продолжил работу над проектом Cray-3.
Поскольку он был более амбициозным, чем Cray-2, и требовались различные эксперименты, он оказался дороже, чем любой из его предшественников. Когда на рынке появилось множество суперкомпьютеров, у Cray-3 не было стартового заказчика, когда он был завершен в 1993 году.
Его первая и единственная модель была отправлена в Национальный центр атмосферных исследований (NRAC) для демонстрации. В связи с отсутствием других перспектив продажи Cray-3, CCC объявила о банкротстве в 1995 году.
Компьютеры SRC и смерть Сеймура Крея
Крей использовал то, что осталось от CCC, для установки SRC Computers в 1995 году. Обладая непоколебимой страстью к суперкомпьютерам, Крей продолжил работу над Cray-4, но ее работа была прервана, когда он умер от травм, полученных в результате автомобильной аварии в 1996 году. смерть, Cray-4 так и не был завершен.
CRI продолжала выпускать свою серию компьютеров C90 вплоть до 1996 года, когда она была приобретена Silicon Graphics, которая объединилась с Tera Computer Company в 2000 году. В том же году Tera переименовала себя в Cray, Inc.
Наследие суперкомпьютеров Cray
Суперкомпьютеры играют важную роль в области вычислительной науки, от прогнозирования погоды, фармацевтики до ядерных исследований и многих других.
Чтобы удовлетворить современный спрос на более быструю обработку данных и возглавить гонку в области суперкомпьютеров, производители постоянно ищут инновации.
На протяжении десятилетий блестящие достижения Сеймура Крея в области суперкомпьютеров позволили создать серию суперкомпьютеров, которые стали столпами сегодняшних гигантов. Его работы, возможно, больше не используются сегодня, но он, несомненно, создал наследие в мире суперкомпьютеров.
Пятёрка быстрейших суперкомпьютеров
Дважды в год операторы самых производительных вычислительных систем в мире с нетерпением ждут формирования последнего рейтинга суперкомпьютеров, публикуемого проектом Top500.
Этот суперкомпьютер – новичок в рейтинге Top500. На сегодня он является самой производительной вычислительной машиной в Китае и способен выполнять благодаря 71680 ядрам 563 триллиона операций с плавающей запятой в секунду (563 Тфлопс). Для сравнения, мощность обычного калькулятора – около 10 флопс. Tianhe, чьё название в переводе с языка Поднебесной означает »река в небе» или »Млечный путь», расположен в Национальном суперкомпьютерном центре (National Super Computer Center) в Тяньцзине. Он более чем вчетверо превосходит в скорости обработки данных своего предшественника.
Tianhe-1 работает на 6144 процессорах Intel Xeon (E5540, E5450) и 5120 графических чипах AMD, основанных на архитектуре RV770. Объём памяти кластера – 98304 Гб, а в качестве операционной системы выступает Linux.
Пропускная способность используемых в Tianhe-1 соединений составляет 40 Гб/с, а максимальная теоретическая пиковая производительность системы – 1,2 Пфлопс. Конструкция включает 155 стоек, которые вместе имеют массу 155 тонн и занимают площадь 1000 м2.
Компьютер будет заниматься вычислениями в области химических составов, биологических макромолекул, симуляций поведения самолётов и космических кораблей.
Имея однажды звание второго по быстродействию компьютера в мире, Jugene в Юлихском суперкомпьютерном центре (Jülich Supercomputing Centre), Германия, базируется на архитектуре IBM Blue Gene/P, в которой используется множество энергоэффективных чипов.
Максимальная тактовая частота каждого процессора PowerPC 450 не превышает 850 МГц, что заметно меньше мощности CPU домашней системы. Однако Jugene »берёт» количеством: 294912 чипов с производительностью 3,4 Гфлопс каждый делают эту машину самой быстродействующей в Европе. Снимок сделан во время обновления ранее в этом году.
Модификация должна позволить преодолеть отметку в 1 Пфлопс, текущее значение – 825,5 Тфлопс. Система со 144 Тб памяти и 6 Пб дискового пространства управляется операционной системой CNK/SLES (SuSE Linux Enterprise) 9. Аппаратное обеспечение располагается в 72 стойках с 32 картами в каждой.
В свою очередь, на карте расположены 32 узла с 2 Гб памяти. Максимальное энергопотребление достигает 35 кВт на одну стойку.
Kraken находится в Национальном институте вычислительных наук (National Institute for Computational Sciences) в Национальной лаборатории Оак-Ридж (Oak Ridge National Laboratory), Теннеси.
Суперкомпьютер использует возможности шестиядерных процессоров AMD Opteron с тактовой частотой 2,6 ГГц (10,4 Гфлопс), обычно устанавливаемых в серверы и высокопроизводительные рабочие станции, чтобы достичь 831,7 Тфлопс.
Эта система класса Cray XT5-HE с 98128 ядрами является быстрейшей в мире среди управляемых академическими организациями. В октябре было выделено финансирование в размере $10 млн для создания компьютера Nautilus, который должен анализировать выходные данные Kraken.
Пиковая производительность суперкомпьютера – 1,03 Пфлопс. Объём оперативной памяти – 129 Тб, дискового пространства – 2,2 Пб. Каждый из 8256 вычислительных узлов включает два Opteron (Istanbul) и 16 Гб памяти. Связь между узлами обеспечивают маршрутизаторы SeaStar 2+ с пропускной способностью 57,6 Гб/с. Мощное »железо» управляется ОС Cray Linux Environment (CLE) 2.2.
Kraken за работой
Это наиболее детализированная симуляция землетрясения из когда-либо проведённых. Kraken производит расчёт последствий изменений в Сан-Андреасском разломе, которых проходит между тихоокеанской и североамериканской плитами преимущественно по территории Калифорнии. Его длина более 1000 км. Моделирование показывает распространение ударных волн.
До ноября 2009 года Roadrunner обладал титулом самого быстродействующего компьютера в мире. Он стал первой подобной системой, преодолевшей барьер в 1 петафлопс – более 1015 операций в секунду (точное значение – 1042 Тфлопс).
Машина класса BladeCenter QS22 Cluster находится в Лос-Аламосской национальной лаборатории (Los Alamos National Laboratory) в Нью-Мексико. Нестандартная архитектура включает 6912 двухъядерных процессора AMD Opteron DC 1,8 ГГц и 12960 девятиядерных PowerXCell 8i с частотой 3.
2 ГГц (12,8 Гфлопс), используемых в консолях Sony PlayStation 3.
Количество вычислительных ядер – 122400. Каждый узел TriBlade включает два Opteron с 16 Гб памяти и четыре PowerXCell 8i с 16 Гб RAM. Всего же на процессоры Opteron приходится 51,8 Тб памяти, на Cell – аналогичный объём. Аппаратное обеспечение заключено в 196 стоек, а потребляемая Roadrunner мощность составляет 2,35 МВт.
Jaguar, обладающий приблизительно на 70% большей вычислительной мощностью по сравнению с Roadrunner, делит вместе с Kraken помещения Национальной лаборатории Оак-Ридж. Впервые суперкомпьютер был продемонстрирован в прошлом году, но его дополнительные 181000 ядер вступили в строй только в нынешнем.
В отличие от большинства американских государственных проектов подобного масштаба, кластер модели Cray XT5-HE не находится под контролем военных. Основное предназначение предыдущих суперкомпьютеров Министерства энергетики, в том числе Roadrunner, — это моделирование различных явлений в области атомной энергетики и ядерных взрывов.
Первый номер Top500 также занимается климатическими изменениями, изучением структуры воды и другими научными задачами.
Согласно тесту Linpack, 224162 ядра продемонстрировали производительность 1,759 Пфлопс. Пиковая теоретическая мощность – 2,3 Пфлопс.
Каждый вычислительный узел содержит два шестиядерных процессора Opteron с тактовой частотой 2,6 ГГц, 16 Гб памяти и роутер SeaStar 2+ с пропускной способностью 57,6 Гб/с.
Узлы объединены в сеть с топологией 3D-тора, как сообщает Национальный центр вычислительных наук (National Center for Computational Sciences) лаборатории Оак-Ридж.
Jaguar в действии
Симуляция течений углекислого газа с учётом их поглощения почвой и растениями во время восхода Солнца над Восточной Европой.
Поглощение CO2 показано в зелёных и белых цветах и имеет наибольшую силу в тропической зоне. Красный цвет обозначает высвобождение парникового газа в атмосферу.
По мере наступления тёмного времени суток лидировать в объёме выбросов начинает территория центральной Африки.