Корпорация Intel анонсировала сопроцессоры Xeon Phi нового поколения (кодовое имя Knights Landing), предназначенные для использования в высокопроизводительных вычислительных системах.
Напомним, что первые изделия Xeon Phi вышли в конце 2012 года.
Такие решения базируются на платформе Intel MIC (Many Integrated Core) — специализированной архитектуре, в которой используются тот же язык, те же инструменты, компиляторы и библиотеки, что и в процессорах Xeon.
При этом в MIC достигается высокая степень параллелизма за счёт использования процессорных ядер меньшего размера, потребляющих меньше энергии. Результатом является высокая производительность в системах с интенсивной параллельной обработкой данных.
Нынешние сопроцессоры Xeon Phi могут иметь до 61 ядра, 244 потоков и обеспечивать производительность до 1,2 терафлопса (триллиона операций с плавающей запятой в секунду). Они представлены во множестве конфигураций для удовлетворения различных требований к аппаратным и программным средствам, рабочим нагрузкам, производительности и эффективности.
Чипы Xeon Phi нового поколения — Knights Landing — имеют более 60 ядер (точное количество не называется) на архитектуре Silvermont. Изделия рассчитаны на работу с инновационной памятью Hybrid Memory Cube (HMC) объёмом до 16 Гбайт, которая обеспечивает в пять раз более высокую пропускную способность по сравнению с DDR4 при меньшем энергопотреблении.
Другой особенностью сопроцессоров Xeon Phi Knights Landing является технология внутренних связей Intel Omni Scale Fabric, которая призвана обеспечить высокие показатели производительности, надёжности, масштабируемости и плотности размещения компонентов.
Продукты поколения Knights Landing могут использоваться как в качестве сопроцессора на базе карт расширения PCIe, так и в качестве центрального процессора (CPU), устанавливающегося непосредственно в сокет материнских плат. В виде центрального процессора изделия сочетают в себе всю функциональность классического основного процессора и возможности специализированных сопроцессоров.
Быстродействие Knights Landing, по заявлениям Intel, превышает 3 терафлопса в вычислениях с двойной точностью. Высокопроизводительные вычислительные системы, оснащённые сопроцессорами Xeon Phi Knights Landing, появятся во второй половине нынешнего года.
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Intel представляет процессоры Xeon Phi с архитектурой Knights Landing
Intel обновляет семейство ускорителей Xeon Phi, представляя версию с архитектурой Knights Landing, о которой компания начала говорить еще почти 3 года назад. Теперь это не просто сопроцессоры, а полноценные независимые процессоры с втрое возросшей производительностью на поток и большим количеством других интересных нововведений
Многоядерные ускорители вычислений Intel Xeon Phi продолжают своё развитие. Об их очередном поколении с кодовым именем Knights Landing разработчик рассказывает уже почти три года, а с конца прошлого года даже поставляет образцы систем с ними своим избранным партнёрам. Однако до официального анонса дело дошло только сейчас.
В рамках проходящей в эти дни в Германии конференции ISC High Performance 2016 компания Intel официально объявила о выходе принципиально новых Xeon Phi на базе дизайна Knights Landing, ключевое свойство которых заключается в том, что теперь это – не сопроцессоры, а полноценные x86-процессоры, способные взять на себя роль центрального компонента системы. Иными словами, новые Xeon Phi могут работать полностью самостоятельно, не нуждаясь ни в каком дополнительном управляющем CPU. И это – очень важное улучшение, так как проведённое коренное изменение архитектуры ликвидирует узкое место – шину PCI Express, которую используют для передачи данных предшествующие и конкурирующие ускорители вычислений, например, базирующиеся на GPU.
Knights Landing воплощают собой уже третье поколение многоядерной x86-архитектуры Intel. Предыдущее поколение, известное под кодовым именем Knights Corner, базировалось на Pentium-подобных ядрах P54C. Новая же версия ускорителей переехала на модифицированную 14-нм микроархитектуру Airmont, известную по процессорам Atom.
Однако в Knights Landing ядра Airmont попарно объединены в модули, которые включают также мегабайтный L2-кеш и четыре блока VPU (Vector Processing Unit), отвечающих за поддержку векторных инструкций AVX-512. Всего в новых процессорах Xeon Phi содержится до 36 таких модулей, то есть, общее число ядер в ускорителе может достигать 72.
При этом каждое ядро дополнительно поддерживает технологию Hyper-Threading и способно выполнять до четырёх потоков одновременно, что наделяет Xeon Phi впечатляющим арсеналом средств для работы с параллельными вычислениями.
Учитывая, что в Knights Landing производительность на поток по сравнению с Knights Corner выросла примерно втрое только за счёт смены микроархитектуры, обновление ускорителей Xeon Phi дало им возможность дотянуться до планки в 3 Тфлопс.
Процессоры Knights Landing снабжены также интегрированной памятью MCDRAM с пропускной способностью до 500 Гбайт/с и объёмом 16 Гбайт, которая может взаимодействовать с системной шестиканальной DDR4-памятью по нескольким принципиально различным алгоритмам. Упоминания заслуживает и реализация в новых Xeon Phi отдельного двухпортового 100 Гбит/с-контроллера Omni-Path, который предполагается использовать для высокоскоростного объединения узлов, основанных на Knights Landing, в вычислительные кластеры.
Объявленная сегодня линейка процессоров Xeon Phi поколения Knights Landing включает четыре модели с числом ядер от 64 до 72 и частотой от 1,3 до 1,5 ГГц.
Стоит отметить, что в настоящее время для заказчиков доступны лишь три младшие модели: Xeon Phi 7250, 7230 и 7210. Самая же мощная 72-ядерная версия ускорителя, Xeon Phi 7290, обещана к сентябрю. Также пока Intel не поставляет варианты с интегрированным контроллером Omni-Path, который по плану появится в перечисленных моделях в октябре этого года.
Высокая производительность процессоров Xeon Phi, простая масштабируемость систем на их основе, а также полная совместимость с x86-экосистемой и знакомым всем средствами разработки, делает новинки отличным вариантом для использования в массе областей, где требуются параллельные высокопроизводительного вычисления. И особенно Intel подчёркивает применимость построенных на Xeon Phi кластеров в системах машинного обучения и искусственного интеллекта, то есть тех областях, где в последнее время высокую активность развила NVIDIA, реализующая свои ускорители семейства Tesla.
В подтверждение лидирующих характеристик Knights Landing, компания Intel приводит информацию о кратном превосходстве системы на базе Xeon Phi 7250 над системой, в которой используется конкурирующий ускоритель вычислений NVIDIA Tesla K80 и пара центральных процессоров Xeon E5-2697 v4.
При этом, Intel говорит не только о достигающем пятикратного размера преимуществе Xeon Phi в производительности. Согласно информации компании, конфигурация с процессором Xeon Phi 7250 оказывается в восемь раз экономичнее и в девять – дешевле.
Учитывая всё сказанное, Intel ожидает, что внедрение новых Xeon Phi пойдёт очень быстрыми темпами.
До конца года производитель намеревается продать более ста тысяч процессоров, а готовые системы на базе Knights Landing будут поставлять более 50 компаний, включая Dell, Fujitsu, Hitachi, HP, Inspur, Lenovo, NEC, Oracle, Quanta, SGI, Supermicro, Colfax и другие.
Кстати, в этом списке место нашлось и для российского интегратора – группы компаний РСК – которая собирается поставлять высокоплотные кластерные решения на базе Xeon Phi, оснащённые системами жидкостного охлаждения.
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.
Новые Intel Xeon Phi с Intel Omni Scale Fabric позволяет в 3 раза увеличить производительность и сохранить низкое энергопотребление
- Представлена информация о новой микроархитектуре и памяти процессоров Intel Xeon Phi следующего поколения (кодовое наименование Knights Landing), выпуск которых запланирован на вторую половину 2015 г.
- Intel Omni Scale Fabric – решение для межсоединений, предназначенное для повышения скорости передачи данных, уменьшения задержек и повышения эффективности. Оно доступно в виде компонентов (2015 г.), а затем будет интегрировано в Intel Xeon Phi (Knights Landing) и 14-нанометровые Intel Xeon.
- Intel по-прежнему занимает ведущие позиции в сегменте высокоскоростных систем. 85% суперкомпьютеров из TOP500* созданы на базе Intel Xeon.
Intel представила информацию о процессорах Intel Xeon Phi следующего поколения (прежнее кодовое наименование Knights Landing), призванных усилить преимущества инвестиций в модернизацию кода продукции текущего поколения.
Они включают в себя новые высокоскоростные коммуникационные каналы и интегрированную память с высокой пропускной способностью, которые позволят повысить скорость обработки данных. В настоящий момент в серверных средах эти модули представляют собой отдельные компоненты, что сокращает производительность и плотность размещения вычислительных ресурсов в суперкомпьютерах.
Новая технология межсоединений Intel Omni Scale Fabric призвана удовлетворить требования будущих поколений высокопроизводительных вычислительных систем. Разработка станет использоваться в Intel Xeon Phi и Intel Xeon будущих поколений.
Интеграция новой технологии и коммуникационной архитектуры, оптимизированной для супервычислений, позволит удовлетворить все требования будущих суперкомпьютеров в отношении производительности, масштабируемости, энергоэффективности и плотности размещения ресурсов. Кроме того, будет обеспечено оптимальное соотношение стоимости и производительности решений начального уровня за счет высокого уровня масштабируемости.
«Intel трансформирует основные компоненты высокопроизводительных компьютерных систем путем интеграции технологии Intel Omni Scale Fabric в процессоры Knights Landing, открывая новые возможности для индустрии суперкомпьютеров, – сказал Чарльз Вуишпард (Charles Wuischpard), вице-президент и руководитель направления рабочих станций и высокопроизводительных систем корпорации Intel. – Knights Landing станет первым по-настоящему многоядерным процессором, который позволит решить проблемы, связанные со скоростью работы памяти и подсистемы ввода/вывода. Он позволит программистам использовать все преимущества существующего кода и моделей программирования для увеличения скорости работы различных приложений. Дизайн платформы, модель программирования и сбалансированная производительность позволят сделать первый шаг на пути к экзафлопсным вычислениям».
Knights Landing – высочайший уровень интеграции Решение Knights Landing будет доступно в виде процессора, устанавливаемого на системной плате, а также в виде платы расширения PCIe.
Первый вариант позволит отказаться от избыточной сложности программирования и ограничений по скорости передачи данных через интерфейс PCIe, характерных для графических процессоров и ускорителей. Knights Landing будет поддерживать до 16 ГБайт высокоскоростной интегрированной памяти.
Эта памяти, разработанная совместно с Micron*, будет обеспечивать в 5 раз большую пропускную способность по сравнению с модулями DDR4, в 5 раз более высокую энергоэффективность и в 3 раза более высокую плотность размещения по сравнению с памятью GDDR.
При использовании с технологией Intel Omni Scale Fabric новое решение памяти позволит устанавливать Knights Landing в виде отдельных вычислительных блоков, что даст возможность уменьшить занимаемое пространство и энергопотребление за счет отказа от множества других компонентов.
Предполагается, что Knights Landing, созданное на базе более чем 60 ядер на основе архитектуры Silvermont, обеспечит производительность свыше 3TFLOPS (3 млрд операций с плавающей запятой в секунду) с двойной точностью и в 3 раза более высокую однопоточную производительность по сравнению с текущим поколением процессоров.
В виде отдельного процессора Knights Landing будет поддерживать память DDR4, сравнимую по пропускной способности с платформами на базе процессоров Intel Xeon, что позволит работать с приложениями, занимающими больший объем памяти.
Кроме того, Knights Landing будет иметь совместимость с процессорами Intel Xeon на уровне двоичного кода, что позволит разработчикам ПО использовать уже существующий программный код.
Для клиентов, предпочитающих приобретать отдельные компоненты, заменять их без необходимости обновления других компонентов системы, Knights Landing и Intel Omni Scale Fabric будут доступны в виде отдельных плат с интерфейсом PCIe.
Приложения для имеющегося в продаже Intel True Scale Fabric и будущего Intel Omni Scale Fabric будут совместимы, поэтому клиенты смогут легко перейти на использование новой технологии.
Для заказчиков, приобретающих Intel True Scale Fabric сегодня, Intel предложит программу перехода на Intel Omni Scale Fabric после выпуска нового решения.
Предполагается, что процессоры Knights Landing появятся в конечных системах во второй половине 2015 г. За этим последует выход многих новинок. Например, в апреле Национальный научный вычислительный центр энергетических исследований (NERSC) объявил о планируемой на 2016 г. установке супервычислительной системы, которая будет обслуживать более 5000 пользователей и 700 научных проектов.
«Мы высоко оцениваем наше сотрудничество с Cray* и Intel по разработке нового суперкомпьютера Cori*, – сказал Судип Досандж (Sudip Dosanjh), директор Национальной лаборатории Лоуренса в Беркли и Национального научного вычислительного центра энергетических исследований.
– Cori* будет включать более 9300 процессоров Intel Knights Landing и откроет пути к экзафлопсным вычислениям благодаря доступной модели программирования. Использование нашего ПО зачастую ограничено пропускной способностью памяти, поэтому и здесь мы получим преимущества от использования Knights Landing с высокоскоростной памятью.
Мы с нетерпением ждем возможности внедрить новые научные инструменты, не доступные на существующих суперкомпьютерах».
Intel Omni Scale Fabric – новые коммуникационные каналы и новая скорость работы Решение Intel Omni Scale создано на базе разработок компаний Cray* и Qlogic* и собственных инновационных технологий Intel. Будет создана полная линейка продукции, включая адаптеры, переключатели, коммутаторы и коммутационные системы, открытые программные средства и инструменты.
Кроме того, традиционные электрические трансиверы в современных коммутаторах будут заменены на решения на базе Intel Silicon Photonics, что позволит увеличить плотность размещения разъемов, упростить систему кабелей и снизить затраты. Решения на базе Intel Silicon Photonics могут также использоваться с процессорами, адаптерами и коммутаторами на базе Intel Omni Scale.
Intel поддерживает развитие суперкомпьютерных вычислений Современное поколение процессоров Intel Xeon и сопроцессоров Intel Xeon Phi используется в самой мощной суперкомпьютерной системы в мире – 35-петафлопсном суперкомпьютере Milky Way 2* (Китай). Кроме того, сопроцессоры установлены в более чем 200 OEM-моделях по всему миру.
На долю систем на базе технологий Intel приходятся 85% всех суперкомпьютеров, вошедших в 43 издание списка TOP500, и 97% из всех новых систем, впервые попавших в список.
Полтора года спустя после запуска первой продукции на базе многоядерной архитектуры на долю систем на основе сопроцессоров Intel Xeon Phi приходятся 18% совокупной производительности всех систем из списка TOP500.
Полная версия списка TOP500 доступна на сайте www.top500.org.
анонсы и реклама
Почти в два раза упала цена 3090 — cмотри
Новая топовая 48Gb Nvidia
6800XT — цена упала почти ВДВОЕ
3070 Ti задешево в Регарде
RTX 3050 за 25тр в Регарде
3070Ti MSI подешевела на порядок
3080 Gigabyte дешевле 90тр в Ситилинке
3080 Ti Gigabyte Gaming за 100тр
3080 дешевле 100 тр — скидка 20%
3060 Ti Gigabyte Gaming за 50тр
3070 Ti Asus Gaming — 70 тр
3090 !! Ti за 160тр в XPERT.RU
RTX Ti 3070 за 68тр Gigabyte Gaming
Для оптимизации приложений для многоядерной обработки Intel совместно с университетами и исследовательскими центрами в разных странах создала более 30 Центров параллельного программирования (Intel Parallel Computing Center – IPCC).
Сегодняшние инвестиции в оптимизацию параллельных вычислений с помощью сопроцессоров Intel Xeon Phi окажутся полезными в будущем при внедрении Knights Landing, поскольку при использовании стандартных, традиционных языков программирования код не потребует повторной компиляции.
Инновации в Intel Xeon Phi: технология Omni Scale Fabric
Корпорция Intel обнародовала информацию о процессорах следующего поколения – Intel Xeon Phi (кодовое название Knights Landing), выпуск которых запланирован на вторую половину 2015 г.
Они включают в себя новые высокоскоростные коммуникационные каналы и интегрированную память с высокой пропускной способностью, что повысит скорость обработки данных.
Сейчас в серверных средах эти модули представляют собой отдельные компоненты, что сокращает производительность и плотность размещения вычислительных ресурсов в суперкомпьютерах.
Новая технология межсоединений Intel Omni Scale Fabric призвана удовлетворить требования будущих поколений высокопроизводительных вычислительных систем. Разработка будет использоваться в Intel Xeon Phi и Xeon будущих поколений.
Интеграция новой технологии и коммуникационной архитектуры, оптимизированной для супервычислений, позволит удовлетворить все требования будущих суперкомпьютеров в отношении производительности, масштабируемости, энергоэффективности и плотности размещения ресурсов.
Кроме того, будет обеспечено оптимальное соотношение стоимости и производительности решений начального уровня за счет высокого уровня масштабируемости.
Решение Knights Landing будет доступно в виде процессора, устанавливаемого на системной плате, а также в виде платы расширения PCIe.
Первый вариант позволит отказаться от избыточной сложности программирования и ограничений по скорости передачи данных через интерфейс PCIe, характерных для графических процессоров и ускорителей. Knights Landing будет поддерживать до 16 Гбайт высокоскоростной интегрированной памяти.
Эта памяти, разработанная совместно с Micron, будет обеспечивать в 5 раз большую пропускную способность по сравнению с модулями DDR4, в 5 раз более высокую энергоэффективность и в 3 раза более высокую плотность размещения по сравнению с памятью GDDR.
При использовании с технологией Intel Omni Scale Fabric новое решение памяти позволит устанавливать Knights Landing в виде отдельных вычислительных блоков, что даст возможность уменьшить занимаемое пространство и энергопотребление за счет отказа от множества других компонентов.
Предполагается, что решение Knights Landing, созданное на базе более чем 60 ядер на основе архитектуры Silvermont, обеспечит производительность свыше 3TFLOPS (3 млрд операций с плавающей запятой в секунду) с двойной точностью и в 3 раза более высокую однопоточную производительность по сравнению с текущим поколением процессоров.
В виде отдельного процессора Knights Landing будет поддерживать память DDR4, сравнимую по пропускной способности с платформами на базе процессоров Intel Xeon, что позволит работать с приложениями, занимающими больший объем памяти.
Кроме того, Knights Landing будет совместим с процессорами Intel Xeon на уровне двоичного кода, что позволит разработчикам ПО использовать существующий программный код.
Для клиентов, предпочитающих приобретать отдельные компоненты и заменять их без обновления других компонентов системы, Knights Landing и Intel Omni Scale Fabric будут доступны в виде плат с интерфейсом PCIe.
Приложения для имеющегося в продаже Intel True Scale Fabric и будущего Intel Omni Scale Fabric будут совместимы, поэтому клиенты смогут легко перейти на использование новой технологии.
Для заказчиков, приобретающих Intel True Scale Fabric сегодня, Intel предложит программу перехода на Intel Omni Scale Fabric после выпуска нового решения.
Решение Intel Omni Scale создано на базе разработок компаний Cray и Qlogic и собственных инновационных технологий Intel. Будет создана полная линейка продукции, включая адаптеры, переключатели, коммутаторы и коммутационные системы, открытые программные средства и инструменты.
Кроме того, традиционные электрические трансиверы в современных коммутаторах будут заменены на решения на базе Intel Silicon Photonics, что позволит увеличить плотность размещения разъемов, упростить систему кабелей и снизить затраты.
Решения на базе Intel Silicon Photonics могут также использоваться с процессорами, адаптерами и коммутаторами на базе Intel Omni Scale.
Сопроцессоры Intel Xeon Phi Knights Landing получат технологию Omni Scale Fabric
24.06.2014 15:08
Корпорация Intel воспользовалась проходящей в Лейпциге международной конференцией по суперкомпьютерным системам, чтобы сообщить некоторые официальные подробности о новом поколении сопроцессоров Intel Xeon Phi с кодовым названием Knights Landing, по поводу разработки которых мы писали в конце прошлого года. К информации, что данные продукты производятся по нормам 14-нм техпроцесса и несут на борту интегрированную память в виде буфера с очень высокой пропускной способностью, добавились сведения о том, что в основе их лежит архитектура Silvermont, знакомая нам по Bay Trail и Merrifield.
Что касается производительности новых сопроцессоров Intel Xeon Phi Knights Landing, работающих «более чем на 60 ядрах», ее пиковое значение заявлено на уровне 3 терафлопс, что более чем вдвое выше показателей сегодняшних решений линейки Knights Corner.
Еще одной особенностью новинок станет, как заявлено, технология внутренних связей Omni Scale Fabric, призванная обеспечить высокие показатели производительности, надежности, масштабируемости и плотности размещения компонентов.
При этом сами решения серии Knights Landing будут доступны в виде CPU наподобие продуктов Xeon и Core, то есть смогут устанавливаться в сокеты.
Intel сообщила, что в комплект Knights Landing будет входить до 16 Гбайт встроенной памяти.
Эта память, разработанная совместно с Micron, обладает в 5 раз большей пропускной способностью по сравнению с памятью DDR4, в 5 раз более высокой энергоэффективностью, и в 3 раза более высокой плотностью монтажа, чем современная GDDR-память.
Совместно с Intel Omni Scale Fabric такая память позволяет устанавливать Knights Landing в качестве отдельного, независимого вычислительного блока, экономя пространство и энергию благодаря уменьшению количества компонентов.
Первый суперкомпьютер на основе Knights Landing будет называться Cori и заработает в Национальном вычислительном центре энергетических исследований США.
Поставки сопроцессоров Knights Landing в составе компьютерных систем ожидаются во второй половине следующего года, так что ждем новых рекордов в плане скорости вычислений.
К слову, заказать лендинг дешево можно для веб-сайтов уже сегодня в специализированных компаниях.
Решение Knights Landing будет доступно в виде отдельного модуля, устанавливаемого непосредственно на материнской плате, а также в виде платы расширения с интерфейсом PCIe.
Первый вариант позволяет избежать затруднений при программировании и резкого сужения полос передачи данных в PCIe, которые широко распространены в устройствах с графическими процессорами и ускорителями.
Появление нового поколения Intel Xeon Phi (кодовое название Knights Landing) в коммерческих продуктах запланировано на вторую половину 2015 года, Intel Omni Scale Fabric появится на рынке в виде компонентов также в 2015 году.
Intel работает над многоядерным процессором Xeon Phi следующего поколения
Knights Landing — многоядерный ЦП, который отвечает современным требованиям к объему памяти и производительности подсистем ввода-вывода. Это позволит программистам использовать существующие коды и стандартные модели программирования и при этом значительно увеличить производительность приложений. Платформа, модель программирования и сбалансированная производительность нового решения позволяет считать его успешным шагом на пути к реализации проекта экзафлопных вычислений.
Решение Knights Landing будет доступно в виде отдельного модуля, устанавливаемого непосредственно на материнской плате, а также в виде платы расширения с интерфейсом PCIe. Первый вариант позволяет избежать затруднений при программировании и резкого сужения полос передачи данных в PCIe, которые широко распространены в устройствах с графическими процессорами и ускорителями.
Intel сообщила, что в комплект Knights Landing будет входить до 16 Гбайт встроенной памяти.
Эта память, разработанная совместно с Micron, обладает в 5 раз большей пропускной способностью по сравнению с памятью DDR4, в 5 раз более высокой энергоэффективностью, и в 3 раза более высокой плотностью монтажа, чем современная GDDR-память.
Совместно с Intel Omni Scale Fabric такая память позволяет устанавливать Knights Landing в качестве отдельного, независимого вычислительного блока, экономя пространство и энергию благодаря уменьшению количества компонентов.
Ожидается, что решение Knights Landing, работающее более чем на 60 ядрах на модифицированной архитектуре Silvermont, обеспечит производительность свыше 3 Терафлопс (при вычислениях с двойной точностью), что в 3 раза выше, чем у современных систем на однопоточных решениях.
В виде отдельного процессора Knights Landing поддерживает DDR4, сравнимую по пропускной способности с решениями на основе Intel Xeon, что позволит работать с приложениями, занимающими гораздо больший объем памяти.
Кроме того, Knights Landing совместим на уровне двоичного кода с процессорами Intel Xeon, что позволяет разработчикам ПО обойтись без перекомпиляции наработанного кода.
Для клиентов, предпочитающих приобретать отдельные компоненты, заменять их на более мощные, не обновляя при этом остальные компоненты системы, Knights Landing и Intel Omni Scale Fabric будут доступны в виде плат с интерфейсом PCIe.
Приложения для имеющегося в продаже Intel True Scale Fabric и будущего Intel Omni Scale Fabric будут совместимы, поэтому клиенты смогут легко перейти на использование новой технологии.
Тем, кто сегодня приобретает Intel True Scale Fabric, корпорация Intel предложит специальную программу обновления до Intel Omni Scale Fabric, когда новое решение появится в продаже.
Появление процессоров Knights Landing в конечных продуктах запланировано на вторую половину 2015 года. За этим последует выход многих новинок. Например, в апреле Национальный научный вычислительный центр энергетических исследований (NERSC) объявил о планируемой на 2016 год. установке супервычислительной системы, которая будет обслуживать более 5000 пользователей и 700 научных проектов.
Решение Intel Omni Scale fabric разработано и оптимизировано для следующих поколений высокопроизводительных вычислительных систем.
Оно создано на основе сочетания усовершенствованной архитектуры системы обработки информации от компаний Cray и Qlogic и собственных инновационных технологий компании Intel.
Будет создана полная линейка продукции, включая адаптеры, переключатели, коммутаторы и коммутационные системы, открытые программные средства и инструменты.
Кроме того, традиционные электрические трансиверы в современных коммутаторах будут заменены на фотонные трансиверы Intel Silicon Photonics-based, что позволит увеличить плотность порта, упростить систему кабелей и снизить затраты. Intel Omni Scale fabric будет также встроена в новое поколение 14-нанометровых процессоров Intel Xeon, что позволит добавить преимущества новой сети к популярному семейству процессоров общего назначения.
Современное поколение процессоров Intel Xeon и сопроцессоров Intel Xeon Phi отвечает за производительность самой мощной суперкомпьютерной системы в мире – 35-петафлопсного суперкомпьютера Milky Way 2 в Китае. Кроме того, сопроцессоры установлен более чем в 200 моделях оригинального оборудования по всему миру.
Для оптимизации приложений для многоядерных устройств Intel совместно с 30 университетами и исследовательскими центрами в разных странах создала 30 Центров параллельного программирования (Intel Parallel Computing Centers – IPCC).
Сегодняшний вклад Intel Xeon Phi в оптимизацию программирования окажется полезным в будущем при внедрении Knights Landing, поскольку при использовании стандартных, традиционных языков программирования код не потребуют перекомпиляции.
Intel представила Omni Scale, Knights Landing с ядрами Silvermont и Hybrid Memory Cube (обновление)
На конференции International Supercomputing Conference (ISC) в Лейпциге Intel представила некоторые подробности о новом интерконнекте Omni Scale между отдельными процессорами и картами ускорения, а также следующее поколение карт Xeon Phi «Knights Landing».
Начнём с быстрого интерконнекта под названием Omni Scale, реализация которого стала возможной после приобретения соответствующих технологических подразделений Cray и Qlogic.
В серверных системах становится всё более важной более тесная и быстрая связь отдельных компонентов сервера и серверов между собой.
В данном направлении NVIDIA, например, разрабатывает собственную технологию NVLINK, но почти все производители аппаратного обеспечения уверены, что у PCI Express, скорее всего, не будет альтернативы в ближайшем будущем по подключению карт ускорения к процессорам.
Подробностей об интерфейсе Omni Scale пока не предоставлено.
Intel говорит только об использовании так называемых граничных коммутаторов («Edge Switches») для подключения к интерконнекту – в сетевой терминологии граничные коммутаторы соединяют две сети (например, локальную сеть и сеть провайдера).
Также Intel, скорее всего, представит карту адаптера PCI Express, планируется и использование оптических соединений в качестве среды передачи данных.
Поддержка интерконнекта Omni Scale планируется в 2015 году в процессорах Xeon на архитектуре «Broadwell EP», которые будут производиться по 14-нм техпроцессу. В планах Intel эти процессоры должны устанавливаться на платы ожидаемых вскоре «Haswell EP» с Socket LGA2011-R3 и поддержкой DDR4. Но довольно сомнительно, что интерконнект Omni Scale появится на этих материнских платах или его можно будет как-то добавить.
Перейдём к «Knights Landing» – следующему поколению карт ускорения Xeon Phi. Они тоже появятся в 2015 году, чип будет изготавливаться по новому 14-нм техпроцессу. Конечно, Intel здесь тоже планирует поддержать новый интерконнект Omni Scale. От высокой пропускной способности и низких задержек выиграют и процессор, и карта ускорения.
«Knight Landing» базируется на 72 ядрах «Silvermont». Они могут обрабатывать до четырёх потоков на ядро, также ядра оснащаются блоками AVX512. В результате новые ускорители Xeon Phi достигают производительности 3 TFLOPS при работе с числами двойной точности.
Для сравнения, профессиональная видеокарта AMD FirePro W9100 даёт производительность до 2,62 TFLOPS, а NVIDIA Tesla K40 – 1,43 TFLOPS. Важно отметить и наличие локальной памяти объёмом до 16 Гбайт. Intel говорит о пятикратном приросте производительности по сравнению с DDR4.
Подсистему памяти Intel разрабатывает совместно с Micron, но пока еще не совсем понятно, будет ли использоваться технология Hybrid Memory Cube (HMC).
На конференции Intel также объявила о сотрудничестве с центром National Energy Research Scientific Computing Center (NERSC) Министерства энергетики США, по итогам которого в 2016 году будет запущен суперкомпьютер «Cori» на новых картах Xeon 9300 Phi.
Конечно, тестов системы пока ещё нет, но два партнёра говорят о производительности в 10 петафлопов.
Самый быстрый на сегодня суперкомпьютер Tianhe-2 обеспечивает скорость до 33,8 петафлопов в тесте Linpack, он опирается на 45 800 карт Xeon Phi нынешнего поколения.
Обновление:
Между тем Intel и Micron подтвердили использование Hybrid Memory Cube (HMC). Данная память будет работать в качестве кэша L2 или L3, расположенного напрямую на чипе. Пропускная способность памяти HMC тоже должна соответствовать кэшу.
Также появилась некоторая новая информация по поводу ядер «Knights Landing». Они базируются на ядрах «Silvermont», которые используются в платформе «Bay Trail». Технически Intel внесла несколько изменений, чтобы данные ядра работали на вычислительных картах Xeon Phi. В том числе использовала другую иерархию кэша, также на ядро может обрабатываться больше четырёх потоков.
Более высокая плотность в серверах у новых «Knights Landing» Xeon Phi Intel планирует получить через использование сокета вместо нынешнего формата карты расширения. В результате в сервер 1U можно будет установить больше вычислительных ускорителей, чем сегодня. Дополнительную информацию о моделях Xeon Phi x200, в том числе и точное количество ядер, Intel пока не сообщила.
Xeon Phi — Википедия
Xeon PhiЦентральный процессор
Производство
с 2010 по 2020[1]
Разработчик
Intel
Производитель
Частота ЦП
1.053—1.7 ГГц
Технология производства
22—14 нм
Наборы инструкций
x86-64
Число ядер
57-61 (серия х100),64-72 (серия x200)
L1-кэш
32 КБ на ядро
L2-кэш
512 КБ на ядро
Разъём
Ядра
Эта статья должна быть полностью переписана.На странице обсуждения могут быть пояснения. |
Xeon Phi — семейство x86 процессоров североамериканской корпорации Intel с большим количеством процессорных ядер. Данные процессоры предназначены для использования в суперкомпьютерах, серверах и высокопроизводительных рабочих станциях[2].
Архитектура процессоров позволяет использовать стандартные языки программирования и технологии OpenMP.[3][4]
Изначально разработаны на основе экспериментальных видеоускорителей Intel для вычислений (GPGPU) (проекты Larrabee 2006 и Intel MIC 2010 года)[5]. В отличие от других GPGPU (в частности Nvidia Tesla), в процессорах Xeon Phi используется x86-совместимое ядро, не требующее переписывания программ на специальные языки (CUDA, OpenCL)[5].
Первоначально представлены в 2012 году в виде карт расширения PCIe (Knights Corner, 22 нм).
Продукты второго поколения Knights Landing (14 нм) анонсированы в 2013 году[6] и появились в 2016 году и представляют собой процессор для установки в серверный сокет LGA3647 (являются центральным процессором).
Суперкомпьютер Tianhe-2, использовавший ускорители Xeon Phi
В июне 2013 суперкомпьютер Tianhe-2 из NSCC-GZ (Китай) стал быстрейшим в мире[7]. Он использовал сопроцессоры Intel Xeon Phi и центральные процессоры Xeon (Ivy Bridge-EP) для достижения 33.86 петафлопсов.[8]
Продукты Xeon Phi ориентированы на рынок, в котором также используются сопроцессоры Nvidia Tesla и AMD Radeon Instinct.
История
Предпосылки
См. также: Larrabee, Teraflops Research Chip и Single-chip Cloud Computer
Микроархитектура Larrabee (разрабатывалась с 2006 года[9]) ввела применение очень широких векторных АЛУ (512-разрядные SIMD) в микропроцессоры с архитектурой x86.
Также в ней применялась кольцевая шина для обеспечения когерентности кэшей и для связи с контроллером памяти. Каждое ядро Larrabee могло исполнять 4 потока. Также Larrabee имели некоторые блоки, специфичные для видеоускорителей (GPU), в частности, текстурный блок.
[10] От планов производить GPU для рынка ПК, основанный на исследованиях проекта Larrabee, отказались в мае 2010.[11]
В другом исследовательском проекте Intel была реализована архитектура x86 на многоядерном процессоре — Single-chip Cloud Computer (прототипы представлены в 2009 году[12]), предназначенном для облачных вычислений.
Одна микросхема имела 48 независимых ядер с индивидуальным управлением частотой и напряжением. Для связи ядер использовалась сеть с ячеистой структурой (mesh). В проекте не поддерживалась когерентность кэшей.
[13]
Teraflops Research Chip (прототип представлен в 2007 году[14]) — экспериментальный 80-ядерный микропроцессор. Каждое ядро содержало 2 АЛУ для обработки вещественных данных. Размер машинной команды — 96 бит (VLIW). Проект смог достичь 1,01 тераFLOPS на частоте 3,16 ГГц и при потреблении 62 Вт электроэнергии.[15][16]
Knights Ferry
Первое поколение процессоров на базе архитектуры Intel MIC под кодовым названием Knights Ferry.[17]
Прототип Intel MIC — плата расширения Knights Ferry, основанная на процессоре Aubrey Isle. Анонсирован 31 мая 2010 года. Заявлено, что продукт является продолжением работ по проектам Larrabee, Single-chip Cloud Computer и другим исследовательским проектам.[18]
Карта с интерфейсом PCIe имеет 32 ядра, in-order, с частотами до 1,2 ГГц, исполняющих 4 потока на каждом ядре. На карте установлено 2 ГБ памяти GDDR5,[19]. Микропроцессор имеет 8 МБ когерентного кэша L2 (256 кБ на ядро; L1 — 32 кБ на ядро).[20] Максимальная потребляемая мощность около 300 Вт,[19] использует 45 нм техпроцесс.
[21] В чипе Aubrey Isle используется кольцевая шина шириной в 1024 разряда (по 512 бит в каждом направлении), соединяющая процессоры и оперативную память.
[22] Одна плата имеет производительность более 750 ГигаFLOPS[21] (в прототипе реализована только работа с 32-разрядными плавающими[23], за такт каждое ядро выполняет до 16 операций[20]).
Прототипы использовались в CERN, Korea Institute of Science and Technology Information (KISTI) и Leibniz Supercomputing Centre. Среди производителей аппаратного обеспечения для прототипов были названы IBM, SGI, HP, Dell.[24]
Knights Corner
Второе поколение процессоров на базе архитектуры Intel MIC под кодовым названием Knights Corner.[17]
Ожидается, что линия продуктов Knights Corner будет выполнена с использованием 22 нм техпроцесса, с применением трехзатворных транзисторов (Intel Tri-gate). Ожидается что микросхема будет содержать более 50 ядер, и что на её базе будут созданы коммерчески доступные продукты.[18][21]
В июне 2011 года SGI объявила о партнерстве с Intel в целях использования продуктов с архитектурой MIC в своих решениях для высокопроизводительных вычислений (HPC).
[25] В сентябре 2011 года Texas Advanced Computing Center (TACC) объявил об использовании карт Knights Corner в проектируемом суперкомпьюетере «Stampede» с планируемой производительностью в 8 петаFLOPS.
[26] Согласно публикации «Stampede: A Comprehensive Petascale Computing Environment» чипы MIC второго поколения (Knights Landing) будут добавлены в суперкомпьютер позже и увеличат пиковую производительность до 15 петаFLOPS.[27]
- 15 ноября 2011 года Intel продемонстрировала ранние инженерные образцы процессора Knights Corner.[28][29]
- 5 июня 2012 года Intel опубликовала исходный код ПО MPSS (Linux, GCC, GDB) и документацию на Knights Corner.[30]
- В июне 2012 года Cray анонсировал, что будет использовать 22-нм 'Knight’s Corner' (под брендом 'Xeon Phi') в качестве сопроцессоров в высокопроизводительных системах 'Cascade'.[31][32]
- На конференции ISC в июне 2012 микропроцессор Knight Corner был переименован в Xeon Phi[33][34].
Knights Landing
Третье поколение процессоров на базе архитектуры Intel MIC под кодовым названием Knights Landing[17][27].
Эти процессоры изготавливаются с использованием 14-нм техпроцесса компании Intel, с применением технологии трехзатворных транзисторов («3-D tri-gate») второго поколения.
Продукты этого поколения могут использоваться как в качестве сопроцессора на базе PCIe карт расширения, так и в качестве центрального процессора (CPU), которые устанавливаются непосредственно в сокет материнских плат.
В виде центрального процессора сочетают в себе всю функциональность классического основного процессора и одновременно функциональность специализированных сопроцессоров. Это избавит от сложностей программирования передачи данных по PCIe, а также значительно увеличит вычислительную плотность и производительность на ватт в данном классе процессоров.
Во всех типах процессоров этого поколения значительно увеличится пропускная способность памяти путём внедрения комплексной многоуровневой интегрированной памяти. Это устранит «узкие места» предыдущего поколения, увеличит производительность для высокопроизводительных вычислений, и позволит в полной мере использовать имеющиеся вычислительные мощности[35].
В 2013 году были представлены некоторые подробности про 72-ядерную систему Knights Landing с ядрами на базе модифицированной микроархитектуры Atom с добавлением AVX-512[36].
В ноябре 2015 года компания Intel продемонстрировала кремниевую пластину и первые образцы чипов Knights Landing. Также стали известны основные подробности об архитектуре и характеристиках чипов, в частности, что в Knights Landing реализован интерфейс высокопроизводительной сети Intel Omni-Path первого поколения[37][38][39].
Knights Hill
Четвёртое поколение процессоров на базе архитектуры Intel MIC под кодовым названием Knights Hill[17].
Будет базироваться на 10-нанометровом техпроцессе и использовать второе поколение межпроцессорного интерфейса Omni-Path[37].
Knights Mill
Knights Mill, следующее поколение Xeon Phi, оптимизирован для ускорения задач глубокого обучения,[40] первоначально выпущен в декабре 2017 года.[41] Почти идентичен по техническим характеристикам Knights Landing, включает в себя оптимизацию для лучшего использования инструкций AVX-512 и обеспечивает 4 потока на ядро.
Xeon Phi
18 июня 2012 года Intel заявила что будет использовать бренд «Xeon Phi» для всей линейки продуктов, созданных на базе Intel MIC.[42][43][44][45][46]
В сентябре 2012 было объявлено о создании суперкомпьютера Stampede с использованием более 6400 процессоров Xeon Phi в Texas Advanced Computing Center.[47] Планируется, что Stampede будет иметь производительность около 10 петафлопс.[47][48]
В ноябре 2012 года Intel анонсировала два семейства сопроцессоров Xeon Phi: Xeon Phi 3100 и Xeon Phi 5110P.[49][50][51] Процессоры Xeon Phi 3100 имеют производительность более 1 терафлопса (при работе с числами двойной точности), пропускную способность памяти в 240 ГБ/с и тепловыделение не выше 300 Вт.
[49][50][51] Семейство Xeon Phi 5110P сможет исполнять до 1,01 терафлопс (двойной точности), работать с памятью со скоростью в 320 ГБ/с и выделять не более 225 Вт.[49][50][51] Производиться Xeon Phi будет по технологии 22 нм.
[49][50][51] Цена Xeon Phi 3100 составит менее 2000 долларов США, а Xeon Phi 5110P будет стоить 2649 долларов.[49][50][51][52]
Характеристики
В основе архитектуры Intel MIC лежит классическая архитектура x86,[21] на ускорителе исполняется ОС Linux[53]. Для программирования MIC предполагается использовать OpenMP, OpenCL,[54] Intel Cilk Plus, специализированные компиляторы Intel Fortran, Intel C++. Также предоставляются математические библиотеки.[55]
- От Larrabee унаследованы набор команд x86, 512-битные векторные АЛУ (до 16 операций над float или до 8 операций над double в инструкции), когерентный L2 кэш размером 512 КБ на ядро[56], и сверхширокая кольцевая шина для связи ядер и контроллера памяти.
- Описание набора команд Intel MIC опубликовано на официальном сайте[57].
- Продажи начались в январе 2013 года.[58]
См. также
- Cell
- Intel Tera-Scale[en]
- Nvidia Tesla (прямой конкурент на рынке HPC[59])
Примечания
- ↑ Ian Cutress & Anton Shilov. The Larrabee Chapter Closes: Intel's Final Xeon Phi Processors Now in EOL (неопр.) (7 May 2019). Дата обращения: 12 марта 2020. Архивировано 26 октября 2021 года.
- ↑ Анонсирован выпуск сопроцессоров Intel Xeon Phi Архивировано 19 октября 2017 года..
- ↑ robert-reed. Best Known Methods for Using OpenMP on Intel Many Integrated Core (Intel MIC) Architecture (неопр.). software.intel.com (4 февраля 2013). Дата обращения: 5 мая 2020. Архивировано 24 июня 2018 года.
- ↑ Jeffers, James; Reinders, James. Intel Xeon Phi Coprocessor High Performance Programming (англ.). — Morgan Kaufmann, 2013. — ISBN 978-0124104143.
- ↑ 1 2 Mittal, Sparsh; Anand, Osho; Kumarr, Visnu P A Survey on Evaluating and Optimizing Performance of Intel Xeon Phi (неопр.) (май 2019). Дата обращения: 7 октября 2019. Архивировано 16 марта 2022 года.
- ↑ Sodani, Avinash et al. Knights Landing: Second-Generation Intel Xeon Phi Product (англ.) // IEEE Micro (англ.) (рус. : journal. — 2016. — Vol. 36, no. 2. — P. 34—46. — doi:10.1109/MM.2016.25.
- ↑ TOP500 — June 2013 (неопр.). TOP500. Дата обращения: 18 июня 2013. Архивировано 21 июня 2013 года.
- ↑ Intel Powers the World's Fastest Supercomputer, Reveals New and Future High Performance Computing Technologies (неопр.). Дата обращения: 21 июня 2013. Архивировано 22 июня 2013 года.
- ↑ Charlie Demerjian (3 July 2006), New from Intel: It's Mini-Cores!, The Inquirer, Архивная копия от 27 апреля 2012 на Wayback Machine
- ↑ Источники:
- doi:10.1145/1360612.1360617
- Tom Forsyth, SIMD Programming with Larrabee, Intel, Архивная копия от 24 октября 2012 на Wayback Machine
- ↑ Ryan Smith (25 May 2010), Intel Kills Larrabee GPU, Will Not Bring a Discrete Graphics Product to Market, AnandTech, Архивная копия от 20 июня 2012 на Wayback Machine
- ↑ Tony Bradley (3 December 2009), Intel 48-Core «Single-Chip Cloud Computer» Improves Power Efficiency, PCWorld, Архивная копия от 27 апреля 2012 на Wayback Machine
- ↑ Intel Research : Single-Chip Cloud Computer, Intel, Архивная копия от 20 апреля 2012 на Wayback Machine
- ↑ Ben Ames (11 February 2007), Intel Tests Chip Design With 80-Core Processor, IDG News, Архивная копия от 17 января 2012 на Wayback Machine
- ↑ Intel’s Teraflops Research Chip, Intel, Архивная копия от 9 октября 2012 на Wayback Machine
- ↑ Anton Shilov (12 February 2007), Intel Details 80-Core Teraflops Research Chip, Xbit laboratories, . Проверено 22 июня 2012. Архивная копия от 5 февраля 2015 на Wayback Machine
- ↑ 1 2 3 4 Charlie Demerjian.