Сопроцессоры INTEL® XEON PHI™: Новые горизонты для научных исследований

Intel стимулирует развитие научных исследований и представляет сопроцессоры Intel® Xeon Phi™, которые позволят увеличить производительность систем, обрабатывающих высокопараллельные рабочие нагрузки. Созданные на базе архитектуры Intel® Many Integrated Core (Intel® MIC), сопроцессоры Intel Xeon Phi расширяют существующие семейства процессоров Intel® Xeon® E5-2600/4600 для повышения производительности и эффективности работы приложений, которые создадут настоящий прорыв в области производства, энергетики, биологических наук и в других сферах жизни. Сопроцессоры Intel Xeon Phi также будут способствовать выходу Intel на уровень эксафлопсной производительности (тысячекратное увеличение скорости работы по сравнению с петафлопсными вычислениями) к 2018 г.

Общие модели программирования для всего кода

Архитектура Intel® поддерживается широким набором языков и моделей программирования и инструментов, которые могут использоваться как с процессорами Intel Xeon, так с сопроцессорами Intel Xeon Phi. Это может значительно снизить избыточную сложность разработки, оптимизации и поддержания программного кода. Приложения по-прежнему вынуждены использовать модели параллельного программирования для любого используемого параллельного аппаратного обеспечения, однако, применяя подход Intel, разработчики могут использовать общие модели, инструменты и принципы работы. Инвестиции, сделанные в параллельный код, позволят получить преимущества в различных вычислительных средах.

Высокая эффективность параллельной обработки

Несмотря на то, что семейство процессоров Intel Xeon E5 остается оптимальным решением для большинства современных приложений, сопроцессоры Intel Xeon Phi обеспечивают более эффективную производительность для высокопараллельных приложений. Использование большего количества ядер и поддержка большего количества вычислительных потоков позволяют добиться более высокого уровня параллелизма. Увеличенный параллелизм работы помогает компенсировать более низкую скорость работы каждого отдельного ядра для повышения обще производительности рабочих нагрузок, которые можно разделить на несколько одновременно обрабатываемых задач.

Сопроцессоры Intel Xeon Phi: ключевые характеристики

Сопроцессоры Intel Xeon Phi – это инновационные решения, которые имеют несколько функциональных возможностей, способствующих развитию высокопроизводительных вычислений.

  • Оптимальный объем памяти для высокопроизводительных систем:

Сопроцессоры Intel Xeon Phi поддерживают до 8 ГБайт системной памяти (7,75 ГБайт с кодом коррекции ошибок) с пиковой пропускной способностью 352 Гбит/с. Это позволят гарантировать высокую скорость сбора и анализа данных.

  • Большой объем кэш-памяти:

Благодаря поддержке до 30,5 МБайт кэш-памяти второго уровня, сопроцессоры Intel Xeon Phi способны предоставить нужный объем вычислительных ресурсов для надежной работы высокопараллельных рабочих нагрузок.

  • Более широкий параллелизм данных за счет использования усовершенствованного 512-разрядного блока обработки.
  • Поддержка многими разработчиками программных инструментов в рамках стандартных решений.
  • Поддержка ОС Linux: Red Hat Enterprise Linux версии 6.x и SuSE Linux версии 12 и выше.

Описание моделей сопроцессоров Intel® Xeon Phi™

Модель, № Форм-фактор, Пиковая производительность двойной точности Кол-во ядер Тактовая частота (ГГц) Скорость работы модулей памяти GDDR5 Пиковая пропускная способность памяти Объем системной памяти Объем кэш-памяти второго уровня Копроцессор (плата) Технологический процесс
охлаждение (гигатрансферов/с) (ГБайт) (МБайт) TDP (Вт)
SE10P PCIe, 1073 гигафлопс 61 1,1 5,5 352 8 30,5 300 22-нм
(специальная версия) пассивное охлаждение
SE10X PCIe, 1073 гигафлопс 61 1,1 5,5 352 8 30,5 300
(специальная версия) без охлаждения
5110P PCIe, пассивное охлаждение 1011 гигафлопс 60 1,053 5 320 8 30 225
Серия 3100 PCIe, активное охлаждение Более 1 терафлопс Информация будет доступна при выпуске сопроцессоров серии 3100 5 240 6 Более 25 300
PCIe, пассивное охлаждение Более 1 терафлопс Выпуск запланирован на первую половину 2013 г. 5 240 6 Более 25 300

Производительность

Результаты оценки производительности, приведенные в этом документе, получены в результате теста, в рамках которого сравнивается производительность оптимизированных процессоров с производительностью оптимизированных сопроцессоров. Это позволяет избежать переоценки сопроцессоров. Кроме того, два процессора используются для сравнения с одним сопроцессором для того, чтобы сравнить одинаковое энергопотребление и для того, чтобы избежать переоценки сопроцессора.

Результаты синтетических тестов

Название теста Результат
SGEMM До 2,9 раза более высокий результат

DGEMM

До 2,8 раза более высокий результат
SMP Linpack До 2,6 раза более высокий результат
STREAM Triad До 2,2 раза более высокий результат

Тесты проводились с использованием одного сопроцессора Intel® Xeon Phi™ и одного двухпроцессорного сервера на базе процессора Intel® Xeon® E5-2670. Сравнивались только параллельные, потоковые и векторизированные коды. Текущая версия библиотеки программ Intel Math Kernel Library (MKL) использовалась для тестов SGEMM, DGEMM и SMP Linpack.

Результаты работы приложений

Заказчик Приложение Увеличение производительности1 по сравнению с процессором Xeon
Los Alamos Molecular Dynamics До 2,52 раза
Acceleware 8th order isotropic variable velocity До 2,05 раза
Jefferson Labs Lattice QCD До 2,27 раза
Financial Services Black-Scholes SP

Monte Carlo SP

До 10,75 раза

До 8,92 раза

Sandia Labs MiniFF

(Finite Element Solver)

До 1,7 раза 3
Sinopec Seismic Imaging До 2,53 раза 2

Программное обеспечение и рабочие нагрузки, использованные в тестах оценки производительности, могли быть оптимизированы для процессоров Intel. Результаты тестов оценки производительности, включая SYSmark и MobileMark, измерены с использованием определенных компьютерных систем, компонентов, ПО, операций и функций. Любые модификации могут привести к изменению результатов. Необходимо ознакомиться с другой информацией и результатами тестов, включая сравнение производительности этой продукции с другими предложениями.

Относительная производительность подсчитана при присвоении базового значения 1.0 результату теста. Значение реального результата теста для базовой платформы затем было разделено на значение каждого конкретного результата теста для каждой из платформ.

Тесты производительности проводились с использованием определенных компьютеров и/или компонентов и отражают приблизительную производительность продукции Intel. Изменение аппаратных или программных компонентов или конфигурации может привести к изменению реальной производительности. Покупателям необходимо обратиться к другим источникам информации для оценки производительности систем или компонентов, которые они хотят приобрести. Дополнительная информация о тестах производительности и производительности продукции Intel представлена в Intel Performance Benchmark Limitations.

Синтетические тесты

1. Процессор Intel® Xeon® E5-2670 использовался для всей матрицы SGEMM = 13824 x 13824, DGEMM 7936 x 7936, SMP Linpack 30720 x 30720

2. Сопроцессор Intel® Xeon Phi™ SE10P (с кодом коррекции ошибок) с программным стеком Gold Release Candidate, SGEMM = 15360 x 15360, DGEMM 7680 x 7680, SMP Linpack 26872 x 28672

Результаты работы приложений

Xeon = процессор Intel® Xeon®;

Xeon Phi = сопроцессор Intel® Xeon Phi™

  1. 2 процессора Xeon против 1 процессора Xeon Phi (предварительная версия аппаратного и программного обеспечения и приложения запускаются на 100% на сопроцессоре, если не указано другое)
  2. 2 процессора Xeon против 2 процессоров Xeon + 2 процессоров Xeon Phi (без нагрузки)
  3. Кластер с 4 узлами, каждый узел с 2 процессорами Xeon (сравнение производительности кластера с и без 1 процессора Xeon Phi на узел) (гетеро)
  4. Измерено корпорацией Intel в октябре 2012 г.

Источник: пресс-релиз

Категории: Комплектующие