Сопроцессоры INTEL® XEON PHI™: Новые горизонты для научных исследований

Ноябрь 14, 2012

Intel стимулирует развитие научных исследований и представляет сопроцессоры Intel® Xeon Phi™, которые позволят увеличить производительность систем, обрабатывающих высокопараллельные рабочие нагрузки. Созданные на базе архитектуры Intel® Many Integrated Core (Intel® MIC), сопроцессоры Intel Xeon Phi расширяют существующие семейства процессоров Intel® Xeon® E5-2600/4600 для повышения производительности и эффективности работы приложений, которые создадут настоящий прорыв в области производства, энергетики, биологических наук и в других сферах жизни. Сопроцессоры Intel Xeon Phi также будут способствовать выходу Intel на уровень эксафлопсной производительности (тысячекратное увеличение скорости работы по сравнению с петафлопсными вычислениями) к 2018 г.

Общие модели программирования для всего кода

Архитектура Intel® поддерживается широким набором языков и моделей программирования и инструментов, которые могут использоваться как с процессорами Intel Xeon, так с сопроцессорами Intel Xeon Phi. Это может значительно снизить избыточную сложность разработки, оптимизации и поддержания программного кода. Приложения по-прежнему вынуждены использовать модели параллельного программирования для любого используемого параллельного аппаратного обеспечения, однако, применяя подход Intel, разработчики могут использовать общие модели, инструменты и принципы работы. Инвестиции, сделанные в параллельный код, позволят получить преимущества в различных вычислительных средах.

Высокая эффективность параллельной обработки

Несмотря на то, что семейство процессоров Intel Xeon E5 остается оптимальным решением для большинства современных приложений, сопроцессоры Intel Xeon Phi обеспечивают более эффективную производительность для высокопараллельных приложений. Использование большего количества ядер и поддержка большего количества вычислительных потоков позволяют добиться более высокого уровня параллелизма. Увеличенный параллелизм работы помогает компенсировать более низкую скорость работы каждого отдельного ядра для повышения обще производительности рабочих нагрузок, которые можно разделить на несколько одновременно обрабатываемых задач.

Сопроцессоры Intel Xeon Phi: ключевые характеристики

Сопроцессоры Intel Xeon Phi – это инновационные решения, которые имеют несколько функциональных возможностей, способствующих развитию высокопроизводительных вычислений.

Оптимальный объем памяти для высокопроизводительных систем:

Сопроцессоры Intel Xeon Phi поддерживают до 8 ГБайт системной памяти (7,75 ГБайт с кодом коррекции ошибок) с пиковой пропускной способностью 352 Гбит/с. Это позволят гарантировать высокую скорость сбора и анализа данных.

Большой объем кэш-памяти:

Благодаря поддержке до 30,5 МБайт кэш-памяти второго уровня, сопроцессоры Intel Xeon Phi способны предоставить нужный объем вычислительных ресурсов для надежной работы высокопараллельных рабочих нагрузок.

Более широкий параллелизм данных за счет использования усовершенствованного 512-разрядного блока обработки.
Поддержка многими разработчиками программных инструментов в рамках стандартных решений.
Поддержка ОС Linux: Red Hat Enterprise Linux версии 6.x и SuSE Linux версии 12 и выше.

Описание моделей сопроцессоров Intel® Xeon Phi™

Модель, №	Форм-фактор,	Пиковая производительность двойной точности	Кол-во ядер	Тактовая частота (ГГц)	Скорость работы модулей памяти GDDR5	Пиковая пропускная способность памяти	Объем системной памяти	Объем кэш-памяти второго уровня	Копроцессор (плата)	Технологический процесс
	охлаждение				(гигатрансферов/с)		(ГБайт)	(МБайт)	TDP (Вт)

SE10P	PCIe,	1073 гигафлопс	61	1,1	5,5	352	8	30,5	300	22-нм
(специальная версия)	пассивное охлаждение
SE10X	PCIe,	1073 гигафлопс	61	1,1	5,5	352	8	30,5	300
(специальная версия)	без охлаждения
5110P	PCIe, пассивное охлаждение	1011 гигафлопс	60	1,053	5	320	8	30	225
Серия 3100	PCIe, активное охлаждение	Более 1 терафлопс	Информация будет доступна при выпуске сопроцессоров серии 3100		5	240	6	Более 25	300

	PCIe, пассивное охлаждение	Более 1 терафлопс	Выпуск запланирован на первую половину 2013 г.		5	240	6	Более 25	300

Производительность

Результаты оценки производительности, приведенные в этом документе, получены в результате теста, в рамках которого сравнивается производительность оптимизированных процессоров с производительностью оптимизированных сопроцессоров. Это позволяет избежать переоценки сопроцессоров. Кроме того, два процессора используются для сравнения с одним сопроцессором для того, чтобы сравнить одинаковое энергопотребление и для того, чтобы избежать переоценки сопроцессора.

Результаты синтетических тестов

Название теста	Результат
SGEMM	До 2,9 раза более высокий результат
DGEMM	До 2,8 раза более высокий результат
SMP Linpack	До 2,6 раза более высокий результат
STREAM Triad	До 2,2 раза более высокий результат

Тесты проводились с использованием одного сопроцессора Intel® Xeon Phi™ и одного двухпроцессорного сервера на базе процессора Intel® Xeon® E5-2670. Сравнивались только параллельные, потоковые и векторизированные коды. Текущая версия библиотеки программ Intel Math Kernel Library (MKL) использовалась для тестов SGEMM, DGEMM и SMP Linpack.

Результаты работы приложений

Заказчик	Приложение	Увеличение производительности¹ по сравнению с процессором Xeon
Los Alamos	Molecular Dynamics	До 2,52 раза
Acceleware	8^th order isotropic variable velocity	До 2,05 раза
Jefferson Labs	Lattice QCD	До 2,27 раза
Financial Services	Black-Scholes SP Monte Carlo SP	До 10,75 раза До 8,92 раза
Sandia Labs	MiniFF (Finite Element Solver)	До 1,7 раза³
Sinopec	Seismic Imaging	До 2,53 раза²

Программное обеспечение и рабочие нагрузки, использованные в тестах оценки производительности, могли быть оптимизированы для процессоров Intel. Результаты тестов оценки производительности, включая SYSmark и MobileMark, измерены с использованием определенных компьютерных систем, компонентов, ПО, операций и функций. Любые модификации могут привести к изменению результатов. Необходимо ознакомиться с другой информацией и результатами тестов, включая сравнение производительности этой продукции с другими предложениями.

Относительная производительность подсчитана при присвоении базового значения 1.0 результату теста. Значение реального результата теста для базовой платформы затем было разделено на значение каждого конкретного результата теста для каждой из платформ.

Тесты производительности проводились с использованием определенных компьютеров и/или компонентов и отражают приблизительную производительность продукции Intel. Изменение аппаратных или программных компонентов или конфигурации может привести к изменению реальной производительности. Покупателям необходимо обратиться к другим источникам информации для оценки производительности систем или компонентов, которые они хотят приобрести. Дополнительная информация о тестах производительности и производительности продукции Intel представлена в Intel Performance Benchmark Limitations.

Синтетические тесты

1. Процессор Intel® Xeon® E5-2670 использовался для всей матрицы SGEMM = 13824 x 13824, DGEMM 7936 x 7936, SMP Linpack 30720 x 30720

2. Сопроцессор Intel® Xeon Phi™ SE10P (с кодом коррекции ошибок) с программным стеком Gold Release Candidate, SGEMM = 15360 x 15360, DGEMM 7680 x 7680, SMP Linpack 26872 x 28672

Результаты работы приложений

Xeon = процессор Intel® Xeon®;

Xeon Phi = сопроцессор Intel® Xeon Phi™

2 процессора Xeon против 1 процессора Xeon Phi (предварительная версия аппаратного и программного обеспечения и приложения запускаются на 100% на сопроцессоре, если не указано другое)
2 процессора Xeon против 2 процессоров Xeon + 2 процессоров Xeon Phi (без нагрузки)
Кластер с 4 узлами, каждый узел с 2 процессорами Xeon (сравнение производительности кластера с и без 1 процессора Xeon Phi на узел) (гетеро)
Измерено корпорацией Intel в октябре 2012 г.

Источник: пресс-релиз

Категории: Комплектующие

Теги: Intel, Intel Many Integrated Core, Intel MIC, Intel Xeon E5-2600, Intel Xeon E5-4600, Intel Xeon Phi, Xeon Phi, Главные, Комплектующие, Процессоры, сопроцессоры, технологии

Сопроцессоры INTEL® XEON PHI™: Новые горизонты для научных исследований

Статьи по Теме

XFX представила видеокарту Radeon HD 7970 Black Edition

Процессоры Intel Pentium G2100T и G2120 (Ivy Bridge) поступили в продажу

Двухканальный набор памяти DDR3-2300 серии RipjawsX объемом 8 Гбайт

Спецификации процессоров Ivy Bridge ULV-класса

GIGABYTE представила бюджетную системную плату с двойным UEFI BIOS

Мечта геймера — видеокарта EVGA GeForce GTX 580 DS Superclocked

Kто быстрее? Radeon HD 6970 или GTX 580

ZOTAC представляет GeForce GTX 780

Сопроцессоры INTEL® XEON PHI™: Новые горизонты для научных исследований

Статьи по Теме

Подождите, идет загрузка!