среда, 1 апреля 2015 г.

Обзор процессора Atom C2758 и материнской платы SuperMicro A1SRM-2758F: бьем рекорды энергоэффективности

Вступление
За последние годы на рынке серверов и суперкомпьютеров произошли серьезные изменения, и главное из них — появление гетерогенных вычислений и микросерверов.
Когда смотришь на рейтинг суперкомпьютеров TOP500, становится ясно, что с каждым годом не только растет количество гетерогенных суперкомпьютеров, но и «классические» суперкомпьютеры на базе ЦП опускаются всё ниже и ниже, сдавая позиции гетерогенным кластерам. То есть современному рынку суперкомпьютеров требуются не унифицированные мощные процессоры, а узкоспециализированные, которые позволяют поднять и производительность, и энергоэффективность вычислительного комплекса на новый уровень — например, не так давно система на базе процессоров Xeon Е5 и сопроцессоров Xeon Phi показала рекордный уровень энергоэффективности в TOP500.
Игнорировать данные тенденции нельзя, если хочешь остаться на рынке, — компания AMD, купив производителя графических карт ATI в далеком 2006 году, решила проблему с сопроцессорами, выпустив профессиональные устройства для GPGPU-вычислений. Компания Intel, не имея под своим крылом разработчика графических ускорителей, пошла своим путем — начала с нуля разработку амбициозного проекта Larrabee, который впоследствии трансформировался в Intel MIC и высокопроизводительные сопроцессоры Xeon Phi. Де-факто Intel сумела ответить на потребности рынка суперкомпьютеров и, очевидно, весьма успешно — согласно ноябрьскому рейтингу TOP500 2013 года, самый производительный суперкомпьютер основан на процессорах Xeon E5 и сопроцессорах Xeon Phi.
Рынок микросерверов также нуждался в специализированном устройстве, как и рынок суперкомпьютеров. Поскольку необходимы были процессоры с небольшим энергопотреблением и высокой энергоэффективностью, классические мощные и сложные х86-ядра как у Xeon E3/E5/E7 и Itanium явно не подходили. Компания AMD пошла по пути наименьшего сопротивления — купила лицензию на ARM-архитектуру, которая отличается своей «простотой» и высокой энергоэффективностью. Решение Intel было понятно сразу — если уж на рынке мобильных телефонов, планшетов, суперкомпьютеров она не отказалась от х86-архитектуры, то что уж говорить про микросерверы? Поскольку реагировать на запросы рынка надо оперативно, то не было и речи о разработке архитектуры с нуля — в качестве отправной точки был взят «вездесущий» Atom. Адаптировав под серверные нужды в 2012 году микроархитектуру Saltwell, Intel получила серию процессоров S1200 с кодовым именем Centerton. Это были двухъядерные процессоры, произведенные по 32-нм техпроцессу. Ввиду невысокой производительности, необходимости в дополнительной обвязке (контроллеры Ethernet, SATA, USB) и ограничения максимального объема ОЗУ отметкой в 8 Гбайт данная серия не получила особого распространения. Это решение было пробой пера на рынке микросерверов, так что ему был отмерен краткий срок.
Intel Avoton
В 2013 году, сделав работу над ошибками, Intel выпускает в свет новую линейку процессоров Atom С2000 — теперь в состав чипа входят не только восемь процессорных ядер с переработанной архитектурой и ИКП, но и контроллеры SATA, USB, Ethernet и PCI Express, то есть речь идет о полноценной SoC.
Материнская плата SuperMicro A1SRM-2758F, CPU-Z
Несмотря на то, что Intel значительно переработала ядро «Атома», от предшественника осталась несимметричная компоновка кешей первого уровня: кеш инструкций объемом 32 Кбайт, кеш данных — 24 Кбайт. Что весьма странно.
Само процессорное ядро Atom С2000 имеет архитектуру Silvermont, которую мы не так давно рассматривали. Поэтому нет смысла делать это еще раз, а вот строение SoC ввиду кардинальных изменений стоит детально разобрать.
Intel Rangeley
Intel Bay Trail-M/D
В состав SoC Bay Trail входит до четырех процессорных ядер, графическое ядро Intel HD с четырьмя EU, контроллеры USB 3.0 и 2.0, SATA 2.0, PCI Express 2.0 с четырьмя линиями и двухканальный контроллер памяти с поддержкой DDR3-1333. В микросервере как таковой необходимости в графическом ядре нет, поэтому первое, что было исключено из SoC, — это графика Intel HD. Хотя здесь стоит сделать поправку — графическое ядро в целом серверу необходимо, но от него требуются другие функции, например, IPMI — для этого используются специализированные устройства вроде Aspeed AST2400. Теоретически можно было оставить Intel HD, «прикрутив» к нему все необходимые функции, в том числе и IPMI, — это позволило бы не только снизить количество дополнительного оборудования (а значит, и упростить разводку материнской платы), но и иметь поддержку OpenCL «на всякий случай» для гетерогенных вычислений «завтрашнего дня». Безусловно, это бы несколько увеличило площадь SoC, а следовательно, и транзисторный бюджет, который, как правило, ограничен на моменте проектирования процессора, но вариант все равно интересный — конкурент в лице AMD двигается именно в этом направлении. Однако это все теории. Итого в состав SoC Atom C2000 входит:
  • до восьми процессорных ядер;
  • двухканальный контроллер DDR3-1600 с поддержкой ECC;
  • контроллер PCI Express 2.0 с шестнадцатью линиями (четыре контроллера по четыре линии);
  • контроллер с квартетом портов SATA 2.0;
  • контроллер с двумя портами SATA 3.0;
  • четыре сетевых контроллера;
  • контроллер USB 2.0 с четырьмя портами;
  • криптографический сопроцессор Intel QuickAssist.
Следует остановиться на самой серии процессоров С2000, ведь в ней формально присутствуют два типа SoC — Rangeley и Avoton. По сути, это одни и те же чипы с одинаковой архитектурой, разница между которыми заключается в том, что процессоры Rangeley имеют поддержку технологии Intel QuickAssist, а Avoton — нет. Для различения процессоров в рамках серии компания Intel использует разный числовой индекс в конце названия: цифра 8 означает принадлежность SoC к Rangeley, а 0 — к Avoton.
У Rangeley и Avoton разные сегменты рынка: первые предназначены для облачных хранилищ и устройств коммутации, а вторые — для микросерверов. Стоит заметить, что Rangeley за счет Intel QuickAssist имеет рекомендованную стоимость на 37 долларов больше, чем Avoton (на примере С2758 и С2750). Безусловно, процессоры Rangeley можно также использовать в микросерверах, переплатив за криптографический сопроцессор.
#Модельный ряд Atom C2000
Модельный ряд серии С2000 на данный момент времени содержит восемь процессоров Rangeley и пять процессоров Avoton. Количество ядер в линейке варьируется от двух до восьми, а TDP — от 6 до 20 ватт.
Модельный ряд Intel Rangeley
Модельный ряд Intel Avoton
#Спецификации процессора Atom C2758
Тестирование производительности Rangeley будем выполнять на примере материнской платы SuperMicro A1SRM-2758F. Стоит заметить, что плата имеет «сестру-близняшку», на которой распаян SoC Avoton, — SuperMicro A1SAM.
Материнская плата SuperMicro A1SRM-2758F, CPU-Z
 Atom C2758Atom C2750
Кодовое названиеRangeleyAvoton
Техпроцесс, нм22
Количество ядер/потоков, шт8/8
Тактовая частота, ГГц2,4
Максимальная тактовая частота с Turbo Boost-2,6
Кеш-память L1i/L1d, Кбайт8х 32/8х 24
Кеш L2, Мбайт4х 1
Набор инструкцийIntel 64, MMX, SSE, SSE2, SSE3, SSSE3, SSE 4.1, SSE4.2, VT-x, AES-NI, EPT
Поддержка Intel QuickAssistЕстьНет
Максимальный объем ОЗУ, Гбайт64
Тип поддерживаемой памятиDDR3, DDR3L
Максимальная эффективная частота ОЗУ, МГц1600
Количество каналов памяти2
Поддержка ECCЕсть
Количество линий PCI Express16
Редакция PCI Express2.0
Количество портов USB 2.04
Количество портов SATA 2.0/3.04/2
Интегрированный сетевой контроллер4 х 1000 Мбит/с или
4 х 2,5 Гбит/с
TDP, Вт20
Рекомендованная стоимость, $208171
Из таблицы спецификаций видно, что Avoton (Atom C2750) имеет поддержку Turbo Boost и несколько меньшую стоимость, в свою очередь Rangeley (Atom C2758) поддерживает технологию Intel QuickAssist. В остальном же перед нами одинаковые чипы.
Материнская плата SuperMicro A1SRM-2758F, CPU-Z
Если говорить о поддерживаемых наборах инструкций, то Atom C2000 выглядит вполне современно: Intel 64, MMX, SSE, SSE2, SSE3, SSSE3, SSE 4.1, SSE4.2, VT-x, EPT, AES-NI. Для полного счастья не хватает только AVX, AVX2 и FMA3, но поддержка данного набора инструкций вылилась бы в кардинальное изменение и усложнение ядра и кешей в силу 256-битной разрядности. Возможно, в следующих поколениях Atom получит поддержку 256-битных расширений — ведь будущее поколение Xeon Phi, базирующееся на схожем с Avoton ядре, имеет поддержку 512-битных AVX-инструкций. Отдельно стоит сказать, что, как и в Haswell, в Rangeley предусмотрен аппаратный цифровой генератор случайных чисел DRNG, обеспечивающий высокую скорость генерации случайных чисел — например для криптографических задач (с помощью инструкции RDRAND). Также присутствует поддержка набора инструкций виртуализации Intel VT-x2, в состав которого входят: Intel VT FlexMigration, Intel VT FlexPriority, VPID, VT Real Mode, VMFUNC.
#Спецификации материнской платы SuperMicro A1SRM-2758F
ПроцессорAtom C2758
Оперативная памятьЧетыре 240-контаных слота для DDR3 SDRAM DIMM
Поддерживается память типа DDR3 1333/1600
Возможен двухканальный доступ к памяти
Максимальный объем 64 Гбайт
Поддержка коррекции ошибок ECC
Возможности расширения2 x SATA 2.0
4 x SATA 3.0
3 x USB 2.0
1 x Fast UART 16550 Serial Port
1 x SATA DOM TPM 1.2 Header
Интерфейсная панель1 x COM
4 x USB 2.0
1 x IPMI LAN
4 x LAN
1 x D-Sub
1 x UID Switch
BIOS128 Мбайт SPI Flash EEPROM with AMI UEFI BIOS DMI2.3 ACPI5.0 USB Keyboard Support SMBIOS 2.7.1 UEFI
Разное3 х 4-pin коннектора для подключения вентиляторов
ПитаниеОсновной 24-контактный разъем питания ATX
МониторингМониторинг напряжений ядер процессора, +1,8V, +3,3V, +5V, +12V, +5V Standby, VBAT, ОЗУ
Мониторинг тахометров вентиляторов
Мониторинг температур ядер процессора
Форм-фактор и размерuATX, 24,4x19,05 см
Перед осмотром материнской платы ознакомимся со схемой коммутации интерфейсов на ней.
Схема коммутации интерфейсов материнской платы SuperMicro A1SAM/A1SRM
А также со схемой расположения слотов и разъемов.
Схема материнской платы SuperMicro A1SAM/A1SRM
#Упаковка и внешний вид
Упаковка материнской платы SuperMicro A1SRM-2758F
Поставляется материнская плата в лаконичной и невзрачной упаковке — стоит заметить, что материнские платы для Xeon имеют аналогичный дизайн. Конечно, не стоит забывать, что это серверное решение, а не геймерское, тем не менее «фирменный» стиль, на наш взгляд, стоит переработать — хотя бы сделать лицевую сторону более информативной.
Комплектация материнской платы SuperMicro A1SRM-2758F
Комплектация материнской платы SuperMicro A1SRM-2758F
Комплектация материнской платы в целом обычна: шесть кабелей SATA, крепежно-усилительная пластина, краткий информационный листок и «чек-лист». Необходимы драйверы и мануал? Добро пожаловать в Сеть. Кстати, это даже к лучшему — пользователь всегда получает свежие драйверы с сайта производителя, а не «50-летней давности», записанные на диске.
Материнская плата SuperMicro A1SRM-2758F, общий вид
Материнская плата имеет форм-фактор MicroATX и, соответственно, размеры 24,4х19,05 см. Безусловно, такой форм-фактор позволяет получить плотную компоновку в стойке, но небольшие габариты выливаются в огрехи дизайна — например, защелки двух из четырех слотов для ОЗУ труднодоступны, так как им мешает интерфейсная панель. Плата питается от 24-контактного разъема ATX, но если не использовать слоты PCI Express, то подойдет и 20-контактный. Также на плате можно заметить нераспаянный слот PCI Express x4, который устанавливается опционально.
Материнская плата SuperMicro A1SRM-2758F, порты SATA
Примечательной особенностью SuperMicro A1SRM является распаянный прямо на плате порт USB 2.0, рядом с которым расположились порты SATA: два белых SATA 3.0 и четыре SATA 2.0 — три черных и желтый.
Материнская плата SuperMicro A1SRM-2758F, ASPEED AST2400
В качестве графического адаптера выступает ASPEED AST2400, поэтому о 3D стоит забыть, но в нем, в принципе, и необходимости нет, особенно в случае NAS.
Материнская плата SuperMicro A1SRM-2758F, Marvell Alaska 88E1543
Marvell Alaska 88E1543
Как мы помним, в SoC интегрирован контроллер Intel I347 с поддержкой четырех сетевых интерфейсов со скоростью 1000/2500 Мбит/с, а в качестве приемопередатчика выступает распаянная на плате микросхема Marvell Alaska 88E1543.
Материнская плата SuperMicro A1SRM-2758F, радиатор СО
Материнская плата SuperMicro A1SRM-2758F, радиатор СО
Система охлаждения пассивная — она представляет собой небольшой радиатор с винтовым креплением, чего, в принципе, должно хватать для процессора с TDP 20 ватт. Полировка основания далека от идеала. Зато на плате распаяно три 4-контактных разъема для подключения вентиляторов, что позволяет трансформировать СО в активную.
Материнская плата SuperMicro A1SRM-2758F, кристалл SoC Atom C2758
Материнская плата SuperMicro A1SRM-2758F, кристалл SoC Atom C2758
Сама SoC Atom C2758 распаяна на материнской плате, поэтому ни о какой смене процессора речи быть не может. Площадь чипа невелика для 8-ядерного процессора — всего 106 мм2. Для сравнения: у 4-ядерного Haswell — 177 мм2, при этом оба изготавливаются по 22-нм техпроцессу с технологией 3D Tri-Gate. Рядом с кристаллом располагаются массивы резисторов, которые, как и ядро, к сожалению, не защищены металлической рамкой от сколов.
Материнская плата SuperMicro A1SRM-2758F, оборотная сторона
На оборотной стороне платы нет ничего примечательного, разве что металлическая усилительная пластина, удерживающая радиатор охлаждения.
Материнская плата SuperMicro A1SRM-2758F, интерфейсная панель
Интерфейсная панель весьма скудная — COM-порт, по четыре порта USB 2.0 и RJ-45 для подключения к локальной сети и Интернету, D-Sub, а также отдельный разъем RJ-45 для IPMI. С другой стороны, для NAS больше и не надо — разве что пару портов USB 3.0.

1 комментарий:

Примечание. Отправлять комментарии могут только участники этого блога.