В этой статье мы заканчиваем наш первый обзор уникального российского микропроцессора «Эльбрус». На сей раз речь пойдёт о реализованных на его основе устройствах, персональных компьютерах, планах серийного производства, а также сравнительные тесты производительности.
Автор: Владимир Иванов
Часть 1: http://cont.ws/post/92016
Часть 2: http://cont.ws/post/92508
Модули на микропроцессорах «Эльбрус»
В настоящее время ЗАО «МЦСТ» выпускает несколько готовых модулей на основе процессоров R1000 архитектуры SPARC, а также серию модулей на основе «Эльбрус». Каждый из модулей изготовлен в виде системной платы с набором необходимых внешних интерфейсов, по сути представляя собой готовый компьютер, требующий лишь подключения источника питания и накопителей для хранения данных, да и то не всегда (зачастую флеш-диск достаточного объёма распаян прямо на плате). Он выполнен в стандартном форм-факторе потребительского либо промышленного стандарта, и устанавливается в корпус заказчика. В настоящее время модули комплектуются процессорами «Эльбрус-2С+», а с началом серийного выпуска «Эльбрус-4С» элементная база будет обновлена.
В каталоге компании «МЦСТ» представлены следующие модули: МВКУБ/С, МВК/U, Монокуб, КУБ-COM, МВ3S/C-К. Первый из них содержит два процессора, остальные — один. Каждый модуль оснащён картой CompactFlash, использующейся либо для хранения системы двоичной трансляции, либо для установки ОС, причём последний из перечисленных модулей содержит также дополнительный SSD-диск стандарта mSATA. Пусть вас не вводит в заблуждение слово «куб» в названиях некоторых из них: форм-фактор конструктивного исполнения — Compact PCI, COM Express type 2 и mini-ITX, напоминающие в лучшем случае прямоугольный параллелепипед, а слово «куб» выбрано, видимо, только «для красоты». Ещё один модуль, МВ3С2/C, не содержит процессора, а предоставляет лишь набор периферийных интерфейсов. Заметим, что интерфейсных модулей существует большое множество, но мы не стали перечислять их все для экономии места.
Вычислительные комплексы
Этим научным термином в компании «МЦСТ» называют любые законченные компьютеры на основе процессора «Эльбрус», от ноутбука и до мощного сервера. Да, вы не ослышались: ноутбук на этом кристалле уже выпускается и носит гордое название «Носимый терминал НТ-ЭльбрусS». Конечно, ему пока ещё далеко по изяществу до Macbook Air, своим брутальным видом он напоминает, скорее, защищённые ноутбуки фирмы Panasonic или аналогичные.
Характеристики «НТ-ЭльбрусS» достаточно скромные, но вполне достаточные для запуска «офиса» и подобных программ. А вот прочность конструкции находится на высоком уровне: аппарат не только способен нормально работать в широком диапазоне температуры (от -10 до +55°С) и влажности (вплоть до полного погружения под воду до глубины 1 м), но и вибрации, ударных нагрузках (вплоть до падения на бетон с высоты 0,75 м).
Полезным может оказаться и наличие универсального приёмника сигналов спутниковой навигации (ГЛОНАСС/GPS), а при необходимости может быть установлен адаптер Wi-Fi. Вот разве что разрешения экрана — 1024 на 768 точек — маловато для комфортной работы, да и батарею можно было бы поставить помощнее, так как заряда штатной хватает всего на 1 час.
Другой ВК — «Монокуб-PC» — вполне сопоставим с недорогим офисным ПК, да и по размерам весьма похож на него. 4 ГБ оперативной памяти и 500 ГБ жёсткого диска, разумеется, могут быть заменены на другие стандартные компоненты нужного объёма, благо что интерфейсы внутри самые что ни на есть общедоступные: слоты DDR2 и разъёмы SATA II (правда, DDR2 смотрится в наши дни некоторым анахронизмом, да и по цене уже проигрывает DDR3). К нему подключается любой стандартный монитор с коннектором VGA или DVI, а также клавиатура и мышь. Лишь наличие интерфейсов GPIO слегка намекает нам на то, что перед нами не обычный офисный ПК, а изделие для лабораторно-промышленного применения.
Ещё одна традиционная компоновка — моноблок КМ4-Эльбрус, или конструкция «всё-в-одном». Это ПК, собранный в общем корпусе с монитором. Его экран обладает уже вполне достойным разрешением 1600 на 900 точек, более того, он сенсорный! Корпус, правда, несколько толстоват, но по большому счёту, малая толщина его — лишь дань моде. На рабочий стол он впишется вполне нормально, а при желании к нему можно без дополнительных средств подключить второй монитор, с разрешением вплоть до 1920 на 1440.
И ещё один ВК, «Эльбрус-3С», является мощным модульным сервером с 16-ю процессорами (4 процессорных модуля по 4 процессора), 128 ГБ ОЗУ, встроенным коммутатором Gigabit Ethernet и оптическим контроллером сети. Он рассчитан на высокопроизводительные вычисления, а благодаря модульной конструкции, его конфигурация может сильно различаться, в зависимости от требований заказчика.
Тесты, тесты, тесты
Наверняка многим из вас не терпится узнать, на что способны новые кристаллы в плане производительности? Есть ли у новой архитектуры преимущества в реальных задачах? Чтобы выяснить это, мы подготовили три «боевых» теста: архивацию и распаковку архиватором 7-zip, обработку видеосигнала цифровым фильтром, и шифрование информации по алгоритму ГОСТ. Такой выбор задач был сделан отчасти из-за того, что все они реализованы в виде приложений для ОС Linux, способной функционировать как на процессорах Эльбрус, так и на чипах производства Intel, что позволяет провести сравнительный анализ, а отчасти потому, что эти задачи входят в число наиболее типичных применений разработанных ВК (не забываем, что основными заказчиками оных являются различные предприятия).
Характеристики тестовых стендов приведены в таблице. Отметим лишь, что в день тестирования сервер на четырёх процессорах «Эльбрус-4С» с частотой 800 МГц оказался занят, и нам предложили такой же, работающий на частоте 700 МГц, что несколько повлияло на результаты. В принципе, ничто не мешает пересчитать их, умножив или разделив на 8/7, так как производительность сервера линейно зависит от частоты. Также следует иметь в виду, что все тесты выполнялись в однопоточном режиме; для хорошо распараллеливаемых задач, а к ним принадлежат все упомянутые тесты, с ростом числа задействованных ядер производительность будет возрастать практически линейно. Соперником наших героев, а также точкой отсчёта, послужил сервер на процессоре Intel Core i7-2600, работающем на частоте 3400 МГц.
Первый тест, архивация по алгоритму 7-zip, является, пожалуй, антипримером, с точки зрения демонстрации эффективности отечественной архитектуры. Алгоритм 7-zip довольно сложен и плохо поддаётся оптимизации, поэтому общая скорость упаковки, измеряемая в мегабайтах в секунду (т.е. чем лучше производительность, тем больше числа), почти точно пропорциональна тактовой частоте, которая у российских кристаллов сильно уступает продукции лидера мирового процессоростроения. При распаковке ситуация чуть лучше: в самом деле, если частоты Core i7 и «Эльбрус-2С+» различаются в 3400/500=6,8 раза, то результаты теста лишь в 33,437/6,296=5,31 раза, что говорит о том, что работая на той же частоте, что и процессор Intel, «Эльбрус» смог бы его обойти!
Логи тестов на скорость архивации по алгоритму 7-zip:
http://filearchive.cnews.ru/img/zoom/2014/05/21/l2_7z.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/i4_7z.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/l16_7z.jpg
С фильтрацией видеосигнала наш кристалл справляется лучше. Недаром эта область являлась одной из профильных при его разработке. Но не следует полагать, что тут задействованы дополнительные ядра встроенного DSP — так было бы «нечестно» по отношению к сопернику, поэтому тестовая программа использует только ядра общего назначения. Здесь «Эльбрус-2С+» медленнее лишь в 2,5 раза (тест измеряет время выполнения одной и той же задачи, так что здесь лучшей производительности соответствует меньшее число). «Эльбрус-4С» практически подобен своему собрату, выдавая результат во столько раз лучше него, во сколько раз различаются их тактовые частоты).
Логи тестов на фильтрацию видеосигнала:
http://filearchive.cnews.ru/img/zoom/2014/05/21/l2_filter.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/i4_filter.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/l16_config.jpg
Но самый выигрышный результат оказался при шифровании по алгоритму ГОСТ, недаром он тоже разрабатывался нашими специалистами. Здесь «Эльбрус-2С+» выполнил задачу на 30% быстрее, несмотря на почти семикратную разницу в частоте, а «Эльбрус-4С» — почти в 2 раза быстрее! Что говорит о том, что эффективность отечественной архитектуры на подобных задачах лучше почти в 9 раз. Подробности можно лицезреть на скриншотах окна терминала. Не удивляйтесь, увидев неожиданное сообщение cpuinfo о странном процессоре «Эльбрус-2S»: именно так планировалось ранее назвать новый четырёхъядерный чип, но в последний момент он был переименован с целью отображения в названии количества ядер. Это же «старое» название можно прочесть и на фотографии крышки корпуса кристалла, массово отштампованной до этого момента.
Логи тестов шифрования по алгоритму ГОСТ:
http://filearchive.cnews.ru/img/zoom/2014/05/21/i4_gost.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/l2_gost.jpg
http://filearchive.cnews.ru/img/zoom/2014/05/21/l16_gost.jpg
Вперёд, к светлому будущему?
Итак, всё выглядит не так уж и плохо? И да, и нет. Несмотря на успешный старт, у МЦСТ осталась ещё масса нерешённых проблем. Главная из них — поиск производственных мощностей для выпуска чипов. Пока «Эльбрус-2С+» производится на фабриках партнёров из Юго-Восточной Азии, что не очень-то вписывается в картину России, как независимой интеллектуальной державы. К тому же для изготовления нового чипа, «Эльбрус-4С», требуется более «тонкий» процесс с нормами литографии 65 нм. Однако, перечитывая новости прессы, можно заметить, что зеленоградский завод полупроводниковых компонентов «Микрон» не так давно разработал новую для России технологию – как раз 65 нм – и закупает под нее дополнительное оборудование в свою производственную линию. Очевидно, что именно туда планируется перенести производство «Эльбрус», но «гладко бывает только на бумаге»: чтобы запустить линию и наладить серийное производство, как правило, требуется не меньше двух лет, а то и заметно больше. К чести предприятия "Микрон" стоит отметить, что задача освоения нового технологического процесса - дело далеко не тривиальное (о том, как организовано производство процессоров мы расскажем в рамках отдельного репортажа).
Вторая актуальная проблема — рост тактовой частоты. Чтобы на равных конкурировать с мировыми производителями, неплохо бы поднять её хотя бы вдвое, а лучше впятеро. Казалось бы, этого можно достичь дальнейшим уменьшением норм техпроцесса, но не всё так просто. Сменив легковушке 100-сильный двигатель на 1000 л.с., не увеличить скорость со 150 до 1500 км/ч. Необходима существенная переработка топологии под новую частоту, отладка, тесты... Да и возможности производства в нашей стране на таких линиях пока призрачны. Проще линейно наращивать количество ядер, добавив кеш-памяти и слегка повышая частоту (по мере оптимизации внутренних узлов). Примерно так и сконструирован «Эльбрус-8С», разработка которого уже идёт полным ходом и должна завершиться в будущем году. Помимо повышения частоты до 1,3 ГГц, в нём вдвое (по сравнению с «Эльбрусом-4С») увеличено количество ядер, и во столько же раз — кеш-памяти, но не только: количество вычислительных устройств с плавающей запятой также возросло с 4-х до 6-ти, что дополнительно позволит выжать из него чуточку мощности, доведя итоговую производительность до впечатляющей цифры в 250 Гфлопс. Правда, уменьшение норм техпроцесса всё же планируется, что позволит сохранить или даже уменьшить при этом суммарное тепловыделение кристалла.
А что же дальше? Увидим ли мы когда-нибудь на прилавках обилие полностью, на 100%, отечественных ПК? Если и увидим, то очень не скоро. Несмотря на некоторые явные преимущества, по соотношению главных потребительских качеств «производительность/цена» наш «Эльбрус» всё ещё проигрывает конкурентам, а доплачивать за сомнительные преимущества в виде защищённого режима или эффективного шифрования массовый потребитель вряд ли захочет. Другое дело — корпоративный клиент, для которого надёжность работы и наличие полной документации является определяющим критерием. А так как всё равно в большинстве случаев систему для него придётся разрабатывать «под заказ», то здесь отечественный производитель может даже предложить более выгодную цену, чем зарубежный партнёр. Поэтому клиентов у МЦСТ пока хватает.
Что ж, пожелаем им удачи! И будем надеяться на то, что наша страна снова станет «супердержавой», как это уже было не раз.
Источник: http://zoom.cnews.ru/publicati...
Дополнение
Перед Новым Годом сотрудники МЦСТ решили протестировать работу обновлённой графической подсистемы платформы Эльбрус, поддерживающей аппаратное 3D ускорение. Для этого решили немного поиграть.
Для теста был выбран RBDOOM3-BFG - вариант игры Doom3 с открытым исходным кодом. В качестве игровой платформы выбрали экспериментальную однопроцессорную материнскую плату с процессором Эльбрус-4С, работающем на частоте 720 МГц, с 12-ю гигабайтами оперативной памяти DDR3.
Главной целью тестирования был стек драйверов с открытым исходным кодом, реализующий стандарт OpenGL 3.3.
Установили мощную видеокарту AMD Radeon HD 6970 c двумя гигабайтами видеопамяти.
Кроссплатформенный проект RBDOOM3-BFG представляет из себя улучшенный вариант широко известной игры Doom3, модифицированный для работы под Linux (ведущий разработчик проекта - Роберт Бекебанс). Оригинальная игра Doom3 вышла в 2004 году и на тот момент предъявляла очень высокие требования к аппаратуре, редакция Doom3 BFG вышла в 2012 году.
Мы скомпилировали исходные коды игры в "родную" систему команд архитектуры Эльбрус. Отметим, что в них активно используется векторное расширение набора команд SSE2, оформленные в виде интринсиков (то есть псевдофункций на
языке Си). Это позволило проверить эффективность работы нашего компилятора с интринсиками и уровень его совместимости с компилятором GCC.
Звуковую карту использовали штатную, встроенную в южный мост КПИ. Использовалась операционная система Эльбрус с ядром Linux 2.6.33.
Игра использует все 4 ядра процессора. Для демонстрации возможностей системы мы выставили разрешение FullHD (1920 на 1080 точек).
Оценили 6 человек
3 кармы