Самый большой в мире процессор Cerebras оказался в сотни раз быстрее суперкомпьютера на базе NVIDIA GPU

14 2746

В эру завершения закона Мура известная шутка про самые большие в мире советские микросхемы перестала быть шуткой. Новым чудом микроэлектроники стал процессор Cerebras WSE со сторонами кристалла 21,5 × 21,5 см. Первая практика применения серверов на базе Cerebras WSE показала, что в ряде задач он обеспечивает подавляющее превосходство, и ещё долго не будет иметь равных.

Процессор Cerebras WSE

Системы CS-1 на базе процессора Cerebras WSE (Wafer Scale Engine) — компактные блоки высотой 26 дюймов (66 см) — были представлены примерно год назад. Эти блоки занимают 1/3 стандартной серверной стойки, но их производительность колоссальна. Причём вся эта производительность — результат работы одного-единственного процессора. Проектировщики компании SeaMicro рискнули разработать процессор размером с целую кремниевую пластину и не прогадали. На выходе получился продукт, который в вычислительных задачах в 10 тыс. раз быстрее самых производительных графических процессоров.

На днях о практических испытаниях CS-1 сообщила Национальная лаборатория энергетических технологий Министерства энергетики США (NETL). Она стала одним из немногих обладателей системы CS-1 и получила возможность сравнить её с классическими суперкомпьютерами на базе x86-процессоров с GPU NVIDIA. В частности, CS-1 сравнивали с одним из последних полученных лабораторией суперкомпьютеров Joule.

 

Система CS-1. Источник изображения: LLNL

Система Joule занимает 82 место в списке 500 мощнейших систем на Земле. Она опирается на 84 тыс. вычислительных ядер, распределённых по десяткам стоек, оценивается в десятки млн долларов США и потребляет 450 кВт. Система Cerebras CS-1 занимает треть стойки, стоит несколько млн долларов и потребляет всего 20 кВт. При этом в задаче, которая нагружает 16 384 ядер Joule, система на Cerebras оказалась в 200 раз быстрее.

Следует сказать, что Cerebras подходит не для всех вычислительных нагрузок. Этот процессор разрабатывался с упором на ускорение вычислений нейронных сетей и идеально подходит для ИИ и машинного обучения. Но даже в таком случае ему требуется мощнейший внешний сервер для подготовки и последующей обработки полученных данных. «Сырые» данные ему не подходят, либо они не позволяют загрузить такого монстра оптимальным образом.

Реклама

И всё же для моделирования, например, гидродинамических задач ему нет равных, что показало сравнение с системой Joule, которая как раз призвана решать подобные задачи. Более того, Cerebras CS-1 настолько быстр, что может решать сложнейшие задачи быстрее, чем моделируемые процессы протекают в реальном времени. К примеру, он заканчивает расчёт ядерной реакции задолго до её прекращения в реальном реакторе. А вместо месяцев обучения той или иной модели ML система CS-1 способна обучиться за считаные минуты.

Подробнее о процессоре Cerebras можно прочесть в нашем архиве новостей. Вкратце напомним, что он состоит из 1,2 трлн транзисторов, часть которых сконфигурирована в 400 тыс. вычислительных ядер.

Источник:

https://3dnews.ru/1025769/sami...

Александр Хинштейн отзывает свои запросы

На 100% правильный поступок.Особенно сейчас, когда выяснилось, что якобы пострадавшая гражданка приехала из другого города специально, чтобы принять участие в массовых беспорядках, рабо...

Работаем, брат!

Разумеется, я очень рада, что глас народа был услышан, здравый смысл восторжествовал и запрос о привлечении сотрудника ГУМВД Санкт-Петербурга был отозван. Но осадочек, как говорится, ос...

Будни США или Картина маслом

Многие сейчас в недоумении, толком не понимают, что происходит. Куча каких-то хаотических действий, которые ни в какую логику не укладываются Например, Германия посылает к берегам Японии 1 (про...

Обсудить
  • необычный проц небось выход 1 годный на 10 000 пластин..
    • DZ
    • 21 ноября 2020 г. 12:46
    :thumbsup:
  • Под лежачий монокристалл вода (деионизованная) не течёт. По любому похвала энтузизистам.
  • Представьте себе два миллиарда китайцев в виде суперкомпьютера? Один китаец - один транзистор. Обучить китайца бинарной логике - как два пальца. Так вот, если два миллиарда китайцев встанут на одной площади...
  • Русским еще далеко до таких технологий. Эх нищета, разруха и русский синонимы 21 века хехехе