DeepSeek — прорыв или маркетинговый ход?

1 521

Недавний отчёт аналитической компании SemiAnalysis проливает свет на истинные затраты, связанные с разработкой китайской языковой модели DeepSeek, опровергая ранее заявленные цифры. Первоначально сообщалось, что обучение модели обошлось всего в 5–6 миллионов долларов, что значительно ниже расходов западных технологических гигантов. Однако, согласно данным SemiAnalysis, реальные затраты DeepSeek значительно выше.

 

По оценкам, DeepSeek и связанный с ней китайский хедж-фонд High-Flyer инвестировали более 500 миллионов долларов в оборудование, включая около 10 000 графических процессоров Nvidia H800 и 10 000 более мощных чипов H100. Кроме того, компания разместила заказы на ускорители H20, специально разработанные для китайского рынка.

Общие капитальные вложения оцениваются примерно в 1,6 миллиарда долларов, а эксплуатационные расходы — около 944 миллионов долларов. Таким образом, суммарные затраты на разработку и поддержку модели могут достигать 2,5 миллиарда долларов, что примерно в 400 раз превышает первоначально заявленные суммы.

DeepSeek была создана в мае 2023 года как дочерняя компания High-Flyer с целью дальнейшего развития ИИ-технологий. Компания активно привлекает таланты из ведущих китайских университетов, предлагая конкурентоспособные зарплаты, превышающие 1,3 миллиона долларов США для перспективных кандидатов. Штат компании насчитывает около 150 сотрудников и продолжает расти.

DeepSeek достигла значительных успехов в области архитектурных инноваций, включая внедрение Multi-Token Prediction (MTP) и модели Mixture-of-Experts (MoE). Эти подходы позволяют улучшить производительность модели и снизить затраты на обучение. Однако разработка таких инноваций требует значительных инвестиций в исследования и разработки, а также в вычислительные ресурсы.

Анализ SemiAnalysis показывает, что ранее заявленные низкие затраты на обучение модели DeepSeek не отражают полной картины расходов. Реальные затраты на разработку и поддержку модели значительно выше, что свидетельствует о том, что создание передовых языковых моделей по-прежнему требует значительных финансовых и технических ресурсов.

https://masterok.livejournal.c...

«Перебить миллиард». Готова ли Россия к войне со всей Европой?

Отвечая на вопросы читателей издания «Военное дело», политолог Ростислав Ищенко прокомментировал готовность России к большой войне в Европе.— Ростислав Владимирович, насколько вероятно ...

ПРО ОСВОБОЖДЕНИЕ ДНЕПРОПЕТРОВСКА, НИКОЛАЕВА И ОДЕССЫ

Здравствуй, дорогая Русская Цивилизация. Ниже пишет автор канала "Записки Традиционалиста": "Итак, вчера мы осветили явные знаки отказа России в течение минувшей недели от всякого по...

Обсудить
  • Китайская НАРОДНАЯ республика может себе это позволить. Это вам не пигмеи Чубайса.