Новая нейросеть из Китая — DeepSeek-R1 - CEВЕР

Совсем недавно я описывал любопытную китайскую нейросеть Qwen, и вот теперь мир потрясла очередная нейросеть — DeepSeek-R1. Потрясла так, что существенно обесценила американские IT-компании, имеющие отношение к разработкам ИИ.

Инвесторов американских компаний напугало то, что DeepSeek смогла создать ИИ с возможностями как у ведущих технологических компаний США, но на менее мощных чипах и за существенно меньшую часть стоимости. Сотрудники DeepSeek пишут, что обучали модель на чипах Nvidia H800, а они значительно менее мощны, чем новые Nvidia Blackwell. Это может означать то, что создание ИИ в США сильно переоценено как по стоимости, так и по требовательности к мощности требующегося железа.

Некоторые источники в США растерянно предполагают, что по факту происходило не обучение модели как таковое, а переобучение или дообучение украденных ранее готовых данных от модели от OpenAI, что и позволило произвести это и быстрее, и на чипах меньшей мощности.

Как говорит о себе сама модель, DeepSeek-R1 оптимизирован для выполнения практических задач: от генерации кода и анализа данных до математических вычислений и логических рассуждений. Он демонстрирует высокую точность в специализированных областях.

Я пощупал и эту модель. Впечатление тоже очень положительное. Есть интересная изюминка — в режиме DeepThink (R1), который включается нажатием соответствующей кнопочки внизу страницы (который, собственно, и является включением новой модели), перед тем, как дать ответ, нейросеть своими словами рассказывает, как она поняла запрос и как она планирует на него отвечать. Эта информация очень интересна и полезна для правильного составления дальнейших запросов.

По состоянию на дату написания этой статьи, актуальность знаний нейросети —июль 2024 года, но для получения более свежей информации можно включить кнопочку Search, и тогда нейросеть будет пользоваться Интернетом для уточнения информации.

У нейросети есть веб-интерфейс: https://www.deepseek.com/. Регистрируемся, как и в случае с Qwen, через Гугл-аккаунт. Также можно зарегистрироваться через почту, если она у вас на почтовом ресурсе gmail.com. На другие почтовики, как и в случае Qwen, информация с подтверждением регистрации не приходит.

У меня с давних времён имеется аккаунт на Google, так что регистрация прошла штатным образом мгновенно и без затруднений.

Первые впечатления

Замечу, что в связи с резкой популярностью нейросети, бывает такое, что серверы просто не отвечают (особенно если включить кнопку Search). Я пробовал пользоваться нейросетью вечером после 18:00 по Москве, и испытывал затруднения с занятостью сервера. Однако в более позднее время (после 22:00 по Москве) Китай засыпает, нагрузка падает, и проблем с отзывчивостью сервиса вроде бы меньше. Но в США в это время ещё день, а они тоже дают свою нагрузку. В общем, надо искать правильное время.

Нейросеть DeepSeek понимает по-русски, и хотя в процессе описания своих рассуждений иногда срывается на английский, ответ даёт всё равно на русском. В любом случае, модель помнит контекст чата, и её можно просто попросить повторить ответ на требующемся языке.

Нейросеть не притворяется живой и всегда подчёркивает, что она — лишь инструмент.

Это очень правильно, потому что не вводит пользователя в заблуждение и не вызывает лишних споров на пустом месте. А то очень многие, пощупав нейросети, начинают потом строчить комментарии о том, что это обман, подмена человеческого интеллекта его видимостью и т.п.

Конечно, только зачем об этом постоянно писать, если никто с этим не спорит? Себя убедить? А тут нейросеть сама говорит — да, я лишь моделирую те или иные особенности человеческого общения. И уже никому не хочется повторять то же самое — нейросеть всё сама уже сказала.

Более того, сам текст описания «логики» при подготовки ответа на вопрос довольно информативно показывает, что текст ответа абсолютно искусственен, и все его краски, эмоции и дружелюбность — искусственные. «От души» тут ничего не идёт. Машина есть машина, и это всячески подчёркивается.

Ещё из правильного поведения нейросети я могу отметить то, что она достаточно часто напоминает пользователю, что её информация может быть не совсем достоверна. Такое напоминание весьма актуально для многих пользователей, излишне доверяющих ответам нейросетей.

У меня сложилось впечатление от этой нейросети, как о довольно профессиональном инструменте. Всё по делу, всё по полочкам и без лишней искусственной эмоциональности.

В отличие от моделей GPT от компании OpenAI, доступ к модели DeepSeek полностью бесплатен, как и у Qwen. На него не нужно оформлять подписку или пользоваться различными ухищрениями, каждое из которых имеет некоторое ограничение.

Кроме всего прочего, у DeepSeek есть андроид-приложение, которое можно установить на смартфон и пользоваться нейросетью через него.

Заключение

Думаю, что в самое ближайшее время станут также бесплатными и ChatGPT, и даже нейросетевые модели от Яндекса и от Сбера. А куда деваться, надо же как-то конкурировать.

В своё время и Whatsapp был платным, пока в 2016 году бесплатный Телеграм не пережил резкий рост своей популярности, вынудив своего прямого конкурента отменить плату за использование своего клиентского приложения.

Судя по всему, всё идёт так, как я и предполагал — ИИ будет становиться всё более осторожным в своих суждениях а его использование людьми станет всё более уместным и профессиональным. Никаких ужасов, которые рисуют некоторые слишком эмоциональные граждане, не ожидается.

То, что мы порою наблюдаем сегодня — это детские болезни, неотрегулированность того, чего ранее просто не было. Но в течение ближайшего десятилетия всё войдёт в правильную колею.

А учиться использовать ИИ нужно уже сейчас. Это хороший инструмент, если знать, как его правильно применять. Может сильно повысить производительность и качество некоторых видов интеллектуальной деятельности человека.

Помню, как в начале 80-х годов многие бегали с причитаниями о том, что микрокалькуляторы отучат людей считать. Потом это стало относится к компьютерам. Но никто из них почему-то не упоминал, что компьютеры научат людей такой сложному виду деятельности, как программирование, а пользователей программ — другим сложным видом деятельности, кратно повышая эффективность их работы (например, САПР для конструкторов).

Точно так же и ИИ, конечно же, не приведёт к деградации человека, а лишь поможет ему взять новые вершины науки и технологий, а в России — поможет немного снизить проблему недостаточного количества населения для эффективного поддержания суверенитета страны на приемлемом уровне.

e-g

Обсудить

- bvrus
- Сегодня 10:44
Есть мнение, что рынок обрушил не сам DeepSeek, он был лишь толчком к событиям, которые давно назревали. Уже много месяцев говорят о том, что акции компаний, которые занимаются сейчас ИИ, невероятно перегреты, и этот пузырь должен лопнуть, и с таким треском, что никому мало не покажется. И он пока еще не лопнул, пока что просто тряхануло...
- Termius
- Сегодня 11:27
DeepSeek создан на основе системы ОГАС академика Глушкова: https://cont.ws/@Teradont/2972384
- VZ_Klaus_Petrov
- Сегодня 13:58
Попробовал пообщаться. Что такое "нофелет" пока не усвоил, обещал запомнить, но три попытки не помогли. Буду его тренировать дальше. :joy_cat: :joy_cat: Только что проверил: усвоил, дал вполне развёрнутый и адекватный ответ. Так, что можно пользоваться :exclamation:
- ®oots (От Бобра всем добра)
- Сегодня 15:02
Уже почти две недели все обсуждают и описывают DeepSeek :laughing: :laughing:

ТОП ЗА 3 ДНЯ

Первые впечатления

Заключение