Поддержите Конт – сохраните и развивайте вашу платформу!

Новая нейросеть из Китая — DeepSeek-R1

5 452

Совсем недавно я описывал любопытную китайскую нейросеть Qwen, и вот теперь мир потрясла очередная нейросеть — DeepSeek-R1. Потрясла так, что существенно обесценила американские IT-компании, имеющие отношение к разработкам ИИ.

Инвесторов американских компаний напугало то, что DeepSeek смогла создать ИИ с возможностями как у ведущих технологических компаний США, но на менее мощных чипах и за существенно меньшую часть стоимости. Сотрудники DeepSeek пишут, что обучали модель на чипах Nvidia H800, а они значительно менее мощны, чем новые Nvidia Blackwell. Это может означать то, что создание ИИ в США сильно переоценено как по стоимости, так и по требовательности к мощности требующегося железа.

Некоторые источники в США растерянно предполагают, что по факту происходило не обучение модели как таковое, а переобучение или дообучение украденных ранее готовых данных от модели от OpenAI, что и позволило произвести это и быстрее, и на чипах меньшей мощности.

Как говорит о себе сама модель, DeepSeek-R1 оптимизирован для выполнения практических задач: от генерации кода и анализа данных до математических вычислений и логических рассуждений. Он демонстрирует высокую точность в специализированных областях.

Я пощупал и эту модель. Впечатление тоже очень положительное. Есть интересная изюминка — в режиме DeepThink (R1), который включается нажатием соответствующей кнопочки внизу страницы (который, собственно, и является включением новой модели), перед тем, как дать ответ, нейросеть своими словами рассказывает, как она поняла запрос и как она планирует на него отвечать. Эта информация очень интересна и полезна для правильного составления дальнейших запросов.

По состоянию на дату написания этой статьи, актуальность знаний нейросети —июль 2024 года, но для получения более свежей информации можно включить кнопочку Search, и тогда нейросеть будет пользоваться Интернетом для уточнения информации.

У нейросети есть веб-интерфейс: https://www.deepseek.com/. Регистрируемся, как и в случае с Qwen, через Гугл-аккаунт. Также можно зарегистрироваться через почту, если она у вас на почтовом ресурсе gmail.com. На другие почтовики, как и в случае Qwen, информация с подтверждением регистрации не приходит.

У меня с давних времён имеется аккаунт на Google, так что регистрация прошла штатным образом мгновенно и без затруднений.

Первые впечатления

Замечу, что в связи с резкой популярностью нейросети, бывает такое, что серверы просто не отвечают (особенно если включить кнопку Search). Я пробовал пользоваться нейросетью вечером после 18:00 по Москве, и испытывал затруднения с занятостью сервера. Однако в более позднее время (после 22:00 по Москве) Китай засыпает, нагрузка падает, и проблем с отзывчивостью сервиса вроде бы меньше. Но в США в это время ещё день, а они тоже дают свою нагрузку. В общем, надо искать правильное время.

Нейросеть DeepSeek понимает по-русски, и хотя в процессе описания своих рассуждений иногда срывается на английский, ответ даёт всё равно на русском. В любом случае, модель помнит контекст чата, и её можно просто попросить повторить ответ на требующемся языке.

Нейросеть не притворяется живой и всегда подчёркивает, что она — лишь инструмент.

Это очень правильно, потому что не вводит пользователя в заблуждение и не вызывает лишних споров на пустом месте. А то очень многие, пощупав нейросети, начинают потом строчить комментарии о том, что это обман, подмена человеческого интеллекта его видимостью и т.п.

Конечно, только зачем об этом постоянно писать, если никто с этим не спорит? Себя убедить? А тут нейросеть сама говорит — да, я лишь моделирую те или иные особенности человеческого общения. И уже никому не хочется повторять то же самое — нейросеть всё сама уже сказала.

Более того, сам текст описания «логики» при подготовки ответа на вопрос довольно информативно показывает, что текст ответа абсолютно искусственен, и все его краски, эмоции и дружелюбность — искусственные. «От души» тут ничего не идёт. Машина есть машина, и это всячески подчёркивается.

Ещё из правильного поведения нейросети я могу отметить то, что она достаточно часто напоминает пользователю, что её информация может быть не совсем достоверна. Такое напоминание весьма актуально для многих пользователей, излишне доверяющих ответам нейросетей.

У меня сложилось впечатление от этой нейросети, как о довольно профессиональном инструменте. Всё по делу, всё по полочкам и без лишней искусственной эмоциональности.

В отличие от моделей GPT от компании OpenAI, доступ к модели DeepSeek полностью бесплатен, как и у Qwen. На него не нужно оформлять подписку или пользоваться различными ухищрениями, каждое из которых имеет некоторое ограничение.

Кроме всего прочего, у DeepSeek есть андроид-приложение, которое можно установить на смартфон и пользоваться нейросетью через него.

Заключение

Думаю, что в самое ближайшее время станут также бесплатными и ChatGPT, и даже нейросетевые модели от Яндекса и от Сбера. А куда деваться, надо же как-то конкурировать.

В своё время и Whatsapp был платным, пока в 2016 году бесплатный Телеграм не пережил резкий рост своей популярности, вынудив своего прямого конкурента отменить плату за использование своего клиентского приложения.

Судя по всему, всё идёт так, как я и предполагал — ИИ будет становиться всё более осторожным в своих суждениях а его использование людьми станет всё более уместным и профессиональным. Никаких ужасов, которые рисуют некоторые слишком эмоциональные граждане, не ожидается.

То, что мы порою наблюдаем сегодня — это детские болезни, неотрегулированность того, чего ранее просто не было. Но в течение ближайшего десятилетия всё войдёт в правильную колею.

А учиться использовать ИИ нужно уже сейчас. Это хороший инструмент, если знать, как его правильно применять. Может сильно повысить производительность и качество некоторых видов интеллектуальной деятельности человека.

Помню, как в начале 80-х годов многие бегали с причитаниями о том, что микрокалькуляторы отучат людей считать. Потом это стало относится к компьютерам. Но никто из них почему-то не упоминал, что компьютеры научат людей такой сложному виду деятельности, как программирование, а пользователей программ — другим сложным видом деятельности, кратно повышая эффективность их работы (например, САПР для конструкторов).

Точно так же и ИИ, конечно же, не приведёт к деградации человека, а лишь поможет ему взять новые вершины науки и технологий, а в России — поможет немного снизить проблему недостаточного количества населения для эффективного поддержания суверенитета страны на приемлемом уровне.


e-g

«Отвечать будет поздно». Как США планируют нанести ядерный удар по России?

Политолог Ростислав Ищенко, отвечая на вопросы читателей издания «Военное дело», объяснил почему первое применение ракеты «Орешник» состоялось без боевой части, а также прокомментировал...

Мигрантам хотят запретить работать в полиции даже после получения гражданства

В Госдуме появился законопроект о запрете работать в полиции бывшим мигрантам даже после того, как они получили гражданство РФ. Законопроект предложила партия «Справедливая Россия – За ...

Идея власти

Трагедия Русского Поречного заключается в том, что туда пришла Украина. Не какие-то особые изверги, не СС-айнзатцкоманды, предназначенные для уничтожения представителей «нежелательных» ...

Обсудить
  • Есть мнение, что рынок обрушил не сам DeepSeek, он был лишь толчком к событиям, которые давно назревали. Уже много месяцев говорят о том, что акции компаний, которые занимаются сейчас ИИ, невероятно перегреты, и этот пузырь должен лопнуть, и с таким треском, что никому мало не покажется. И он пока еще не лопнул, пока что просто тряхануло...
  • DeepSeek создан на основе системы ОГАС академика Глушкова: https://cont.ws/@Teradont/2972384
  • Попробовал пообщаться. Что такое "нофелет" пока не усвоил, обещал запомнить, но три попытки не помогли. Буду его тренировать дальше. :joy_cat: :joy_cat: Только что проверил: усвоил, дал вполне развёрнутый и адекватный ответ. Так, что можно пользоваться :exclamation:
  • Уже почти две недели все обсуждают и описывают DeepSeek :laughing: :laughing: