Совсем недавно я описывал любопытную китайскую нейросеть Qwen, и вот теперь мир потрясла очередная нейросеть — DeepSeek-R1. Потрясла так, что существенно обесценила американские IT-компании, имеющие отношение к разработкам ИИ.
Инвесторов американских компаний напугало то, что DeepSeek смогла создать ИИ с возможностями как у ведущих технологических компаний США, но на менее мощных чипах и за существенно меньшую часть стоимости. Сотрудники DeepSeek пишут, что обучали модель на чипах Nvidia H800, а они значительно менее мощны, чем новые Nvidia Blackwell. Это может означать то, что создание ИИ в США сильно переоценено как по стоимости, так и по требовательности к мощности требующегося железа.
Некоторые источники в США растерянно предполагают, что по факту происходило не обучение модели как таковое, а переобучение или дообучение украденных ранее готовых данных от модели от OpenAI, что и позволило произвести это и быстрее, и на чипах меньшей мощности.
Как говорит о себе сама модель, DeepSeek-R1 оптимизирован для выполнения практических задач: от генерации кода и анализа данных до математических вычислений и логических рассуждений. Он демонстрирует высокую точность в специализированных областях.
Я пощупал и эту модель. Впечатление тоже очень положительное. Есть интересная изюминка — в режиме DeepThink (R1), который включается нажатием соответствующей кнопочки внизу страницы (который, собственно, и является включением новой модели), перед тем, как дать ответ, нейросеть своими словами рассказывает, как она поняла запрос и как она планирует на него отвечать. Эта информация очень интересна и полезна для правильного составления дальнейших запросов.
По состоянию на дату написания этой статьи, актуальность знаний нейросети —июль 2024 года, но для получения более свежей информации можно включить кнопочку Search, и тогда нейросеть будет пользоваться Интернетом для уточнения информации.
У нейросети есть веб-интерфейс: https://www.deepseek.com/. Регистрируемся, как и в случае с Qwen, через Гугл-аккаунт. Также можно зарегистрироваться через почту, если она у вас на почтовом ресурсе gmail.com. На другие почтовики, как и в случае Qwen, информация с подтверждением регистрации не приходит.
У меня с давних времён имеется аккаунт на Google, так что регистрация прошла штатным образом мгновенно и без затруднений.
Первые впечатления
Замечу, что в связи с резкой популярностью нейросети, бывает такое, что серверы просто не отвечают (особенно если включить кнопку Search). Я пробовал пользоваться нейросетью вечером после 18:00 по Москве, и испытывал затруднения с занятостью сервера. Однако в более позднее время (после 22:00 по Москве) Китай засыпает, нагрузка падает, и проблем с отзывчивостью сервиса вроде бы меньше. Но в США в это время ещё день, а они тоже дают свою нагрузку. В общем, надо искать правильное время.
Нейросеть DeepSeek понимает по-русски, и хотя в процессе описания своих рассуждений иногда срывается на английский, ответ даёт всё равно на русском. В любом случае, модель помнит контекст чата, и её можно просто попросить повторить ответ на требующемся языке.
Нейросеть не притворяется живой и всегда подчёркивает, что она — лишь инструмент.
Это очень правильно, потому что не вводит пользователя в заблуждение и не вызывает лишних споров на пустом месте. А то очень многие, пощупав нейросети, начинают потом строчить комментарии о том, что это обман, подмена человеческого интеллекта его видимостью и т.п.
Конечно, только зачем об этом постоянно писать, если никто с этим не спорит? Себя убедить? А тут нейросеть сама говорит — да, я лишь моделирую те или иные особенности человеческого общения. И уже никому не хочется повторять то же самое — нейросеть всё сама уже сказала.
Более того, сам текст описания «логики» при подготовки ответа на вопрос довольно информативно показывает, что текст ответа абсолютно искусственен, и все его краски, эмоции и дружелюбность — искусственные. «От души» тут ничего не идёт. Машина есть машина, и это всячески подчёркивается.
Ещё из правильного поведения нейросети я могу отметить то, что она достаточно часто напоминает пользователю, что её информация может быть не совсем достоверна. Такое напоминание весьма актуально для многих пользователей, излишне доверяющих ответам нейросетей.
У меня сложилось впечатление от этой нейросети, как о довольно профессиональном инструменте. Всё по делу, всё по полочкам и без лишней искусственной эмоциональности.
В отличие от моделей GPT от компании OpenAI, доступ к модели DeepSeek полностью бесплатен, как и у Qwen. На него не нужно оформлять подписку или пользоваться различными ухищрениями, каждое из которых имеет некоторое ограничение.
Кроме всего прочего, у DeepSeek есть андроид-приложение, которое можно установить на смартфон и пользоваться нейросетью через него.
Заключение
Думаю, что в самое ближайшее время станут также бесплатными и ChatGPT, и даже нейросетевые модели от Яндекса и от Сбера. А куда деваться, надо же как-то конкурировать.
В своё время и Whatsapp был платным, пока в 2016 году бесплатный Телеграм не пережил резкий рост своей популярности, вынудив своего прямого конкурента отменить плату за использование своего клиентского приложения.
Судя по всему, всё идёт так, как я и предполагал — ИИ будет становиться всё более осторожным в своих суждениях а его использование людьми станет всё более уместным и профессиональным. Никаких ужасов, которые рисуют некоторые слишком эмоциональные граждане, не ожидается.
То, что мы порою наблюдаем сегодня — это детские болезни, неотрегулированность того, чего ранее просто не было. Но в течение ближайшего десятилетия всё войдёт в правильную колею.
А учиться использовать ИИ нужно уже сейчас. Это хороший инструмент, если знать, как его правильно применять. Может сильно повысить производительность и качество некоторых видов интеллектуальной деятельности человека.
Помню, как в начале 80-х годов многие бегали с причитаниями о том, что микрокалькуляторы отучат людей считать. Потом это стало относится к компьютерам. Но никто из них почему-то не упоминал, что компьютеры научат людей такой сложному виду деятельности, как программирование, а пользователей программ — другим сложным видом деятельности, кратно повышая эффективность их работы (например, САПР для конструкторов).
Точно так же и ИИ, конечно же, не приведёт к деградации человека, а лишь поможет ему взять новые вершины науки и технологий, а в России — поможет немного снизить проблему недостаточного количества населения для эффективного поддержания суверенитета страны на приемлемом уровне.
e-g
Оценили 13 человек
15 кармы