Роботы трезвеют и умнеют - Олег Макаренко

Трёхмерный город.png

Если бы я был клерком, то есть если бы моя работа состояла в переписке по электронной почте, в телефонных звонках и в обработке таблиц с документами, я бы сейчас, пожалуй, подыскивал себе новое ремесло.

Вчера вышла новая модель от ОпенАИ — ЖПТ 4.5. По некоторым тестам она уступает самым продвинутым конкурентам, так что на этот раз широкая публика не ахала, однако специалисты серьёзно впечатлены. Дело в том, что современные нейросети поставляются в двух «вкусах»: или думающие, или лепящие ответы наобум.

Базовая нейросеть отвечает на вопрос первое, что придёт ей в голову, немедленно. Для многих вопросов этого вполне достаточно: например, если спросить вас, «как отвинтить колесо от автомобиля» или «сколько соли добавлять на трёхлитровую кастрюлю пельменей», вы, вероятно, сходу сможете ответить верно.

Однако для решения сложных вопросов нужно время, иногда и расчёты. К примеру, вопрос «во сколько обойдётся спартанский ремонт студии на Парнасе» заставит вас сесть и задуматься — вероятно, даже набросать смету. Рассуждающие нейросети, такие как перехваленный китайский ДипСик Р1, именно так и делают. Базовая нейросеть — которая отвечает наобум — делает глубокий вздох, открывает Эксель, и составляет план ремонта строчку за строчкой, разбивая сложный вопрос на много простых:

— Какова планировка студии?
— Какая площадь помещений?
— Надо ли выравнивать полы и стены?
— Что будет лучше: краска или обои?
— Работает ли в доме лифт?
— Берём ванную или душевую?

По каждому простому вопросу нейросеть также просчитывает детали. Допустим, выбирая между обоями и покраской, нейросеть задумается про грунтовку, учтёт разницу в оплате труда маляра, а также прикинет, нельзя ли сэкономить на штукатурке, выдав неровные стены за элемент стиля. Вот так, рассмотрев дело со всех сторон, нейросеть выдаёт уже надёжный, вдумчивый ответ.

Проведу аналогию с людьми. Люди бывают умными и менее умными. Господин Мозгов, получив задачу по математике или обойдя вокруг неисправного автомобиля, выдаёт вердикт немедленно: «икс равен трём», «пора менять генератор». Его товарищ, господин Тугодумов, не так быстр, однако и он, потратив 20-30 минут на раздумья и расчёты, тоже доходит в итоге до верного решения.

Так вот, текущие лидеры рейтингов нейросетей — это Тугодумовы. Под капотом у них относительно слабая соображалка, однако они, как говорил мой учитель немецкого, «берут мягким местом»: умеют усердно работать над поставленной им задачей. Если они думают долго, они выдают неплохой результат. Если же они думают очень долго (вот как если бы живой Тугодумов работал над задачей два месяца), то они выдают отличный результат — на уровне крепкого профессионала в своей области.

Нейросеть ЖПТ 4.5, которую нам показали вчера — это уже не Тугодумов, а Мозгов. Она навскидку даёт ответы примерно того же качества, что и Тугодумов после усердных размышлений. И, главное, она как будто «протрезвела»: меньше галлюцинирует, реже ошибается, даёт значительно более точные ответы, даже когда её пытаются намеренно запутать (ссылка).

Уже сейчас размышляющая версия Тугодумова (ЖПТ о1 про) ошибается на уровне обычного внимательного человека, то есть достаточно редко: ответы от о1 про можно не проверять. Следовательно, когда ЖПТ 4.5 усадят за стол и попросят давать обдуманные ответы вместо экспромтов, ошибаться она будет реже, чем человек.

Чтобы применять всё это в реальной работе не хватает так называемой «последней мили»: сделать нормальный интерфейс, чтобы конечные пользователи могли в два клика подключить умную нейросеть к решению своих задач. Технически в этом ничего сложного нет: прикрутить голосовой интерфейс в Вотсап и Телеграм, сделать удобный для нейросетей браузер, разработать набор базовых мелочей типа стандартного клиента электронной почты. Однако создание нормального интерфейса — муторное дело, особенно для ОпенАИ, которые на этом направлении слабы. Не удивлюсь, кстати, если на этом они и погорят: у них будут самые мощные модели, но их обгонят конкуренты с моделями менее мощными, зато удобными.

В любом случае, когда задачу «Последней мили» решат — а её решат, это очевидно уже сейчас — поголовье офисных сотрудников начнёт стремительно сокращаться. Нет смысла платить клерку 50'000 рублей в месяц, если нейросеть может выполнять его работу круглосуточно и без отпусков, причём не за 50'000, а за 500 рублей.

PS. На картинке к посту вы можете наблюдать стилизованный город. Это живая трёхмерная модель, собранная из отдельных компонентов: машины едут, люди ходят, на них можно смотреть с разных сторон. Вот видео — оно впечатляет (ссылка). Программу для браузера, рисующую этот город с нуля, нейросеть Соннет 3.7 создала «одним ударом» — пользователь объяснил, что ему нужно, и нейросеть с первой попытки выдала полностью работающий код.

https://olegmakarenko.ru...

ТОП ЗА 3 ДНЯ