Пока что нейросети работают в режиме консультанта. Задаёшь им вопрос, они отвечают. Ответы часто полезные — нейросети могут, к примеру, сходу выдать кусок работающего кода, чем большая часть программистов уже и пользуется.
Сейчас в Рунете шутят про вторники: если задать Алисе вопрос «сколько в ноябре вторников», она ответит, что в ноябре 9-10 вторников. Логика у ЯндексЖПТ такая: в ноябре 30 дней, четыре полных недели. В каждой неделе 7 дней, из них 5 — будни. Следовательно, в ноябре 2024 будет 20 будних дней, включая 10 вторников (ссылка).
Шутка смешная, успокаивающая, но уже устаревшая. Более современная модель, ЖПТ 4о, говорит, что в ноябре 5 вторников и правильно перечисляет даты всех четырёх — то есть ошибается всего лишь на один вторник, вот как мог бы ошибиться обычный невнимательный человек, которого попросили ответить на вопрос немедленно, без раздумий. Такая невнимательность вообще является фирменной особенностью нейросетей уходящего поколения.
Самая новая из доступных широкой публике модель, о1, думает перед ответом и даёт точный ответ (ссылка). Скажу больше: это даже не модель o1, а её урезанная версия — полную модель o1 к нам ещё не выкатили.
И так как новые нейросети уже умеют работать вдумчиво, ответственно, без массы глупых ошибок, режим консультанта постепенно сменяется… режимом агента. Суть в следующем:
1. Роботу выдают контроль за мышкой и экраном, как будто удалённый админ подключается к вашему компьютеру через какой-нибудь ЭниДеск.
2. Роботу ставят общую задачу, в духе «проанализируй материалы из вон той папки, составь сводный отчёт и отправь по такому-то адресу».
3. Робот прилежно шуршит, открывает файлы, гуглит всякое нужное и выполняет задачу.
Пока что это ещё фронтир, то есть экспериментальные технологии, однако мы уже довольно близки к выходу нейросетей-агентов в массы. В лабораториях, во всяком случае, нейросети-агенты уже показывают более-менее адекватные результаты — им можно поручить реальную работу, и они чуть ли не в половине случаев уже успешно с ней справляются. При этом, как показывает надёжный опыт, если робот справляется сейчас с задачей в 50% случаев, то через год это будет 95% случаев, а через два года — 100%.
Вот как со вторниками в ноябре. ЯндексЖПТ, модель старого поколения, слабо разбирается в концепции дней недели. ЖПТ 4о уже более-менее понимает, о чём идёт речь, но иногда путается в мелочах. Модель о1-превью уже не путается.
А вот забавное, зарисовка из работы нейросети-агента, развёрнутого на основе одной из версий Клода. На видео мы наблюдаем, как модель работала над чем-то скучным, но потом отвлеклась и… пошла смотреть в Гугле картинки по запросу «Йеллоустонский национальный парк» — совсем как реальный человек, которому захотелось отвлечься (ссылка). Конспирологи вспомнят сейчас, что в Йеллоустоне находится спящий вулкан, который, если пробудить его направленным взрывом, может уничтожить Соединённые Штаты, но я полагаю, что это просто совпадение.
Также я думаю, что нам не стоит бояться новости о 70 тысячах новых вирусов, найденных искусственным интеллектом (ссылка). Напротив — ожидаемый в ближайшем будущем прорыв в медицине может изменить нашу жизнь к лучшему до такой степени, что даже закоренелые луддиты заставят себя немного порадоваться прогрессу.
А вот чего следует бояться, так это проходной новости от разработчиков игры «Колл оф Дюти». Они хвастаются, что нейросеть, слушающая голосовые чаты, помогла им снизить «уровень токсичности» на 43% (ссылка).
Если вдуматься, роботизированные слушатели — огромная сила в руках государства. Люди страшно болтливы, а прослушивать все их разговоры сейчас — уже дело техники. Развернув пару мощных датацентров, современное государство может слушать, понимать и заносить в базу данных все телефонные разговоры граждан, собирая тем самым полную информацию о том, что происходит внутри страны.
Можно будет, например, поручить роботу изучить разговоры, в которых упоминается продажная любовь, а потом совместить полученные данные с перемещениями владельцев мобильников, с движением денег по карточкам и с телефонными звонками другим абонентам. Три часа работы скрипта, и на карте города высвечиваются все адреса борделей и все адреса независимых жриц любви — уже сразу с полными списками сотрудников и клиентов, а также с развёрнутой характеристикой на каждого из них. Аналогичным образом можно будет отслеживать все заговоры иноагентов и подавляющее большинство преступлений.
С одной стороны, такая прозрачность позволит навести больше порядка в стране, и это, наверное, хорошо. С другой стороны, представьте, что закон действительно начнут соблюдать до последней буквы, и что все бордели в стране действительно закроют. Можем ли мы быть уверены, что наше общество станет от этого лучше и безопаснее?
Оценили 34 человека
44 кармы