Искусственный интеллект.

18 1220

                                                                                                                        Эпиграф:

— Да где же это видано, чтобы ишаки учились богословию и наизусть читали Коран!

— Таких ишаков немало и сейчас в Бухаре.


В качестве предисловия.

Пока писал материал, вспомнилась громкая и поскорее забытая (ещё бы!) афера второй половины 90-х с покупкой сканеров в различные финансовые учреждения для распознавания платёжных поручений. Страшно подумать, сколько денег на это было потрачено. Энтузиазм был всеобщим – и в коммерческих банках, и в госструктурах. Отмыли килотонны баксов. Больше денег было потрачено, пожалуй, только на «проблему 2000». О ней во всём мире не любят вспоминать – грязь сплошная… Совестливые и ответственные руководители информационных департаментов были готовы к «проблеме 2000» уже к 1998 году – к тому моменту для них она просто перестала существовать. И им оставалось только головой качать, глядя на очередную вакханалию по распилу бюджетов.


Однако, перейдем к задаче, которую мне очень хочется адресовать кумиру всех утюгов сегодняшнего дня – ИИ.

Да, сегодня компьютеры многому научились, точнее – люди их научили. Сначала они научились распознавать графические изображения символов алфавитов и компактно кодировать их, потом научились распознавать лица по фотографиям, распознавать речь и синтезировать её. Читать научились, правда, без выражения. Но, тем не менее, достижения, действительно, впечатляющие. И на фоне этой красоты неописуенной моя задачка выглядит более чем скромно. Задачку эту видели все, кто регулярно пользуется компьютером. Иногда эта задачка выглядит так:

Эта строка изначально выглядела красивой. А сейчас такая же?

Иногда в браузерах хуже, вот так:

��������������������������

Этому явлению даже название придумали: кракозябры. Не очень благозвучно, зато получилось, как с глокой куздрой. Стоит только услышать, и всем всё понятно, ну, или почти...

Так вот, суть проблемы заключается в том, что умные, читающие, разговаривающие, запахи различающие, 3D печатающие и, в скором времени – нам советы дающие и решения за нас принимающие, машины сходу с задачей правильного распознавания кодировки текста справиться не могут.

Знающие люди утверждают, что первая таблица ASCII была стандартизована в США в 1963 году. Наша КОИ-8 описана в ГОСТ СССР в 1974 году. И именно в момент разработки национальных кодировок задачка и возникла. Всё было так хорошо и радужно-перспективно, и нате вам здрасьте: как объяснить ЭВМ – с помощью какой кодировки формировался тот или иной документ, какими символами его отрисовывать на экране или выводить на печать? Речь идёт о документе, сохранённом в самом примитивном текстовом формате, который не имеет никакой структуры и специальных полей-инструкций для обозначения кодировки. Странно, не правда ли? Вот, и ЭВМ во всех своих ипостасях без помощи человека в непонятках по сю пору…

Прошло почти полвека, а ни люди не могут научить машину, ни сама она обучиться не может быстро, как говорится, на лету отличать кракозябры от нормального текста. Нормального для человека. А железному мозгу – что кракозябры, что нормальный текст – ему «по барабану», хоть по магнитному, хоть по кожей обтянутому. Ему всё нормально... что параллельно, что перпендикулярно. Без специальных идентифицирующих кодировку полей машина бессильна. Человек мгновенно видит проблему на экране или бумаге, а машина – нет. А если бы видела, то я бы не смог вывести на экран окошко с непонятным текстом. В котором (окошке) – с заголовком всё ОК, а сообщение прочитать невозможно. Не дала бы мне машина этого сделать.

Ребята, занимающиеся стандартизацией кодировок национальных алфавитов и написанием соответствующих библиотек для всех современных алгоритмических языков, не пальцем деланы. Что-то у них получается и становится полегче, но не всегда и не везде… И не удивительно. Любой, кто задастся целью, обнаружит на своем компьютере кириллицу и в старинной 866-ой кодовой странице, и в чуть более молодой 1251, и в современной 65001. И с этим кодовым зверинцем программистам приходится работать. Различать, и правильно обрабатывать. Чтобы отечественный пользователь видел свои родные 33 как в первом классе в букваре было нарисовано, а не как машина «решила» и отобразила.

А были ли попытки? Конечно. И весьма успешные. Соответствующие программы легко доступны в сети. При одном условии – у вас есть набор побайтно разложенных символов. Непонятно? Тогда попробуйте скопировать содержимое картинки в начале поста и воспользоваться хотя бы вот этим неплохим сервисом: http://www.online-decoder.com/.... Не получилось? Картинку эта умная программа обрабатывать не умеет (кстати, подобное: ���� – даже смысла чем-то обрабатывать нет). Текст в картинке умеет обрабатывать другая умная программа. Идите и ищите эту «другую», или останетесь с тем, с чего и начали. А хочется ведь совсем иного – чтобы проблема «кракозябров» исчезла раз и навсегда, чтобы забыть о ней.

Итак, подытожим. Есть проблема. Интеллектуальная. Человеком решаемая. При этом, очень, я бы сказал, «машинная». Когда можно ожидать решения? Хотя бы по Указу Президента РФ от 10.10.2019 N 490 – годику к 2030-му будет результат?

Или этот вопрос надо не гаранту задавать, а ИИ? А может – благочестивому ишаку?

Чесслово – ужасть как интересно. Дожить бы.

Реакция на пуск "Орешника"
  • pretty
  • Вчера 07:00
  • В топе

Австрийский журналист Крис Вебер: Россия запускает неядерную межконтинентальную баллистическую ракету в качестве предупреждения о недопустимости дальнейшей эскалации.Фракция поджигателей войны го...

Картинки 22 ноября 2024 года
  • Rediska
  • Вчера 11:01
  • В топе

1 2 3 4 5 6 7 8 9 10 Источник

Обсудить
  • Блестяще! Мне бывает трудно подобрать аргументы невозможности очевидного, а тут такой подарок от одного из любимых авторов!!! Утащила на стену)
  • :hushed: :point_up: :thumbsup:
  • :thumbsup: :exclamation: :sweat_smile:
  • Видно полное непонимание автором вопроса
  • В последние годы у меня складывается впечатление, что цифровизация – это нечто новой религии, где ИИ – высшее божество. Эдакая современная продвинутая форма мракобесия. Деградация коснулась всех слоев общества. Люди разучились ставить задачи. Теперь уповают на то, что ИИ сам увидит проблему (с чего бы?), себе поставит задачу, сам решит её, а набор готовых рецептов выдаст благодарному человечеству на блюдечке с голубой каемочкой. Предположим, что когда-нибудь машина сможет давать правильные ответы на поставленные вопросы. Но во весь рост встает другая проблема: кто будет формулировать правильные вопросы. Или адептам ИИ невдомек, что интеллект определяется не тем, какие ответ он может дать, а тем – какие вопросы он может ставить.