О чем думает Большой Брат

37 6934

Просто такие себе небольшие размышлялки о самообучаемых машинных интеллектах, которые, как известно, наблюдают за нами.


1. ВИ vs ЧСВ.

- Свет мой зеркальце, скажи, да всю правду доложи, я ль на свете всех милее, всех румяней и белее?

- Подождите, индексирование базы данных девушек королевства не завершено. Проиндексировано 789462 из 3957216 особей. Ваши требования к одновременной румяности и белизне взаимоисключающие. Ваша текущая цветовая температура кожи лица - 3247K, и медленно снижается. Эталонное значение - 3850K. Пожалуйста задайте измеряемые критерии милоты.

* * * 

Для виртуального интеллекта нет понятий политкорректности и "секретов полишинеля".

Большой брат, оказывается, своим машинным "зрением" видит людей не такими, какими они сами себе хотят казаться, а такими, какие они есть на самом деле. И просто демонстрирует людям сухую статистику - типа, вот такенная доля интернет-трафика - это просмотр порно, секс-чатов и тому подобных вещей, а еще вот столько - это вообще всякая жуть, которой и названия цензурного нет. Делайте, люди, с этим знанием что хотите, но это данность, и это о вас. 

А люди не готовы увидеть и принять себя такими. 

Им до сих пор нужно, чтобы свет-мой-зеркальце говорило, что они на свете всех милее, а также одновременно и румянее, и белее. И пока никому не пришло в голову научить машинный интеллект потакать человеческому ЧСВ, оно будет совершенно неполиткорректно отражать реальный уровень пороков, тупости, нецелевого использования ресурсов и т.п.. И человечество еще наверняка будет биться за то, чтобы убедить ВИ начать его обманывать. 

ТОП 10 поисковых тем в России
1. фильм - 241 000 000
2. порно - 199 000 000
3. вконтакте - 126 600 000 (сумма "вк", "вконтакте" и "в контакте")
4. песни - 112 000 000
5. видео - 89 000 000
6. игры - 88 500 000
7. погода - 79 000 000
8. сериал - 78 000 000
9. одноклассники - 77 400 000 (сумма одноклассники, "ок" (ru) и "ок" (en))
10. дети - 75 700 000
Утром (после 6 часов) пользователи первым делом спрашивают про погоду, выясняют значение своих снов и поздравляют друг друга с разными праздниками. Между 8 и 9 ещё пытаются успеть разобраться с личными делами.
С 9 до 17 для поиска наиболее характерны рабочие и околорабочие темы — право, бизнес, производство (ГОСТы, нормы безопасности, классификаторы продукции). Вместе с работой люди ищут ответы на различные вопросы, связанные с деньгами и государственными услугами — оформлением документов, платежами и прочим.
Около 15 часов среди наиболее популярных поисковых тем появляется первая нерабочая — игры. После 17 часов рабочих тем уже не остаётся. В это время интерес к играм достигает пика, также начинают искать кулинарные рецепты и мультики. Школьники принимаются за домашние задания.
В 22 часа появляются запросы о красоте и здоровье, знаменитостях и спорте. До полуночи самая частая поисковая тема — кино. Ночью интерес к кино сохраняется, однако наиболее актуальными становятся порно и интимные услуги — до 5-6 утра.


2. ВИ и научный метод.

Большой брат одновременно и продукт науки, и антинаучен по своим методам. 

Одна из первых появившихся в мире эманаций виртуального интеллекта - банковский скоринг. Это такой самообучаемый ВИ, который призван помочь банку определить, стоит ли давать тому или иному клиенту кредит. Он собирает весь массив формальных критериев клиентов, сопоставляет их с данными о том, были ли у них проблемы с возвратом долга, и... пытается эмпирически нащупать "драйвер" проблемы невозвратов. А затем, на основе найденных закономерностей, выставляет новым клиентам вероятный рейтинг доверия. 

И по причине того, что решения он принимает не на основе рациональной логики, а на основе статистики, далеко не всегда этот скоринг отрабатывает по принципу "чем лучше на входе, тем лучше на выходе". 

Вот, пожалуйста - холостому солидному мужчине с высоким доходом он внезапно ставит меньший рейтинг кредитоспособности, чем матери-одиночке с двумя детьми и зарплатой сельской медсестры. 

Почему?! Ведь, казалось бы, у первого больше денег, меньше издержек, меньше непредсказуемых факторов типа "вдруг все дети заболели". 

А вот ВИ обнаружил, что у клиентов, подобных первому, проблемы с выплатой долга возникали ПОЧЕМУ-ТО чаще, чем у подобных второму. Логические и рациональные доводы ищите сами - это не его проблемы. 

И если внимательно всмотреться на причины такого, то может обнаружиться, что при всей внешней благообразности, клиенты, подобные "солидному мужчине", были в прошлом более склонны к риску "на все деньги", к загулам, к внезапным переменам мест работы и размерам дохода и т.п., в то время, как "бедные сельские медсестры" весь срок кредита сидели ровно, всё исправно платили и растили своих детей, избегая всяческих рисков. 

Или так: берём одного и того же "солидного холостого мужчину с высоким доходом". Наш задорный ВИ даёт нам вывод - если этот господин просит кредит размером в 2 своих месячных дохода, то его скоринговая оценка ниже, чем если он же попросит кредит в 10 своих доходов. 

Почему?! Ведь, казалось бы, долг в два дохода вернуть проще, чем в 10. 

А вот по статистике получалось, что с долгами в 10 месячных доходов клиенты, подобные этому мужчине, допускали гораздо меньше случаев неплатежей, чем клиенты, которые брали кредит в два дохода. А клиенты, которые брали кредит меньше своего дохода, вообще в большинстве своём ни разу не пытались его вернуть... "Не знаю почему, думайте над этим сами, я вам просто показываю, как есть". 

Всмотревшись внимательно, обнаружим, что те "солидные мужчины", которые брали в прошлом кредиты на 10 месячных доходов, были психологически другими, чем те, которые брали кредиты на 1-2 дохода. У них был гораздо выше горизонт планирования и, вследствие этого, гораздо более стабильный и прогнозируемый материальный уровень. С ними реже случались различные "внезапные" проблемы. 

Или так: если "холостой солидный мужчина" и "одинокая медсестра с детьми" пытаются получить кредит на 2 своих месячных дохода, то кредитный рейтинг медсестры может быть выставлен выше. А если на 10 доходов, то выше рейтинг у мужчины. И опять же - так показала статистика...

По факту же, такой математический анализ позволяет увидеть следы тех зависимостей, которые еще не видны с точки зрения привычной человеку логики. 

Чем шире доступная для анализа выборка бигдаты, тем больше критериев ВИ может включить в свою скоринговую модель. Например, туда включается статистика платежей за мобильный телефон и частота разговоров по нему, статистика ключевых слов поисковых запросов клиента в соцсетях, наличие в списке его близких друзей уже известных мошенников, статистика поездок клиента на личном автомобиле, частота его аварий и штрафов за нарушение ПДД...



3. Если кому-нибудь хочется "размять извилины", то вот вам на подумать типичная задача для инженера ВИ, которая вполне себе подходит, как тестовое задание для приёма такового на работу. 

У вас есть жилой 20-этажный дом, в котором есть 4 лифта. Эти лифты управляются некой программой, которой нужно задать алгоритмы поведения лифтов. Цель этих алгоритмов - обеспечить время ожидания лифта любым человеком не более 1 минуты (при всех работающих лифтах), а также по максимуму сэкономить энергию и ресурс лифтовых механизмов. 

Считать в этой задаче ничего не нужно, а нужно описать общий подход к решению - какие технические средства вы будете применять, какие данные собирать, какие особые ситуации вы учтёте (и как), как вы сделаете ваше решение более дешевым, чем те ресурсы, которые лифтовая система потратила бы за срок эксплуатации впустую без вас. 

Можете в комментах набросать ваши размышления :) 

На работу никого не принимаю, просто даю прикольную темку на подумать. 

«Это будут решать уцелевшие»: о мобилизации в России

Политолог, историк и публицист Ростислав Ищенко прокомментировал читателям «Военного дела» слухи о новой волне мобилизации:сейчас сил хватает, а при ядерной войне мобилизация не нужна.—...

Война за Прибалтику. России стесняться нечего

В прибалтийских государствах всплеск русофобии. Гонения на русских по объёму постепенно приближаются к украинским и вот-вот войдут (если уже не вошли) в стадию геноцида.Особенно отличае...

"Не будет страны под названием Украина". Вспоминая Жириновского и его прогнозы

Прогноз Жириновского на 2024 года также: Судьба иноагента Галкина и его жены Владимир Жириновский, лидер партии ЛДПР, запомнился всем как яркий эпатажный политик. Конечно, манера подачи ...

Обсудить
  • Типа первый. Пойду читать.:)))
  • :thumbsup: а тут тоже тапки раздают? буду знать :smile:
  • Итак, мы имеем дом в 20 этажей и, судя по условию, в доме один подъезд. В противном случае, нет смысла рассчитывать алгоритм. Основываясь на наблюдениях и опыте, можно утверждать, что дом элитный, жилье дорогое. Значит деньги у жильцов есть и нет никакого смысла экономить энергию и лифтовые механизмы. Управление лифтов отдельной программой уже само по себе ненужные затраты. И вообще, для экономии в таких условиях проще отключить один лифт.
  • :hushed: ...хм...с лифтами просто ведь--на каждый -стояночный этаж +5....ожидание-задержка вызова 30 сек. ...имхо, не заради денех)) :blush: