Ученые из Института математических проблем биологии РАН создали нейросеть, которая управляет своим "взглядом" и ищет объекты на воспринимаемой картинке почти так же, как это делают органы зрения и мозг человека, говорится в статье, опубликованной в журнале Neural Networks.
"Разработанная модель предлагает простое и неожиданное объяснение для весьма сложного когнитивного процесса поиска и распознавания объектов на картинке, воспринимаемой нашими глазами", — рассказывает Яков Казанович из Института математических проблем биологии РАН в Пущино. По его словам, созданная его командой нейросеть должна помочь нейрофизиологам разобраться в том, как работает реальное человеческое зрение.
За последние десять лет сотни программистов и десятки крупных IT-компаний создали бесчисленное множество систем машинного зрения, способных распознавать различные объекты на воспринимаемой картинке и классифицировать их. Эти данные современные роботы, поисковые машины и дроны могут использовать для самых разных целей — к примеру, для обхождения препятствий или поиска клиента при доставке посылки.
Несмотря на огромные успехи в этой области, ученые до сих пор фактически ничего не знают о том, как работает зрение человека и животных и как нам удается автоматически классифицировать и распознавать даже те объекты, которые мы никогда раньше не видели.
Поэтому, как рассказывает Казанович, многие особенности человеческого сознания, восприятия реальности и зрения до сих пор остаются загадкой для нейрофизиологов и психологов. К примеру, ученые достаточно давно спорят о том, почему человек очень легко находит "контрастирующие" объекты в огромном множестве непохожих на него других структур, но при этом испытывает сложности при поиске нескольких фигур, запрятанных в небольшом числе похожих на них объектов.
Казанович и его коллега Роман Борисюк сделали большой шаг к решению этой проблемы, создав систему искусственного интеллекта, которая при решении этих задач ведет себя абсолютно таким же образом, что и человек.
Главной ее особенностью, как рассказывают ученые, является то, что она состоит из множества относительно независимых друг от друга структур, так называемых "ансамблей", нейроны в которых вырабатывают особые колебания. Одна из этих структур становится своеобразным "дирижером", который управляет работой остальных "ансамблей" и раздает им задания, а другие ансамбли по сути являются объектами, которые "видит" нейросеть на картинке.
"Ансамбли" постоянно конкурируют друг с другом за влияние на "дирижера" и на работу всей нейросети в целом. То, как протекает эта конкуренция, как показали опыты и расчеты Казановича, почти идеально отражает принцип работы зрения человека и похоже на "скольжение" нашего взгляда по картинке при поиске объектов разной степени "контрастности".
Эта модель, как надеются ученые, поможет нейрофизиологам не только найти аналогичные структуры в мозге человека и обезьян, но и понять, как они работают, что приблизит нас к созданию "естественных" систем машинного зрения.
Оценили 11 человек
13 кармы