Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн)

Эти данные, полученные при изучении зрительной системы кура-

ризированных кошек, были использованы в дальнейшем для моделиро-

216 вания различных аспектов зрительного восприятия. Если нейроны вы-

деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей MOI ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).

На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ

15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003)

по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вычислительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной информации. На первом этапе вычисляется грубое, но полное описание изменений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения яркости: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных параметрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, поскольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок картины. По отношению к первичному наброску последовательно применяются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.

Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в работах Марра значительно менее подробно, чем первичная сенсорная обработка. Первоначально строится так называемая «двух-с-половиной-мер-ная» (2’/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом восприятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, универсальными элементами «ментального конструктора» служат обобщенные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответствует микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческого тела, показанная на рис. 3.16. Незначительная модификация параметров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).

К этой же группе моделей примыкает теория американского психолога Ирвина Бидермана (Biederman, 1987), предположившего, что зрительная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит включает еще несколько других простых форм, таких как конусы и параллелепипеды. Различные предметы могут составляться из разных элементов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявлялись в некотором иррелевантном контексте непосредственно перед опытами на его прямое опознание, не выявили в общем случае ожидавшегося ускорения опознания. Поэтому вопрос о возможности некоторой

человек

кисть

кисть

16. Описание сложного объекта с помощью иерархии «обобщенных цилиндров» (по: Магг, 1982).

универсальной, основанной на геометрии декомпозиции предметов остается открытым. Скорее всего такая декомпозиция может быть только результатом развернутого во времени обучения, позволяющего постепенно выявить компоненты предмета, которые обладают наибольшей автономной вариабильностью и, таким образом, заслуживают статуса «частей».

С помощью компьютерной графики и других, например акустических и тактильных, средств предъявления новой информации и обратной связи о собственных движениях, у наблюдателя можно создать живую иллюзию взаимодействия с динамическим предметным окружением — виртуальную реальность {virtual reality, VR)25. Кроме таких полностью искусственных моделей среды и объектов на практике (в частности, в устройствах отображения информации) широко используется промежуточная форма представления среды, расширенная реальность {augmented reality, AR).

В этом случае восприятие реального окружения совмещается с элементами искусственного окружения, созданного средствами компьютерной графики, что дает возможность воспринимать скрытые характеристики объектов, такие как внутреннее устройство автомобильного двигателя, положение анатомических структур во время эндоскопической операции, детальный рельеф местности в тумане и т.д. (см. 9.2.3).

25 Значительный прогресс наблюдается сегодня в создании тактильных (гаптических) компонентов виртуальной реальности. С их помощью сапер может за сотни метров от эпицентра событий почувствовать сопротивление проржавевшего металла обезвреживаемой роботом мины, хирург — пластичность обрабатываемых на расстоянии тканей и т.д.

Последней разновидностью является так называемая расширенная виртуальность (augmented virtuality, AV), которая представляет собой искусственное окружение для реальных объектов и, например, используется для проведения VR-видеоконференций с обсуждением и проверкой реальных технических изделий (Величковский, 2003).

Все эти сенсорные технологии разрабатываются при участии психологов. Они начинают оказывать заметное влияние и на сами психологические исследования, прежде всего психологию восприятия. В частности, системы виртуальной реальности используются для создания условий экспериментов, которые, с одной стороны, экологически валидны, а с другой, позволяют контролировать независимые переменные (как, например, в исследованиях восприятия опасных ситуаций и реагирования на них при поездках по виртуальному городу — см. 3.4.2). Наряду с этим вкладом в методологию эксперимента, компьютерная графика может служить источником аналогий для теоретических представлений о восприятии. При создании виртуального окружения сначала строится схематическая (или «проволочная») модель среды, которая затем «облачается» участками различных текстур. Можно предположить, что восприятие решает обратную задачу, а именно задачу перехода от информационно богатого внешнего окружения к обедненной схематической модели среды. Понятно, что на ранних этапах микрогенеза важную рель должны играть не только контуры, но и в особенности текстуры.

Именно при обработке текстур, выделении границ объектов и контуров обнаруживается особая компетентность разрабатываемых в ней-роинформатике коннекционистских моделей (см. 2.3.3). На рис. 3.17 показаны примеры того, как самоорганизующаяся нейронная сеть справляется с соответствующими тестовыми заданиями. В первом случае (А) сеть различает участки достаточно похожих текстур. Во втором (Б) — выделяет и подчеркивает контурные компоненты сложного изображения. Методы параллельной обработки используются также при распознавании пластических трансформаций биологических объектов, таких как движения губ при речи и мимика эмоций. Значительный практический интерес представляет собой и обратная задача — продуцирование правдоподобной мимики и эмоционального выражения лица виртуальных персонажей (аватаров). Соответствующие технологии необходимы для создания антропоморфных интерфейсов, например, систем «видимой речи», позволяющих глухим людям пользоваться для общения обычным телефоном с соответствующей компьютерной приставкой (см. 7.4.3 и 9.4.2).

Методы нейроинформатики могут использоваться и в значительно более глобальном плане — для так называемого эволюционного моделирования механизмов восприятия. Для этого первоначально совершенно гомогенная нейронная сеть (то есть сеть с одинаковыми весовыми коэффициентами синаптических связей) начинает подвергаться много-220 кратному (десятки тысяч раз) воздействию разнообразных, возникаю-

17. Примеры сенсорно-перцептивных задач, успешно решаемых

17. Примеры сенсорно-перцептивных задач, успешно решаемых

нейронными сетями А. Дифференциация текстур; Б. Выделение контуров в составе сложного изображения

щих в различных участках «поля зрения» сети объектов. Успешность работы сети определяется ее способностью распознавать эти объекты. Такого рода идеализированные компьютерные эксперименты обычно демонстрируют любопытный эффект постепенной «модуляризации сети»: нейронная сеть начинает распадаться на две автономные подсистемы, одна из которых занимается преимущественно выделением параметров местоположения объектов, а другая — анализом их фигуративных характеристик, критических для собственно распознавания (Calabretta & Parisi, 2005).

Вырисовывающееся различение соответствует изложенным выше фактам об уровневой организации восприятия и прямо напоминает два гипотетических механизма построения движений, а именно уровни пространственного поля С и предметного действия D, описанные в 1947 году H.A. Бернштейном (см. 1.4.2). В современной нейропсихологии предположение о существовании в восприятии приматов и человека двух, филогенетически различных зрительных систем одним из пер-

вых высказал, в 1968 году, шотландский исследователь Колуин Тривар-зен (Trevarthen, 1968). Специализацией более древней системы, или так называемого «амбьентного зрения» (от фр. ambiance = окружение), по его мнению, является динамическая пространственная локализация. Вторая система, или «фокальное зрение», занимается идентификацией объектов. На основании экспериментов с перерезкой мозолистого тела (корпус коллозум), связывающего между собой полушария большого мозга, Триварзен и Сперри пришли к выводу, что первая система расположена преимущественно в субкортикальных структурах, тогда как вторая система находится в коре и поэтому зависит от сохранности межполушарных связей (Trevarthen & Sperry, 1973).

В последующем нейропсихологический поиск субстрата этих двух форм зрительной обработки надолго сместился в кору (отчасти потому, что процессы в коре проще наблюдать, чем в субкортикальных структурах). В этом контексте различают дорзальный (ведущий в заднетеменные зоны коры) и вентральный (нижние височные зоны) «потоки» зрительной информации, хотя постепенно накапливается все больше данных, подтверждающих мнение Бернштейна и Триварзена, что филогенетически более древний дорзальный поток {амбьентное зрение, или уровень С) включает и субкортикальные компоненты. Различие механизмов локализации и идентификации было установлено в последнее время также в слуховом восприятии (см. 4.1.2). Аналогичные взаимодействия выявляются и при выполнении мануальных движений: при схватывании предмета сначала задается общее направление и расстояние (локализация), и лишь затем осуществляется приспособление пальцев к его форме и размерам (идентификация). Мы более подробно остановимся на дискуссиях об уровневой организации восприятия в последнем разделе этой главы (см. 3.4.2) после рассмотрения взаимоотношений восприятия и семантики.

Январь 24, 2019 Психология труда, инженерная психология, эргономика
Еще по теме
2.4 Усиливающееся влияние нейронаук
ПРУССКАЯ-ЮРКЕВИЧ С.Н., РЫБАЛКО Е.Ф. ВЛИЯНИЕ КОМПЬЮТЕРНОЙ ТРЕВОЖНОСТИ НА НАЧАЛЬНОЕ ОБУЧЕНИЕ ИНФОРМАТИКЕ
Язык и нейронаука
ГЛАВА 2. Когнитивная нейронаука
Н. Г. Кожемяченко ОСОБЕННОСТИ МОТИВАЦИИ УЧАЩИХСЯ МЛАДШЕГО ПОДРОСТКОВОГО ВОЗРАСТА К ИЗУЧЕНИЮ ИНФОРМАТИКИ
Зарождение функциональной нейронауки.
Когнитивная нейронаука
Язык: познание и нейронаука
ИСПОЛЬЗОВАНИЕ МЕТОДА ПРОЕКТОВ В ОРГАНИЗАЦИИ ИССЛЕДОВАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ УЧАЩИХСЯ ПРИ ИЗУЧЕНИИ ПРОГРАММИРОВАНИЯ В КУРСЕ ИНФОРМАТИКИ И ИКТ
ВЛИЯНИЕ ВОЗРАСТА.
ПОСТУРАЛЬНОЕ ВЛИЯНИЕ.
K2 – ПСИХОЛОГИЧЕСКОЕ ВЛИЯНИЕ
ВЛИЯНИЕ НА АКТИВНОСТЬ ЧЕЛОВЕКА.
ВЛИЯНИЕ НА ЖЕНЩИН
Влияние задержки подсказки
СПОСОБНОСТЬ ОКАЗЫВАТЬ ВЛИЯНИЕ НА ДРУГИХ.
ВЛИЯНИЕ ПОРНОГРАФИИ НА АГРЕССИЮ
СОЦИАЛЬНОЕ ВЛИЯНИЕ И НЕЗАВИСИМОСТЬ
ВЛИЯНИЕ ПРОФЕССИОНАЛЬНОГО УРОВНЯ.
Добавить комментарий