Глобальные когнитивные модели

Представления о процессах преобразования символьной информации, как основе наших познавательных достижений (см. 2.2.3), были использованы в второй половине 1970-х годов авторами, поставившими своей целью разработать общие модели организации познания. По своему объему глобальные когнитивные модели напоминают сверхтеории таких необихевиористов, как Кларк Халл (см. 1.3.3). Влияние формальной логики, математики и исследований в области искусственного интеллекта видно в том, что большинство глобальных когнитивных моделей, например вопросно-ответная система Т. Винограда или теория решения задач человеком А. Ньюэлла и Г. Саймона, задуманы и построены как машинные программы. Как правило, речь идет при этом о моделях представления знаний и понимания, хотя намерения авторов заключаются в моделировании возможно более широкого круга задач, начиная с поиска в памяти (см. 5.1.1) и кончая дедуктивными умозаключениями (см. ниже 8.2.2).

Теоретически каждая такая модель должна включать четыре компонента. Первый — это так называемый парсер, функция которого состоит в расчленении лингвистической (и в ограниченном объеме невербальной) информации на отдельные порции и их преобразовании к виду, соответствующему внутренней репрезентации знания. Второй компонент — фиксированная в семантической памяти база знаний. Третий компонент — экзекутивные процессы, или процессы управления (см. 5.2.3). Они определяют алгоритмы распознавания, поиска, логического вывода, принятия решений и т.д. Четвертый компонент полностью симметричен первому и обеспечивает переход от внутренней репрезентации знания к моторному программированию и выполнению целесообразных ответов. Фактически до сих пор лишь самая первая программа Терри Винограда (1976) содержала все четыре компонента27. Центр тяжести обычно ложится на описание системы представления знания.

27 Модель Винограда представляла собой формальную систему, отвечающую на про стые вопросы по поводу «мира» нескольких расположенных в ее «поле зрения» цветных стереометрических фигур. Одной из первых и наиболее влиятельных глобальных моделей стала предложенная в 1976 году Дж.Р. Андерсоном модель под названием ACT (Adaptive Control of Thought — адаптивный контроль мышления). Эта модель продолжает разрабатываться по настоящее время (см. ниже). Архитектура модели отличается от структуры формальных моделей семантической памяти наличием широкого списка операций, которые могут выполняться над репрезентированным в форме логических пропозиций знанием (см. рис. 6.12А). Сами эти операции репрезентированы с помощью систем продукции (см. 2.2.3 и 9.2.1). Система продукций специфицирует условия выполнения и характер исполняемых операций, или «действий». Условиями продукций являются значения лингвистических переменных и их комбинаций. Так как «действия» могут вести к модификации критических условий, это создает условия для

(ДАВАТЬ, АКТОР, РЕЦИПИЕНТ, ОБЪЕКТ)=

(БЫТЬ ПРИЧИНОЙ (ДЕЙСТВОВАТЬ, АКТОР), (ПОЛУЧАТЬ,

РЕЦИПИЕНТ, ОБЪЕКТ)=

(БЫТЬ ПРИЧИНОЙ (ДЕЙСТВОВАТЬ, МАША), (ИЗМЕНЯТЬ, (ИМЕТЬ

МАША, КНИГА), (ИМЕТЬ, ПЕТЯ, КНИГА)))

12. Пропозициональная репрезентация предложения «Маша дает Пете книгу»: А. ЖТ Дж.Р. Андерсона; Б. LNR Д. Нормана и Д. Румелхарта (простейший вариант представления); В. Постулат значения в теории У. Кинча.

новых «действий». Всякий когнитивный акт, таким образом, способен привести к изменению хранящегося в памяти знания, причем полностью такие изменения нельзя предсказать даже с позиций создателя модели. В отличие от моделей семантической памяти, ACT не только отвечает на вопросы о заученных ранее предложениях, но и способна на простые умозаключения.

Андерсон показал, что возможности формального аппарата его теории эквивалентны вычислительному потенциалу машины Тьюринга — все, что может быть смоделировано в виде комбинации дискретных символов, описывается также и моделью ACT. Поскольку данная модель фактически является обрамлением формального языка большой мощности, с ее помощью удается описать любой массив данных. В результате оказывается трудно найти подтверждающие или опровергающие ее данные. Например, поиск в памяти осуществляется в ACT параллельно (см. 5.1.1), а линейные зависимости времени реакции моделируются благодаря допущению об ограниченности ресурсов внимания и об активации с их помощью фрагментов семантических сетей, как в модели семантической памяти Коллинса и Лофтус (см. 6.2.1).

В течение нескольких лет усилия Андерсона и его коллег были сконцентрированы на изучении феномена, получившего название эффект веера: чем больше фактов узнает испытуемый по поводу определенного понятия или лица (например, утверждений о личностных качествах некоторого индивида), тем медленней он верифицирует соответствующие частные утверждения. Это можно было бы объяснить тем, что содержимое ограниченного резервуара ресурсов, определяющее скорость переработки информации, распределяется по большему числу ассоциативных связей, ведущих к данному узлу памяти. Позднее Андерсон нашел, однако, что если речь идет об относительно хорошо известных лицах (например братьях Кеннеди), то эффект веера меняет свой знак — проверка новых фактов осуществляется здесь намного быстрее. По-видимому, этот феномен проявляется только при нагрузке на рабочую, но не на семантическую память. Кстати, эффект веера оказывается особенно сильным у пожилых людей, которые испытывают трудности с отбором релевантной порции сведений (метапроцедура КОНТРОЛЬ — см. 5.4.3 и 8.1.3).

Точно так же как в лингвистике, теориям, ориентированным на субъект (подлежащее), противопоставляются концепции, центрированные на предикате (то есть прежде всего на глаголе), в ряде глобальных моделей главным элементом репрезентации оказывается глагол, который задает схему или список возможных семантических ролей для других единиц описания (см. 7.3.2). Пример этого — модель LNR (названная так по первым буквам фамилий авторов Линдсея, Нормана и Румелхар-та). Как видно из рис. 6.12Б, в центре репрезентации оказывается глагольный элемент (в данном случае глагол ДАТЬ). Дальнейшая спецификация значения предложения идет в направлении декомпозиции глагола на примитивные семантические компоненты. В результате получается довольно сложная семантическая сеть. Авторы называют ее активной,

так как в ней нет разделения статичного знания и операций над ним, характерного, например, для ACT Андерсона. Одна и та же структура содержит значения отдельных слов, факты, информацию о задачах, целях и алгоритмах их достижения. Часть сети используется для управления процессами разворачивающейся в ней активации. Реализация LNR состоит из анализирующего предложения естественного языка парсера, семантической сети только что описанного типа и интерпретатора, который состоит из элементов этой сети и управляет преобразованиями информации.

Целью этих авторов было создание вопросно-ответной системы для работы с большими массивами семантической информации. Собственно психологических исследований, связанных с этой теорией, оказалось не много, хотя, как справедливо считает Норман, оценка идеи зависит не от количества экспериментов, а от прояснения фундаментальных проблем. Одно из конкретных предсказаний модели состояло в том, что в онтогенезе более простые глаголы (в смысле набора элементарных семантических компонентов) усваиваются раньше, чем более сложные. Это предположение очевидно подтверждается для таких пар глаголов, как «брать» — «покупать» и «давать» — «продавать».

Модель Уолтера Кинча (Kintsch, 1974) отличается от только что изложенной отсутствием семантических сетей, так как он считает их использование нарушением принципа целостности. Ограничения на значения аргументов ментальных предикатов задаются с помощью правил, построенных по типу постулатов значений Карнапа (см. 6.1.1). Пример соответствующего правила показан на рис. 6.12В. Данная модель применяется для описания запоминания, узнавания и воспроизведения отрывков прозы (обычно итальянские новеллы эпохи Возрождения), а также для осуществления простых индуктивных умозаключений на основе пропозициональной репрезентации знания. Кинчем и голландским лингвистом Ван Дейком были проведены обширные исследования, в ходе которых анализировалось запоминание явно сформулированной и неявной, но выводимой информации. Авторам удалось показать связь запоминания со сложностью пропозициональной репрезентации.

В современных вариантах своей модели Кинч проводит разграничение между базой знаний, которая строится эмпирически — с помощью латентного семантического анализа, и процессами управления, опосредованными «долговременной рабочей памятью» (см. 5.2.3 и 6.1.1). В ходе дальнейшего развития (см. 7.4.2) областью применения модели стали также феномены метафорического использования речи (Kintsch, 2000). Эта модель, содержащая минимальное число формальных допущений, оказывается более успешной, чем другие глобальные модели, хотя и ее применение ограничено в основном лингвистическим материалом.

Складывается впечатление, что сегодня эти формальные модели перестали играть ведущую роль в когнитивных исследованиях, уступив первенство содержательному анализу неиропсихологических механизмов познания (см. 8.1.1 и 9.1.1). В настоящее время продолжают разрабатываться главным образом две глобальные когнитивные модели. Одна из них 72 является современной модификацией модели Андерсона ACT, известная

под названием ACT-R. Другая модель была предложена в начале 1990-х годов Аланом Ньюэллом и продолжает развиваться его последователями и учениками. Эта модель (вернее, группа моделей и своего рода философская концепция) называется Soar {англ. взлетать, парить).

Буква «A» в названии модели ACT-R Дж.Р. Андерсона подчеркивает, что речь идет о модели адаптивного контроля рационального мышления28. По мнению Андерсона, базовым механизмом мышления служат умозаключения по аналогии. Когда мы сталкиваемся с новой проблемной ситуацией, мы часто пытаемся найти какой-нибудь пример аналогичной задачи с известным решением. Этот процесс представляет собой нахождение сходства между элементами и их отношениями в разных областях знаний. Такое решение будет не всегда идеальным, однако оно может быть полезным первым приближением. Иначе говоря, умозаключение по аналогии является разновидностью эвристических способов решения задач. Модель Андерсона успешно справляется с нахождением аналогий между простыми примерами из арифметики, алгебры и языков программирования. Она, например, позволяет найти форму записи сложения двух чисел в языке LISP (язык программирования, используемый в работах по искусственному интеллекту) по известной форме записи умножения.

Архитектура модели (в одной из последних версий — ACT-R5) показана на рис. 6.13. Она состоит из трех основных видов памяти: декларативной, процедурной и рабочей. Рабочая память содержит репрезентацию актуальной цели и понимается как активированное подмножество структур декларативной памяти. Процедурная память хранит системы продукций, имеющих вид правил «условие —» действие». Когда в рабочую память из внешнего мира или из декларативной памяти попадает информация, репрезентация которой совпадает с левой частью одной из хранящейся в процедурной памяти продукций, то это автоматически ведет к выполнению «действия», записанного в правой части продукции. Декларативная память содержит знание о фактах, причем в данной модели всякое знание первоначально имеет декларативную форму. Организация знания в декларативной памяти связана с его расчленением на «куски» (chunks) размером примерно три элемента, типа IBM. В процессе функционирования модели происходит компиляция знания — подобно тому как в информатике программа, написанная на одном из языков «высокого уровня», переводится в машинный код («компилируется»), чтобы компьютер мог выполнить эту программу. В результате декларативное

28 В своих работах Андерсон исходит из логико-нормативного («экономического») представления о рациональности. Мышление человека рационально, поскольку главной решаемой когнитивными механизмами задачей является обеспечение максимального выигрыша при минимальных затратах. В этом отношении он даже более радикален, чем создатели первых компьютерных моделей мышления, Г. Саймон и А. Ньюэлл, которые ввели представление об ограниченной (bounded) рациональности человека (см. 8.4.2).

Действие N. / Восприятие

ВНЕШНИЙ МИР 13. Архитектура модели ACT-R5 Дж.Р. Андерсона (2005).

знание начинает вызывать процедурный ответ. С течением времени этот ответ становится все более специфичным и может возникать без сколь-нибудь широкой активации структур декларативной памяти. Таким путем формируются разнообразные навыки (см. 5.4.2).

Для оптимизации работы модели прочность продукций и связи декларативной и процедурной памяти подвержены влиянию так называемого байесовского механизма, позволяющего определять вероятность будущего возникновения некоторых событий (то есть в данном случае появления определенной комбинации символов на входе модели) на основании вероятности их возникновения в прошлом. Экспериментальный материал, который будет рассмотрен в одной из следующих глав, свидетельствует, однако, что большинство людей испытывают значительные трудности с пониманием и использованием именно этой формулы расчета вероятностей (см. 8.2.1). Модель Андерсона с ее зависимостью от поиска готовых решений в памяти системы, конечно, трудно считать полноценной моделью мышления. Полностью «декларативными остаются пока представления о целенаправленности работы системы.

Основная альтернатива этой модели — модель Soar, разработанная Аланом Ньюэллом и его коллегами Дж. Лэйрдом и П. Розенблумом (например, Newell, 1990; Laird & Rosenbloom, 1996). Прежде всего она имеет совершенно другую архитектуру. В ней, в частности, отсутствует

разделение декларативной и процедурной памяти. Причиной является использованная авторами возможность записи декларативного знания (пропозиций) в форме систем продукции. К числу достоинств этой модели относятся выделение целой иерархии подцелей по мере возникновения затруднений, а также работа с более или менее полным «деревом», или пространством, потенциальных подзадач в рамках проблемной ситуации. Кроме того, модель допускает возможность использования эвристик — неформальных процедур, сокращающих число шагов при поиске решения.

Основной эвристикой, выделенной еще в совместных исследованиях Ньюэлла и Герберта Саймона, стал «анализ средств и целей» (means-ends analysis). Он включает следующие этапы: 1) регистрация рассогласования между актуальным состоянием решения задачи и требуемым состоянием; 2) формирование подцели, достижение которой может уменьшить отмеченное рассогласование; 3) выбор средств, применение которых позволит достичь эту подцель. Очевидно, что на последнем этапе может возникнуть необходимость выделения еще более частных подцелей. Репрезентация задачи, таким образом, разворачивается в целое проблемное пространство разноуровневых целей и средств (см. 8.3.2). Эти особенности делают Soar в большей степени похожей на описание собственно процесса мышления. Она особенно полезна в таких областях, как когнитивная эргономика, где важно определять число «ходов» (нажатий на клавиатуру и движений компьютерной мышкой), необходимых для достижения требуемой цели — при наличии альтернативных вариантов организации компьютерного интерфейса или программного обеспечения. Вместе с тем, в случае более сложных, недискретных задач Soar чрезвычайно сомнительна именно как формальная модель процессов решения. В этом общем случае она оставляет впечатление лишь псевдоформального языка для описания того, что и так известно из более традиционных психологических исследований (см. 8.3.1).

В начале данного подраздела мы отмечали, что главным мотивом для введения пропозиционального описания знания было желание свести множество поверхностно различных высказываний к более простому набору базовых семантических элементов. Однако приходится признать, что стремление к упрощению и гомогенизации обернулись в этой области усложнением терминологии и размножением формальных моделей, экспериментальная проверка которых оказалась практически невозможной (см. 9.1.2). Хотя результаты эмпирических исследований и накладывают ограничения на глобальные модели, формальная подготовка и интуиция автора имеют несоизмеримо большее значение. В частности, критические замечания вызывает в последние годы использование для моделирования познавательных процессов систем продукций. Они критикуются за отсутствие гибкости и сугубо описательный характер, позволяющий — post factum — аппроксимировать любые данные, но не предсказывать их.

Январь 24, 2019 Психология труда, инженерная психология, эргономика
Еще по теме
Глобальные теории когнитивного развития после Пиаже
МОДЕЛИ ФУНКЦИОНАЛЬНОГО РАЗРЕЗА И КОГНИТИВНЫЕ МОДЕЛИ
3. КОГНИТИВНЫЕ МОДЕЛИ РАССТРОЙСТВ
ЧТО СЛЕДУЕТ ИЗ КОГНИТИВНЫХ МОДЕЛЕЙ
КОГНИТИВНЫЕ МОДЕЛИ АГРЕССИВНОГО ПОВЕДЕНИЯ
3.3. КОГНИТИВНАЯ МОДЕЛЬ ВНУТРИЛИЧНОСТНОГО КОНФЛИКТА
КОГНИТИВНЫЕ МОДЕЛИ ВНИМАНИЯ
Когнитивная модель расстройств личности.
Когнитивная модель тревожных расстройств.
КОГНИТИВНАЯ МОДЕЛЬ ФОБИИ.
КОГНИТИВНАЯ МОДЕЛЬ ИСТЕРИИ.
Добавить комментарий