Распознавание образов

12.09.2016
Сенсорные регистры называют также прекатегориальным хранилищем. Термин «прекатегориальный» означает, что информация в этом хранилище содержится в нераспознанной сенсорной форме. После распознавания сенсорные следы быстро угасают. Одна из основных задач при исследовании сенсорных регистров — отделение эффектов, связанных собственно с регистрами, от возможных влияний распознанной информации.

Человек обладает не только образной памятью — он способен описывать словами то, что видит. Эта чисто человеческая способность — использовать для хранения информации язык — дает возможность кодировать запоминаемый материал несколькими различными способами. Изучение таких кодов становится важной проблемой теоретического изучения памяти человека. К ней мы вернемся ниже.

Процесс распознавания образов имеет фундаментальное значение в процессах памяти человека, поскольку является частью взаимодействия между реальным миром и сознанием субъекта. Для этого информация, находящаяся в сенсорном регистре, должна быть сопоставлена с информацией, хранящейся в долговременной памяти. Например, нам предъявляют «А», т.е. фигуру, состоящую из линий «/», «\» и «—», и мы называем этот стимул: «Это буква А». Распознавание образа не всегда означает словесную формулировку. Все, что поступает в мозг от сенсорных регистров, соотносится со всем тем, что данному субъекту известно об окружающем мире. При изучении этой проблемы мы сталкиваемся с проблемой информационного кода памяти. Под «кодом памяти» понимают способ представления информации в памяти.
Распознавание образов

Из схемы на рис. 12.8 видно, что процесс распознавания образов многоэтапный. Прежде всего стимул поступает в сенсорный регистр. Информация сохраняется здесь недолго, поэтому процесс распознавания должен завершиться быстро. Собственно данный процесс заключается в сопоставлении входного стимула с информацией, находящейся в долговременной памяти, а это означает, что информация о стимулах должна быть там представлена в такой форме, чтобы этот стимул можно было с ней сравнивать, т.е. распознавать его. После того как образ стимула распознан, из долговременной памяти может быть извлечена дополнительная информация о нем. Например, распознав букву «А», мы можем припомнить о ней и что-то еще: это буква русского алфавита, с этой буквы начинается слово «арбуз» и т.д.

Таким образом, распознавание образов происходит в три этапа: сенсорная регистрация; процесс сравнения с эталоном и «опознание» (принятие решения), т. е. признание на основании кода памяти того, что предъявлен определенный стимул.

Существует несколько гипотез кодов памяти. Приведем некоторые из них.

Гипотеза «эталонов» состоит в том, что хранящиеся в долговременной памяти коды представляют собой своеобразные эталоны каждого стимула. Распознавание происходит в тот момент, когда выбран подходящий эталон. Очевидно, что гипотеза эталона наивна. Ее главный недостаток — необходимость применять бесконечное число эталонов, например отдельный для каждого варианта написания буквы «А». Другими словами, таких эталонов должно быть больше, чем может вместить долговременная память. Улучшить гипотезу «эталонов» можно, предположив, что каждый стимул подвергается процессу «нормализации» (или очистке от всего второстепенного). Возникает возражение: чтобы «нормализовать», надо знать, к чему стремиться, к какому эталону например, при распознавании «R» и «А» до нормализации нужно решить, какая это буква. Иначе говоря, здесь должна быть задействована система опознавания, и только после нее должна вступить в действие система нормализации. Для преодоления вышеописанных трудностей была предложена гипотеза «прототипов». Согласно этой гипотезе, в долговременной памяти хранятся обобщенные, идеализированные образцы (прототипы, если хотите, Платоновы «идеи») известного множества стимулов. Теоретически любой стимул можно закодировать в виде прототипа в сочетании с перечнем вариаций, после чего все поступающие стимулы можно сопоставить с прототипами.

Таким образом, гипотеза «эталонов» заменяется гипотезой «прототипов». В общем, идея сводится к тому, что из простых элементов, взятых в различных сочетаниях, можно создать все образы, входящие в некоторое более мощное множество (например, множество печатных букв). Это предполагает, что зрительное восприятие должно основываться на анализе признаков. Одна из проблем сводится к пониманию механизма распознавания отдельных признаков, например линий, образующих данный угол. Другой пример — устная речь с бесчисленным множеством выговоров, тембров голоса и т.п. Фонему можно определить как звук, который, изменяясь как отдельный элемент, может изменять смысл слова. Например, звуки, соответствующие буквам «л», «в» и «б» в словах «лес», «вес», «бес», представляют собой разные фонемы, потому что каждый из этих звуков изменяет смысл произносимого слова. Каждая фонема имеет множество акустических вариантов. Мы можем считать фонему единицей речи, абстракцией, объединяющей множество сходных звуков, и в этом смысле она аналогична рукописной букве. Приведенные соображения иллюстрируют трудности, возникающие при попытке определить тип кодирования в долговременной памяти.

Физиологическим обоснованием гипотезы прототипов могут служить детекторы, описанные в зрительной системе низших позвоночных, и аналогичные, но значительно более сложные образования — гностические нейроны у млекопитающих. Например, в пользу этой гипотезы может говорить то, что маленькие дети и взрослые при кратковременном предъявлении путают буквы «Q» и «D», европейцы путают азиатские или негритянские лица, но после некоторого опыта (обучения) способность узнавать заметно улучшается. Возможно, что многие типы гностических нейронов формируются в особо чувствительные периоды развития головного мозга. Именно этот процесс можно обозначить в физиологии зрения как формирование предметного зрения, а в физиологии слуха — как формирование речи.

Как происходит сравнение с эталоном? Эталоны выбираются из набора в долговременной памяти последовательно или имеет место параллельное сравнение. Испытуемому предъявляют список букв, и после нахождения заданной буквы он должен нажать на кнопку. Время, которое испытуемый затрачивает на решение задачи, называется временем реакции. Разумно предположить, что если время реакции не зависит от длины списка, то поиск идет параллельно. При последовательном переборе элементов время реакции пропорционально длине списка. График на рис. 12.12 однозначно подтверждает первую гипотезу — идет последовательный перебор (сканирование) элементов списка.

При опознавании букв большое значение имеет контекст. При зрительном восприятии букву легче опознать (идентифицировать), если она входит в состав слова. Таким образом, слово создает контекст, и он направляет процесс анализа признаков. Сходное явление наблюдают при слуховом восприятии, когда слово воспринимается на фоне шума. Если слово входит в осмысленную фразу, оно воспринимается легче.

Процесс распознавания взаимодействует с процессом внимания. Разберем пример избирательного внимания в экспериментах с дихотическим прослушиванием (т.е. обоими ушами) и слежением за смыслом фразы в целом. Например, фразу «пять мышей едят сыр» можно разбить: слово «пять» подать на левое ухо, слово «мышей» — на правое, слово «едят» — на правое и «сыр» — на левое. Как показывает опыт, испытуемый в этом случае слышит осмысленную фразу. Другими словами, процесс внимания следит за осмысленными последовательностями слов. При дихотическом прослушивании испытуемые следят за смыслом произносимых слов, вне зависимости от того, на какое ухо подают отдельное слово. Например, испытуемый может продолжать следить за сообщением, когда оно «перескакивает» с одного уха на другое, хотя по инструкции он должен непрерывно следить за информацией, поступающей на правое ухо.

Таким образом, феномен внимания нельзя объяснить только физическими особенностями стимула. На основании выше рассмотренного можно составить следующую модель распознавания (рис. 12.9). Входная информация о стимуле (это может быть набор фонем, букв и т.п.) поступает в сенсорный регистр. Здесь она подвергается предварительному анализу. Информация может быть приведена к стандартизированному виду. На этот процесс влияет контекст. Затем поступившая информация сравнивается с набором образцов, которые хранятся в долговременной памяти. Сегодня наука не может указать, являются ли эти образцы эталонами, прототипами, создаваемыми с помощью ряда правил, или как-то еще. По-видимому, далее происходит параллельное сравнение. Принятое решение поступает по обратной связи в механизм, реализующий учет контекста, с тем чтобы улучшить дальнейшее распознавание.
Распознавание образов