Когнитивные механизмы невербальной коммуникации - Владимир Александрович Барабанщиков 12 стр.


Отвечая на поставленные вопросы, мы провели ряд экспериментов, в которых исследовалась зависимость распознавания базовых эмоциональных экспрессий от условий их экспозиции. Точность восприятия эмоций оценивалась в ситуациях (1) стробоскопического движения, (2) прямой и обратной зрительной маскировки и (3) статической экспозиции фотоизображений лицевых экспрессий на пустом экране. В условиях стробоскопического движения на короткое время экспонировалась статическая экспрессия, до и после которой в этой же позиции предъявлялись изображения спокойного лица. В условиях зрительной маскировки спокойное лицо заменялось «маской», созданной путем случайного перемешивания частей спокойного лица; возникновение эффекта движения в этом случае не ожидалось. Наконец, в контрольной серии фотографии эмоционального лица предъявлялись сами по себе без каких-либо дополнительных изображений.

Согласно гипотезе, при быстром предъявлении наблюдателям последовательности статичных изображений «нейтральное лицо-экспрессия  нейтральное лицо» возникает впечатление динамической микроэкспрессии, длящейся доли секунды. По сравнению со статичными «срезами» лица и/или с изображениями, подверженными маскировке, распознавание эмоций в условиях кажущегося движения может быть более эффективным.

Стимульный материал и процедура исследования

Стимульным материалом служили цветные фотографии лиц натурщиков (трех мужчин и трех женщин) анфас, выражающих шесть базовых эмоциональных экспрессий (радость, удивление, страх, печаль, отвращение, гнев) и спокойное состояние (нейтральное лицо). Изображения отобраны из валидизированной базы RaFD (Langner et al., 2010). Их размер и угол поворота лица были скорректированы так, чтобы глаза натурщиков на всех изображениях располагались на одном уровне, расстояние между зрачками было одинаковым, а изображения лица на каждой фотографии занимали равную площадь. Изображения кадрировались до размера 450×564 пикселей (рисунок 2.1).

При маскировке использовались «рандомизированные лица», которые получали следующим образом. Изображения лиц, выражающих спокойное состояние, разрезали на 13 частей по вертикали и 15 частей по горизонтали; полученные прямоугольники (размером 35×38 пикселей) в случайном порядке меняли местами. Благодаря этой процедуре распределения цветов и яркости на изображениях сохранялись, но целостная структура лица разрушалась.


Рис. 2.1. Примеры фотоизображений экспрессий лица из базы RaFD (Langner et al., 2010): а  спокойное (нейтральное), б  радость, в  отвращение, г  удивление


Стимульные изображения предъявлялись на экране ЭЛТ-монитора (ViewSonic G90f, частота 100 Гц), подключенного к ПК, в условиях нормальной освещенности. Испытуемые располагались на расстоянии около 60 см от экрана и смотрели на изображения бинокулярно. Угловые размеры изображений составляли около 16°×20°.

В эксперименте 1 участвовали 53 человека (37 женщин, 16 мужчин; возраст 1753 года, медиана  19 лет) с нормальным или скорректированным до нормального зрением. Каждый испытуемый выполнил все три серии. Порядок выполнения серий варьировался.

Исследование включало три экспериментальные серии, отличавшиеся друг от друга содержанием контекста  изображениями, которые предшествовали тестовому и следовали за ним. В серии 1.1 в качестве контекста использовались изображения нейтрального лица того же натурщика, экспрессия которого демонстрировалась в данной пробе. В серии 1.2 контекстом служили рандомизированные лица, в серии 1.3  светло-серый фон пустого экрана.

На рисунке 2.2 представлена схема предъявления стимульного материала и время экспозиции каждого изображения. В каждой пробе в центре экрана на светло-сером фоне последовательно экспонировались: 1) черный фиксационный крест (угловые размеры 1,4°×1,4°); 2) пустой экран; 3) первое контекстное изображение; 4) пустой экран; 5) тестовое изображение лица; 6) второе контекстное изображение, аналогичное первому; 7) пустой экран; 8) вопрос «Какие эмоции присутствовали на изображении?» с вариантами ответа «радость», «гнев», «страх», «удивление», «отвращение», «печаль», «спокойное лицо». Участнику предлагалось выбрать из предъявленного списка название той эмоции, которая бы максимально соответствовала увиденной экспрессии. Ответ, выбранный в каждой пробе, а также время ответа регистрировались путем нажатия клавиши «пробел», которое позволяло перейти к следующей пробе. Для сохранения эффекта движения в пробах, где в качестве тестового предъявлялось спокойное лицо, оно смещалось на 5 пикселей вверх.

Временная организация стимульного материала подбиралась опытным путем на основе данных, полученных в других исследованиях (Джафаров и др., 1981; Линде, Соколов, 1986; Braddick, 1980; Claworthy, Frigby, 1973; Kolers, 1972; Michaels, Turvey, 1979; Turvey, 1973). Тестовые изображения предъявлялись на время, равное 50, 100 либо 200 мс. Длительность первого контекстного изображения составляла 300 мс, второго  100 мс.

В течение одной серии каждая из семи экспрессий, выраженная каждым из шести натурщиков, предъявлялась по 7 раз. Таким образом, серия включала: 3 времени экспозиции × 7 экспрессий × 6 натурщиков × 7 повторов = 882 пробы. Все пробы были разбиты на 4 блока, между которыми испытуемые могли делать паузы. Порядок предъявления стимульного материала в каждом блоке был случайным.


Рис. 2.2. Структура стимульной ситуации


Перед началом основного эксперимента проводилась тренировочная серия. Она состояла из 7 проб, в каждой из которых экспонировалась одна из 7 экспрессий, выраженная одним из 6 натурщиков. Длительность тестового изображения составляла 300 мс. Экспонируемые экспрессии в тренировочных пробах не повторялись.

Статистическая обработка данных проводилась при помощи пакета R 3.0.3. Анализировалось влияние изучаемых факторов на точность распознавания экспрессий. Верными ответами считали совпадение выбранной в каждой пробе категории эмоции с тем состоянием, которое изображал натурщик. Методом дисперсионного анализа с внутригрупповыми факторами Время предъявления (3 градации), Содержание контекста (3 градации), Экспрессия натурщика (7 градаций) рассчитывались отношения F Фишера для каждого из факторов и их взаимодействий. Значимость критерия оценивалась с помощью рандомизационного теста, эффективного даже при нарушении условий использования дисперсионного анализа. Рандомизация проводилась для каждого испытуемого в отдельности, количество итераций  1000.

С помощью точного теста Фишера частоты верных ответов в трех сериях сопоставлялись попарно: а) средние по всем экспрессиям и всем временам предъявления; б) средние по всем временам предъявления для каждой экспрессии; в) средние по всем экспрессиям для каждого времени предъявления; г) для каждой экспрессии и каждого времени предъявления в отдельности.

Частоты выборов семи категорий  названий базовых эмоций  сопоставлялись при помощи χ2 Пирсона для каждой экспрессии: сравнивались распределения частот в трех сериях (кажущееся движение; маскировка; изолированное лицо) и при разном времени экспозиции (50, 100, 200 мс). Уровни значимости во всех случаях рассчитывались методом Монте-Карло (количество итераций  2000) с коррекцией Беньямини  Хохберга на множественные сравнения.

Оценка эмоций в условиях кажущегося движения

Феноменология восприятия. Несмотря на близость временной организации стимульных паттернов в трех сериях, их восприятие зависит от содержания контекста, в который включалось тестовое фотоизображение. Если оно просто демонстрируется на светло-сером фоне экрана, наблюдатели воспринимают неподвижное экспрессивное лицо само по себе. Если фотографии экспрессии лица предшествует и следует за ней изображение этого же натурщика в спокойном состоянии, воспринимается кажущееся движение  быстрое непрерывное изменение выражения лица, нередко сопровождаемое движением головы. Наконец, в тех случаях, когда появление тест-объекта ограничивается рандомизированными изображениями, наблюдатель видит статичное изображение экспрессии с наложенными на него шумовыми масками. Три содержательно различные стимульные ситуации, реализованные в соответствующих экспериментальных сериях, обозначим как «кажущееся движение» (серия 1.1), «маскировка» (серия 1.2) и «изолированное лицо» (серия 1.3).

Точность распознавания экспрессий. В ходе анализа мы пытались установить, зависит ли относительная частота проб, в которых выбранная испытуемым эмоция совпадала с экспрессией, выраженной натурщиком («верные ответы»), от условий восприятия и модальности экспрессии. Ответы, не совпадающие с экспрессией натурщика, считались «ошибочными». Согласно полученным данным, все варьируемые факторы: Время, Экспрессия, Контекст, а также их взаимодействия оказались значимыми (p = 0,001). Средние значения эффективности распознавания в зависимости от времени экспозиции, модальности экспрессии и содержания контекста приведены на рисунке 2.3 и в таблицах 2.1 и 2.2.


Рис. 2.3. Точность распознавания экспрессий (доля «верных» ответов) в зависимости от модальности эмоции, времени экспозиции (мс) и содержания контекста


Вероятность правильных ответов в подавляющем большинстве случаев выше случайной (средняя точность распознавания по всем условиям 0,76). Лучше всего распознаются «радость» (0,95), «удивление» (0,90) и спокойное лицо (0,90), хуже всего  «гнев» (0,53) и «страх» (0,56). Средние по всем экспрессиям и временам экспозиции частоты верных ответов в сериях 1.1 и 1.2 значимо не различаются (доля «верных» ответов в обеих сериях составляет 0,74; скорректированный уровень значимости точного теста Фишера при сопоставлении частот ответов в этих двух сериях p = 0,423). Ответы в серии 1.3 (изолированное предъявление лица, точность распознавания 0,81) значимо отличны от соответствующих ответов в сериях 1 и 2 (кажущееся движение и маскировка) (p<0,001). Отдельно по каждой экспрессии все различия между сериями значимы (p<0,008) за исключением «удивления» (p = 0,489) и нейтрального лица (p = 0,481), для которых результаты оценки в условиях кажущегося движения и изолированного лица не отличаются. Средняя по всем экспрессиям точность ответов в разных сериях значимо различается в зависимости от времени экспозиции, кроме серий с кажущимся движением и маскировкой при 100 мс (p = 0, 374).


Таблица 2.1. Точность распознавания в зависимости от содержания контекста, времени экспозиции и модальности экспрессий


Таблица 2.2. Точность распознавания экспрессии в каждом из экспериментальных условий

Назад Дальше