Таблица 4.3 - Содержание этапов обработки и анализа сообщений. | |
---|---|
Содержание этапа | Э-ID |
Получение физического доступа к среде распространения данных | 00 |
Получение материальной копии массива данных | 01 |
Разбиение массива данных на сообщения по структурным признакам | 02 |
Анализ и согласование форматов представления данных | 03 |
Экспресс-анализ и отбор сообщений (язык, ключевые слова, структурные признаки и идентификационные данные) | 04 |
Структурный анализ сообщения (выделение элементов структурной организации текста) | 05 |
Выделение, категорирование и маркировка метаязыковых конструкций | 06 |
Анализ и восстановление ссылочных отношений | 07 |
Анализ и восстановление временных отношений | 08 |
Анализ и восстановление пространственных отношений | 09 |
Анализ и восстановление функциональных отношений (субъект-объектных, инструментальных и иных) | 10 |
Идентификация ситуационной модели или фрейма, описывающего ситуационный и коммуникативный контекст | 11 |
Анализ и восстановление рефлексийных отношений | 12 |
Анализ эмоциональной компоненты сообщения и соотнесение оценочных суждений с субъектами рефлексии | 13 |
Анализ акцентов внимания субъектов рефлексии | 14 |
Анализ и восстановление логических (причинно-следственных) отношений | 15 |
Выделение и связывание повествовательных стратегий (сюжетных линий), их пространственная и временная синхронизация | 16 |
Выделение релевантных сведений | 17 |
Выявление противоречий | 18 |
Обобщение информации | 19 |
Ниже, в табл. 4.4, приведено основное содержание и обозначения семантических классов атрибутов сообщений (колонка "Идентификатор семантического класса" - С-ID).
Таблица 4.4 - Содержание семантических классов атрибутовсообщений. | |
---|---|
Семантическая группа | С-ID |
Технология АК: параметры канала информационного взаимодействия | 00 |
Технология АК: параметры инструментария обработки данных | 01 |
Технология АК: адресная и маршрутная информация | 02 |
Технология АК: лексико-синтаксические параметры | 03 |
Системно-реляционные параметры: время | 04 |
Системно-реляционные параметры: пространство | 05 |
Системно-реляционные параметры: морфология | 06 |
Системно-реляционные параметры: информационный обмен | 07 |
Системно-реляционные параметры: процессы | 08 |
Системно-реляционные параметры: энергия | 09 |
Теперь мы можем перейти к рассмотрению атрибутов, вынесение которых на верхний уровень описания сообщения позволит упростить многие задачи, связанные с повторным вовлечением сообщений в цикл ИАР за счет применения средств автоматизации. В приводимой ниже таблице в соответствие атрибутам приведены их семантические классы и этапы обработки сообщения (имеющий желание, да изучит).
Таблица 4.4 - Соответствие атрибутов семантическим классам и этапам аналитической обработки сообщения. | ||
---|---|---|
Атрибуты | С-ID | Э-ID |
Физические параметры носителя | 00 | 00 |
Идентификационные данные канала или носителя данных | 00 | 00, 01 |
Интенсивность потока сообщений | 00 | 00 |
Стоимостные характеристики носителя или стоимость эксплуатации канала | 00 | 00, 01 |
Способ первичного представления данных | 01 | 03 |
Правила формализации | 01 | 03, 05 |
Адресные и идентификационные данные участников АК | 02,05 | 02, 04, 11, 12 |
Язык представления | 03 | 03 |
Специфика синтаксических предписаний, используемых в сообщении | 03 | 03, 05, 06 |
Специфика словаря сообщения | 03 | 04, 05, 06 |
Время получения данных аналитиком | 04 | 02 |
Время получения данных источником | 04 | 08 |
Время события, инициировавшего появление сообщения (ставшего центральной темой) - внутреннее время сообщения | 04 | 06, 08, 12, 14 |
Пространственная локализация события (физическое, организационное, целевое и иные виды пространства) | 05 | 09, 10, 14 |
Перечень объектов сообщения | 06 | 10, 12 |
Перечень неявных объектов сообщения (тех, чье участие подразумевается, но не декларируется) | 06 | 10, 11, 12 |
Цепочка распространения информации | 07 | 11, 12 |
Заинтересованные и потенциально заинтересованные потребители | 07 | 00, 1114, 10 |
Временная и событийная иерархия сообщения (с привязкой к объектам) | 04 | 08, 10, 11, 16 |
Динамические характеристики процессов, в том числе - процесса распространения информации | 04,08,09 | 08, 10, 11, 16 |
Координатная и траекторная информация (с привязкой к объектам) | 04-09 | 09-11, 15, 16 |
Атрибуты | С-ID | Э-ID |
Полнота АК и/или сообщения | 03 | 02, 07 |
Достаточность для интерпретации | 03,04-09 | 07, 15 |
Локальный коммуникативный контекст сообщения в рамках информационного взаимодействия тех же участников АК | 02,06 | 02, 04, 11 |
Тематический контекст сообщения в рамках информационного взаимодействия произвольных участников АК (предшествующие и последующие сообщения в рамках данной тематики) | 06 | 02, 04, 11, 14 |
Ситуационный контекст сообщения | 11 | |
Класс источника (первичный или вторичный) | 07 | 11, 12 |
Класс сообщения (контактное, внутрисистемное, транзитное, межсистемное) | 00-09 | 11, 12 |
Вид фильтрации сообщения (пассивная или активная) | 00-09 | 12-15 |
Ценностная ориентация субъекта и объекта | 04-09 | 01, 04, 11-15 |
Устойчивость системы ценностей | 04-09 | 01, 04, 11-15 |
Целевая ориентация субъекта/объекта | 04-09 | 01, 04, 11-15 |
Функциональная группа сообщения (информативная, подкрепительная, нормативно-директивная, запрос, общекоммуникативная, преобразования сознания, эмоционального воздействия) | 04-09 | 01, 04, 11-15 |
Идентификационные данные и характеристики систем, к которым принадлежат объекты сообщения | 04-09 | 01, 04, 08-15 |
Характеристика оснований для наличия отношений доверия (в том числе - принадлежность участников АК к единой иерархической системе) | 04-09 | 01, 04, 08-15 |
Отношения потребления ресурсов в системах участников АК или объектов сообщения | 04-09 | 01, 04, 08-15 |
Экспертная оценка достоверности сообщений участников АК | 04-09 | 01, 04 |
Вероятные причины и последствия события | 04-09 | 01, 04, 08-15 |
Достаточность или необходимость дополнительных условий | 04-09 | 01, 04, 08-15 |
Возможность или необходимость протекания событий | 06,07 | 01, 04, 08-15 |
Атрибуты | С-ID | Э-ID |
Ожидаемость и расчетное время получения сообщения или свершения события | 04-09 | 01, 04, 08-16 |
Наличие оттенка модальности в сообщении | 03-09 | 08-15 |
В приведенном перечне дана лишь базовая совокупность атрибутов, позволяющая осуществлять различные виды автоматизированного связывания сообщений как по "внешним" атрибутам, доступным на этапе получения сообщения, так и по "внутренним" атрибутам, получаемым на этапе семантического анализа. Для специфических же задач анализа и различных организационно-технических систем перечень атрибутов может варьироваться.
8. Выявление неполноты, противоречивости и недостоверности информации
Важнейшая компонента аналитики связана с исследованием и прогнозированием поведения целеполагающих систем, способных к активной генерации и реализации целей. Особенностью таких систем является их способность к проведению целенаправленных акций по дезинформации в интересах достижения поставленных целей. В связи с этим аналитику требуется установить, являются ли имеющиеся в его распоряжении данные полными, непротиворечивыми и достоверными.
Оценивание достоверности данных, поступающих на вход системы ИАР, представляет собой сложную задачу. Ее решение возможно только при условии, что аналитик располагает:
- адекватной моделью процесса;
- адекватной моделью ситуации (состояния).
Существует масса подходов к решению задачи оценивания достоверности: начиная от подходов, предусматривающих учет вероятности распределения ошибок в канале связи, по которому поступила информация, и заканчивая попытками анализа целостности и непротиворечивости данных или оценивания надежности источника (в том числе с учетом характера тех искажений, которые он склонен целенаправленно вносить - см. активная фильтрация сообщения).
При этом, оперируя данными, полученными от целенаправленно функционирующих систем, аналитик может исходить только из трех базовых посылок, позволяющих высказывать суждения об истинности или ложности утверждений, содержащихся в данных, поступающих на вход системы анализа:
- достоверность знания о динамической характеристике оцениваемого параметра (следствие адекватности модели);
- достоверность знания о значении параметра в некоторый предшествующий момент времени (следствие адекватного суждения на предыдущем этапе анализа);
- достоверность идентификации состояния системы в целом на предшествующем этапе анализа.
Все прочие сведения, поступающие к аналитику в виде деклараций о намерениях или утверждений о текущем состоянии системы, не могут быть признаны достоверными без проверки с применением перечисленных выше моделей и исходных данных.
Когда в качестве предмета анализа выступает система, обладающая свойством целеполагания, аналитик в большинстве случаев не располагает объективными критериями для формулирования выводов. При анализе декларативных заявлений, связанных с будущим, предметом аналитических суждений нередко становится не только реальный, но и модельный мир объекта анализа (совокупные общественные установки, идеологическая и духовная сфера общества или индивида-субъекта управления), что еще больше осложняет работу.
8.1 Логико-лингвистические средства анализа достоверности
Довольно часто, не имея возможности установить факт достоверности данных, аналитику приходится оперировать шкалами достоверности, синтезированными на основе опыта использования данных от конкретных источников (используя рейтинги достоверности и т. д.). Однако такой подход не гарантирует качества результатов, хотя и существуют способы повышения качества выводов за счет включения в рассмотрение ценностной ориентации и целей источников, а также построения выводов на основе анализа конфликтов в материальной, идеологической и духовной сферах.
В этих случаях при анализе достоверности данных, представленных в виде суждений, используются следующие подходы:
- использование примитивных мажоритарных методов;
- метод экспертных оценок;
- ранжирование источников данных;
- интеграция с объективными данными;
- привлечение методов теории игр для анализа оптимальных стратегий и сопоставления входных данных о выборе стратегии с результатами игрового моделирования;
- анализ ценностной ориентации источников;
- выявление базисных процессов реального мира, влияющих на процесс генерации суждений и др.
Для систем, обладающих способностью к реализации функции целеполагания, решение задачи верификации тесно связано с решением задач технологического обеспечения ИАР, поскольку требует от аналитика формализации тех ценностей субъекта целеполагания, относительно которых могут быть выявлены конфликты целей, декларируемых в совокупности суждений (выражающих стратегии поведения субъекта целеполагания).
Декларации стратегий, скрыто противоречащих базисным ценностям индивида или некоторого сообщества индивидов, в своей основе содержат логически выводимые высказывания, явно противоречащие ценностной аксиоматике. То есть, в результате интеграции с другими данными о ситуации или процессе, либо в результате приведения к примитивным высказываниям, могут быть получены высказывания, явно противоречащие друг другу или системе аксиом, относительно которой строится вся система аргументации. В ходе направленных акций по дезинформации особый интерес представляют моменты смены стратегии дезинформации в ответ на адаптивные действия оппонента, оспаривающего заявления дезинформатора. В такой ситуации дезинформатор вынужден менять линию поведения, что часто требует коррекции аксиом, на которых построена вся логика убеждения.
В настоящее время средства автоматизированного оценивания достоверности данных реализованы лишь для систем, не способных к целеполаганию либо не являющихся объектом преобразующей деятельности человека. В сферах, где это условие не выполняется, пределом достижений в области оценивания достоверности данных является автоматизация процесса маркирования пар противоречивых утверждений, предварительно формализованных экспертами. Маркирование может также осуществляться на основании сопоставления с набором допустимых стратегий, измеренных значений и иных данных разного уровня формализации и верифицируемости. Существуют системы, позволяющие оценивать действия целеполагающих систем на основе сопоставления с эталоном. Чаще всего, в таких системах в качестве эталона используются некие непротиворечивые системы регламентов, сохраняющие стабильность на протяжении рассматриваемого интервала времени - например, законодательные акты и иные.
Там же, где верификация данных (сообщений) по причине специфичности их объекта невозможна, автоматизация этого процесса сводится преимущественно к автоматизации процедур обработки результатов экспертных опросов, осуществляемых различными классическими методами.
Поскольку возможность оценивания достоверности данных связана с анализом прагматической составляющей знаковых систем и отображением элементарных или сложных высказываний на множество значений [0, 1] (как правило), постольку реализация автоматизированных систем, обладающих такой возможностью, связана с генерацией стратегий дискредитации утверждений. То есть для создания полностью автоматической системы, способной оценивать достоверность предоставляемых данных, требуется синтезировать систему искусственного интеллекта, способную вырабатывать эффективные стратегии, направленные на дискредитацию утверждений, а это требует от машины способности к автоматическому подбору аргументации (что не так уж и просто).
Для того чтобы автоматизированная информационная система могла автоматически подбирать аргументы, она должна быть в состоянии выделять из сообщений утверждения, подлежащие проверке (то есть, атомарные высказывания, содержащие сведения, значимые для решения проблемы), выполнять преобразование совокупности имеющихся данных в совокупность примитивных утверждений, соотнесенных с моделью фрагмента реального мира, на которой возможно осуществить проверку их истинности и непротиворечивости.
В отличие от задачи анализа достоверности, для решения задачи анализа непротиворечивости высказываний и сообщений не требует столь сложных операций, как синтез стратегий дискредитации утверждений (хотя теория поиска логического вывода, активно разрабатываемая в теории систем искусственного интеллекта предоставляет достаточно развитый аппарат для этого). Решение задачи анализа логической непротиворечивости потока сообщений связано с рядом проблем, среди которых на первом месте стоит проблема формализации текста (преобразования поступающего на вход системы ИАР произвольного сообщения к некоторому синтаксически однородному представлению). Первым этапом на пути к решению этой проблемы является построение модели естественного языка, на котором это сообщение представлено.
Современные подходы к решению проблемы анализа сообщений в общих чертах воспроизводят аналитические операции, выполняемые человеком, с той лишь разницей, что при этом учитывается необходимость алгоритмизации и автоматизации этих операций. Уникальное быстродействие "арифметикологического устройства" и ресурсы памяти, которыми располагает человек при аналитической обработке сообщений, позволяют ему быстро адаптироваться к способу синтаксического представления. Механизмы сценарной синхронизации (распознавание знакомого ситуационного контекста, сценария развития ситуации), активизирующиеся при наличии минимального социального опыта, обеспечивают человеку высокую избирательность и помехоустойчивость при восприятии сообщений. Эти механизмы функционируют не на уровне сообщения и даже не на уровне предложений - уровень их функционирования гораздо ниже и соответствует уровню элементарного высказывания.
В реальных условиях на способ представления сообщения могут оказывать влияние различные факторы. В число этих факторов, влияющих на способ синтаксического оформления сообщения (более общо - речевого акта) входят:
- цель сообщения;
- категория потребителя (образовательный статус, социальная или профессиональная группа);
- мотивация к восприятию (заинтересованность, нейтралитет, сопротивление);
- способ представления (устная, письменная форма);
- стиль (литературный, новостийный, обыденный и т. п.);
- способ взаимодействия (монолог, диалог, интервью и т. д.).