Аналитика: методология, технология и организация информационно аналитической работы - Юрий Курносов 46 стр.


Таблица 4.3 - Содержание этапов обработки и анализа сообщений.
Содержание этапаЭ-ID
Получение физического доступа к среде распространения данных00
Получение материальной копии массива данных01
Разбиение массива данных на сообщения по структурным признакам02
Анализ и согласование форматов представления данных03
Экспресс-анализ и отбор сообщений (язык, ключевые слова, структурные признаки и идентификационные данные)04
Структурный анализ сообщения (выделение элементов структурной организации текста)05
Выделение, категорирование и маркировка метаязыковых конструкций06
Анализ и восстановление ссылочных отношений07
Анализ и восстановление временных отношений08
Анализ и восстановление пространственных отношений09
Анализ и восстановление функциональных отношений (субъект-объектных, инструментальных и иных)10
Идентификация ситуационной модели или фрейма, описывающего ситуационный и коммуникативный контекст11
Анализ и восстановление рефлексийных отношений12
Анализ эмоциональной компоненты сообщения и соотнесение оценочных суждений с субъектами рефлексии13
Анализ акцентов внимания субъектов рефлексии14
Анализ и восстановление логических (причинно-следственных) отношений15
Выделение и связывание повествовательных стратегий (сюжетных линий), их пространственная и временная синхронизация16
Выделение релевантных сведений17
Выявление противоречий18
Обобщение информации19

Ниже, в табл. 4.4, приведено основное содержание и обозначения семантических классов атрибутов сообщений (колонка "Идентификатор семантического класса" - С-ID).

Таблица 4.4 - Содержание семантических классов атрибутовсообщений.
Семантическая группаС-ID
Технология АК: параметры канала информационного взаимодействия00
Технология АК: параметры инструментария обработки данных01
Технология АК: адресная и маршрутная информация02
Технология АК: лексико-синтаксические параметры03
Системно-реляционные параметры: время04
Системно-реляционные параметры: пространство05
Системно-реляционные параметры: морфология06
Системно-реляционные параметры: информационный обмен07
Системно-реляционные параметры: процессы08
Системно-реляционные параметры: энергия09

Теперь мы можем перейти к рассмотрению атрибутов, вынесение которых на верхний уровень описания сообщения позволит упростить многие задачи, связанные с повторным вовлечением сообщений в цикл ИАР за счет применения средств автоматизации. В приводимой ниже таблице в соответствие атрибутам приведены их семантические классы и этапы обработки сообщения (имеющий желание, да изучит).

Таблица 4.4 - Соответствие атрибутов семантическим классам и этапам аналитической обработки сообщения.
АтрибутыС-IDЭ-ID
Физические параметры носителя0000
Идентификационные данные канала или носителя данных0000, 01
Интенсивность потока сообщений0000
Стоимостные характеристики носителя или стоимость эксплуатации канала0000, 01
Способ первичного представления данных0103
Правила формализации0103, 05
Адресные и идентификационные данные участников АК02,0502, 04, 11, 12
Язык представления0303
Специфика синтаксических предписаний, используемых в сообщении0303, 05, 06
Специфика словаря сообщения0304, 05, 06
Время получения данных аналитиком0402
Время получения данных источником0408
Время события, инициировавшего появление сообщения (ставшего центральной темой) - внутреннее время сообщения0406, 08, 12, 14
Пространственная локализация события (физическое, организационное, целевое и иные виды пространства)0509, 10, 14
Перечень объектов сообщения0610, 12
Перечень неявных объектов сообщения (тех, чье участие подразумевается, но не декларируется)0610, 11, 12
Цепочка распространения информации0711, 12
Заинтересованные и потенциально заинтересованные потребители0700, 1114, 10
Временная и событийная иерархия сообщения (с привязкой к объектам)0408, 10, 11, 16
Динамические характеристики процессов, в том числе - процесса распространения информации04,08,0908, 10, 11, 16
Координатная и траекторная информация (с привязкой к объектам)04-0909-11, 15, 16
АтрибутыС-IDЭ-ID
Полнота АК и/или сообщения0302, 07
Достаточность для интерпретации03,04-0907, 15
Локальный коммуникативный контекст сообщения в рамках информационного взаимодействия тех же участников АК02,0602, 04, 11
Тематический контекст сообщения в рамках информационного взаимодействия произвольных участников АК (предшествующие и последующие сообщения в рамках данной тематики)0602, 04, 11, 14
Ситуационный контекст сообщения11
Класс источника (первичный или вторичный)0711, 12
Класс сообщения (контактное, внутрисистемное, транзитное, межсистемное)00-0911, 12
Вид фильтрации сообщения (пассивная или активная)00-0912-15
Ценностная ориентация субъекта и объекта04-0901, 04, 11-15
Устойчивость системы ценностей04-0901, 04, 11-15
Целевая ориентация субъекта/объекта04-0901, 04, 11-15
Функциональная группа сообщения (информативная, подкрепительная, нормативно-директивная, запрос, общекоммуникативная, преобразования сознания, эмоционального воздействия)04-0901, 04, 11-15
Идентификационные данные и характеристики систем, к которым принадлежат объекты сообщения04-0901, 04, 08-15
Характеристика оснований для наличия отношений доверия (в том числе - принадлежность участников АК к единой иерархической системе)04-0901, 04, 08-15
Отношения потребления ресурсов в системах участников АК или объектов сообщения04-0901, 04, 08-15
Экспертная оценка достоверности сообщений участников АК04-0901, 04
Вероятные причины и последствия события04-0901, 04, 08-15
Достаточность или необходимость дополнительных условий04-0901, 04, 08-15
Возможность или необходимость протекания событий06,0701, 04, 08-15
АтрибутыС-IDЭ-ID
Ожидаемость и расчетное время получения сообщения или свершения события04-0901, 04, 08-16
Наличие оттенка модальности в сообщении03-0908-15

В приведенном перечне дана лишь базовая совокупность атрибутов, позволяющая осуществлять различные виды автоматизированного связывания сообщений как по "внешним" атрибутам, доступным на этапе получения сообщения, так и по "внутренним" атрибутам, получаемым на этапе семантического анализа. Для специфических же задач анализа и различных организационно-технических систем перечень атрибутов может варьироваться.

8. Выявление неполноты, противоречивости и недостоверности информации

Важнейшая компонента аналитики связана с исследованием и прогнозированием поведения целеполагающих систем, способных к активной генерации и реализации целей. Особенностью таких систем является их способность к проведению целенаправленных акций по дезинформации в интересах достижения поставленных целей. В связи с этим аналитику требуется установить, являются ли имеющиеся в его распоряжении данные полными, непротиворечивыми и достоверными.

Оценивание достоверности данных, поступающих на вход системы ИАР, представляет собой сложную задачу. Ее решение возможно только при условии, что аналитик располагает:

- адекватной моделью процесса;

- адекватной моделью ситуации (состояния).

Существует масса подходов к решению задачи оценивания достоверности: начиная от подходов, предусматривающих учет вероятности распределения ошибок в канале связи, по которому поступила информация, и заканчивая попытками анализа целостности и непротиворечивости данных или оценивания надежности источника (в том числе с учетом характера тех искажений, которые он склонен целенаправленно вносить - см. активная фильтрация сообщения).

При этом, оперируя данными, полученными от целенаправленно функционирующих систем, аналитик может исходить только из трех базовых посылок, позволяющих высказывать суждения об истинности или ложности утверждений, содержащихся в данных, поступающих на вход системы анализа:

- достоверность знания о динамической характеристике оцениваемого параметра (следствие адекватности модели);

- достоверность знания о значении параметра в некоторый предшествующий момент времени (следствие адекватного суждения на предыдущем этапе анализа);

- достоверность идентификации состояния системы в целом на предшествующем этапе анализа.

Все прочие сведения, поступающие к аналитику в виде деклараций о намерениях или утверждений о текущем состоянии системы, не могут быть признаны достоверными без проверки с применением перечисленных выше моделей и исходных данных.

Когда в качестве предмета анализа выступает система, обладающая свойством целеполагания, аналитик в большинстве случаев не располагает объективными критериями для формулирования выводов. При анализе декларативных заявлений, связанных с будущим, предметом аналитических суждений нередко становится не только реальный, но и модельный мир объекта анализа (совокупные общественные установки, идеологическая и духовная сфера общества или индивида-субъекта управления), что еще больше осложняет работу.

8.1 Логико-лингвистические средства анализа достоверности

Довольно часто, не имея возможности установить факт достоверности данных, аналитику приходится оперировать шкалами достоверности, синтезированными на основе опыта использования данных от конкретных источников (используя рейтинги достоверности и т. д.). Однако такой подход не гарантирует качества результатов, хотя и существуют способы повышения качества выводов за счет включения в рассмотрение ценностной ориентации и целей источников, а также построения выводов на основе анализа конфликтов в материальной, идеологической и духовной сферах.

В этих случаях при анализе достоверности данных, представленных в виде суждений, используются следующие подходы:

- использование примитивных мажоритарных методов;

- метод экспертных оценок;

- ранжирование источников данных;

- интеграция с объективными данными;

- привлечение методов теории игр для анализа оптимальных стратегий и сопоставления входных данных о выборе стратегии с результатами игрового моделирования;

- анализ ценностной ориентации источников;

- выявление базисных процессов реального мира, влияющих на процесс генерации суждений и др.

Для систем, обладающих способностью к реализации функции целеполагания, решение задачи верификации тесно связано с решением задач технологического обеспечения ИАР, поскольку требует от аналитика формализации тех ценностей субъекта целеполагания, относительно которых могут быть выявлены конфликты целей, декларируемых в совокупности суждений (выражающих стратегии поведения субъекта целеполагания).

Декларации стратегий, скрыто противоречащих базисным ценностям индивида или некоторого сообщества индивидов, в своей основе содержат логически выводимые высказывания, явно противоречащие ценностной аксиоматике. То есть, в результате интеграции с другими данными о ситуации или процессе, либо в результате приведения к примитивным высказываниям, могут быть получены высказывания, явно противоречащие друг другу или системе аксиом, относительно которой строится вся система аргументации. В ходе направленных акций по дезинформации особый интерес представляют моменты смены стратегии дезинформации в ответ на адаптивные действия оппонента, оспаривающего заявления дезинформатора. В такой ситуации дезинформатор вынужден менять линию поведения, что часто требует коррекции аксиом, на которых построена вся логика убеждения.

В настоящее время средства автоматизированного оценивания достоверности данных реализованы лишь для систем, не способных к целеполаганию либо не являющихся объектом преобразующей деятельности человека. В сферах, где это условие не выполняется, пределом достижений в области оценивания достоверности данных является автоматизация процесса маркирования пар противоречивых утверждений, предварительно формализованных экспертами. Маркирование может также осуществляться на основании сопоставления с набором допустимых стратегий, измеренных значений и иных данных разного уровня формализации и верифицируемости. Существуют системы, позволяющие оценивать действия целеполагающих систем на основе сопоставления с эталоном. Чаще всего, в таких системах в качестве эталона используются некие непротиворечивые системы регламентов, сохраняющие стабильность на протяжении рассматриваемого интервала времени - например, законодательные акты и иные.

Там же, где верификация данных (сообщений) по причине специфичности их объекта невозможна, автоматизация этого процесса сводится преимущественно к автоматизации процедур обработки результатов экспертных опросов, осуществляемых различными классическими методами.

Поскольку возможность оценивания достоверности данных связана с анализом прагматической составляющей знаковых систем и отображением элементарных или сложных высказываний на множество значений [0, 1] (как правило), постольку реализация автоматизированных систем, обладающих такой возможностью, связана с генерацией стратегий дискредитации утверждений. То есть для создания полностью автоматической системы, способной оценивать достоверность предоставляемых данных, требуется синтезировать систему искусственного интеллекта, способную вырабатывать эффективные стратегии, направленные на дискредитацию утверждений, а это требует от машины способности к автоматическому подбору аргументации (что не так уж и просто).

Для того чтобы автоматизированная информационная система могла автоматически подбирать аргументы, она должна быть в состоянии выделять из сообщений утверждения, подлежащие проверке (то есть, атомарные высказывания, содержащие сведения, значимые для решения проблемы), выполнять преобразование совокупности имеющихся данных в совокупность примитивных утверждений, соотнесенных с моделью фрагмента реального мира, на которой возможно осуществить проверку их истинности и непротиворечивости.

В отличие от задачи анализа достоверности, для решения задачи анализа непротиворечивости высказываний и сообщений не требует столь сложных операций, как синтез стратегий дискредитации утверждений (хотя теория поиска логического вывода, активно разрабатываемая в теории систем искусственного интеллекта предоставляет достаточно развитый аппарат для этого). Решение задачи анализа логической непротиворечивости потока сообщений связано с рядом проблем, среди которых на первом месте стоит проблема формализации текста (преобразования поступающего на вход системы ИАР произвольного сообщения к некоторому синтаксически однородному представлению). Первым этапом на пути к решению этой проблемы является построение модели естественного языка, на котором это сообщение представлено.

Современные подходы к решению проблемы анализа сообщений в общих чертах воспроизводят аналитические операции, выполняемые человеком, с той лишь разницей, что при этом учитывается необходимость алгоритмизации и автоматизации этих операций. Уникальное быстродействие "арифметикологического устройства" и ресурсы памяти, которыми располагает человек при аналитической обработке сообщений, позволяют ему быстро адаптироваться к способу синтаксического представления. Механизмы сценарной синхронизации (распознавание знакомого ситуационного контекста, сценария развития ситуации), активизирующиеся при наличии минимального социального опыта, обеспечивают человеку высокую избирательность и помехоустойчивость при восприятии сообщений. Эти механизмы функционируют не на уровне сообщения и даже не на уровне предложений - уровень их функционирования гораздо ниже и соответствует уровню элементарного высказывания.

В реальных условиях на способ представления сообщения могут оказывать влияние различные факторы. В число этих факторов, влияющих на способ синтаксического оформления сообщения (более общо - речевого акта) входят:

- цель сообщения;

- категория потребителя (образовательный статус, социальная или профессиональная группа);

- мотивация к восприятию (заинтересованность, нейтралитет, сопротивление);

- способ представления (устная, письменная форма);

- стиль (литературный, новостийный, обыденный и т. п.);

- способ взаимодействия (монолог, диалог, интервью и т. д.).

Назад Дальше