Логико-смысловые модели позволяют формировать тематически связные описания различных аспектов проблемы (равно, как и проблемы в целом) и проводить структурный анализ проблемной области. Тематически связные описания получаются за счет выделения из общей совокупности когнитивных элементов логико-смысловой сети некоторых тех, которые непосредственно относятся к заданной тематике. В качестве частного примера применения логико-смыслового моделирования можно рассматривать гипертекстовые системы, получившие широкое распространение в глобальной телекоммуникационной сети Интернет.
В качестве когнитивных элементов могут выступать не только знания, но и высказывания иного характера, например описания отдельных задач. В этом случае логико-смысловые модели могут использоваться для решения проблемы выявления и анализа взаимосвязанных комплексов задач, их декомпозиции и агрегирования, для построения деревьев целей и задач.
Логико-смысловая модель представляется в виде связного неориентированного графа, в котором вершины соответствуют высказываниям, а ребра - семантическим связям между ними. Характеристики графа используются для исследования логико-смысловой сети. Применение такого способа представления позволяет ввести метрики семантической близости когнитивных элементов, и оценки их значимости. Так, например, количество связей, замыкающихся на одном элементе (валентность вершины), рассматривается как выражение значимости элемента, а длина пути от элемента до элемента, измеренная в узлах сети, как семантическая близость элементов (значимость относительно некоторого элемента).
Логико-смысловое моделирование позволяет выявить на основе анализа текстов, сформулированных различными экспертами, скрытые зависимости между различными аспектами проблемы, на взаимосвязь которых не указывалось ни в одном из предложенных текстов, а также произвести объективное ранжирование проблем и задач по их важности. Анализ графа позволяет обнаружить неполноту модели, локализовать те ее места, которые нуждаются в пополнении системы связей и элементов. Это становится возможным благодаря построению взаимосвязанной системы высказываний о предметной области объекта и автоматизированного выделения и структурирования высказываний, характеризующихся семантической близостью.
Благодаря применению средств накопления логико-смысловых моделей в активное использование могут быть вовлечены знания, полученные при решении сходных задач в смежных отраслях деятельности, то есть, реализован принцип историчности при принятии решений. Это приводит к постепенному снижению трудоемкости процессов синтеза новых логико-смысловых моделей.
Методы логико-лингвистического моделирования не исчерпываются перечисленными здесь. Следует упомянуть методы логико-лингвистического моделирования ситуаций, основанные на анализе потока сообщений, разрабатываемые одним из авторов этой книги, П.Ю. Конотоповым, рассмотрению которых будет уделено внимание далее, методы логико-лингвистического моделирования деловых процессов, методы синтеза деревьев целей и задач, а также иные методы, основанные на применении логико-лингвистических моделей и методов. Широкое применение логико-лингвистические модели нашли в отрасли разработки программного обеспечения, управления корпоративными информационными ресурсами и многих других отраслях, где требуется определенный уровень формализации, представляющий единство строгости, интуитивной понятности и высокой выразительной способности моделей.
2.5 Логические модели
Логические модели представляют собой следующий уровень формального представления (по сравнению с логико-лингвистическими). В таких моделях естественно-языковые высказывания замещаются на примитивные высказывания - литералы, между которыми устанавливаются отношения, предписываемые формальной логикой.
Различают логические модели, в которых рассматриваются различные схемы логических отношений: отношения логического следования, включения и иные, которыми замещаются отношения, характерные для традиционной формальной логики. Последнее замечание связано с многообразием неклассических логических систем, в которых отношения традиционной логики замещены альтернативными или расширены за счет включения отношений различной степени строгости (например, отношения нестрогого временного предшествования или следования). Здесь следует сослаться на более последовательное и полное описание логических систем различного рода данное в специальных источниках.
Говоря о логических моделях трудно обойти стороной терминологию логики. Однако в данном разделе мы не будем приводить строгий тезаурус логики, а приведем достаточно вольное толкование некоторых общеупотребительных терминов. В первую очередь введем понятие высказывания. Высказывание или литерал - это некоторое языковое выражение, имеющее смысл в рамках некоторой теории, относительно которого можно утверждать, что оно истинно или ложно (для классической логики это так). Логической операцией называется операция построения из одного или более высказываний нового высказывания. Для записи логических формул используются пропозициональные переменные (они замещаются высказываниями), связки (обозначающие тип устанавливаемого отношения) и метасимволы, управляющие процессом разбора формулы (скобки различного рода и т. д.). Силлогизм - это система логических формул, состоящая из двух исходных посылок (антецедентов) и следствия (консеквента). Такие логические системы являются основой для построения традиционных логических рассуждений со времен Аристотеля. Расширением такой логической системы является система, состоящая из нескольких силлогизмов, получившая название полисиллогизма или сорита. В подобной системе на количество исходных посылок и выводов ограничений не налагается, а на соотношение их числа (при условии, что система высказываний не содержит противоречий) налагается условие, что количество выводов не может превышать количество исходных посылок.
В соответствии с последними замечаниями, при рассмотрении логических моделей следует выделять два типа моделей: модели, решаемые по силлогической схеме, и модели, решаемые по полисиллогической схеме. Первый способ анализа системы высказываний требует достаточно громоздких логических вычислений, для которых трудно реализовать процедуры сокращения операций перебора, поскольку пары высказываний должны быть подобраны на основе применения семантических критериев (иначе получится задача, составленная из высказываний типа: "в огороде бузина = Истина, а в Киеве - дядька = Ложно" - выводы из такой системы посылок строить дело неблагодарное). Для полисиллогических моделей существуют методы сокращения вычислений, однако вопросам методологического и технологического обеспечения решения полисиллогизмов в настоящее время уделяется недостаточное внимание. На сегодня теоретическими и прикладными вопросами, связанными с решением полисиллогичеких задач, занимается сравнительно небольшое число ученых, среди которых - наши соотечественники Б.А. Кулик и А.А. Зенкин. Актуальность методов решения полисиллогизмов объясняется ростом потребностей, связанных с анализом потоков сообщений, потенциально содержащих противоречивые высказывания, либо предоставляющих неполную аргументацию, для анализа чего и целесообразно использовать методы решения полисиллогизмов.
Надо сказать, что один из методов решения полисиллогизмов был предложен математиком и логиком Ч. Доджсоном (литературный псевдоним - JI. Кэрролл), обильно "насорившим" соритами в своих книгах "Алиса в стране чудес", "История с узелками" и других.
Так, например, рассмотрим следующий полисиллогизм Кэррола:
1) "Все малые дети неразумны".
2) "Все, кто укрощает крокодилов, заслуживают уважения".
3) "Все неразумные люди не заслуживают уважения".
Необходимо определить, что следует из этих посылок.
Пытаясь решить подобную задачу в рамках аристотелевой силлогистики, нам пришлось бы последовательно подбирать подходящие пары суждений, получать из них следствия до тех пор, пока не будут исчерпаны все возможности. Это при росте числа утверждений оказалось бы чрезвычайно сложной задачей, результат решения которой не всегда приводит к однозначному выводу.
Л. Кэррол разработал оригинальную методику решения полисиллогизмов. Начальный этап решения таких задач может быть представлен в виде следующей последовательности операций (эти этапы присутствуют как у Л. Кэррола, так и в методике Б.А. Кулика):
- определение основных терминов, из которых состоит система посылок;
- введение для терминов системы обозначения;
- выбор подходящего универсума (множества, охватывающего все упоминаемые объекты).
В приведенном примере основными терминами данной задачи являются: "малые дети" (С), "разумные люди" (S), "те, кто укрощает крокодилов" (Т) и "те, кто заслуживает уважения" (R). Очевидно, что эти основные термины представляют какие-то множества в универсуме "люди". Их отрицаниями соответственно будут следующие термины: "не малые дети" (~С), "неразумные люди" (~S), "те, кто не укрощает крокодилов" (~T) и "те, кто не заслуживает уважения" (~R). Универсумом же для данной системы будет являться множество всех людей (U).
По существу, мы сформировали систему элементов формального описания предметной области, отраженной в полисиллогизме. Завершим пример, используя подход Б.А. Кулика (для прочтения символической записи достаточно припомнить школьные годы)…
Итак, С С T CI R\ S CI R (знак С символизирует отношение включения множеств). - Именно так будет выглядеть запись базовых суждений сорита. По школьным годам помнится, что операция инверсии знаков у обеих частей неравенства приводит к интересным результатам (превращению знака "больше" в знак "меньше" и т. д.). В нашем случае такая аналогия вполне уместна: операция отрицания поставленная перед каждым из терминов приведет к инверсии отношения включения, то есть получим:
S с= С; R^T; R<^S. То есть, "Все разумные люди не являются малыми детьми" и т. п. Далее получим:
C^S,S^R =>С <^R Т (z R,R çz S =>Т œS S^R,
RœT ^SœT
СсГ;
ГсС.
RœS,SœC ^KçC
Итого, получаем: "Все малые дети не укрощают крокодилов" и "Все, кто укрощает крокодилов, не являются малыми детьми". Расшифровать прочие утверждения читатели могут самостоятельно.
Логические модели широко используются для описания систем знаний в различных предметных областях, при этом уровень формализации описания в таких моделях существенно выше чем в логико-лингвистических. Достаточно заметить, что одному высказыванию (когнитивному элементу) логико-лингвистической модели, как правило, соответствует несколько высказываний логической модели.
Зачастую, наряду с классическим логическим формализмом, в таких моделях используется формальные средства теории множеств и теории графов, служащие для расширения возможностей по описанию и представлению отношений в логических моделях. Здесь прослеживается их сходство с логико - лингвистическими моделями. Так же, как и логико-лингвистические модели, логические модели позволяют осуществлять качественный анализ, однако, будучи дополнены формальными средствами и методами других разделов математики (что делается достаточно легко, поскольку логика является метаязыком как для естественного языка, так и для искусственных языков), логические модели позволяют осуществлять и строгий численный анализ.
Наиболее широкое распространение логические модели получили в области построения систем искусственного интеллекта, где они используются в качестве основы для производства логического вывода из системы посылок, зафиксированных в базе знаний, в ответ на внешний запрос.
Ограничения, связанные со спецификой предметной области (нечеткость и неполнота экспертных знаний) привели к тому, что в последние годы в отрасли построения систем искусственного интеллекта приобрели особую популярность квазиаксиоматические логические системы (подход, развиваемый отечественным ученым Д.А. Поспеловым). Такие логические системы заведомо неполны и для них не выполняется полный комплекс требований, характерных для классических (аксиоматических) систем. Более того - для большинства логических высказываний, образующих такую систему, задается область определения, в пределах которой эти высказывания сохраняют свою значимость, а все множество высказываний, на основе которых осуществляется анализ, делится на общезначимые высказывания (справедливые для всей модели) и высказывания, имеющие значимость лишь в рамках локальной системы аксиом.
Те же причины (неполнота и нечеткость экспертных знаний) сделали популярными такие направления логики, как многозначные логики (первые работы в этой области принадлежат польским ученым Я. Лукасевичу и А. Тарскому 1920-30-е годы), вероятностные логики и нечеткие логики (Fuzzy Logic - автор теории Л. Заде - 1960-е годы). Этот класс логик активно используется при синтезе логических моделей для систем искусственного интеллекта, предназначенных для ситуационного анализа.
Поскольку большинство знаний и понятий, используемых человеком, нечетко, Л. Заде предложил для представления таких знаний математическую теорию нечетких множеств, позволяющую оперировать такими "интересными" множествами, как множество спелых яблок или множество исправных автомобилей. На таких вот интересных множествах были определены операции нечеткой логики.
Системы, использующие модели на базе нечеткой логики разрабатываются специально для решения плохо определенных задач и задач с использованием неполной и недостоверной информации. Внедрение аппарата нечетких логик в технологии создания экспертных систем привело к созданию нечетких экспертных систем (Fuzzy Expert Systems).
Нечеткие логики стали особенно популярны в последние годы, когда Министерство Обороны США всерьез приступило к финансированию исследований в этой области. Сейчас в мире наблюдается всплеск интереса к аналитическим программным продуктам, созданных с применением методов нечетких логик и нечетких логических моделей. Правда, логическими эти модели назвать уже трудно - в них широко используются многозначные вероятностные отношения меры и принадлежности взамен традиционного математического аппарата бинарной логики. Нечеткая логика позволяет решать широкий класс задач, не поддающихся строгой формализации - методы нечеткой логики используются в системах управления сложными техническими комплексами, функционирующими в непредсказуемых условиях (летательными аппаратами, системами наведения высокоточного оружия и т. д.).
Многие зарубежные аналитические технологии, в силу действия экспортных ограничений, на российские рынки не поставляются, а инструментальные средства для самостоятельной разработки приложений являются ноу-хау фирм производителей - экономически выгоднее поставлять готовые приложения, чем создавать себе армию конкурентов (тем более в странах с "дешевыми" мозгами).
По существу логические модели представляют собой последний этап формализации, на котором в качестве элементов высказывания еще могут выступать понятия, сформулированные на языке человеческого общения. Но как мы видели в логические методы уже активно вмешиваются элементы формальных систем, речь о которых пойдет далее.
2.6 Статистические, теоретико-вероятностные модели
Статистические и теоретико-вероятностные методы составляют методологическую основу одноименного вида моделирования. На этом уровне формализации модели речь о вскрытии закона, обеспечивающего устранение неопределенности при принятии решения, пока еще не идет, но существует некоторый массив наблюдений за данной системой или ее аналогом, позволяющих сделать некие выводы относительно прошлого/текущего/будущего состояния системы, основываясь на гипотезе об инвариантности ее поведения.
Как всегда, сформулируем определение. Статистическая или теоретико-вероятностная модель (стохастическая модель) - это модель, в которой обеспечивается учет влияния случайных факторов в процессе функционирования системы, основанная на применении статистической или теоретико-вероятностной методологии по отношению к повторяющимся феноменам. Данная модель оперирует количественными критериями при оценке повторяющихся явлений и позволяет учитывать их нелинейность, динамику, случайные возмущения за счет выдвижения на основе анализа результатов наблюдений гипотез о характере распределения некоторых случайных величин, сказывающихся на поведении системы.
По существу, теоретико-вероятностные и статистические модели отличаются уровнем неопределенности знаний о моделируемой системе, существующей на момент синтеза модели. В случае, когда представления о системе носят, скорее, теоретический характер и основываются исключительно на гипотезах о характере системы и возмущающих воздействий, не подкрепленных результатами наблюдений, теоретико-вероятностная модель является единственно возможной. Когда же на этапе синтеза модели уже существуют данные, полученные опытным путем, появляется возможность подкрепления гипотез за счет их статистической обработки. Это становится очевидным, если рассмотреть соотношение между методами математической статистики и теории вероятностей. Математическая статистика - это наука, изучающая методы вскрытия закономерностей, свойственных большим совокупностям однородных объектов или событий, на основании их выборочного обследования (либо большим массивам данных, полученных в результате наблюдения за одним и тем же объектом на протяжении достаточно протяженного интервала времени). Теория же вероятностей изучает количественные закономерности, которым следуют случайные явления, если эти явления определяются событиями известной вероятности. Соответственно, математическая статистика является связующим звеном между теорией вероятностей и явлениями реального мира, поскольку позволяет сформулировать оценки вероятности тех или иных событий на основе анализа статистических данных.
Можно утверждать, что статистические модели представляют собой особый вид математических моделей, использующих в качестве исходных данных не только актуальные данные о текущем состоянии объекта, но и данные, характеризующие состояние либо других объектов данного класса, либо этого объекта, но в иной момент времени. Статистические модели применимы для изучения массовых явлений любой природы, включая и те, которые не относятся к категории вероятностно определенных (математическая статистика приспособлена и для решения детерминированных задач). При моделировании последних статистический процесс вводится в модель искусственно для получения статистических оценок численного решения (например, точности измерения параметров детерминированного процесса).