УДК 681.3.016 ББК 32.973-018.2 Учебное пособие содержит

УДК 681.3.016 ББК 32.973-018.2 Семенов, Н.А. Интеллектуальные информационные системы: учебное пособие/Н.А. Семенов. 2-е изд. Тверь: ТГТУ, 2009. 124 с.

Учебное пособие содержит теоретические и практические аспекты теории интеллектуальных информационных систем. Материал пособия охватывает вопросы, связанные с построением экспертных систем, систем поддержки принятия решений и экономических советующих систем на основе результатов современных исследований.

Предназначено для студентов и магистрантов, изучающих дисциплину «Интеллектуальные информационные системы» в технических университетах.

Рецензенты: кафедра системного и экономико-математического анализа ТвГУ (зав. кафедрой, доктор технических наук, профессор В.Н. Михно); заведующий кафедрой ЭВМ ТГТУ, доктор технических наук, профессор В.А. Григорьев.

© Н.А. Семенов, 2009 ISBN 978-5-7995-0471-7 © Тверской государственный

технический университет, 2009

3

Введение

Интеллектуальные информационные системы (ИИС) – результат развития обычных информационных систем (ИС), которые сосредоточили в себе наиболее наукоемкие технологии с высоким уровнем автоматизации не только процессов подготовки информации для принятия решений, но и самих процессов выработки вариантов решений, опирающихся на полученные ИС данные [1].

В пособии на основе последних достижений в области разработки ИИС рассмотрены различные модели представления знаний, методы их извлечения, нейронные сети и мультиагентные системы, интеллектуальные методы проектирования сложных систем, определены основные разновидности ИИС в виде экспертных систем, систем поддержки принятия решений и экономических советующих систем. Кроме того, приведены сведения об инструментальных средствах разработки ИИС, некоторые из них доступны в Интернете.

Во втором издании дополнительно рассмотрены вопросы в области основных направлений развития искусственного интеллекта, приведены примеры мультиагентных систем различного функционального назначения, определены интегрированные, гибридные и синергетические ИИС, интеллектуальные методы проектирования сложных систем и методы эволюционного моделирования.

Учебное пособие предназначено для студентов специальности «Прикладная информатика (в экономике)», будет полезно для магистрантов и аспирантов, использующих методы искусственного интеллекта в научных исследованиях.

4

Глава 1. Интеллектуальные информационные системы как одно из направлений теории искусственного интеллекта

1.1. Основные направления в искусственном интеллекте

Искусственный интеллект (ИИ) – это раздел информатики, посвященный моделированию интеллектуальной деятельности человека, который в середине ХХ века оформился в самостоятельную науку. Термин «искусственный интеллект» (artificial intelligence) был предложен в 1956 году. ИИ охватывает обширную область исследований и разработок интеллектуальных систем, предназначенных для работы в трудно формализуемых областях деятельности человека. Для задач, решаемых методами ИИ, характерно наличие большого числа степеней свободы с числом вариантов поиска решений, приближающимся к бесконечности.

Основные направления развития ИИ: 1. Разработка интеллектуальных информационных систем,

основанных на знаниях. ИИС объединяют в себе возможности систем управления базами данных (СУБД), лежащих в основе информационных систем, и технологию ИИ, благодаря чему хранение в них информации сочетается с ее обработкой и подготовкой для использования при принятии решений. Разновидностями ИИС являются экспертные системы (ЭС), системы поддержки принятий решений (СППР) и экономические советующие системы (ЭСС).

2. Нейросетевые и нейрокомпьютерные технологии. Искусственные нейронные сети и нейрокомпьютеры в значительной

мере заимствуют принципы работы головного мозга человека. Знания в них изначально не закладываются, а приобретаются в процессе обучения.

3. Мультиагентные (многоагентные) системы. Агент – это программная или программно-аппаратная сущность,

способная действовать в интересах достижения целей, поставленных владельцем. Интеллектуальные агенты обладают свойствами автономности, социального поведения, реактивности, базовых знаний, убеждений и др. Многоагентные системы (МАС) состоят из множеств:

системных единиц, в котором выделяется подмножество активных единиц – агентов, манипулирующих подмножеством пассивных единиц – объектов;

задач (функций, ролей), которые поручаются агентам; отношений между агентами; организационных структур, формируемых агентами; действий агентов.

Средой функционирования МАС является Интернет.

5

4. Распознавание образов. К нему относят широкий круг проблем в области распознавания изображений, символов, текстов и звуков.

5. Компьютерная лингвистика. В рамках данного направления решаются задачи машинного перевода и разработки естественно-языковых интерфейсов между человеком и компьютером на основе нейросетевых технологий.

6. Игры и творчество. Традиционно ИИ включает интеллектуальные задачи, решаемые при игре в шахматы и шашки. В широком смысле под игрой понимается некоторая конфликтная ситуация, участники которой своими действиями не только достигают своих целей, но и влияют на достижение целей другими участниками игры (экономические, политические и военные конфликты).

7. Эволюционное моделирование предполагает воспроизведение процесса естественной эволюции с помощью компьютерных программ, в частности, на основе генетических алгоритмов и методов группового учета аргументов.

1.2. Данные и знания

Данные – это информация, полученная в результате наблюдений или измерений отдельных свойств (атрибутов), характеризующих объекты, процессы и явления предметной области. При обработке на компьютере данные трансформируются, условно проходя следующие этапы:

данные как результат измерений и наблюдений; данные на материальных носителях информации (таблицы,

протоколы); структуры данных в виде диаграмм, графиков, функций; данные на языке описания (сетевые, иерархические, реляционные

модели представления данных); базы данных (БД) на машинных носителях информации.

Знания – это связи и закономерности предметной области (принципы, модели, законы), полученные в результате практической деятельности и профессионального опыта, позволяющего специалистам ставить и решать задачи в данной области. При обработке на компьютере знания трансформируются аналогично данным:

знания в памяти человека как результат анализа опыта и мышления; материальные носители знаний (литература, учебники,

аналитические отчеты); поле знаний – условное описание основных объектов предметной

области, их атрибутов и закономерностей, связывающих их;

6

знания, описанные на языках представления знаний (формально-логические, продукционные, фреймовые модели, семантические сети);

база знаний (БЗ) на машинных носителях информации. Существенными для понимания природы знаний являются способы

определения понятий. Один из широко применяемых способов основан на идее интенсионала и экстенсионала. Интенсионал понятия – это определение его через соотнесение с понятием более высокого уровня абстракции с указанием специфических свойств. Экстенсионал – это определение понятия через перечисление его конкретных примеров. При этом интенсионалы формируют знания об объектах, а экстенсионалы объединяют данные. Вместе они формируют элементы поля знаний конкретной предметной области.

1.3. Эволюция развития информационных систем

Принятие решений относительно действий или поведения в той или иной ситуации любых субъектов осуществляется на основе информационных процессов (ИП). ИП реализует отношения объекта и субъекта и представляет собой восприятие субъектом объективной реальности в виде данных, переработку этих данных в соответствии с целевой установкой и имеющимися знаниями о зависимостях фактов в информацию. На основе полученной информации происходят обновление знания субъекта, выработка решения по возможному изменению состояния объекта и целевой установки субъекта. Следовательно, ИП может быть рассмотрен в трех аспектах:

- синтаксический аспект – предполагает отображение объективной реальности в некоторой среде или на определенном языке;

- семантический аспект – определяет понимание и интерпретацию данных на основе знаний субъекта, которые отражают зависимости, закономерности взаимодействия объектов;

- прагматический аспект – предусматривает оценку полезности полученного нового знания субъекта в соответствии с целевой установкой для принятия решения. В широком смысле под информацией понимаются все три аспекта

отражения ИП. Любая ИС обеспечивает ввод данных, хранение, обработку информации и вывод результатов.

Знание имеет двоякую природу: предметную (фактуальную) и проблемную (операционную). Предметное знание представляет известные сведения об объектах отражаемой реальности, они накапливаются в базе данных. Проблемное знание отражает зависимости и отношения между объектами, которые позволяют интерпретировать данные или извлекать из них информацию. Проблемные знания представляются либо в

7

алгоритмической форме, либо в декларативной форме в виде БЗ. Часто предметные знания называют экстенсиональными (детализированными), а проблемные – интенсиональными (обобщенными).

ИП с помощью компьютерной информационной системы сводится к адекватному соединению предметных и проблемных знаний, что в различных ИС осуществляется по-разному. В системах, основанных на БД, происходит отделение предметных и проблемных знаний. Первые организуются в виде БД, вторые – в виде алгоритмов и соответствующих программ. В качестве посредника при этом выступает некоторая СУБД. Концепция независимости программ от данных позволяет повысить гибкость ИС по выполнению информационных запросов, но пользователь должен знать структуру БД и алгоритм решения задачи. Недостатками традиционных ИС является слабая адаптивность к изменениям в предметной области и невозможность решения плохо формализованных задач.

Эти недостатки устраняются в ИИС. При этом проблемные знания выделяются в БЗ, которая в декларативной форме хранит общие для различных задач единицы знаний. Управляющая структура приобретает характер универсального механизма решения задач (механизма вывода).

Следующим шагом в развитии ИИС является выделение в самостоятельную подсистему (репозитарий) метазнаний (знания о знаниях), которые описывают структуру предметных и проблемных знаний. Репозитарий отражает модель проблемной области в виде совокупности данных и правил. ИИС, обрабатывающие метазнания, получили название систем, основанных на моделях. В таких системах и программы, и структуры данных генерируются или компонуются из единиц знаний, описанных в репозитарии, каждый раз при изменении модели проблемной области [3].

Для ИИС, ориентированных на генерацию алгоритмов решения задач, характерны следующие признаки:

- развитые коммуникативные способности; - умение решать сложные плохо формализуемые задачи; - способность к самообучению; - адаптивность.

Коммуникативные способности ИИС характеризуют способ взаимодействия конечного пользователя с системой, в частности, возможность формулирования произвольного запроса в диалоге с ИИС на языке, максимально приближенном к естественному. Сложные плохо формализованные задачи – это задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний. Способность к самообучению – это возможность автоматического извлечения знаний для решения задач из

8

накопленного опыта конкретных ситуаций. Адаптивность – способность к развитию системы в соответствии с объективными изменениями модели проблемной области.

Знания могут быть классифицированы по категориям [2]: поверхностные – знания о видимых взаимосвязях между отдельными

событиями и фактами в предметной области; глубинные – абстракции, аналогии, схемы, отображающие структуры

и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов. Современные ЭС работают с поверхностными знаниями.

Исторически первичными были процедурные знания, то есть знания, «растворенные» в алгоритмах. Эти знания управляют данными. Для их изменения необходимо переделать программу. С развитием ИИ приоритет данных постепенно изменялся и все большая их часть сосредоточивалась в структурах данных (таблицы, списки, графы), то есть увеличивалась роль декларативных знаний. 1.4. Основные разновидности ИИС и характеристики решаемых задач

ИИС предназначены для решения задач, требующих высочайшей

квалификации исполнения. Характерной особенностью ИИС является наличие БЗ – совокупности знаний, записанной на магнитный носитель в форме, понятной эксперту и пользователю. Эксперт – высококвалифицированный специалист, готовый к передаче своей компетентности и опыта БЗ. Пользователь – специалист предметной области, для которого предназначена ИИС. Под предметной областью понимается множество объектов, значений их характеристик и связывающих их отношений. Проблемная область определяется характеристиками соответствующей предметной области и характеристиками типов решаемых в ней задач.

Потребность отражения человеческих знаний в памяти компьютера породила новое направление в информатике – инженерию знаний. Инженер по знаниям (когнитолог) – специалист, выступающий в роли буфера между экспертом и БЗ.

Основными разновидностями ИИС являются экспертные системы, системы поддержки принятия решений и экономические советующие системы.

ЭС применяются для решения неформализованных задач, которые обладают одной или несколькими из следующих характеристик [4,5]:

- задачи не могут быть заданы полностью в числовой форме;

9

- исходные данные и знания о предметной области обладают неоднозначностью, ошибочностью и противоречивостью;

- цели не могут быть выражены в терминах точно определенной целевой функции;

- алгоритмическое решение задач отсутствует; - алгоритмическое решение существует, но его нельзя использовать по

причине большой размерности пространства решения и ограниченности ресурсов компьютера. Для принятия решений в условиях определенности используются

методы математического программирования. Однако в условиях неопределенности, неполноты и нечеткости знаний задача многократно усложняется. Для того чтобы СППР оставалась работоспособной в условиях изменяющегося окружения, необходима реализация механизмов ее самообучения. Основные требования, предъявляемые к СППР:

- оказание квалифицированной поддержки процесса принятия решения на уровне консультанта;

- обладание возможностями самообучения, то есть умение добавлять новые знания в БЗ, накапливать их и обрабатывать;

- умение работать с неполной и нечеткой информацией; - поддержка многовариантных процессов принятия решений; - оценка последствий принимаемых решений.

ЭСС являются ИИС, ориентированными на решение широкого круга экономических задач, и могут быть разделены на два класса [6]:

1. Системы, воспроизводящие осознанные мыслительные усилия человека (дедуктивные).

2. Системы, воспроизводящие неосознанные (подсознательные) мыслительные действия человека (индуктивные). К первому классу относятся:

- расчетно-диагностические системы, в основе которых лежит ясное понимание целей принятия решений. Цель, трансформируемая в дерево целей, накладывается на дерево экономических показателей предприятия. В результате получается синтезированное дерево «цель – показатель», которое способно обеспечить расчет нужных для достижения целей ресурсов и резервов;

- ЭС приближенных рассуждений. Создаются в том случае, если цель принятия решений сформулировать невозможно или нецелесообразно, однако ее можно заменить гипотезой. Для создания систем данного класса формулируются правила вывода типа «ЕСЛИ-ТО», которые синтезируются в дерево вывода. Результатом использования системы является оценка правдивости заданной пользователем гипотезы;

10

- системы поддержки исполнения решений. Подразделяются на обучающие и рекомендательно-контролирующие системы. Основная цель – предоставить управленческому персоналу

недостающие знания, обучить конкретным действиям, необходимым для выполнения рекомендаций, предоставленных СППР, с последующим контролем исполнения.

Ко второму классу относятся: - системы нейросетевых вычислений. Осознанные знания являются

лишь небольшой частью от общего объема знаний, которыми оперирует человек в повседневной жизни. Многие действия человек выполняет подсознательно или неосознанно. В данном случае классические модели бесполезны, так как предполагают наличие четко или нечетко сформулированных правил. Используемый для создания ЭСС нейросетевых вычислений эволюционный подход ориентирован на индуктивное обобщение и вывод. В основе построения систем индуктивного характера лежат нейросетевые технологии. Искусственная нейросеть предназначена главным образом для того, чтобы на основе анализа большого объема информации, отражающей частные случаи какого-либо явления, выявить общие закономерности, которые в свою очередь могут быть использованы для распознавания новых частных случаев. Нейросеть рассматривается в качестве «черного ящика», для которого известны лишь вход, выход и некоторые другие внешние параметры;

- системы, ориентированные на естественно-языковые запросы. Исследования в этой области находятся на начальном этапе развития. Основная сложность заключается в предоставлении неосознанных (ассоциативных) знаний. БЗ представляется в форме семантической сети, то есть ориентированного графа, вершина которого соответствует понятиям, а дуги – отношениям между ними, отражающим осознанные (логические) знания.

Кроме этого, ЭСС содержит лингвистический процессор и базу ассоциаций. Лингвистический процессор предназначен для выявления с помощью лингвистических структур той БЗ, которая касается данного запроса. Выявленная часть семантической сети используется блоком обработки для последующей выдачи информации пользователю. Если в БЗ явно не присутствуют необходимые знания, то подключается база ассоциаций, которая пытается восполнить недостающую информацию. В ней подобно нейросетям активизируются те ассоциации, которые по специально рассчитанным коэффициентам наиболее близки к анализируемому запросу.

11

1.5. Классификация ИИС

ИИС можно классифицировать по разным основаниям, например, [1]:

- по областям применения (ИИС менеджера, ИИС для анализа инвестиций, ИИС для налогообложения);

- степени интеграции с другими программными средствами, используемыми на предприятии (автономные, сопрягаемые интерфейсом, интегрированные);

- оперативности (статические, квазидинамические, реального времени);

- адаптивности (обучаемые, настраиваемые); - используемой модели знаний (метод резолюций исчисления

предикатов, фреймовые, продукционные, семантические сети, нейросетевые, нечеткие системы и выводы). ИИС особенно эффективны в применении к

слабоструктурированным задачам, в которых отсутствует строгая формализация и для решения которых применяются эвристические процедуры, позволяющие в большинстве случаев получить решение. По мере совершенствования принципов логического и правдоподобного вывода, применяемых в ИИС за счет использования нечеткой, модальной, временной логики, байесовских сетей вывода, ИИС начинают проникать в высокоинтеллектуальные области, связанные с разработкой стратегических решений по совершенствованию деятельности предприятий. Включение в состав ИИС классических экономико-математических моделей, методов линейного, квадратичного и динамического программирования позволяет сочетать анализ объекта на основе экономических показателей с учетом факторов и рисков политических и внеэкономических факторов, оценивать последствия полученных решений.

Классификация ИИС может быть выполнена на основании признаков, определенных в п. 1.1 [3]:

- по коммуникативным способностям (интеллектуальности интерфейса): интеллектуальные БЗ, естественно-языковой интерфейс, гипертекстовые системы, контекстные системы помощи, когнитивная графика;

- решению сложных задач: классифицирующие системы, доопределяющие системы, трансформирующие системы, многоагентные системы;

- способности к самообучению: индуктивные системы, нейронные сети, интеллектуальный анализ данных;

- адаптивности: CASE- технология, компонентная технология.

12

ЭС классифицируется [2]: - по решаемой задаче: интерпретация данных, диагностика,

проектирование, прогнозирование, планирование, обучение, мониторинг, управление;

- связи с реальным временем: статические, квазидинамические, динамические;

- типу ЭВМ: супер-ЭВМ, ЭВМ на символьных процессорах, на рабочих станциях, на персональных компьютерах;

- степени интеграции: автономные и гибридные. Интерпретация данных является традиционной задачей для ЭС. Под

интерпретацией понимается процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Обычно предусматривается многовариантный анализ данных.

Под диагностикой понимается процесс соотнесения объекта с некоторым классом объектов или обнаружение неисправности в некоторой системе.

Проектирование состоит в подготовке спецификаций на создание объекта с заранее заданными свойствами. Прогнозирование позволяет предсказывать последствия некоторых событий или явлений на основании анализа имеющихся данных.

Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции.

Обучение предполагает использование компьютера для усвоения материала по некоторой дисциплине.

Основная задача мониторинга – непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы.

Под управлением понимается функция организованной системы, поддерживающая определенный режим деятельности.

Приведенные классификации ИИС не являются исчерпывающими и в процессе развития теории и практики построения систем могут модифицироваться и дополняться.

Глава 2. Структура и этапы проектирования экспертных систем

2.1. Структура статической и динамической ЭС

ЭС – сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей [2]. Первые ЭС, получившие

13

практическое использование, были статическими, то есть не учитывали изменение исходных данных во время решения задачи (рис. 2.1).

Рис. 2.1. Обобщенная структура статической ЭС Интерфейс пользователя – комплекс программ, реализующих диалог

пользователя и ЭС как на стадии ввода информации, так и при получении результатов. Рабочая память предназначена для хранения исходных и промежуточных данных решаемой в текущий момент задачи. Решатель является программой, моделирующей ход рассуждений эксперта на основании знаний, имеющихся в БЗ. Синонимами понятия «решатель» являются дедуктивная машина, машина вывода, блок логического вывода. Используя исходные данные рабочей памяти знания из БЗ, решатель формирует такую последовательность правил, которая, будучи применима к исходным данным, приведет к решению задачи. БЗ – ядро ЭС, совокупность знаний предметной области. Подсистема объяснений – это программа, позволяющая пользователю получить ответы на вопросы: «Как была получена рекомендация? Почему система приняла такое решение?». Ответ на вопрос «Как?..» – это трассировка всего процесса получения решения с указанием использованных фрагментов БЗ. Ответ на вопрос «Почему?..» – ссылка на умозаключение, непосредственно предшествовавшее полученному решению, то есть отход на один шаг назад. Развитие подсистемы объяснений поддерживают и другие типы вопросов. Интеллектуальный редактор БЗ – программа, представляющая инженеру по знаниям (когнитологу) возможность создавать БЗ в диалоговом режиме. Программа включает в себя систему вложенных меню, шаблонов языка представления знаний, подсказок и других сервисных средств, облегчающих работу с БЗ. Промышленные прикладные ЭС включают дополнительно БД, интерфейсы обмена данными с различными пакетами прикладных программ (ППП).

ЭС может функционировать в двух режимах: режиме приобретения знаний и режиме использования. В режиме приобретения знаний

Интерфейс пользователя

Интеллектуальный редактор БЗ

Рабочая память

Решатель

Б З

Подсистема объяснений

14

эксперт, используя интеллектуальный редактор, наполняет БЗ знаниями. В режиме использования общение с ЭС осуществляет конечный пользователь, который в общем случае не является специалистом в данной проблемной области.

Существуют проблемные области, требующие учитывать динамику исходных данных в процессе решения задачи (системы противовоздушной обороны, управление атомными электростанциями). Соответствующие ЭС называются динамическими (рис. 2.2) [7].

Рис. 2.2. Обобщенная структура динамической ЭС Подсистема моделирования внешнего мира необходима для анализа

и адекватной оценки состояния внешней среды. Подсистема сопряжения с внешним миром осуществляет связь с внешним миром через систему датчиков и контроллеров. С целью отражения временной логики происходящих в реальном мире событий претерпевают существенные изменения БЗ и решатель.

2.2. Характеристики, стадии существования

и этапы проектирования статических ЭС

ЭС как любую сложную систему можно определить совокупностью характеристик. В основном исходят из статичности предметной области. Характеристики, определяющие ЭС [2]:

- число и сложность правил, используемых в задаче. По степени сложности выделяют простые и сложные правила;

- связанность правил. Малосвязанные задачи удается разбить на несколько подзадач;

- пространство поиска, которое определяется размером, глубиной и широтой. Малыми считаются пространства поиска до 10! состояний. Глубина характеризуется средним числом последовательно применяемых правил, преобразующих исходные данные в конечный результат. Ширина характеризуется средним числом правил, пригодных к выполнению в текущем состоянии.

Статическая ЭС

Подсистема моделирования внешнего мира

Подсистема сопряжения с внешним миром

15

По типу используемых методов и знаний ЭС подразделяются на традиционные и гибридные. Традиционные используют в основном неформализованные методы инженерии знаний и неформализованные знания, полученные от эксперта. Гибридные ЭС используют методы инженерии знаний и формализованные методы.

Выделяют три поколения ЭС: - статические поверхностные, в которых знания представляются в

виде правил и процесс поиска не обрывается до решения; - статические глубинные, которые обладают способностью при

возникновении неизвестной ситуации определить действия, которые следует выполнить;

- динамические (глубинные и гибридные). Простые ЭС являются поверхностными, традиционными, БЗ

включает от 200 до 1000 правил. Сложные ЭС – это глубинные, гибридные системы с БЗ от 1500 до 10 000 правил.

Стадии существования ЭС: - демонстрационный прототип – решает часть требуемых задач, БЗ

содержит до 100 правил; - исследовательский прототип – решает все задачи, в работе не-

устойчив, БЗ содержит до 500 правил; - действующий прототип – решает все задачи, но для решения

сложных задач требуется большой объем вычислительных ресурсов. БЗ содержит до 1000 правил;

- промышленный образец обеспечивает высокое качество решаемых задач;

- коммерческая система – предназначена для широкого распространения. Статические поверхностные ЭС предусматривают следующие этапы

проектирования: - идентификация – определяются задачи, выявляются цели, ресурсы,

наличие экспертов, категории пользователей; - концептуализация – содержательный анализ предметной области,

выделяются используемые понятия и их взаимосвязи, определяются методы решения задач;

- формализация – определяются способы представления, специфицируются выделенные ранее понятия, фиксируются способы интерпретации знаний, моделируется работа ЭС, оцениваются полученные результаты;

- реализация – создание программной обстановки, в которой будет функционировать ЭС и наполнение БЗ;

- тестирование – эксперт и когнитолог в интерактивном режиме, используя объяснения, проверяют компетентность ЭС.

16

Процесс разработки промышленной ЭС можно разделить на шесть основных этапов.

1. Выбор проблемы. Данный этап предшествует решению начать разработку ЭС и предусматривает:

- определение проблемной области; - нахождение экспертов и разработчиков; - определение предварительного подхода к решению поставленных

задач; - анализ расходов и прибыли от разработки; - подготовку плана разработки ЭС.

Задачи, подходящие для решения с помощью ЭС, являются узкоспециализированными; не являются для эксперта ни слишком легкими, ни слишком сложными; время, необходимое эксперту для решения задачи, может составлять от трех часов до трех недель; условия исполнения задачи определяются пользователем ЭС; полученные результаты можно оценить.

2. Разработка прототипной системы. Прототипная система является усеченной версией ЭС, спроектированной для проверки жизнеспособности выбранного подхода к представлению фактов, связей и стратегий рассуждений эксперта. Разработка прототипной ЭС включает стадии:

- Идентификация проблемы. Уточняется задача и определяются необходимые ресурсы, источники знаний, аналогичные ЭС, цели и классы решаемых задач. Задача стадии – создание неформальной формулировки проблемы.

- Извлечение знаний. Получение когнитологом наиболее полного из возможных представления о предметной области и способах принятия решения в ней.

- Структурирование (концептуализация) знаний. Выявляется структура полученных знаний о предметной области, то есть определяются терминология, список основных понятий и атрибутов; отношения между понятиями; структура входной и выходной информации; стратегия принятия решений; ограничения стратегий. Задача стадии – разработка неформального описания знаний о предметной области в виде графа, таблицы, диаграммы или текста, которое отражает основные концепции и взаимосвязи между понятиями предметной области. Такое описание называется полем знаний Pz.

- Формализация. Строится формализованное представление концепции предметной области на основе выбранного языка представления знаний (ЯПЗ) или специального формализма с использованием логических методов, продукционных моделей, семантических сетей, фреймов. Задача стадии – разработка БЗ.

17

- Реализация. Создается прототип ИИС, включающий БЗ и остальные блоки (п. 2.1), при помощи одного из следующих способов: программирование на языках С++, Паскаль и др.; программирование на специализированных языках ЛИСП, ПРОЛОГ, SMALL TALK; использование инструментальных средств типа СПЭИС, ПИЭС, ART, J2; использование «пустых» ЭС GURU, ЭКСПЕРТ, ФИАКР. Задача стадии – разработка программного комплекса, демонстрирующего жизнеспособность подхода в целом.

- Тестирование. Прототип проверяется на удобство и адекватность интерфейсов ввода/вывода, эффективность стратегии управления, качество проверочных примеров, корректность БЗ. Задача стадии – выявление ошибок в подходе и реализации прототипа, выработка рекомендаций по доводке системы до промышленного образца. 3. Доработка прототипа до промышленной ИИС. Основное на

данном этапе заключается в добавлении большого числа дополнительных эвристик, которые увеличивают «глубину» ЭС. После установления основной структуры системы когнитолог приступает к разработке и адаптации интерфейсов, с помощью которых ЭС будет общаться с пользователем и экспертом.

4. Оценка ЭС. Оценку системы можно проводить исходя из различных критериев: критерии пользователей (понятность и «прозрачность» работы ЭС, удобство интерфейсов); критерии приглашенных экспертов (оценка советов-решений, предлагаемых системой; сравнение с собственными решениями; оценка подсистемы объяснений); критерии коллектива разработчиков (эффективность реализации, производительность, время отклика, дизайн, широта охвата предметной области, непротиворечивость БЗ, количество тупиковых ситуаций).

5. Стыковка системы. Под стыковкой понимается включение всех процедур, необходимых для успешной работы ЭС совместно с остальными системами, эксплуатируемыми в организации.

6. Поддержка системы. Поддержка ЭС предусматривает деятельность по ее совершенствованию и адаптации. При перекодировании ЭС на язык, подобный С, повышается быстродействие системы, увеличивается переносимость, однако гибкость ЭС уменьшается. Это приемлемо лишь в том случае, если ЭС сохраняют все знания проблемной области, и эти знания не будут изменяться. Однако если ЭС создана именно из-за того, что проблемная область изменяется, то необходимо поддерживать ЭС в ее инструментальной среде разработки.

18

Глава 3. Модели представления знаний

Знания – это хорошо структурированные данные, а данные – информация, полученная в результате наблюдений или измерений, отдельных свойств (атрибутов), характеризующих объект, процессы и явления предметной области [2,8]. В настоящее время разработаны различные модели представления знаний, которые сводятся к классам:

продукционные модели; формально-логические модели; фреймовые модели; семантические сети.

Продукционные и формально-логические модели относятся к классу модульных, т.е. оперируют отдельными элементами знаний (правилами, аксиомами предметной области). Фреймовые модели и семантические сети относятся к классу сетевых моделей, поскольку представляют возможность связывать фрагменты знаний через отношения.

3.1. Продукционная модель

Продукционная модель, или модель, основанная на правилах,

позволяет представить знания в виде конструкций типа «Если (условие), то (действие)». Под условием (антецедентом) понимается некоторое предложение – образец, по которому осуществляется поиск в БЗ, а под действием (консеквентом) – действия, выполняемые при успешном исходе поиска. Они могут быть промежуточными, выступающими далее как условия, и терминальными (целевыми), завершающими работу системы.

Пример 3.1

Если «двигатель не заводится» и «стартер не работает», то «неполадки в системе электропитания стартера».

Антецедент и консеквент формируются из атрибутов (двигатель, стартер) и значений (не заводится, не работает).

Пример 3.2

Если «матрица значений регрессоров мультиколлинеарна» и «сокращение числа регрессоров невозможно», то необходимо «использование для построения линейной модели метода гребневой (ридж) регрессии» [9].

В данном случае атрибутами являются матрица значений регрессоров и число регрессоров, а значениями – мультиколлинеарность, и сокращение невозможно.

19

В рабочей памяти продукционной системы хранятся пары «атрибут – значение», истинность которых установлена в процессе решения конкретной задачи к некоторому текущему моменту времени. Содержание рабочей памяти изменяется в процессе решения задачи, что происходит по мере срабатывания правил. Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти, с образцом правила имеет место совпадение. Для представления реальных знаний используются описания с помощью триплета «объект – атрибут – значение». С введением триплета правила из БЗ могут срабатывать более одного раза в процессе одного логического вывода, поскольку одно правило может применяться к различным объектам.

Существует два типа продукционных систем – с прямым и обратным выводом. Прямой логический вывод реализует стратегию от фактов к заключению или от данных к поиску цели. При обратном выводе выдвигаются гипотезы, которые могут быть подтвержены или опровергнуты на основании фактов, поступающих в рабочую память.

Продукционная модель представления знаний используется более чем в 80% ЭС [8], поскольку обладает наглядностью, высокой модульностью, легкостью внесения дополнений и изменений, простотой логического вывода. К недостаткам продукционных моделей следует отнести отличие от структуры знаний, свойственной человеку; неясность взаимных отношений правил; сложность оценки целостного образа знаний; низкую эффективность обработки знаний. В настоящее время имеется большое число программных средств (ПС), реализующих продукционный подход по построению БЗ, например языки высокого уровня CLIPS, OPSS, «пустые» ЭС EXSYS, Kappa, GURU, инструментальные системы KEE, ARTS, PIES.

3.2. Формально-логическая модель

Формализация знаний основана на системе исчисления предикатов

первого порядка, которая в свою очередь основывается на исчислении высказываний. Высказыванием называется предложение, принимающее только два значения: истина или ложь. Например: «Иван студент». Из простых высказываний с помощью слов: и, или, не, если – то, могут формироваться более сложные высказывания.

Иван студент и Татьяна студентка; Иван студент или Татьяна студентка.

Логика высказываний оперирует логическими связями между высказываниями, то есть решает вопросы типа:

Можно ли на основе высказывания А получить высказывание В? Истинно ли высказывание В при истинности высказывания А?

20

Элементарные высказывания, т.е. те, которые нельзя разделить на частичные, могут рассматриваться как переменные логического типа, над которыми разрешены следующие логические операции: отрицание (┐); конъюнкция, или логическое умножение (٨); дизъюнкция, или логическое сложение (٧); импликация (→); эквивалентность (↔). Исчисление высказываний позволяет формализовать лишь малую часть множества рассуждений, поскольку этот аппарат не позволяет учитывать внутреннюю структуру высказывания, которая существует в естественных языках.

Пример 3.3. Пусть сформулированы следующие высказывания:

P: Все люди смертны; Q: Сократ – человек; R: Сократ – смертен.

Можно составить формулу (P٨Q) → R.

Однако эта формула не является общезначимой, поскольку относится только к Сократу. Кроме того, высказывание R не выводится из P и Q, то есть при его отсутствии невозможно записать импликацию. Для достижения общезначимости Q необходимо разделить на две части: «Сократ» (субъект) и «человек» (свойство субъекта), что можно записать в виде некоторой функции:

человек (Сократ) или в общем случае

человек (x) Такая запись имеет внутреннюю структуру, т.к. значение

высказывания является функцией его компонент, не является элементарным высказыванием и называется предикатом первого порядка.

Исчисление предикатов первого порядка – это формальный язык,

используемый для представления отношений между объектами и для выявления новых отношений между объектами на основе существующих [7,10]. Алфавит языка исчисления предикатов первого порядка включает переменные, константы, предикаты, логические операции, функции, кванторы ( , ). Конструкцией предложений в языке исчисления предикатов первого порядка управляют синтаксические правила.

Терм – это переменная, константа или результат применения функции к терму, например, a, x, f (x). Предложения языка исчисления предикатов первого порядка есть формулы, определенные следующим образом: 1. Если P – n-арный предикат (предикат от n аргументов) и t1, t2, …, tn –

термы, тогда P (t1, t2, …, tn) – атомическая формула (атом). 2. Атом – это правильно построенная формула. 3. Если F1 и F2 – атомы, то F1 ٨ F2, F1 ٧ F2, F1 → F2, ┐F1 – тоже атомы.

21

4. Если F – формула и x – не связанная квантором переменная в F, тогда x (F) и x (F) – также атомы.

Чтобы избежать неоднозначности, необходимо определять формулы, в которых все переменные квантованы, т.е. связаны кванторами, например, x y ЛЮБИТ (x,y).

Такая формула называется замкнутой. Замкнутая формула имеет единственное истинное значение. Формула y ЛЮБИТ (x,y) является незамкнутой, или открытой.

Для построения модели некоторой предметной области следует описать известные факты на языке логики предикатов и, используя ее результаты, построить систему, способную на основе имеющихся фактов строить некоторые новые предложения и отвечать на поставленные вопросы.

Пример 3.4. Пусть заданы предикаты:

E (x) – «x» въезжает в страну; ٧ (x) – «x» высокопоставленное лицо; S (x,y) – «y» обыскивает «x»; C (y) – «y» - таможенник; P (x) – «x» способствует провозу наркотиков.

Тогда произвольные предложения на естественном языке могут быть записаны в виде:

1. Таможенники обыскивают всех, кто въезжает в страну, кроме высокопоставленных лиц:

x (E (x) ٧ ┐ ٨ (x) → (y (S (x,y) ٨ C (y)))). 2. Некоторые люди, въезжавшие в страну и способствовавшие провозу

наркотиков, были обысканы исключительно людьми, способствовавшими провозу наркотиков:

x (E (x) ٨ P (x) ٨ ( y (S (x,y) → P (y)))). 3. Никто из высокопоставленных лиц не способствовал провозу

наркотиков: x (P (x) → ┐ ٧ (x)).

4. Некоторые таможенники способствуют провозу наркотиков: x (P (x) ٨ C (x)).

Задача состоит в том, чтобы, признав фактами предложения 1, 2, 3, доказать, что предложение 4 является истинным.

Для машинного решения вышеприведенной задачи используется

методика автоматического формирования суждений, или метод дедукции. При этом последовательно реализуются процедуры: исключение знаков импликации; ограничение области действия знака отрицания; переименование переменных; вынесение кванторов в начало формулы; исключение кванторов и др. При автоматизации вывода доказательств

22

методами исчисления предикатов требуется определить ряд процедур для выбора правил, позволяющих предотвратить «комбинаторный взрыв» и обеспечить проведение немонотонных рассуждений [11]. Решением стало создание декларативных (непроцедурных) языков программирования, в частности Пролога. Программирование на Прологе состоит из этапов: объявление некоторых фактов об объектах и отношениях между ними; определения некоторых правил об объектах и отношениях между ними; формулировки вопросов об объектах и отношениях между ними. Реально исчисление предикатов первого порядка в промышленных ЭС

практически не используется. Формально-логическая модель представления знаний применима в основном в исследовательских системах, т.к. предъявляет очень высокие требования и ограничения к предметной области [8].

3.3. Фреймовая модель

Термин «фрейм» (англ. frame – каркас, рамка) был предложен

Марвином Минским в 70-е годы XX века для обозначения структуры знаний при восприятии пространственных сцен. Фрейм – это абстрактный образ для представления стереотипа объекта, понятия или ситуации [8]. В психологии и философии известно понятие абстрактного образа. Например, произнесение слова «комната» порождает образ жилого помещения (стены, потолок, пол, дверь, окна). Из этого описания ничего нельзя убрать, но есть слоты – незаполненные значения некоторых атрибутов (количество окон, высота потолков, цвет стен). В теории фреймов такой образ называется фреймом комнаты [12].

Различают фреймы-образцы (прототипы), хранящиеся в БЗ, и фреймы-экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний через фреймы-структуры (заем, залог), фреймы-роли (клиент, менеджер), фреймы-сценарии (банкротство, собрание акционеров), фреймы-ситуации (тревога, авария).

Структура фрейма представляется как список свойств: (имя ФРЕЙМА:

(имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота),

… (имя N-го слота: значение N-го слота)).

При описании предметной области для классов задач структурно-параметрической идентификации, прогнозирования временных рядов, распознавания образов используются классификационные фреймы (КФ) и фреймы-смысловые связки (ФСС) [9].

23

В нормальных формах Бэкуса – Науэра КФ определяется следующим образом:

<КФ>::=<идентификатор><имя фрейма>:=<список классификаций> <список классификаций>::={[<поле>:]}<классификация> <поле>::=<идентификатор> <классификация>::={<вариант>} <вариант>::=<идентификатор>{<условие><альтернатива>}|<иденти-

фикатор> <альтернатива> <альтернатива>::=<текст>{<указание>} <указание>::=<ссылка на фрейм>|<описание фрейма>|<принуди-

тельное разрешение фрейма> Пример 3.5. Применительно к предметной области регрессионного

анализа КФ имеет вид: К0 <цель исследования>:=

V1 <регрессионный анализ данных> К1 <этапы решения задачи>:=

V1 <предварительный анализ исходных данных> V2 <структурно-параметрическая идентификация регрессионных

моделей> V3 <оценка качества регрессионных моделей>

К2 <предварительный анализ исходных данных>:= V1 <анализ корректности исходных данных> V2 <проверка условий применимости регрессионного анализа> V3 <функциональное преобразование матрицы регрессоров>

К7 <оценка качества регрессионных моделей>:= V1 <для К6 = 1 ٧ К6 = 4> V2 <для мультипликативных моделей> V3 <для нелинейных нереализуемых моделей>

ФСС определяется конструкцией

<ФСС>::=<идентификатор><входной аргумент> <глагол> <выходной аргумент>

Пример 3.6. Применительно к предметной области регрессионного

анализа ФСС имеет вид [9]: C0 <начало работы> требует

A <обеспечить ввод исходных данных> B <назначить режим работы>

C1 <предварительный анализ исходных данных> A <восстановление отсутствующих значений> B <исключение аномальных значений отклика> C <проверку значений отклика на нормальность распределения>

24

D <проверку значений отклика на статистическую независимость> E <проверку матрицы регрессоров на мультиколлинеарность>

. . . C3 <оценка качества регрессионных моделей> требует

A (если К7 = 1, то) А1 <проверку нормальности распределения значений остатков> А2 <проверку статистической независимости значений

остатков> . . .

С (если К7=3, то) С1 <вычисление F-статистик> С2 <визуальный анализ значений остатков>

Множество КФ и ФСС служат основой для построения фрейм-фраз,

совокупность которых образует семантическую модель предметной области.

В качестве значения слота может выступать имя другого фрейма, так образуются сети фреймов (рис. 3.1).

Рис. 3.1. Сеть фреймов

Существует несколько способов получения слотом значений во

фрейме-экземпляре: - по умолчанию от фрейма-образца; - через наследование свойств от фрейма, указанного в слоте АКО

(«это»); - по формуле, указанной в слоте; - через присоединенную процедуру; - явно из диалога с пользователем; - из БД.

25

Важнейшим свойством теории фреймов является наследование свойств по АКО-связям. Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся, значения аналогичных слотов. В общем случае на наследование свойств ориентируют указатели наследования:

U – уникальный, показывает, что значение не наследуется; S – показывает, что значение слота наследуется; R – показывает, что значения слота должны находиться в пределах

значений, указанных в одноименных слотах родительского фрейма; O – выполняет одновременно функции U и S (при отсутствии значения

наследуется, в противном случае не наследуется). Тип значения слота показывают указатели типа данных: frame

(указатель на фрейм), real, integer, boolean, text, list, table. Демон – это процедура, автоматически запускаемая при выполнении

некоторого условия. Демоны запускаются при обращении к соответствующему слоту. Демон IF-NEEDED запускается, если в момент обращения к слоту его значение не было установлено. Демон IF-ADDED запускается при попытке изменения значения слота. Демон IF-REMOVED запускается при удалении значения слота.

Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность [8]. Фреймовый подход реализуется на основе специальных языков представления знаний FRL, KRL, фреймовая «оболочка» Карра.

3.4. Семантические сети

Семантика – это наука, устанавливающая отношения между

символами и объектами, которые они обозначают, т.е. наука, определяющая смысл знаков.

Семантическая сеть – это ориентированный граф, вершины которого – понятия, а дуги – отношения между ними.

В качестве понятия выступают абстрактные или конкретные объекты, а отношения – это связи типа: «принадлежит», «имеет частью», «это». Можно предложить несколько классификаций семантических сетей, связанных с типами отношений между понятиями. По количеству типов отношений: однородные (с единственным типом отношений); неоднородные (с различными типами отношений). По типам отношений: бинарные, в которых отношения связывают два объекта; N-арные, в которых есть специальные отношения, связывающие более двух понятий.

Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

- класс – элемент класса (цветок – роза);

26

- свойство – значение (цвет – красный); - пример элемента класса (роза – чайная).

Наиболее часто в семантических сетях используются отношения: - атрибутивные связи – «иметь свойство» (память – объем); - часть – целое – «имеет частью» (велосипед – руль); - функциональные связи – «производит», «влияет»; - количественные – «больше», «меньше», «равно»; - пространственные – «далеко», «близко», «за», «под», «над»; - временные – «раньше», «позже», «в течение»; - логические связи – «и», «или», «не».

Фрагмент семантической сети приведен на рис. 3.2 [8].

Рис. 3.2. Семантическая сеть

Недостатком этой модели является сложность организации вывода

на семантической сети. Эта проблема сводится к нетривиальной задаче поиска фрагмента сети, соответствующего некоторой подсети, отражающей поставленный запрос к БЗ.

Для реализации семантических сетей существуют специальные сетевые языки, например NET, SIMER+MIR.

27

Глава 4. Методы обработки знаний в интеллектуальных системах. Нечеткие знания

4.1. Интерпретатор правил и управление выводом

При использовании продукционной модели представления знаний БЗ

состоит из набора правил, а программа, управляющая перебором правил, называется интерпретатором правил, или машиной вывода. Интерпретатор правил – это программа, имитирующая логический вывод эксперта, пользующегося продукционной БЗ для интерпретации поступивших в систему данных [8].

Обычно он выполняет две функции: 1. Просмотр существующих данных из БД и правил из БЗ и

добавление в БД новых фактов. 2. Определение порядка просмотра и применения правил. Этот

механизм управляет процессом консультации, сохраняя для пользователя информацию о полученных заключениях, и запрашивает у него информацию, когда для срабатывания очередного правила в БД оказывается недостаточно данных. Механизм вывода представляет собой программу, включающую два

компонента: один реализует собственно вывод, а другой управляет этим процессом. Действие компонента вывода основано на применении правила, называемого modus ponens: «Если известно, что истинно утверждение А и существует правило вида «Если А, то В», тогда утверждение В также истинно». Таким образом, правила срабатывают, когда находятся факты, удовлетворяющие их левой части: если истинна посылка, то должно быть истинно и заключение. Компонент вывода должен функционировать даже при недостатке информации. Полученное решение может быть неточным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.

Управляющий компонент определяет порядок применения правил и выполняет четыре функции:

1. Сопоставление – образец правила сопоставляется с имеющимися фактами.

2. Выбор – если в конкретной ситуации могут быть применены сразу несколько правил, то из них выбирается одно, наиболее подходящее по заданному критерию (разрешение конфликта).

3. Срабатывание – если образец правила при сопоставлении совпал с какими-либо фактами из БД, то правило срабатывает.

4. Действие – БД подвергается изменению путем добавления в нее заключения сработавшего правила.

28

Интерпретатор правил работает циклически (рис.4.1).

Рис. 4.1. Цикл работы интерпретатора правил В каждом цикле интерпретатор правил просматривает все правила,

чтобы выявить те посылки, которые совпадают с известными на данный момент фактами из БД. После выбора правило срабатывает, его заключение заносится в БД, и цикл повторяется сначала. В одном цикле может срабатывать только одно правило. Если несколько правил успешно сопоставлены с фактами, то интерпретатор производит выбор по определенному критерию единственного правила, которое срабатывает в данном цикле. Совокупность отобранных правил составляет конфликтное множество. Работа интерпретатора правил зависит только от состояния БД и состава БЗ.

От выбранной стратегии решения зависит порядок применения и срабатывания правил. Процедура вывода сводится к определению направления поиска и способа его осуществления. Процедуры, реализующие поиск, обычно «зашиты» в механизм вывода, поэтому в большинстве систем когнитологи не имеют к ним доступа и, следовательно, не могут в них ничего изменить по своему желанию.

При разработке стратегии управления выводом важны: - исходная точка в пространстве состояний. От выбора этой точки

зависит метод осуществления поиска – в прямом или обратном направлении;

- метод и стратегия перебора – в глубину, в ширину, по подзадачам.

БД БЗ

Сопоставление

Конфликтное множество

Разрешение конфликта

Критерий выбора правил

Выполняемое правило

Действие

29

В системах с прямым выводом по известным фактам отыскивается заключение, которое из этих фактов следует. Прямой вывод часто называют выводом, управляемым данными. В системах с обратным выводом вначале выдвигается некоторая гипотеза, а затем механизм вывода как бы возвращается назад, переходя к фактам, пытаясь найти те, которые подтверждают гипотезу. Если она оказалась правильной, то выбирается следующая гипотеза, детализирующая первую и являющаяся по отношению к ней подцелью. Далее отыскиваются факты, подтверждающие истинность подчиненной гипотезы. Вывод такого типа называется управляемым целями. Существуют системы, в которых вывод основывается на сочетании упомянутых методов, – обратного и ограниченного прямого. Такой комбинированный метод получил название циклического.

Пример 4.1. Пусть имеется фрагмент БЗ из двух правил: П1: Если «отдых летом» и «человек активный», то «ехать в горы». П2: Если «любит солнце», то «отдых летом». Предположим, что в систему поступили факты – «человек активный»

и «любит солнце». Прямой вывод

Первый проход БЗ: Шаг 1. П1 не работает, поскольку не хватает данных «отдых

летом». Шаг 2. П2 срабатывает, в БД поступает факт «отдых летом».

Второй проход БЗ: Шаг 3. П1 срабатывает, активизируя цель «ехать в горы», которая

выступает как совет, который дает ЭС. Обратный вывод

Первый проход БЗ: Шаг 1. Цель – «ехать в горы»: пробуем П1-данных «отдых

летом» – нет. Они становятся новой целью, и ищется правило, где она находится в правой части.

Шаг 2. Цель «отдых летом»: правило П2 подтверждает цель и активизирует ее.

Второй проход БЗ: Шаг 3. Правило П1 подтверждает искомую цель.

В системах, БЗ которых насчитывают сотни правил, желательным

является использование стратегии управления выводом, позволяющей минимизировать время поиска решения и тем самым повысить эффективность вывода. К числу таких стратегий относятся поиск в глубину, поиск в ширину, разбиение на подзадачи и альфа-бета-алгоритм.

30

При поиске в глубину в качестве очередной подцели выбирается та, которая соответствует следующему, более детальному уровню описания задачи. При поиске в ширину вначале анализируют все факты (симптомы), находящиеся на одном уровне пространства состояний. Разбиение на подзадачи подразумевает выделение подзадач, решение которых рассматривается как достижение промежуточных целей на пути к конечной цели. Если удастся правильно понять сущность задачи и оптимально разбить ее на систему иерархически связанных целей-подцелей, то можно добиться того, что путь к ее решению в пространстве поиска будет минимален. Альфа-бета-алгоритм позволяет уменьшить пространство состояний путем удаления ветвей, не перспективных для успешного поиска. Потом просматриваются только те вершины, в которые можно попасть в результате следующего шага, после чего неперспективные направления исключаются. Данный алгоритм нашел широкое применение в системах, ориентированных на различные игры.

Основным механизмом вывода в ИИС с фреймовым представлением знаний является механизм наследования. Управленческие функции механизма наследования заключаются в автоматическом поиске и определении значений слотов фреймов нижележащих уровней по значениям слотов фреймов верхних уровней, а также в запуске присоединенных процедур и демонов. Присоединенная процедура запускается по сообщению, переданному из другого фрейма. Демоны и присоединенные процедуры являются процедурными, т.е. описывающими действия знаниями, объединенными вместе с декларативными, описывающими явления знаниями в единую систему. Процедурные знания являются и средствами управления выводом во фреймовых системах, причем с их помощью можно реализовать любой механизм вывода. Возможность организации механизмов вывода является существенным преимуществом фреймовых систем по сравнению с продукционными. Однако практически реализация фреймовых систем сопряжена со значительной трудоемкостью, а их стоимость на порядок выше продукционных.

Семантические сети – это общее название методов описания, использующих сети, ими же называют один из способов представления знаний. На основе сетей осуществляются выводы, однако для этого необходимы специальные алгоритмы. Поскольку семантические сети являются собирательным названием систем представления, использующих сети, нет смысла определять для них специфические алгоритмы выводов. Для каждого конкретного формализма определяются собственные правила вывода, поэтому усиливается элемент произвольности, вносимый человеком. Выводы, которые достаточно тщательно не проверены, таят в себе угрозу создания противоречий. Следовательно, в семантических сетях необходимо больше, чем в продукционных системах, уделять внимания

31

таким обстоятельствам, как устранение противоречий. Сама система такими возможностями не обладает, и потому во многих случаях эта функция возлагается на человека. Просматривая все знания, человек способен управлять их непротиворечивостью, однако если объем знаний будет увеличиваться, то их представление резко усложнится, чем ограничит круг решаемых проблем сравнительно небольшими проблемами [11].

4.2. Нечеткие знания и нечеткая логика

При формализации знаний существует проблема, затрудняющая

использование традиционного математического аппарата. Это проблема описания понятий, оперирующих качественными характеристиками объектов (много, мало, больно). Эти характеристики обычно размыты и не могут быть однозначно интерпретированы, однако содержат важную информацию. В задачах, решаемых ИИС, часто приходится пользоваться неточными знаниями, которые не могут быть интерпретированы как полностью истинные или ложные. Существуют знания, достоверность которых выражается некоторым значением, например 07. Таким образом, возникает проблема размытости и неточности. Для разрешения таких проблем в начале 70-х годов ХХ века Лотфи Заде предложил формальный аппарат нечеткой алгебры и нечеткой логики. В последующем это направление получило название «мягкие вычисления». Л. Заде ввел одно из главных понятий в нечеткой логике – лингвистическая переменная (ЛП). ЛП – это переменная, значение которой определяется набором вербальных (словесных) характеристик некоторого свойства. Например, ЛП «рост» определяется через набор {карликовый, низкий, средний, высокий, очень высокий}.

Значения ЛП определяются через нечеткие множества (НМ), которые в свою очередь определены на некотором базовом наборе значений или базовой числовой шкале, имеющей размерность. Каждое значение ЛП определяется как НМ, например «низкий рост».

НМ определяется через некоторую базовую шкалу В и функцию принадлежности НМ – μ(х), х В, принимающую значения на интервале [0;1]. Таким образом, нечеткое множество А – это совокупность пар вида (х, μ(х)), где х В. Часто используется такая запись:

n

i i

i

xx

А1

,

где хi – i-е значение базовой шкалы; n – число элементов НМ.

Функция принадлежности определяет субъективную степень уверенности эксперта в том, что данное конкретное значение базовой шкалы соответствует определяемому НМ. Эту функцию нельзя путать с

32

1 0,9 0,8 0,7 0,6 0,3 1 0,9 0,8 0,4 0,1

вероятностью, носящей объективный характер и подчиняющейся определенным математическим зависимостям.

Пример 4.2. Для двух экспертов определение НМ «высокая цена»

для ЛП «цена автомобиля» в условных единицах может существенно отличаться в зависимости от их социального и финансового положения.

«Высокая цена автомобиля 1 » = {50000/1 + 25000/0,8 + 10000/0,6 + + 5000/0,4};

«Высокая цена автомобиля 2 » = {25000/1 + 10000/0,8 + 5000/0,7 + + 3000/0,4}.

Пример 4.3. Пусть необходимо решить задачу интерпретации

значений ЛП «возраст», таких как «младенческий», «детский», «юный»,…, «старческий». Для ЛП «возраст» базовая шкала – это числовая шкала от 0 до 120. На рис. 4.2 отражено, как одни и те же значения В могут участвовать в определении различных НМ.

х

Рис. 4.2. Формирование нечетких множеств

При этом НМ определяются следующим образом:

«младенческий» =

3,0

56,0

47,0

38,0

29,0

111,0 ;

«детский» =

1,0

104,0

88,0

69,0

514 .

Таким образом, НМ позволяют при определении понятия учитывать субъективные мнения отдельных экспертов.

Для операций с нечеткими знаниями, выраженными при помощи ЛП,

существует много различных способов, которые являются в основном эвристическими и реализующими логику Заде или вероятностный подход.

0 1 2 3 4 5 6 7 8 9 10

Младенческий Детский

Возраст

33

Усиление или ослабление лингвистических понятий достигается введением специальных квантификаторов. Для вывода на НМ используются специальные отношения и операции над ними. В настоящее время в большинство инструментальных средств разработки систем, основанных на знаниях, включены элементы работы с НМ, кроме того, разработаны специальные ПС реализации нечеткого вывода, например «оболочка» Fuzzy CLIPS.

Для обработки нечетких знаний используется нечеткая логика, опирающаяся на теорию Байеса. Эта теория занимается условными вероятностями и входит в качестве раздела в классическую теорию вероятности. Методика разработана на основе утверждения, что «некоторое событие произойдет, потому что раньше уже произошло другое событие». Нечеткая логика играет ту же роль, что и двузначная (булева) логика в классической теории множеств. В общем случае вместо классических истинных значений «истина» и «ложь» рассматриваются классические величины, учитывающие различные степени неопределенности. Они могут принимать целый ряд значений: «верно», «неверно», «в высшей степени верно», «не совсем верно», «более или менее верно», «не совсем ошибочно», «в высшей степени ошибочно» и т.п.

Нечеткая логика имеет дело с ситуациями, когда и сформулированный вопрос и знания, которыми мы располагаем, содержат нечетко очерченные понятия. Однако нечеткость формулировки понятий является не единственным источником неопределенности, поскольку порой нет уверенности в самих фактах. Например, если утверждается: «Возможно, что студент Иванов сейчас находится на лекции по ИИС», то говорить о нечеткости понятия «студент Иванов» и «лекция по ИИС» не приходится. Неопределенность заложена в самом факте, действительно ли студент Иванов находится на лекции.

Теория возможностей является одним из направления в нечеткой логике, в котором рассматриваются точно сформулированные вопросы, базирующиеся на некоторых знаниях.

Пример 4.4. Пусть на занятии присутствуют 10 студентов и

известно, что несколько из них готовы ответить на вопросы преподавателя. Какова вероятность того, что преподаватель вызовет отвечать того, кто готов?

Обозначим искомую вероятность через Р. Просто вычислить искомое значение, основываясь на знаниях, что несколько студентов знают материал, нельзя.

Согласно теории возможности определяется понятие «несколько» как НМ:

«несколько» = {(3;0,2), (4;0,6), (5;1), (6;1), (7;0,6), (8;0,3)}

34

В этом определении выражение (3;0,2) означает, что 3 из 10 вряд ли можно признать как «несколько», а выражения (5;1) и (6;1) означают, что значения 5 и 6 из 10 идеально согласуются с понятием «несколько». В определении НМ не входят значения 1 и 10, поскольку интуитивно ясно, что «несколько» означает «больше одного» и не «все». Значение 9 не внесено в НМ, потому как 9 из 10 – это «почти все».

Распределение возможностей для Р рассчитывается по обычной формуле»

10""несколькоР ,

которая после подстановки дает Р = {(0,3;0,2), (0,4;0,6), (0,5;1), (0,6;1), (0,7;0,6), (0,8;0,3)}

Выражение (0,3;0,2) означает: что шанс на то, что Р = 0,3, составляет 20%. Р рассматривается как нечеткая вероятность. Глава 5. Теоретические основы инженерии знаний

5.1. Процедура извлечения знаний

Центральным понятием на стадиях получения и структурирования

знаний является «поле знаний» Pz (п. 2.1) – условное нормальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы эксперта в виде текста, графа, диаграммы или таблицы. Поле знаний представляет собой модель знаний о предметной области в том виде, в каком ее сумел выразить аналитик на некотором языке L, который должен обладать свойствами [2.8]:

максимальная точность – идеал точности, это язык математики, минимальная точность – естественный язык;

однозначность терминов; L либо символьный, либо графический язык.

Учение о символах получило название «семиотика». В последнее время сложилась новая ветвь – «прикладная семиотика». Семиотика включает: синтаксис – совокупность правил построения языка или отношения между знаками; семантику – связь между элементами языка и их значениями или отношения между знаками и реальностью; прагматику – отношения между знаками и их пользователями, отражает практические разработки и использования Pz.

При формировании Pz ключевым является сам процесс получения знаний, когда происходит перенос компетентности экспертов на когнитологов. Извлечение знаний – это процедура взаимодействия эксперта с когнитологом, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. При построении промышленной ЭС

35

процесс извлечения знаний является самым «узким» местом, поскольку приходится преодолевать трудности [2]: организационные неувязки; неудачный метод извлечения, не совпадающий со структурой знаний в данной области; неадекватная модель для представления знаний; неумение наладить контакт с экспертом; терминологический разнобой; отсутствие целостной системы знаний в результате извлечения только «фрагментов» знаний и т.д.

Процесс извлечения знаний – это длительная и трудоемкая процедура, когда когнитологу необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения.

Приобретение знаний представляет собой процесс наполнения БЗ экспертом с использованием специализированных программных средств при прямом контакте с ЭС.

Формирование знаний является процессом анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств [9]. Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификации и распознавания образов. Извлечение, приобретение и формирование знаний определяют три основные стратегии получения знаний (рис. 5.1) [2].

Рис. 5.1. Стратегии получения знаний

5.2. Основные аспекты извлечения знаний Процедура извлечения знаний включает психологический,

лингвистический и гносеологический аспекты. Психологический является ведущим, поскольку определяет успешность и эффективность взаимодействия когнитолога с экспертом.

С применением компьютера

Без применения компьютера

Формирование знаний

Приобретение знаний

Извлечение знаний

Структурирование Получение знаний

Идентификация проблемы

36

Извлечение знаний происходит через общение, которое является процессом выработки новой информации, общей для общающихся людей и рождающей их общность. Можно выделить следующие структурные компоненты модели общения при извлечении знаний: участники общения (партнеры); средства общения (процедура); предмет общения (знания). В соответствии с этой структурой выделяются три слоя психологических проблем, возникающих при извлечении знаний: контактный, процедурный и когнитивный.

Разработка проблематики контактного слоя позволила выявить параметры партнеров, влияющие на результаты извлечения знаний:

пол, возраст – хотя и влияют на эффективность контакта, но не являются критическими;

личность, под которой понимается устойчивая система психологических черт, характеризующая индивидуальность человека: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность, находчивость;

темперамент (холерик, сангвиник, меланхолик, флегматик). Известно, что флегматики и меланхолики медленнее усваивают информацию. Их не надо торопить с ответом, задавать быстрый темп диалогу. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации;

мотивация, которая определяет стремление к успеху. Когнитолог должен изыскать различные стимулы для эксперта, в т.ч. и материальные. Знания – один из самых дорогих продуктов, и их отторжение от эксперта должно быть вознаграждено.

Параметры процедурного слоя описывают непосредственно процесс процедуры извлечения знаний и являются по сути профессиональными:

ситуация общения определяется местом проведения бесед с экспертом, продолжительностью и временем их проведения. Желательно проводить беседы с экспертом наедине продолжительностью не более двух часов в первой половине дня;

оборудование включает вспомогательные средства (наглядный материал, средства протоколирования), освещенность, мебель;

профессиональные приемы когнитолога (темп, стиль, методы). Учет индивидуального темпа эксперта позволяет когнитологу снизить напряженность процедуры извлечения знаний. Лучше всего человек воспринимает предложения из 5-9 слов. Это письмо получило название Ингве-Миллера (мера «разговорности» речи). Большая часть информации поступает к когнитологу в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи, которая гораздо богаче и

37

многообразнее. При этом для передачи этой внутренней речи эксперт использует и невербальные средства (интонация, мимика, жесты). Методы извлечения знаний проанализированы ниже (п. 5.3). Наименее исследованы в настоящее время проблемы когнитивного слоя, связанные с изучением семантического пространства памяти эксперта и реконструкцией его понятийной структуры и модели рассуждений. Основными факторами, влияющими на когнитивную адекватность, являются:

когнитивный стиль, под которым понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека (поленезависимость, импульсивность, ригидность, когнитивная эквивалентность). Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи. Под импульсивностью понимается быстрое принятие решения в противоположность рефлексивности. Эксперту и когнитологу желательно быть рефлексивными. Ригидные люди не склонны менять свои представления и структуру восприятия, что для когнитологов нежелательно. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы;

семантическая репрезентативность Pz и концептуальной модели подразумевает подход, исключающий традиционное навязывание эксперту некой модели представления знаний, и заставляет когнитолога последовательно воссоздавать модель мира эксперта. Проблема семантической репрезентативности ориентирована на достижение адекватности Pz и концептуальной модели. Лингвистический аспект извлечения знаний касается исследований языковых проблем и включает 3 слоя;

«общий код» решает проблему «языковых ножниц» между профессиональной терминологией эксперта и обычным языком когнитолога, включая компоненты: общенаучная терминология, элементы бытового языка, неологизмы, профессиональный жаргон (рис.5.2). В дальнейшем «общий код» преобразуется в некоторую семантическую сеть, которая является прообразом Pz предметной области;

понятийная структура предполагает построение иерархической сети понятий, или «пирамиды знаний». Задача когнитолога на данном слое заключается в построении фрагментов БЗ «сшивания» терминов»;

38

словарь пользователя обеспечивает «прозрачность» и доступность ЭС для конечных пользователей.

Рис. 5.2. Структура «общего кода»

Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулирует некоторые закономерности из личного опыта. Инженерия знаний как наука дважды гносеологична – сначала действительность отражается в сознании эксперта, а затем опыт эксперта интерпретируется сознанием когнитолога в поле знаний, служащим основой построения ЭС. Гносеологическую цепочку можно представить в виде: факт обобщенный факт эмпирический закон теоретический закон. Основными методологическими критериями научности, позволяющими считать научным и само новое знание и способ его получения, являются:

внутренняя согласованность, определяющая характеристики эмпирического знания (модальность, противоречивость, неполнота). Модальность знания означает возможность его существования в различных категориях, т.е. в конструкциях существования и долженствования – часть закономерностей возможна, часть обязательна. Кроме того, необходимо различать такие оттенки модальности, как: эксперт знает, что…; эксперт думает, что…; эксперт хочет, чтобы…; эксперт считает, что… Противоречивость эмпирического знания – естественное следствие из основных законов диалектики, и противоречия должны разрешаться Pz, а напротив. именно противоречия служат чаще всего отправной

Общенаучные термины

Специальные термины

«Общий код» Специальная терминология

эксперта

Бытовой язык

Эксперт Когнитолог

39

точкой в рассуждениях эксперта. Неполнота знания связана с невозможностью полного описания предметной области;

системность ориентирует эксперта на рассмотрение предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, т.е. все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков), и наоборот, любые объекты можно рассматривать как элементы более высоких классов обобщений;

объективность является труднодостижимым методологическим критерием, поскольку процесс познания глубоко субъективен, т.е. существенно зависит от особенностей эксперта. Субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов. Следовательно, более корректно говорить о глубине понимания, чем об объективности знания;

историзм – этот критерий связан с развитием. Познание настоящего есть познание породившего его прошлого. Большинство ЭС дают «горизонтальный» срез знаний – без учета времени (в статике). Тем не менее когнитолог должен рассматривать изучаемые процессы с учетом временных изменений. Методологическая структура познания может быть представлена как

последовательность этапов: описание и обобщение фактов; установление логических и математических связей, дедукция и индукция законов; построение идеализированной модели; объяснение и предсказание явлений.

5.3. Методы извлечения знаний

По принципу источника знаний методы их извлечения делятся на

коммуникативные и текстологические. Коммуникативные методы – это набор приемов и процедур, предпочитающих контакт когнитолога с непосредственным источником знаний – экспертом, а текстологические включают методы извлечения знаний из документов и специальной литературы.

В свою очередь коммуникативные методы делятся на пассивные и активные. Пассивные методы извлечения знаний включают такие методы, где ведущая роль фактически передается эксперту, а когнитолог только фиксирует рассуждения эксперта во время работы по принятию решений. К этим методам относятся наблюдения, анализ протоколов «мыслей вслух» и лекции.

В процессе наблюдений когнитолог находится рядом с экспертом во время его профессиональной деятельности и протоколирует все его

40

действия. Эксперт максимально комментирует свои действия. Непременное условие этого метода – невмешательство когнитолога в работу эксперта. Наблюдения – один из распространенных методов извлечения знаний на начальных этапах разработки ЭС.

Протоколирование «мыслей вслух» отличается от наблюдений тем, что эксперт не просто комментирует, но и объясняет цепочку рассуждений при решении конкретной задачи. Основной трудностью при протоколировании «мыслей вслух» является принципиальная сложность для любого человека объяснить, как он думает, поскольку люди не всегда в состоянии достоверно описать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме, слабо коррелируют с их словесным описанием (например, различные процедурные знания типа «Как завязать галстук»). Обычно «мысли вслух» дополняются одним из активных методов для реализации обратной связи с экспертом.

Лекция является самым старым способом передачи знаний. Использование лекции для извлечения знаний целесообразно, если эксперт обладает лекторским мастерством. В процессе лекции когнитолог может задавать уточняющие вопросы. Как и другие пассивные методы, лекции используются для извлечения знаний на начальных стадиях разработки ЭС.

В активных методах извлечения знаний ведущая роль принадлежит когнитологу. Активные методы подразделяются на индивидуальные и групповые. Активные индивидуальные методы извлечения знаний в настоящее время являются наиболее распространенными и включают анкетирование, интервью, свободный диалог, игры с экспертом.

Анкетирование – наиболее жесткий метод (стандартизированный). Когнитолог заранее составляет вопросник и осуществляет опрос некоторых экспертов. Существует несколько общих рекомендаций при составлении анкет:

анкета не должна быть монотонной и однообразной; анкета не должна быть приспособлена к языку экспертов; поскольку вопросы влияют друг на друга, их последовательность

должна быть строго продумана; желательно стремиться к оптимальной избыточности; язык анкеты должен быть ясным, понятным, предельно вежливым.

Под интервью понимается специфическая форма общения когнитолога с экспертом, в которой когнитолог задает эксперту серию заранее подготовленных вопросов. В интервью когнитолог имеет возможность в зависимости от ситуации ряд вопросов опускать или вставлять новые, изменять темп, разнообразить ситуацию общения. По форме вопросы подразделяются на открытые (для ответа предоставляют полную свободу) и закрытые (предполагают фиксированные ответы), личные и безличные, прямые и косвенные, вербальные и с использованием

41

наглядного материала. По функции – на основные, зондирующие и контрольные, по воздействию вопросы подразделяются на нейтральные и наводящие.

Свободный диалог – это метод извлечения знаний в форме беседы когнитолога и эксперта. Диалог предполагает выбор правильного темпа и ритма беседы, поскольку при больших паузах эксперт отвлекается, а при высоком темпе быстро утомляются оба собеседника.

Игра с экспертом предполагает, что эксперт и когнитолог в моделируемой ситуации берут на себя некоторые роли, например «учитель» и «ученик». В процессе игры эксперт поправляет ошибки «ученика». Существуют следующие советы когнитологу по проведению индивидуальных игр: играть смело, нешаблонно; не навязывать игру эксперту, если он не расположен; в игре «не давить на эксперта» и не забывать цели игры.

К активным групповым методам извлечения знаний относятся «мозговой штурм», дискуссии за круглым столом и ролевые игры.

«Мозговой штурм», или «мозговая атака», – один из наиболее распространенных методов раскрепощения и активизации творческого мышления. Основная идея «штурма» – это отделение процедуры генерирования идей в замкнутой группе экспертов от процесса анализа и оценки высказанных идей. Как правило, «штурм» длится не более 40 минут с числом участников до 10 человек. Экспертам предлагается высказывать любые идеи на заданную тему (критика запрещена). Оценивает результаты группа экспертов, не участвовавшая в «штурме».

Метод круглого стола предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Задача дискуссии – коллективно, с разных точек зрения, под разными углами исследовать спорные гипотезы предметной области. По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменили тему и чтобы критика позиций друг друга была обоснованной.

Ролевые игры предусматривают участие в экспертной игре нескольких экспертов. Роль – комплекс образцов поведения. Когнитолог является режиссером и сценаристом, и ему предоставляется полная свобода в выборе формы проведения игры. Из трех основных типов деловых игр (учебных, планово-производственных и исследовательских) к экспертам ближе всего исследовательские, которые используются для анализа систем, проверки правил принятия решений.

Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении текстов. Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре

42

(смысловой структуре, или макроструктуре текста), настраиваемой над естественным текстом. При этом можно выделить две смысловые структуры (рис. 5.3):

М1 – смысл, который пытался заложить автор в текст, его модель мира; М2 – смысл, который постигает читатель, в данном случае когнитолог,

в процессе интерпретации I (понимания) текста; Т – результат вербализации V смысла М1.

Сложность процесса извлечения знаний из текста заключается в принципиальной невозможности совпадения знаний, образующих М1 и М2. Таким образом, два когнитолога извлекут из одного текста Т две различные модели.

Рис. 5.3. Схема извлечения знаний из специальных текстов

Сложность интерпретации научных и специальных текстов

заключается еще и в том, что любой текст приобретает смысл только в контексте, под ним понимается окружение, в которое «погружен» текст.

Методы извлечения знаний являются основой к структурированию знаний. Простейший прагматический подход к формированию Рz включает этапы:

1. Определение входных и выходных данных. 2. Составление словаря терминов и набора ключевых слов. 3. Выявление объектов и понятий, т.е. формирование полного

систематического набора терминов из области знаний. 4. Выявление связей между понятиями. 5. Выявление метапонятий и детализация понятий на более низком

уровне. 6. Построение пирамиды знаний – иерархической лестницы понятий,

подъем по которой означает углубление понимания и повышение уровня обобщенности понятий.

7. Определение отношений между понятиями как внутри каждого из уровней пирамиды, так и между уровнями.

М1 М2

Т

Эксперт Текст Когнитолог

43

8. Определение стратегий принятия решений, т.е. выявление цепочек рассуждений, связывающих все сформированные ранее понятия и отношения.

9. Структурирование Рz. Глава 6. Нейронные сети

6.1. Искусственный нейрон и функции активации

Биологический нейрон содержит сому (тело нейрона), совокупность

отростков – дендритов, по которым в нейрон поступают входные сигналы и отросток – аксон, передающий выходной сигнал нейрона другим нейронам. Точка соединения дендрита и аксона называется синапсом. Общее число нейронов в головном мозгу человека превышает 100 миллиардов, при этом один нейрон соединен более чем с 10 тысячами соседних нейронов. Время срабатывания нейрона составляет около одной миллисекунды, чуть меньше тратится на передачу сигнала между двумя нейронами. Таким образом, биологический нейрон – чрезвычайно медленный процессорный элемент, уступающий быстродействию современных компьютеров в миллионы раз. Тем не менее в целом мозг способен за доли секунды решать задачи, которые не может решить и суперкомпьютер (например, узнать лицо человека, показанное в непривычном ракурсе).

Искусственным нейроном называется простой элемент в виде следующей структуры (рис.6.1) [1].

Рис. 6.1. Искусственный нейрон: ),...,,,( 321 nxxxxx вектор входных

переменных (дендритов); ),...,,,( 321 nwwwww вектор синаптических весов; S – сома; y – выход (аксон)

x1

x2

x3

…

xn

S y

wn

w1

w2

w3

44

Сначала вычисляется взвешенная сумма V входных переменных (скалярное произведение):

.1

n

iii xwxwV

Затем полученная сумма (потенциал нейрона) сравнивается с

заданной пороговой величиной W0. Если VW0, то нейрон «не срабатывает», в противном случае вычисляется функция активации (решающая функция) f . При этом

)(Vfy .

Величину порогового барьера можно рассматривать как еще один

весовой коэффициент при постоянном входном сигнале. Функции активации могут быть различных видов: линейная,

ступенчатая, линейная с насыщением, многопороговая. Наиболее распространенной является сигмоидная функция с выходными значениями в интервале (0,1):

VVf

exp11

или в интервале (-1,1):

1exp

1exp)(

VVVf

.

Коэффициент определяет крутизну сигмоида. Поскольку сигмоидная функция является гладким отображением )1,0();( , крутизну можно учесть через величины весов и порогов, и без ограничения общности можно полагать = 1. Чтобы учесть особенности конкретной задачи, могут быть выбраны различные другие функции активации – гауссова, синусоидальная, всплески и т.д.

6.2. Нейронные сети с прямой связью

Нейронная сеть представляет собой совокупность большого числа нейронов, топология соединения которых зависит от типа сети. Нейронные сети с прямой связью состоят из статических нейронов, так что сигнал на выходе сети появляется в тот же момент, когда подаются сигналы на вход. Наиболее общий тип архитектуры сети получается в случае, когда все нейроны связаны друг с другом, но без обратных связей (рис. 6.2).

45

Рис. 6.2. Нейронная сеть с прямой связью и одним скрытым слоем

Каждому нейрону соответствует свой вектор синаптических весов mjWWWW njjjj ,1,,...,, 21 , множество которых образуют синаптическую матрицу mnWW dim: . Связь с нейронами выходного слоя определяет синаптическая матрица kmWW ** dim: , где m – число нейронов скрытого слоя, k – число нейронов выходного слоя.

Число нейронов скрытого слоя неограниченно возрастает при увеличении точности решения задачи. На практике рекомендуется выбирать m = (n + k)/2.

Согласно теоретическим результатам, нейронные сети с прямой связью и с сигмоидными функциями активации являются универсальным средством для аппроксимации различных функций. Любую многослойную сеть можно трансформировать в однослойную без потери информации путем пересчета синаптических матриц.

Применение нейронных сетей целесообразно для решения задач моделирования, прогнозирования, распознавания образов, если:

- отсутствует алгоритм или неизвестны принципы решения задач, но накоплено достаточно большое количество примеров;

- задача характеризуется большим объемом входной информации; - входные данные неполны, зашумлены и противоречивы.

Характер разработок в области нейронных сетей принципиально отличается от ЭС: последние построены на правилах типа «если …, то…», которые вырабатываются на основе формально-логических структур. В основе нейронных сетей лежит преимущественно-поведенческий подход к решаемой задаче: сеть «учится на примерах» и подстраивает свои

f

f

f

f

f

f

S1 S2 … Sm

…

…

y1* y2

* ym*

x1 x2 x3

y1 yk

xn

Выходные переменные

Нейроны выходного слоя

y2

Нейроны скрытого слоя

Входные переменные

46

параметры при помощи алгоритмов обучения через механизм обратной связи.

Пример 6.1. Пусть n=2, m=2,k=2. Порог возбуждения отсутствует,

Vf . Задана структура сети (рис.6.3).

Рис. 6.3. Структура нейронной сети с одним скрытым слоем

4;23;1

W , x1 = 1, x2 = - 1. Определить значения y1, y2.

Решение ;12121111 WxWxy .12221212 WxWxy

Пример 6.2. Пусть задана нейронная сеть с двумя скрытыми слоями

(рис. 6.4). Порог возбуждения отсутствует, Vf .

Рис. 6.4. Структура нейронной сети с двумя скрытыми слоями

4;23;1

W ,

1;32;4*W , x1 = - 1, x2 = 1.

S1

x1

y1 y2

x2

S2

S21

x1

y1 y2

x2

S22

S11 S12

y2* y1

*

47

Определить значения y1, y2 и преобразовать сеть в однослойную. Решение

;1212111*

1 WxWxy ;1222121

*2 WxWxy

;7*21

*2

*11

*11 WyWyy

;3*22

*2

*12

*12 WyWyy

Для преобразования нейронной сети в однослойную необходимо переопределить семантическую матрицу, т.е. вычислить новую матрицу Wп.

8;205;13

1;32;4

4;23;1*WWWП .

Самым важным свойством нейронной сети является ее способность

обучаться на примерах. Цель обучения состоит в настройке синаптических матриц.

6.3. Алгоритмы обучения нейронных сетей

На этапе обучения происходит вычисление синаптических коэффициентов в процессе решения нейронной сетью конкретных задач. Контролируемое обучение нейронной сети можно рассматривать как решение оптимизационной задачи. Ее целью является минимизация функций ошибок (невязок) на данном множестве примеров путем выбора значений весов W.

Известно два вида обучения: с учителем и без учителя. Обучение с учителем предполагает предъявление сети последовательности обучающих пар (Xi, Di), где Xi – обучающий пример, Di – эталон, который должен быть получен на выходе сети. Для каждого Xi вычисляется yi, который сравнивается с Di. Разница используется для корректировки синаптической матрицы. Обучение без учителя предполагает наличие только обучающих примеров Xi. Синаптическая матрица настраивается так, чтобы близким входным векторам соответствовали одинаковые результирующие векторы.

Процесс обучения можно рассматривать как дискретный процесс, описываемый конечно-разностными уравнениями. Большинство методов обучения используют идею Хэбба, смысл которой заключается в повторении заучиваемого примера. Синаптический вес увеличивается, если два нейрона – источник и приемник – активизированы. Наращивание веса определяется произведением уровней возбуждения двух нейронов, что можно записать так:

0001jiijij yyWW ,

48

где 10 ,ij

WW ij – значения веса связи от i-го нейрона к j-му на предыдущей итерации обучения и текущей; – скорость обучения ( 10 );

0iy – выход нейрона i, являющийся входом для j-го нейрона на 0-й

итерации; 0jy – выход нейрона j на 0-й итерации.

Процесс обучения нейронной сети рассматривается как задача минимизации некоторой функции F(W) min, где W – синаптическая матрица сети.

Для решения такой задачи могут использоваться различные методы нелинейного программирования: градиентный, квазиньютоновский случайный поиск и другие.

Общим для методов обучения сети является следующее: для некоторого начального состояния синаптической матрицы определяется направление уменьшения целевой функции F(W) и находится ее минимум в этом направлении. Для полученной точки опять вычисляется направление убывания функции и осуществляется одномерная оптимизация. В общем алгоритм можно представить как

,0001 tWW

где 0 величина шага на этапе 0;

0t направление поиска на этапе 0. Наиболее развитым методом обучения является алгоритм обратного

распространения. Каких-либо ограничений на количество слоев и топологию сети не накладывается. Единственное требование состоит в том, чтобы функция возбуждения была всюду дифференцируема. Как правило, используется сигмоидная (логистическая) функция. Алгоритм обратного распространения является методом обучения с учителем (рис. 6.5).

Рис. 6.5. Схема обучения нейронной сети с учителем

Нейросеть

Алгоритм обучения

…

…

ijW

Обучающий вектор Х

Выходной вектор

Эталонный вектор

y

D

49

Алгоритм обратного распространения представляет собой развитие

обобщенного дельта-правила и является алгоритмом градиентного спуска, минимизирующим суммарную квадратичную ошибку. Главная цель состоит в том, чтобы вычислить чувствительность ошибки сети к изменению весов.

Пусть нейронная сеть соответствует схеме на рис. 6.2. Тогда алгоритм обучения можно описать [6]:

1. Задать синаптические матрицы W, W*. 2. Для каждой обучающей пары (Xi, Di) выполнить действия:

подать на вход скрытого слоя очередной набор обучающих данных x ;

вычислить выход скрытого слоя *

y :

)(*

xFy ; вычислить выход выходного слоя:

)(*

yFy . 3. Рассчитать ошибки для выходного и скрытого слоев:

между полученными выходными величинами сети и эталонными величинами; для нейронов скрытого слоя.

Повторять шаги 2 и 3 до тех пор, пока ошибки не станут приемлемыми.

Пример 6.3. Пусть нейронная сеть соответствует схеме на рис. 6.2.

При этом n=2, m=2,k=1 (рис. 6.6). Обучающее множество x =(1;2), D=3. Необходимо обучить нейронную сеть складывать цифры 1 и 2. Все нейроны возбуждаются сигмоидной функцией. Заданы синаптические матрицы для скрытого слоя на первой итерации:

2,0;1,02,0;1,0

)1(W

и вектор для выходного слоя

1,02,0*

)1(W .

50

Рис. 6.6. Нейросеть с одним скрытым слоем Вычислим взвешенную сумму

].6,0;3,0[)1()1( WxV тогда

646,0;574,01

1;1

1)( 6,03,0)1(*

)1(

ee

VFy .

Взвешенный вход для выходного слоя ,179,0*

)1(*

)1(*)1( WyV

.1

1)( 179,0*)1()1(

eVFy

В то же время желаемое значение y(1), преобразованное функцией возбуждения

D = F(3) = 0,952. Поэтому среднеквадратическая ошибка (СКО):

.0828,0)952,0545,0(5,0 2 E Значения фактического выхода и желаемого не совпадают, поэтому

синаптические веса следует изменить. Для этого следует выяснить, каким образом повлияют эти изменения на величину ошибки. Анализ, согласно алгоритму обратного распространения, выполняют начиная с выходного слоя сети и продвигаясь к входу:

1) прежде всего выясняют, как влияют на ошибку сети изменения на выходе. Для этого достаточно определить скорость изменения ошибки при данном значении выхода. Скорость определяется с помощью производной. Дифференцирование выполняется по аргументу y(1).

.407,0952,0545,0)1()1(

DyyEEA

S2 S1

y1= 0,545

y2(1)*= 0,646 y1(1)

*= 0,574

x1(1)= 1 x2(1)= 2

51

Полученная реакция скорости изменения ошибки при данном значении выхода отрицательная, что указывает на необходимость увеличения значения на выходе; 2) определить, каким образом влияет на ошибку сети каждый из

входов выходного слоя. Для этого определим скорость изменения ошибки сети при изменении средневзвешенного входа выходного слоя V*

(1):

.06,0)1( *)1(

*)1(*

)1(

)1(

)1(*)1(

VVEAVy

yE

VEEQ

Значение EQ показывает, что скорость изменения ошибки в процессе изменения средневзвешенного входа выходного нейрона существенно ниже по сравнению со скоростью реакции сети на изменение ее выхода.

Каким образом влияет на ошибку сети каждый из входов выходного слоя, можно узнать, если результат предыдущего шага умножить на уровень активности нейрона, из которого эта связь исходит:

].039,0;034,0[]*;*[ )1(2)1(1 yEQyEQEW 3) для корректировки синаптических весов на второй итерации

алгоритма обучения следует вычислить

.139,0234,0

)1()2(

EWWW

Далее вычисляются поправочные коэффициенты EW для синаптической матрицы скрытого слоя и значения )2(W :

204,0110,0202,0105,0

)1()2( EWWW .

Второй прямой проход выполняется, чтобы определить, насколько рассматриваемая сеть близка к поставленной цели. В результате повторного просчета с синаптическими матрицами

)2()2( , WW получим

)2(y =0,564 и соответственно 0752,0)952,0564,0(5,0 2 E .

За n итераций нейронная сеть будет обучена. В [13] приведены результаты решения задачи по выбору

оптимального маршрута при перевозке крупногабаритных грузов на основе нейросетевых технологий. Для решения использован модуль Neural Analyser, входящий в состав пакета Deductor Professional [14].

52

Глава 7. Технология создания экономических советующих систем

7.1. Определение и виды информационных технологий Создаваемые ЭСС используются для информационной поддержки

лиц, принимающих решение. Решения характеризуются свойствами: - имеют многошаговый характер; - управленческие процессы протекают в условиях несогласованности

целей и интересов участников принятия решений. Большая часть решений направлена на урегулирование и разрешение внутрифирменных конфликтов;

- процессы, протекающие вне фирмы, характеризуются случайными событиями;

- экспертные знания профессионалов носят субъективный характер, что приводит к противоречиям при их интеграции в БЗ. ЭСС – это локальные системы, которые не требуют серьезных

средств для своего создания, ибо обычно пользуются поддержкой уже действующей на предприятии информационной системы. Поэтому можно воспользоваться технологией, специально созданной для разработки ЭСС, ориентированной на программные оболочки.

Рассмотрим основные понятия. Технология – связанная цепь процедур, а также система правил,

регламентирующая их выполнение. Информационная технология – связанная согласно правилам цепь

процедур, обеспечивающих информационное сопровождение процессов управления с помощью компьютера и средств коммуникаций. Существует три вида информационных технологий:

- предметная; - обеспечивающая; - функциональная.

Предметная технология – это последовательность процедур, выполняемых с целью обработки информации без привлечения компьютера.

Обеспечивающая ИТ (ОИТ) представляет собой ПС, ориентированные на некоторый класс задач, но не снабженные конкретными технологическими правилами их решения (пустые программные оболочки). ОИТ можно представить как

ОИТ = ОБ + ТС + П1,

где ОБ – программная оболочка; ТС – технологические средства; П1 – правила и ограничения наполнения и использования ОБ.

53

К ОИТ относятся: табличный и текстовый процессоры, гипертекстовые системы, экспертная система, СППР. ОИТ – это инструмент для пользователя.

Функциональная ИТ (ФИТ) – это ОИТ, наполненная правилами из предметной технологии и данными из предметной области. ФИТ можно представить в виде

ФИТ = ОБ + ТС + П1 + П2 + данные, где П2 – правила реализации ИТ.

7.2. Технология «Ресурс – Обучение – Цель» Технология «Ресурс–Обучение–Цель» (РОЦ-технология)

представляет собой совокупность процедур, выполнение которых на систематической основе позволяет создать ЭСС, удовлетворяющие главному требованию – не только помочь в принятии решений, но и обеспечить воплощение этого решения в жизнь [6].

Процедуры РОЦ–технологии ориентируются на представление целей лица, принимающего решение, в виде дерева решений.

Пример 7.1. Построить дерево целей для решения задачи

обеспечения высокого уровня стабильности предприятия (рис. 7.1).

Рис. 7.1. Дерево целей

Расщифровка вершин графа дерева целей приведена в табл. 1

Процедуры РОЦ-технологии можно разделить на три уровня: 1. Верхний уровень, базирующийся на дереве целей, обеспечивает

предварительное определение варианта принятия решения. 2. Средний уровень ориентируется либо на дерево решений, либо на

таблицу решений, либо на то и на другое одновременно. Задача данного уровня состоит в определении окончательного решения.

ФС

СС КИ ВЛ

ВОТА КФ КА КЗ КП КЛ КЛС

54

3. Нижний уровень предназначен для обеспечения исполнения принятого решения: интеллектуальная информационная поддержка.

Таблица 1

№

уровня Код цели

Цель № уровня

Код цели

Цель

2 СС Обеспечить эффективное использование собственных средств

2 КИ Создать благоприятный инвестиционный климат

1 ФС Обеспечить высокий уровень финансовой стабильности предприятия

2 ВЛ Обеспечить высокую ликвидность

3 ВОТА Снизить время оборота текущих активов

3 КФ Стабилизировать коэффициент финансирования

3 КА Увеличить коэффициент автономии

СС Обеспечить эффективное использование собственных средств

3 КЗ Уменьшить коэффициент задолженности

3 КП Повысить коэффициент покрытия

3 КЛ Повысить коэффициент ликвидности

2

ВЛ Обеспечить высокую ликвидность

3 КЛС Повысить коэффициент средней ликвидности

Выбор цели является исходной точкой в процессе принятия

решений. Ее знание позволяет приступить к процедурам подготовки информации и поиска альтернатив. Для этого следует выполнить этапы: Формулировка главной цели управления и подцелей, достижение

которых обеспечит реализацию идей лица, принимающего решения (ЛПР).

Определение ресурсов и резервов, имеющихся в распоряжении ЛПР, а также ограничений, накладываемых внешними условиями на их использование.

Формулировка альтернативных вариантов достижения главной цели и расчет возможных последствий для каждого из вариантов.

Выбор одного из решений в соответствии с критерием оценки ЛПР.

55

РОЦ-технология содержит четыре комплекса проектных процедур: 1. Формулирование цели создания ЭСС. 2. Разработка структур БЗ и БД. 3. Наполнение ЭСС знаниями. 4. Тестирование и внедрение ЭСС.

7.3. Определение коэффициента важности целей При построении ЭСС используется БЗ в виде дерева целей,

снабженное коэффициентами относительной важности и направлениями изменений каждой из вершин дерева. Числовая характеристика важности целей измеряется в шкале 0 1 и называется коэффициентом важности целей (КОВ) – относительный вес целей. Для измерения КОВ используются методы непосредственной оценки и последовательного парного сравнения.

Пусть имеется n целей niAi ,1, и выполнено их парное сравнение. Определим матрицу z, размерность которой z: dim z=n·m:

,,0,,1

ji

jiij AAесли

AAеслиz

т.е. 1ijz указывает на предпочтительность цели (не меньшую важность) по сравнению с другой. Тогда

n

i

n

jij

n

jij

i

z

zКОВ

1 1

1 . (7.1)

Пример 7.2. Пусть n=4: А1 – обеспечить повышение производительности труда, А2 – увеличить коэффициент сменности оборудования, А3 – увеличить обратную величину к стоимости установленного

оборудования, А4 – обеспечить повышение удельного веса машин и оборудования в

стоимости основных производственных фондов. Задана матрица Z

1000110011101111

z

Тогда в соответствии с (7.1) получим КОВ1=4; КОВ2=0,3; КОВ3=0,2; КОВ4 = 0,1.

56

Глава 8. Программный инструментарий разработки систем, основанных на знаниях

8.1. Цели и принципы технологии разработки

программных средств

Технология – это наука о мастерстве (технос – мастерство, логос – слово, наука). Под технологией программирования понимается совокупность знаний о способах и средствах достижения целей в области ПО. Изменения являются постоянным фактором разработки ПО. Для того чтобы преодолеть их разрушающий эффект, в качестве целей технологии разработки ПО принимаются следующие свойства ПС:

модифицируемость: необходимость возникает, чтобы отразить в системе изменение требований или чтобы исправить ошибки;

эффективность системы подразумевает, что при функционировании оптимальным образом используются имеющиеся в ее распоряжении ресурсы (время, память);

надежность системы означает, что она должна предотвращать концептуальные ошибки, ошибки в проектировании и реализации, ошибки, возникающие при функционировании системы;

понимаемость является мостом между конкретной проблемной областью и соответствующим решением. Для того чтобы система была понимаемой, она должна быть прозрачной. По мере выполнения работ необходимо придерживаться

определенного набора принципов, которые обеспечивают достижение поставленных целей:

абстракция – выделение существенных свойств с игнорированием несущественных деталей. По мере декомпозиции решения на отдельные компоненты каждый из них становится частью абстракции на соответствующем уровне. Абстрагирование применяется и к данным, и к алгоритмам. На любом уровне абстракции могут фиксироваться абстрактные типы данных, каждый из которых характеризуется множеством значений и множеством операций, применимых к любому объекту данного типа;

сокрытие (упрятывание) информации имеет целью сделать недоступными детали, которые могут повлиять на остальные более существенные части системы. Упрятывание информации обычно скрывает реализацию объекта или операции и позволяет фиксировать внимание на более высоком уровне абстракции. Сокрытие проектных решений нижнего уровня оберегает стратегию принятия решений верхнего уровня от влияния деталей. Абстракция и сокрытие информации способствует модифицируемости и понимаемости ПО;

57

модульность реализуется целенаправленным конструированием. Модули могут быть функциональными (процедурно-ориентированными) или декларативными (объектно-ориентированными). Связность модулей определяется как мера их взаимной зависимости. В идеале должны разрабатываться слабосвязанные модули;

локализация помогает создавать слабо связанные и весьма прочные модули. По отношению к целям технологии разработки ПО принципы модульности и локализации прямо способствуют достижению модифицируемости, надежности и понимаемости. Абстракция и модульность считаются наиболее важными

принципами, используемыми для управления сложностью систем ПО. Но они не являются достаточными, потому что не гарантируют получения согласованных и правильных систем. Для обеспечения этих свойств необходимо привлекать принципы единообразия, полноты и подтверждаемости.

8.2. Технология и инструментарий разработки

программных средств

Рис. 8.1. Общая структура типовой технологической системы поддержки разработки ПС

Новой ветвью в технологии разработки ПО является CASE-технология (Computer Aided Software Engineering). Первоначально CASE-

Подсистема отладки

СУБД

БД проекта

Подсистема документирования

Подсистема разработки и реализации

Документация

Спецификация, тесты

Подсистема управления

документиро-вания

58

технология появилась в проектах создания систем обработки данных. Все средства поддержки CASE-технологии делятся на две группы: CASE-Tool Kits и CASE-Work Benches. Русских эквивалентов нет, но первую группу называют «инструментальные сундучки» (технологические пакеты), а вторую – «станки для производства программ» (технологические линии) (рис.8.2).

Рис. 8.2. Типовая система поддержки CASE-технологии

Стиль программирования в ИИ-системах существенно отличается от стиля программирования с использованием обычных алгоритмических языков [9]. В табл. 2 приведены соответствующие сравнительные характеристики.

Таблица 2

Характеристики программирования

Программирование в ИИ-системах

Традиционное программирование

Тип обработки Символьная Числовая Методы Эвристический поиск Алгоритм Задание шагов решения Неявное Точное Искомое решение Удовлетворительное Оптимальное Управление и данные Перемешаны Разделены Знания Неточные Точные Модификации Частые Редкие

CASE-средства

Анализ и проектирование

Генерация года Сопровождение

Обработка экранных форм

Моделирование проектных решений

Прототипирова-ние

Обнаружение ошибок

Программирова-ние

Тестирование

Документирова-ние

Выполнение

Документаторы

Анализаторы программы

Реструкториза-торы

Подсистемы перепроектирования

Управление проектом

Проектирова-ние БД

Планирование

Контроль

Управление

Отчетность

перепроекти-рования

59

Разработка системы ИИ начинается с формирования полных непротиворечивых и однозначных требований. При проектировании используются принципы технологии разработки ПО: сокрытие информации, локализация и модульность. Система ИИ проектируется как композиция уровней. Любой уровень чувствителен лишь к нижестоящим уровням. Такое проектирование упрощает реализацию и тестирование системы ИИ.

Тестирование ПО ИИ отличается от тестирования обычных систем, так как для ИИ-систем характерно недетерминированное поведение вследствие использования стратегии разрешения конфликтов, зависящей от параметров периода исполнения программы. Поэтому единственным эффективным способом тестирования систем ИИ является прототипизация.

Фаза сопровождения, включающая выполнение самых различных модификаций системы, является важнейшим этапом процесса разработки любой системы, но имеет свою специфику для систем ИИ. Здесь БЗ наиболее динамичный компонент и меняется в течение всего жизненного цикла. Поэтому сопровождение ИИ-систем является сложной проблемой. Приобретение знаний ключевая задача во всех технологиях построения систем, основанных на знаниях. Производительность ИИ-систем находится в прямой зависимости от количества знаний, содержащихся в системе.

В области поддержки разработки ИИ-систем можно указать две тенденции:

* классический путь развития средств автоматизации программирования: автокоды => языки высокого уровня => языки сверхвысокого уровня => языки спецификаций. Условно эту тенденцию можно назвать восходящей стратегией в области создания средств автоматизации ИИ-систем;

* нисходящая тенденция связывается со специальными средствами, уже изначально ориентированными на определенные классы задач и методы ИИ. Эти тенденции, взаимно обогатив друг друга, должны привести к

созданию мощного и гибкого инструментария интеллектуального программирования. В настоящее время усилия концентрируются в следующих направлениях:

1. Разработка систем построения знаний (СПЗ) путем прямого использования широко распространенных языков обработки символьной информации и языков программирования общего назначения [2].

2. Расширение базисных языков ИИ до СПЗ за счет специализированных библиотек и ППП.

60

3. Создание языков представления знаний (ЯПЗ), специально ориентированных на поддержку определенных формализмов, и реализация соответствующих трансляторов с этих языков. До недавнего времени наиболее популярным языком реализации

ИИ-систем был ЛИСП, разработанный под руководством Дж. Маккарти в Стэнфорде в начале 60-х годов XX века. Это был язык, который должен был стать следующим за ФОРТАНом шагом на пути автоматизации программирования. К концу 80-х годов ЛИСП был реализован на всех классах ЭВМ от персональных до высокопроизводительных вычислительных систем. В настоящее время фирмами США, Японии, Западной Европы выпускаются ЛИСП-машины.

Параллельно с ЛИСПом разрабатывались другие языки обработки символьной информации СНОБОЛ, РЕФАЛ. СНОБОЛ стал одной из первых практических реализаций развитой продукционной системы. РЕФАЛ вобрал в себя лучшие черты языков обработки символьной информации, активно используется концепция поиска по образцу.

В начале 70-х годов XX века появился ПРОЛОГ, разработанный в Марсельском университете. В японском проекте вычислительных систем V поколения ПРОЛОГ был выбран в качестве базового языка для машины вывода. ПРОЛОГ удобен, если число отношений не слишком велико и каждое отношение описывается небольшим числом альтернатив. Механизмы вывода обеспечивают поиск решения на основе перебора возможных альтернатив и декларативного возврата из тупиков. ЛИСП, СНОБОЛ, РЕФАЛ и ПРОЛОГ – языки общего назначения для задач ИИ. Вместе с тем в рамках развития средств автоматизации ПС, ориентированных на знания, были языки, сыгравшие важную роль в эволюции основных языков ИИ. Языки, основанные на программировании поисковых задач, – ПЛЭНЕР, КОННАЙВЕР, функционируют в ЛИСП-среде, реализуют представление данных в виде поисковых структур, развитые методы сопоставления образцов, поиск с возвратами и вызов процедур по образцу.

В 70-х годах в ИИ сформировались концепции представления знаний на основе семантических сетей и фреймов. Характерными чертами разработанных языков KRL, FRL были двухуровневое представление данных (абстрактная модель предметной области в виде иерархии множеств понятий и конкретная модель ситуаций как совокупность взаимосвязанных экземпляров этих понятий); представление связей между понятиями и закономерностей предметной области в виде присоединенных процедур; семантический подход к сопоставлению образцов и поиску по образцу.

Одним из распространенных ЯПЗ стал OPS5 (Official Production Systems), который в начале 80-х годов претендовал на роль языка стандарта в области представления знаний для ЭС. OPS5 – один из самых

61

многочисленных на сегодняшний день ЯПЗ для ЭС, поддерживающий продукционный подход к представлению знаний. Модуль вывода решений в OPS5-системе состоит из трех блоков:

* отождествление, где осуществляется поиск подходящих правил; * выбор исполняемого правила из конфликтного множества правил; * исполнитель выбранного правила.

В OPS5 поддерживается единственная стратегия вывода решений – вывод, управляемый целями (обратный вывод).

В общем случае к ЯПЗ предъявляются требования: * наличие простых и мощных средств представления

сложноструктурированных и взаимосвязанных объектов; * возможность отображения описаний объектов на разные виды

памяти компьютера; * наличие гибких средств управления выводом, учитывающих

необходимость структурирования правил работы решателя; * «прозрачность» системных механизмов для программиста,

предполагающая возможность их доопределения и переопределения на уровне входного языка;

* возможность эффективной реализации. Следующим этапом в развитии инструментальных средств стала

ориентация на среды поддержки разработок ИИ-систем. Примерами инструментальных пакетов и систем оболочек служат EXSYS, GURU, однако наиболее распространенными являются ART, KEE, J2.

В середине 80-х годов система ART была одной из самых современных интегрированных сред, поддерживающих технологию проектирования систем, основанных на правилах. ART является пакетом разработчика. ART объединяет два главных формализма представления знаний: правила для процедурных знаний и фреймоподобные структуры для декларативных знаний. ART предлагает традиционные модели вывода: «от фактов к цели» и «от цели к фактам». Первые версии ART опирались на язык ЛИСП, последние – на язык С.

Главное отличие между формами представления знаний KEE и ART заключается в способе, которым эти интегрированные системы связывают фреймы и правила. KEE является средой, в основе которой лежат фреймы, а в ART – правила. Описание объектов и правил в KEE представляется в виде иерархии фреймов.

Инструментальная среда J2 является развитием ЭС реального времени PICON и самой мощной системой реального времени. Работает под управлением Windows NT, возможна работа с системой в режиме «клиент–сервер» в сети Internet. Основные функциональные возможности J2 связаны с поддержкой процессов слежения за множеством (порядка тысячи) одновременно изменяющихся параметров и обработкой из-менений в режиме реального времени; проверкой нештатных ситуаций на

62

управляемых объектах и принятием решений как в режиме ассистирования оператору, так и в автоматическом режиме. J2 является одной из первых инструментальных сред, поддерживающих разработку интегрированных ИИ-систем.

Системы Work Bench в контексте автоматизации программиро- вания – это интегрированные инструментальные системы, поддерживающие весь цикл создания и сопровождения программ. К основным характеристикам Work Bench-систем относятся:

* использование определенной технологии проектирования на протяжении всего жизненного цикла (ЖЦ) системы;

* вертикальная интеграция инструментальных средств, обеспечивающая связи и совместимость по данным между различными инструментами, используемыми на различных стадиях создания системы;

* горизонтальная интеграция модулей и методов, используемых на одной и той же стадии проектирования;

* сбалансированность инструментария, то есть отсутствие дублирующих компонентов, необходимость и достаточность каждого инструмента.

К Work Bench-системам относятся VITAL, KEATS, SHELLY. Глава 9. Интеллектуальные интернет-технологии

9.1. Интеллектуальные агенты

Проблематика интеллектуальных агентов и мультиагентных систем

(МАС) имеет почти 40-летнюю историю и сформировалась на основе результатов, полученных в рамках работ по распределенному ИИ (DAI), распределенному решению задач (DPS) и параллельному ИИ (PAI). Данная тематика интегрирует достижения в области компьютерных сетей и открытых систем, ИИ и информационных технологий [15].

Агент – это аппаратная или программная сущность, способная действовать в интересах достижения целей, поставленных перед ним владельцем или пользователем.

Таким образом, в рамках МАС-парадигмы программные агенты рассматриваются как автономные компоненты, действующие от лица пользователя.

Интеллектуальные агенты должны обладать следующими свойствами:

* автономность – способность функционировать без вмешательства со стороны своего владельца и осуществлять контроль внутреннего состояния и своих действий;

63

* социальное поведение – возможность взаимодействия и коммуникации с другими агентами;

* реактивность – адекватное восприятие среды и соответствующие реакции на ее изменения;

* активность – способность генерировать цели и действовать рациональным образом для их достижения;

* базовые знания – знания агента о себе, окружающей среде, включая других агентов, которые не меняются в рамках ЖЦ-агента;

* убеждения – переменная часть базовых знаний, которые могут меняться во времени, хотя агент может об этом не знать и продолжать их использовать для своих целей;

* цели – совокупность состояний, на достижение которых направлено текущее поведение агента;

* желания – состояния или ситуации, достижение которых для агента важно;

* обязательства – задачи, которые берет на себя агент по просьбе других агентов;

* намерения – то, что агент должен делать в силу своих обязательств. В зависимости от концепций, выбранных для организации МАС,

обычно выделяются три базовых класса архитектур: * архитектуры, которые базируются на принципах и методах работы со

знаниями; * архитектуры, основанные на поведенческих моделях типа «стимул–

реакция»; * гибридные архитектуры.

Архитектуру или агентов, которые используют только точное представление картины мира в символьной форме и принимают решения на основе формальных рассуждений и использования методов сравнения по образцу, принято определять как делиберативные (1-й подход).

Реактивными называются агенты и архитектуры, в которых функционирование отдельных агентов и всей системы осуществляется по правилам типа «ситуация–действие». При этом под ситуацией понимается потенциально сложная комбинация внутренних и внешних состояний (2-й подход).

Для решения реальных задач используются гибридные архитектуры. Развитие и внедрение программных агентов было бы невозможно без

опыта разработки открытых систем, которые характеризуются свойствами: * расширяемость/масштабируемость (возможность изменения набора

составляющих систем); * мобильность/переносимость (простота переноса ПС на разные

аппаратно-программные платформы);

64

* интероперабельность (способность к взаимодействию с другими системами);

* дружелюбность, легкая управляемость. Одним из результатов внедрения концепции открытых систем в

практику стало распространение архитектуры «клиент - сервер». В настоящее время выделяются следующие модели клиентсерверного взаимодействия:

«толстый клиент – тонкий сервер». Серверная часть реализует только доступ к ресурсам, а основная часть приложения находится на клиенте;

«тонкий клиент – толстый сервер». Модель активно используется в связи с распространением интернет-технологий. Клиентское приложение обеспечивает реализацию интерфейса, а сервер объединяет остальные части приложений. Мобильные агенты – это программы, которые могут перемещаться

по сети. Они покидают клиентский компьютер и перемещаются на удаленный сервер для выполнения своих действий, после чего возвращаются обратно.

Мобильные агенты являются перспективными для МАС, но в настоящее время нет единых стандартов их разработки, нерешенным остается ряд проблем, таких как легальные способы перемещения по сети, верификация агентов (защита от передаваемых по сети вирусов), соблюдение агентами прав частной собственности и сохранение конфиденциальности информации, которой они обладают, перенаселение сети агентами.

С точки зрения разработки и реализации МАС наиболее эффективными системами поддержки распределенных технологий являются DCOM, Java RMI, COBRA.

Основная ценность DCOM – предоставление возможности интеграции приложений, реализованных в разных системах программирования.

Java RMI-приложения обычно состоят из клиента и сервера. При этом на сервере создаются объекты, которые можно передавать по сети, либо методы, доступные для вызова удаленными приложениями, а на клиенте реализуются приложения, пользующиеся удаленными объектами. Отличительной чертой RMI является возможность передачи в сети не только методов, но и самих объектов, что обеспечивает в конечном счете реализацию мобильных агентов.

Основным преимуществом COBRA является интерфейс IDL, унифицирующий средства коммуникации между приложениями.

Агентом является все, что может воспринимать свою среду с помощью датчиков и воздействовать на нее с помощью исполнительных

65

механизмов (человек, робот, программа). Каждый агент может воспринимать собственные действия.

Выбор агентом действия в любой конкретный момент времени может зависеть от всей последовательности актов восприятия, наблюдавшихся до этого момента времени. Поведение агента может быть описано и с помощью функции агента, которая отображает любую конкретную последовательность актов восприятия на некоторое действие. Внешним описанием агента может служить таблица. Внутреннее описание состоит в определении того, какая функция агента реализуется с помощью программы агента, то есть конкретная реализация, действующая в рамках архитектуры агента.

В любой конкретный момент времени оценка рациональности действий агента зависит: - от показателей производительности; - знаний агента о среде, приобретенных ранее; - действий, которые могут быть выполнены агентом; - последовательности актов восприятия агента, которые произошли

до настоящего времени. Рациональный агент должен иметь способность к обучению и быть

автономным. Под проблемной средой агента понимается совокупность

показателей производительности, среда, исполнительные механизмы и датчики.

Пример 9.1. Проблемная среда водителя такси

Тип агента

Показатели производительности

Среда Исполнительные механизмы

Датчики

Водитель такси

Безопасная, быстрая езда в рамках правил, максимизация прибыли

Дороги, другие транспортные средства, пешеходы, клиенты

Рулевое упр., газ, тормоз, световые сигналы, звуковые сигналы, дисплей

Видеокамеры, ультразвуковой дальномер, система навигации, датчики двигателя

Программные агенты (программные роботы, софтботы) существуют

в сложных неограниченных проблемных областях. Например, софтбот для управления тренажером, имитирующим пассажирский самолет, морское судно или софтбот, предназначенный для просмотра источников новостей в Интернете и показа клиентам интересующих их сообщений. Интернет представляет собой среду, которая по своей сложности соперничает с физическим миром, а в число обитателей этой сети входит множество искусственных агентов.

66

Классификация вариантов проблемной среды: - полностью/частично наблюдаемая: полностью наблюдаемая, если

датчики фиксируют все необходимые данные; - детерминированная/стохастическая: если следующее состояние среды определяется текущим и действием агента, то среда

детерминированная; - эпизодическая/последовательная: в эпизодической среде опыт агента состоит из неразрывных эпизодов. Каждый эпизод включает в себя восприятие среды агентом, а затем выполнение одного действия (распознавание дефектных деталей), в последовательных средах агенту следует думать наперед (вождение машины, игра в шахматы); - статическая/динамическая: если среда может измениться в ходе принятия агентом решения, то она является динамической; - дискретная/непрерывная: игра в шахматы дискретная, вождение автомобиля – непрерывная; - одноагентная/многоагентная (мультиагентная): решение кроссворда, диагностика – одноагентная, игра в шахматы, вождение автомобиля – многоагентная. Задача искусственного интеллекта состоит в разработке программы агента, которая реализует функцию агента, отображая восприятия на действия. Предполагается, что программа должна работать в своего рода вычислительном устройстве с физическими датчиками и исполнительными механизмами. Эти компоненты составляют архитектуру агента: агент = архитектура + программа

Архитектура может представлять собой персональный компьютер или роботизированный автомобиль.

Существуют четыре основных вида программных агентов, которые лежат в основе почти всех интеллектуальных систем: - простые рефлексивные агенты; - рефлексивные агенты, основанные на модели; - агенты, действующие на основе цели; - агенты, действующие на основе полезности. Простейшим видом агента является простой рефлексивный агент, который выбирает действия на основе текущего акта восприятия, игнорируя всю остальную историю актов восприятия. Агент – пылесос: решения основаны только на информации о текущем местоположении и о том, содержит ли оно мусор. Наиболее эффективный способ организации работы в условиях частичной наблюдаемости состоит в том, чтобы агент отслеживал ту часть ситуации, которая воспринимается им в текущий момент. Это означает, что агент должен поддерживать внутреннее состояние, которое зависит от

67

предыстории. Для обеспечения возможности обновления внутренней информации о состоянии среды в программе агента должны быть закодированы знания двух видов. Во-первых, нужна информация о том, как изменяется внешняя среда независимо от агента. Во-вторых, требуется определенная информация о влиянии действий агента на среду. Знания о том, как работает среда, называются моделью мира. Агент, в котором используется такая модель, называется агентом, основанным на модели. Знаний о текущем состоянии среды не всегда достаточно для принятия решения. На перекрестке такси может ехать прямо, направо, налево. Правильное решение – место назначения клиента. То есть кроме текущего состояния агенту необходимо знать цель. Инструментом для выработки последовательности действий, позволяющих агенту достичь цели, являются поиск и планирование. Программа агента может комбинировать информацию о цели с информацией о результатах возможных действий. Такие агенты получили название агентов, действующих на основе цели. Функция полезности отображает состояние на вещественное число, которое обозначает соответствующую степень удовлетворенности агента. Полная спецификация функции полезности обеспечивает возможность принимать рациональные решения, если имеются конфликтующие цели (скорость и безопасность) или несколько целей, к которым может стремиться агент, но ни одна из них не может быть достигнута со всей определенностью. Такие агенты получили название агентов, действующих на основе полезности. Структура обучающего агента включает четыре концептуальных компонента. Обучающий компонент отвечает за внесение усовершенствований, производительный компонент обеспечивает выбор внешних действий. Обучающий компонент использует информацию обратной связи от критика с оценкой того, как действует агент, и определяет, каким образом должен быть модифицирован производительный компонент для того, чтобы он успешнее действовал в будущем. Задача генератора проблем состоит в том, чтобы предлагать действия, которые должны привести к получению нового и информативного действия. Процесс обучения в интеллектуальных агентах можно охарактеризовать как процесс модификации каждого компонента агента для обеспечения более точного соответствия этих компонентов доступной информации обратной связи и тем самым улучшения общей производительности агента.

68

9.2. Мультиагентные системы

Мультиагентные системы состоят из следующих компонентов: * множество системных единиц, в котором выделяется подмножество

активных единиц-агентов, манипулирующих подмножеством пассивных единиц-объектов;

* среда – некоторое пространство, в котором существуют агенты и объекты;

* множество задач (функций, ролей), которые поручаются агентам; * множество отношений (взаимодействий) между агентами; * множество организационных структур (конфигураций),

формируемых агентами; * множество действий агентов.

Возникновение, структура и динамика МАС как класса (сообщества агентов) определяются ситуацией взаимодействия агентов в зависимости от совместимости целей, уровня взаимных обязательств и ответственности, ограниченности ресурсов (рис. 9.1).

Рис. 9.1. Классификация МАС

Распределенный ИИ: МАС образуется для решения некоторой задачи.

Осуществляется централизованное управление и координация действий нескольких интеллектуальных агентов.

Децентрализованный ИИ: исследуется деятельность автономного агента в динамической многоагентной среде.

Искусственная жизнь: исследуются и моделируются процессы децентрализованного управления, эволюции, адаптации и кооперации в МАС, состоящей из большого числа реактивных агентов.

Основными направлениями в разработке МАС являются распределенный ИИ и искусственная жизнь.

Главная проблема в РИИ разработка интеллектуальных групп и организаций, способных решать задачи путем рассуждений, связанных с обработкой символов. Групповое интеллектуальное поведение образуется на основе индивидуальных интеллектуальных поведений, в связи с чем

МАС

Искусственная жизнь

Децентрализованный ИИ

Распределенный ИИ

69

необходимо согласование целей, интересов и стратегий отдельных агентов, координация их действий, разрешение конфликтов путем переговоров.

Системы РИИ определяются тремя основными характеристиками: * способ распределения задач между агентами; * способ распределения властных полномочий; * способ коммуникации агентов.

Искусственная жизнь (ИЖ) в большей степени связана с трактовкой интеллектуального поведения в контексте выживания, адаптации и самоорганизации в динамичной, враждебной среде. Глобальное интеллектуальное поведение всей системы рассматривается как результат локальных взаимодействий большого числа простых агентов. Основные положения:

* МАС – популяция простых и зависимых друг от друга агентов; * каждый агент самостоятельно определяет свои реакции на события в

локальной среде и взаимодействия с другими агентами; * связи между агентами являются горизонтальными, т.е. не существует

агента-супервизора, управляющего взаимодействием других агентов; * нет точных правил, чтобы определить глобальное поведение агентов; * поведение, свойства и структура на коллективном уровне

порождаются только локальными взаимодействиями агентов. В децентрализованных ИИ управление происходит только за счет

локальных взаимодействий между агентами. Наряду с распределенными знаниями и ресурсами описываются локальные задачи отдельных агентов, решаемые на базе локальных концептуальных моделей и локальных критериев.

В целом задачи агентов в МАС могут изменяться от чисто индивидуальных до совместных, а сами агенты – от узкоспециализированных до универсальных (автономных). По этим критериям можно выделить следующие ситуации взаимодействия агентов в МАС: сосуществование (автономные агенты, индивидуальные задачи); сотрудничество (автономные агенты, совместная задача); совместная работа (специализированные агенты, совместная задача), распределенная работа (специализированные агенты, индивидуальные задачи).

Типичная схема распределенного решения задач несколькими агентами включает этапы:

декомпозиция исходной проблемы на отдельные задачи (агент-субординатор);

распределение задач между агентами-исполнителями; решение подзадач; интеграция частных результатов (агент-интегратор).

ИЖ в узком смысле есть раздел теории и приложений МАС, где изучаются вопросы возникновения интеллектуального поведения на

70

основе локальных взаимодействий агентов. При этом сами агенты могут быть не обязательно интеллектуальными. Искусственный рой – множество агентов, способных взаимодействовать друг с другом, формировать и перестраивать функциональные паттерны (образы ситуации) и совместно решать различные задачи путем параллельных действий. Таким образом, рой представляет собой динамическую сеть взаимодействующих агентов, в которой происходят согласованное восприятие сигналов и воздействие на среду. Основные принципы формирования интеллекта роя: соседства; определения качества среды обитания; разнообразия ответных реакций в рое; устойчивости роя; адаптации.

ИЖ в широком смысле есть очень обширная междисциплинарная научно-техническая область, в которой проводятся работы по созданию и исследованию искусственных организмов и систем, реализующих принципы и механизмы организации живого.

9.3. Мультиагентные системы различного функционального назначения

Электронный магазин. Представляет собой программу, которая размещена на сервере. В электронной торговле участвуют агенты-продавцы и агенты-покупатели. Агенты действуют по поручению своих персональных пользователей. Агенты-продавцы стремятся продать товар по максимально возможной цене, а агенты-покупатели купить товар по минимальной цене. Оба вида агентов действуют автономно и не имеют целей кооперации. Электронный магазин регистрирует появление и исчезновение агентов и организует контакты между ними, делая их «видимыми» друг для друга. Поведение агента-продавца характеризуется следующими параметрами: - желаемая дата, до которой необходимо продать товар; - желаемая цена, по которой пользователь хочет продать товар; - минимально допустимая цена; - функция снижения цены во времени (линейная, квадратичная); - описание товара. Агент-покупатель имеет «симметричные» параметры: - крайний срок покупки товара; - желаемая цена покупки; - максимально приемлемая цена покупки; - функция роста цены во времени; - описание товара. Торги ведутся по схеме закрытого аукциона первой цены. Поведение агентов описывается простой моделью, в которой не используются знания

71

и рассуждения. Агент-продавец, получив от электронного магазина информацию о потенциальных покупателях, последовательно опрашивает их всех с целью принятия решения о возможности совершения сделки. Сделка заключается с первым агентом-покупателем, который готов дать за товар запрашиваемую цену. Продавец не может вторично вступить в контакт с покупателем, пока не опросит всех потенциальных покупателей. При каждом контакте агент-продавец ведет переговоры, предлагая начальную цену либо снижая ее. Агент-покупатель действует аналогичным образом, отыскивая продавцов товара и предлагая им свою цену покупки, которую он может увеличивать в процессе переговоров. Любая сделка завершается только в случае ее одобрения пользователем агента. Система для поддержки процессов принятия решений на предприятии по многокритериальной оценке инновационной деятельности. Общая схема принятия решений включает следующие этапы: - спецификация требований; - генерация решений; - оценка альтернатив; - выбор эффективного решения. Оценку решений проводит рабочая группа, которая состоит из руководителя, аналитика и экспертов. Руководитель формирует набор критериев, которые будут использоваться для оценки решений, подбирает состав экспертов, составляет график выполнения работ. Каждый эксперт работает по индивидуальному сценарию, предложенному руководителем. Аналитик, функции которого может выполнять руководитель, высказывает свое мнение о результатах работы, проведенной экспертами. Для поддержки группового процесса принятия решений используется метод анализа иерархий, который предусматривает: - формирование и согласование иерархической структуры показателей; - оценку и согласование качественных показателей проекта; - оценку и согласование важности показателей; - ранжирование альтернативных решений и согласование результатов. В решении этих задач участвует множество экспертов, поэтому на каждом этапе предусмотрены процедуры согласования их мнений. Ядром мультиагентной системы «Multi Expert» является менеджер знаний, использующий три внешних компонента: - информационную модель проблемной области в виде упорядоченного набора показателей качества решений; - средства программной поддержки; - множество типов пользователей. Для координации работы коллектива экспертов используется двухуровневый механизм согласования. Каждый из экспертов представлен агентом, в задачу которого входит оценка предлагаемых руководителем

72

альтернатив по заданному набору показателей качества. С помощью редактора знаний руководитель формирует задания экспертам и проводит анализ полученной от них информации. Задача координации поведения агентов возложена на агента-координатора. Результатом работы системы являются согласованные экспертные оценки, на основании которых проводится многокритериальное ранжирование альтернатив. Основные функции агентов Агент-руководитель: - предоставляет набор процедур для облегчения работы в распределенной системе; - вычисляет конечный результат на основании данных, полученных от других агентов; - отслеживает согласованность решения, вырабатываемого группой экспертов; - предоставляет средства визуализации результатов работы; - подготавливает сообщения агенту-координатору; - выполняет почтовые функции в распределенной среде. Агент-координатор: - поддерживает целостность БД на групповом уровне и вносит в БД необходимые изменения; - обеспечивает выполнение пошагового алгоритма принятия решения; - подготавливает диалоговые формы для информационного обмена через Интернет. Агент-эксперт: - поддерживает выполнение текущего шага задания; - готовит сообщения агенту-координатору; - поддерживает целостность локальных БД; - выполняет почтовые функции в распределенной среде. Работа агентов осуществляется следующим образом. Руководитель формирует задания, оперируя справочниками, содержащими знания об экспертах, показателях качества и решениях, требующих рассмотрения. Далее задание в виде входного сообщения Minp поступает агенту-координатору, определяющему состав изменений, которые необходимо сделать в БД на локальном уровне. Координатор с помощью предоставленного ему набора функций готовит информацию для всех агентов-экспертов рабочей группы. Агенты-эксперты выполняют задания, предназначенные для своих пользователей, анализируя поступившие от координатора сообщения Mij (j – номер эксперта), и отсылают ему ответные сообщения Moj. Агент-координатор собирает сообщения о готовности выполненных заданий от всех членов группы. При выполнении всего пакета заданий его состояние изменяется, и посылается сообщение агенту-руководителю Mout. Руководитель может выполнить проверку согласованности

73

экспертных суждений либо на основе вычислений, либо с помощью логического анализа предоставленной ему информации. Решение руководителя о степени согласованности суждений посылается агенту-координатору, который продвигает задание на следующий шаг или возвращает экспертов на предыдущий этап в целях достижения лучшей согласованности. МАС для поиска информации. В связи с быстрым развитием интернет-технологий возникла необходимость применения средств ИИ для поиска и обработки интернет-ресурсов. Применение МАС для решения задач сбора, поиска и анализа информации в глобальных сетях дает следующие существенные преимущества перед традиционными средствами обработки информации: - обеспечение доступа пользователя к сетевым протоколам в сети Интернет; - параллельное решение нескольких задач; - выполнение поиска информации после отключения пользователя от сети; - увеличение скорости и точности поиска, а также уменьшение загрузки сети за счет поиска информации непосредственно на сервере; - создание собственных баз информационных ресурсов, постоянно обновляемых и расширяемых; - реализация возможности сотрудничества между агентами, которая позволяет использовать накопленный опыт; - возможность автоматически корректировать и уточнять запросы, используя контекст и применяя модели пользователей. В настоящее время существует несколько коммерческих МАС, предназначенных для интеллектуального поиска и обработки информации в сети Интернет, в частности системы Autonomy и Web Compass. Недостатком их является слабая способность к обучению. Поэтому основные усилия по совершенствованию интеллектуальных систем информационного поиска в сети Интернет направлены на развитие моделей представления знаний, механизмов вывода новых знаний, моделей рассуждения и способов обучения агентов. Одним из успешных исследовательских проектов, выполненных в этом направлении, стал проект системы MARRI, разработанной для поиска Web-страниц, релевантных запросам в определенной предметной области. Для решения поставленной задачи система использует знания, представленные в виде онтологии, под которой понимается упорядоченное множество понятий предметной области.

74

Типы агентов системы MARRI: - агент пользователя (интерфейсный агент) обеспечивает интеллектуальное взаимодействие с пользователем, поддерживает

процесс формулирования запросов и представляет результаты поиска в виде списка URL или Web-страниц;

- агенты-брокеры двух типов: брокер типа URL предназначен для формирования списков

Интернет-адресов, поставляемых браузером (специальная клиентская программа, предназначенная для просмотра Web-узлов);

брокер типа HTML выполняет функции запоминания полученных Web-страниц и их распределения между агентами обработки текста;

- Интернет-агент (агент сети) обеспечивает считывание и анализ заданной страницы URL или Web-страницы (URL – автономная Java – программа с собственным сетевым адресом), выполняет обработку исключительных ситуаций (страница недоступна); - агент обработки текста сначала преобразует HTML-текст к представлению, с которым работают морфологический (морфология – часть языковой системы, объединяющая слова) и синтаксический анализаторы, а затем проводит семантический анализ Web-страниц для проверки их релевантности запросу на основе соответствующей онтологии.

Результат обработки текста представляется в виде синтаксического дерева, которое должно соответствовать

какому-нибудь фрагменту используемой онтологии. Каждый из агентов наделен специальными знаниями, которые используются для повышения эффективности поиска информации. Агенты способны взаимодействовать друг с другом, обмениваться информацией, контактировать с Web-браузерами, анализаторами естественного языка и онтологическими БД. Виртуальное предприятие. Создание виртуальных предприятий является одним из современных направлений бизнеса, которое в значительной мере стимулируется быстрым ростом информационных ресурсов и услуг, предоставляемых в сети Интернет. Кроме того, появлению виртуальных предприятий способствует сокращение времени жизненного цикла создаваемых изделий и повышение уровня их сложности, так как при этом возникает необходимость оперативного объединения производственных, технологических и интеллектуальных ресурсов. Еще одна немаловажная причина – ужесточение конкуренции на товарных рынках, стимулирующее объединение предприятий с целью выживания. Виртуальное предприятие можно определить как кооперацию юридически независимых предприятий, организаций и отдельных лиц, которые производят продукцию или услуги в общем бизнес-процессе.

75

Во внешнем мире виртуальное предприятие выступает как единая организация, в которой используются методы управления и администрирования, основанные на применении информационных и телекоммуникационных технологий. Целью создания виртуального предприятия является объединение производственных, технологических, интеллектуальных и инвестиционных ресурсов для продвижения на рынок новых товаров и услуг. Поскольку каждое реальное предприятие в рамках виртуального выполняет только часть работ из общей технологической цепочки, то при его создании решаются две главные задачи: - декомпозиция общего бизнес-процесса на компоненты (подпроцессы); - выбор рационального состава реальных предприятий – партнеров, которые будут осуществлять технологический процесс. Первая задача решается с применением методов системного анализа, а для решения второй могут применяться средства мультиагентных технологий. Задача оптимального распределения множества работ среди множества предприятий формулируется как задача о назначениях. Ее решение начинается с формирования множеств подпроцессов и потенциальных предприятий-участников. Затем строятся возможные отображения из множества участников на множество подпроцессов и делается выбор наиболее приемлемого отображения, которое соответствует конкретным назначениям предприятий на бизнес-процессы. Для этого можно использовать механизм аукциона. Пусть выделены бизнес-процессы А, В, С, Д, Е и участники-предприятия Р1, Р2, Р3, Р4, претендующие на их реализацию. Каждое из предприятий представлено интеллектуальным агентом, при этом Р1 выступает в роли инициатора создания виртуального предприятия (аукционера). Перед началом аукциона аукционер (менеджер) формирует БД и БЗ об участниках аукциона. Затем он выставляет на продажу отдельные бизнес-процессы, информация о которых представлена стартовой ценой и требованиями по заданному набору показателей. Каждый претендент выдвигает свои предложения по параметрам, которые он в состоянии обеспечить, и свою цену. Собрав и обработав эти предложения, аукционер с помощью некоторой модели рассуждения упорядочивает потенциальных претендентов с учетом собственной информации о них. После этого он принимает решение о выборе назначений или отвергает их и выдвигает новые предложения. Задача создания виртуального предприятия относится к задачам структурного синтеза сложных систем, удовлетворяющих заданным требованиям.

76

Глава 10. Новые тенденции инженерии знаний, хранилища данных и управление знаниями

10.1. Методы извлечения глубинных пластов экспертного знания

Большинство методов извлечения знаний не затрагивают их

глубинную структуру, а отражают лишь поверхностную составляющую знаний эксперта. Для увеличения глубинных пластов экспертного знания используют методы психосемантики – науки, возникшей на стыке когнитивной психологии, психолингвистики, психологии восприятия и исследований индивидуального сознания. Психосемантика исследует структуры сознания через моделирование индивидуальной системы знаний и выявление тех структур сознания, которые могут не осознаваться (латентные, имплицитные или скрытые) [2].

Основным методом экспериментальной психосемантики является метод реконструкции субъективных семантических пространств. В отличие от лингвистических методов, направленных на анализ текстов, отчужденных от субъекта, его мотивов и замыслов, психолингвистические методы обращаются непосредственно к испытуемому. Большинство из них связано с различными формами субъективного шкалирования. Перед испытуемым ставится задача оценить «сходство знаний» с помощью некоторой градуированной шкалы (0÷9), в результате исследователь получает численно представленные стандартизованные данные, поддающиеся статистической обработке.

В основе построения семантических пространств, как правило, лежит статистическая процедура (факторный анализ, многомерное шкалирование, кластерный анализ), позволяющая группировать ряд отдельных признаков описания в более емкие категории-факторы – построение концептов более высокого уровня абстракции. При геометрической интерпретации семантического пространства значение отдельного признака отображается как точка или вектор с заданными координатами внутри n-мерного пространства, координатами которого выступают выделенные факторы.

На основе получаемых методами психосемантики моделей можно проводить контроль знаний. Контроль структуры знаний проводится на основе сопоставления семантических пространств хороших специалистов и новичков. Степень согласованности семантических пространств будет определять уровень знаний новичка.

Построение семантического пространства обычно включает три этапа:

* Выбор и применение соответствующего метода оценки семантического сходства.

77

* Построение структуры семантического пространства на основе математического анализа полученной матрицы сходства.

* Идентификация, интерпретация выделенных факторных структур. Поиск смысловых эквивалентов для выделенных структур.

Многомерное шкалирование (МШ) – это математический инструментарий, предназначенный для обработки данных о попарных сходствах, связях или отношениях между анализируемыми объектами с целью представления этих объектов в виде точек некоторого координатного пространства. МШ используется для решения трех типов задач:

* поиск и интерпретация латентных (скрытых) переменных, объясняющих заданную структуру попарных расстояний (связей);

* верификация геометрической конфигурации системы анализируемых объектов в координатном пространстве латентных переменных;

* сжатие исходного массива данных с минимальными потерями в их информативности. В основе данного подхода лежит интерактивная процедура

субъективного шкалирования. Эксперту предлагается оценить сходство между различными элементами с помощью некоторой градуированной шкалы (0÷9, -2 ÷ +2). Мера близости между двумя объектами (i, j) – dij. Если dij такова, что большие значения соответствуют наиболее похожим объектам, то dij – мера сходства, в противном случае dij – мера различия.

Большинство методов извлечения знаний ориентировано на верхние вербальные уровни знания. Необходим косвенный метод, ориентированный на выявление скрытых предпочтений практического опыта или операциональных составляющих опыта. Таким методом может служить метафорический подход. Метафора (от гр. перенесение) – образное выражение, употребление слова в переносном смысле на основе сходства, сравнения. В настоящее время доказано:

* метафора работает как фильтр, выделяющий посредством подбора адекватного объекта сравнения определенные свойства основного объекта;

* метафора имеет целью не сообщить что-либо о данном объекте, т.е. ответить на вопрос «что это?», а призвать к определенному отношению к нему, указать на некоторую парадигму (от гр. пример, образец – совокупность общепризнанных предпосылок, определяющих конкретное научное исследование), говорящую о том, как следует вести себя по отношению к данному объекту;

* объект сравнения выступает в метафоре не по своему прямому назначению, не просто «лев» как представитель фауны, а воплощение силы, ловкости, могущества. Введение метафор – это некая игра, которая раскрепощает сознание

эксперта и, как все игровые методики извлечения знаний, является

78

хорошим катализатором трудоемких серий интервью с экспертом. Пример метафорической классификации языков программирования – мир животных (мир транспорта). При интерпретации удалось выявить такие латентные понятия и структуры, как «степень изощренности языка», «сила», «универсальность», «скорость». Полученные результаты в виде координатных пространств позволили выявить скрытые предпочтения экспертов и существенные характеристики объектов, выступающих в виде стимулов – «сила» языка С («слон»), скорость С++ («яхта»), «старомодность» Фортрана («телега»).

Среди методов когнитивной психологии – науки, изучающей то, как человек познает и воспринимает мир, других людей и самого себя, как формируется целостная система представлений и отношений конкретного человека, особое место занимает метод репертуарных решеток. Репертуарная решетка представляет собой матрицу, которая заполняется либо самим испытуемым, либо экспериментатором в процессе обследования или беседы. Столбцу матрицы соответствует определенная группа объектов (элементов). В качестве элементов могут выступать люди, предметы, понятия, звуки, цвета – все, что интересует психодиагноста. Строки матрицы конструкты. Конструкт – некоторый признак или свойство, по которому два или несколько объектов сходны между собой и, следовательно, отличны от третьего объекта или нескольких других объектов. Например, из трех элементов «диван», «кресло», «табурет» два элемента «диван», «кресло» выявляют конструкт «мягкость мебели». В процессе заполнения репертуарной решетки испытуемый должен оценить каждый элемент по каждому конструкту. Конструкты – не изолированные образования, они носят целостный характер. Элементы выбираются по определенным правилам так, чтобы они соответствовали какой-либо одной области и все вместе были связаны осмысленным образом (контекстом) аналогично репертуару ролей в пьесе. Изменяя репертуар элементов, можно «настраивать» методики на выявление конструктов разных уровней общности и относящихся к разным системам. Репертуарная решетка не всегда является матрицей в строгом смысле, так как элементы – не всегда числа, строки могут быть разной длины, матрица – непрямоугольного формата. Репертуарная решетка – это специфическая разновидность структурированного интервью. Анализ репертуарных решеток позволяет определить силу и направленность связей между конструктами респондента, выявить наиболее значимые (глубинные конструкты), лежащие в основе конкретных оценок и отношений.

79

10.2. Хранилища данных

Для устранения разрозненности, разнотипности, противоречивости данных используется концепция «хранилище данных» (ХД). ХД – предметно-ориентированная, интегрированная, некорректируемая, зависимая от времени коллекция данных, предназначенная для поддержки принятия управленческих решений. ХД должно предложить такую среду накопления данных, которая оптимизирована для выполнения сложных аналитических запросов управленческого персонала. Данные в хранилище не предназначены для модификации. Предметная ориентация означает, что данные объединены и хранятся в соответствии с теми областями, которые они описывают. Интегрированность определяет данные таким образом, чтобы они удовлетворяли требованиям всего предприятия. Некорректируемость заключается в том, что данные в ХД не создаются (поступают из внешних источников), не корректируются и не удаляются. Данные в ХД должны быть согласованы во времени.

При реализации ХД особое значение приобретают следующие процессы: извлечение, преобразование, анализ, представление. При извлечении данные приводятся к единому формату. Источники данных могут быть классифицированы по территориальному, административному расположению, степени достоверности, частоте обновляемости, количеству пользователей, секретности и используемым СУБД. Вся эта информация составляет основу словаря метаданных ХД. Словарь метаданных призван обеспечить корректную периодическую актуализацию ХД.

Инструментальные средства, реализующие аналитические методы анализа и обработки данных, классифицируются по способу представления данных:

* ИС, хранящие данные в реляционном виде, но имитирующие многоразмерность для пользователя;

* ИС, хранящие данные в многоразмерных базах; * ИС, хранящие данные как в реляционном виде, так и в

многоразмерных базах. Помимо извлечения данных из БД для принятия решений актуален

процесс извлечения знаний в соответствии с информационными потребностями пользователя. Если в ЭС основное внимание уделяется проблеме извлечения знаний от экспертов, то в данном случае знания извлекаются из БД.

С точки зрения пользователя в процессе извлечения знаний из БД должны решаться задачи преобразования данных (неструктурированных наборов чисел, символов) в информацию (описание обнаруженных закономерностей), информации в знания (значимые для пользователя закономерности), знаний в решения (последовательность шагов,

80

направленная на достижение информационных потребностей пользователя).

Интеллектуальные средства извлечения знаний из БД позволяют выявить закономерности и вывести правила из них. Эти закономерности и правила можно использовать для принятия решений и прогнозирования их последствий. Существует несколько интеллектуальных методов выявления и анализа знаний: ассоциация, последовательность, классификация, кластеризация и прогнозирование. Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Если существует цепочка связанных во времени событий, то говорят о последовательности. С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Кластеризация аналогична классификации, но отличается от нее тем, что сами группы еще не сформированы. С помощью прогнозирования на основе особенностей поведения данных оцениваются будущие значения непрерывно изменяющихся переменных.

10.3. Управление знаниями

Понятие «управление знаниями» появилось в середине 90-х годов

прошлого века в крупных корпорациях, где проблемы обработки информации приобрели особую остроту. Системы управления знаниями (Knowledge Mаnаgement) получили название КМ-систем. Для их применения используются технологии:

* электронная почта; * базы и хранилища данных; * системы групповой поддержки; * браузеры и системы поиска; * корпоративные сети и Интернет; * ИИ-системы.

Хранилища данных, которые работают по принципу центрального склада, были одним из первых инструментариев КМ. Управление знаниями – это совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия. Причины необходимости разработки КМ-систем:

* работники предприятия тратят слишком много времени на поиск необходимой информации;

* опыт ведущих специалистов используется только ими самими; * ценная информация захоронена в огромном количестве документов,

доступ к которым затруднен; * дорогостоящие ошибки повторяются из-за недостаточной

информированности и игнорирования предыдущего опыта.

81

Одним из новых решений по управлению знаниями является понятие корпоративной памяти, которая фиксирует информацию из различных источников предприятия и делает ее доступной специалистам для решения производственных задач. Корпоративная память не позволяет исчезнуть знаниям выбывающих специалистов. Различают два уровня корпоративной памяти:

1. Уровень материальной или явной информации – это данные и знания, которые могут быть найдены в документах организации в форме сообщений, статей, справочников, патентов, ПО.

2. Уровень персональной или скрытой информации – это персональное знание, неотрывно связанное с индивидуальным опытом, которое может быть передано через процедуры извлечения знаний. Скрытое знание – основа СППР.

При разработке КМ-систем можно выделить следующие этапы: * Накопление. Стихийное и бессистемное накопление информации в

организации. * Извлечение знаний – наиболее сложный и трудоемкий этап. * Структурирование – выделение основных понятий, выработка

структуры представления информации. * Формализация – представление структурированной информации на

языках описания данных и знаний. * Обслуживание – корректировка данных и знаний.

Автоматизированные системы КМ (Organizational Memory Information Systems) OMIS предназначены для накопления и управления знаниями предприятия. Основные функции OMIS (рис. 10.1):

* сбор и систематическая организация информации из различных источников в централизованное или структурное информационное хранилище;

* интеграция с существующими автоматизированными системами; * обеспечение нужной информации по запросу.

В отличие от ЭС первичная цель систем OMIS – не поддержка одной задачи, а лучшая эксплуатация необходимого общего ресурса знаний.

Первые информационные системы на основе гипертекстовых (ГТ) моделей появились в середине 60-х годов прошлого века, но первые коммерческие ГТ-системы появились в 80-х годах. Под гипертекстом понимают технологию формирования информационных массивов в виде ассоциативных сетей, элементами или узлами которой выступают фрагменты текста, рисунки, диаграммы. Навигация по таким сетям осуществляется по связям между узлами.

82

Рис. 10.1. Архитектура OMIS

Основные функции связей: * переход к новой теме; * присоединение комментария к документу; * соединение ссылки на документ с документом, показ на экране

графической информации; * запуск другой программы.

Мультимедиа (ММ) понимается как интегрированная компьютерная среда, позволяющая использовать наряду с традиционными средствами взаимодействия человека и компьютера (дисплей, принтер, клавиатура) новые возможности – звук, мультипликацию, видеоролики. Когда элементы ММ объединены на основе сети гипертекста, можно говорить о гипермедиа (ГМ). Основной сферой применения ГМ являются автоматизированные обучающие системы или электронные учебники. Глобальный успех в этом направлении получила сеть Интернет.

Интерфейс разработчиков

Структура БД, метаописания

Описания

документации

Структура БЗ, понятийные структуры

БЗ (продукции, фреймы, семант. сети, лог. вывод)

Документальные БД

Фактографические БД

Интерфейс пользователя

Данные Документы Знания

Онтологический уровень (структурный)

Содержательный уровень

83

10.4. Технология создания систем управления знаниями Проектирование систем управления знаниями (СУЗ)

декомпозируется на этапы, которые свойственны любой другой ИИ-системе. Вместе с тем имеется ряд особенностей:

* коллективное использование знаний предполагает объединение и распределение источников знаний по различным субъектам, а следовательно, решение организационных вопросов администрирования и оптимизации деловых процессов, связывающих пользователей СУЗ;

* задача проектирования СУЗ носит непрерывный характер, поскольку постоянно добавляются внешние источники данных;

* поскольку СУЗ имеет многоцелевое значение, возникает потребность в интеграции разнообразных источников знаний на основе единого семантического описания пространства знаний.

Этапы проектирования СУЗ: идентификация проблемной области:

– определение типов решаемых задач; – отбор источников знаний; – определение категорий пользователей;

концептуализация: – выявление понятий (категорий); – выявление свойств (отношений); – построение правил (ограничений);

формализация: – выбор метода представления знаний; – представление знаний;

реализация: – создание онтологий; – аннотирование и подключение источников знаний; – настройка (создание) приложений;

внедрение: – тестирование; – развитие. Онтология – это точное (явное) описание концептуализации знаний

(от греч. «онтос» – сущее, «логос» – учение), учение о сущем. Идентификация проблемной области. В первую очередь

определяется состав решаемых задач. Возможно создание узкоспециализированных систем по отдельным функциям управления: маркетинга, менеджмента, финансов. Разработка СУЗ может начинаться с отдельных областей, например с маркетинга, не требуя одновременной разработки всех необходимых онтологий и источников знаний. Для создания БЗ прецедентов требуется определить набор типовых бизнес-

84

процессов, для которых будут отбираться прецеденты, например, разработка проектов, заключение договоров, проведение PR-акций. Центральное место в проектировании СУЗ занимает онтология, которая определяет и интегрирует все источники знаний. Требования разработки онтологий оформляются в виде спецификации требований (табл. 3)

Таблица 3 Предметная область

Подбор и повышение квалификации персонала компании

Назначение Онтология служит для обмена знаниями между департаментом управления и менеджерами проектов при отборе персонала. Используется для семантического поиска квалификационных характеристик для выполнения определенных видов работ

Область значений Онтология содержит концепты (категории) управления персоналом. Концепты используемых квалификаций в технологиях рассматриваются детально

Поддерживающие приложения

Система управления квалификацией персонала в ИНТРАНЕТ-среде

Источники знания Web-страницы департамента управления персоналом Руководство о развитии персонала Спецификация продукции и технологий Интервью с работниками департамента управления персоналом и менеджерами проектов

Концептуализация знаний с помощью онтологий Назначение онтологий – обеспечение возможностей:

* повышение интеллектуальности СУЗ на основе того, что остается неявным;

* стандартизация на основе описания целевого мира в виде словаря, согласованного среди людей, разделение знаний между различными пользователями и компьютерными системами;

* систематизация знаний, позволяющая интегрировать разнородные источники знаний на основе единой многоаспектной таксономии, представляемой в общем словаре;

85

* снабжение необходимыми понятиями, отношениями и ограничениями, которые используются как строительные блоки для создания конкретной модели решения задач;

* постепенное обобщение понятий конкретной проблемной области. Требования к проектированию онтологий знаний:

* ясность – четкая передача смысла введенных терминов (концептов); * согласованность – логическая непротиворечивость определений; * расширяемость – возможность монотонного расширения и

специализации без необходимости пересмотра уже существующих понятий;

* инвариантность к методам представления знаний; * отражение только наиболее существенных предположений о

моделируемом мире. Онтологическое знание организуется на трех уровнях:

онтология верхнего уровня (метаонтология); онтология предметной области; онтология задач.

Метаонтология отражает такие общие понятия, как «сущность», «класс», «свойство», «значение», «типы данных», «типы отношений», «процесс», «событие». Определение общих категорий позволяет системе контролировать синтаксические конструкции понятий предметных и проблемных областей, которые объявляются как наследники общих категорий.

Онтология предметной области определяет набор понятий, используемых при решении различных интеллектуальных задач и не зависимых от самого метода решения задач. При построении онтологии предметной области выявляются свойства и отношения понятий, строятся логические правила, расширяющие семантику модели предметной области.

Онтология задач имеет дело с понятиями, описывающими методы преобразования объектов предметной области в процессе решения задач. Например, для задач обучения в качестве методов обучения могут использоваться дедуктивный (от общего к частному), индуктивный (от частного к общему) и абдуктивный (от частного к частному). С помощью понятий, свойств и отношений описывается сущность используемых методов, устанавливается последовательность их выполнения. Введение онтологии задач позволяет расширить класс интеллектуальных задач, решаемых с помощью СУЗ, в частности перейти от простых поисковых задач к задаче конфигурации, когда система автоматически разбивает задачу на подзадачи, для каждой подзадачи выбирает метод решения задачи, а для каждого метода выбирает необходимые единицы предметных знаний. Такая СУЗ является не просто интеллектуальной информационно-поисковой системой, но и системой, которая планирует и генерирует

86

решение задачи. В этом аспекте СУЗ должна обладать развитым механизмом вывода и по своей реализации сближается с классом ЭС, но на более развитой семантической основе.

Формализация онтологического знания В основе формализации онтологий, с одной стороны, лежат

общепризнанные методы представления знаний (исчисление предикатов, семантические сети и фреймы), с другой методы описания онтологических знаний с помощью специальных семантических конструкций. В качестве языков представления онтологического знания используются:

* языки, основанные на исчислении предикатов; * HTML-подобные языки; * XML-подобные языки. Языки, основанные на исчислении предикатов, построены на

декларативной семантике и обеспечивают выражение произвольных логических предложений. С помощью этих языков хорошо представляется метазнание. Это позволяет пользователю представлять знания в явном виде и разрешает пользователю новые конструкции представления знаний без изменения самого языка. Одним из таких языков является KIF, разработанный для обмена знаниями между различными программными агентами (ЛИСП-подобный язык).

HTML-подобные языки (Hypertext Markup Language). Язык разметки гипертекста. С использованием HTML создано более 60% ресурсов современного Интерента. Браузер – специальная клиентская программа, предназначенная для просмотра содержимого Web-узлов и отображения документов HTML. В качестве основы для описания онтологий и онтологического аннотирования текстов может выступать язык разметки данных HTML, дополненный специальными тегами (указателями). С помощью тегов происходит выделение семантических фрагментов текста, которые унифицированно интерпретируются семантическими анализаторами различных ПС. Языки данной группы позволяют описать объекты онтологии (концепты), отношения между ними и определить правила вывода. Основное назначение таких языков состоит в возможности описания онтологии, аннотирования необходимых Web-страниц концептами онтологии и дальнейшее осуществление поиска данных Web-страниц с помощью специальной поисковой машины.

XML-подобные языки. В качестве основы для таких языков выступает расширяемый язык разметки. В настоящее время существует около 20 различных языков, основанных на XML. Основным достоинством языка является то, что для работы с документами, подготовленными с помощью него, достаточно обычного интернет-браузера, т.е. не требуется никаких дополнительных средств. XML-документ представляет собой

87

размеченное дерево, например, структура XML представления описания обычного учебного курса приведена на рис. 10.2.

Рис.10.2. Размеченное дерево Сам язык XML в принципе не обладает практически никакими

возможностями в области представления онтологий. В нем отсутствуют специальные конструкции, позволяющие описать взаимоотношения между концептами онтологии, правила вывода. Он предназначен исключительно для представления данных. Язык RDF, представляющий расширение XML, позволяет описать концепты, отношения между ними, поддерживает иерархию концептов и их наследование, задает некоторые правила вывода. Базовыми строительными блоками в RDF является триплет «объект-атрибут-значение», часто записываемый в виде A (O, V), который читается как объект О, имеет атрибут А со значением V. В семантической сети эту связь можно представить как ребро с меткой А, соединяющее два узла О и V.

Выбор ИС реализации СУЗ во многом определяется требуемой функциональностью использования СУЗ: информационный поиск в источниках знаний, коллективное решение задач, обучение и др. Для узкоспециализированных целей, ориентированных на поиск в интернет-ресурсах, используются специализированные системы, например SHOE, которая обеспечивает аннотацию документов, сбор знаний в централизованную БЗ, выполнение поисковых запросов.

ИС должны обеспечивать две основные группы функций. 1. Создание и поддержание источников знаний: – создание и поддержание онтологий; – аннотирование источников знаний; – подключение источников знаний; – автоматическая рубрикация и индексирование источников знаний;

ФИО

Курс

Студенты Заголовок Преподаватель

88

2. Доступ к источникам знаний: – реализация запросов; – навигация и просмотр; – коммуникация пользователей; – распространение знаний.

Глава 11. Интеллектуальные информационные системы в условиях неопределенности и риска

11.1. Понятие риска в СППР слабоструктурированных проблем

Экономические решения в зависимости от определенности возможных исходов или последствий рассматриваются в рамках трех моделей:

* выбор решения в условиях определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому исходу;

* выбор решения при риске, если каждое действие приводит к одному из множества возможных частных исходов, причем каждый исход имеет вычисляемую или экспертно оцениваемую вероятность появления;

* выбор решений при неопределенности, когда то или иное действие имеет своим следствием множество частных исходов, но их вероятности неизвестны. Вероятностные методы обеспечивают подходящие условия для

принятия решения и содержательные гарантии качества выбора. При этом исходят из предположения, что суждения относительно значений, предпочтений и намерений представляют ценные абстракции человеческого опыта и их можно обрабатывать для принятия решений. В то время как суждения относительно правдоподобия событий квалифицируются вероятностями, суждения относительно желательности действий представляются понятиями. Байесовская методология рассматривает ожидаемую полезность U(d) как оценку качества решения d. В соответствии с этим, если мы можем выбрать либо действие d1, либо d2, вычисляем U(d1), U(d2) и выбираем действие, которое соответствует наибольшему значению. Семантика полезности состоит в том, чтобы описать риск.

Под риском принято понимать вероятность (угрозу) утраты лицом или организацией части своих ресурсов, недополучения доходов или появление дополнительных расходов в результате осуществления определенной финансовой политики.

Под уровнем риска понимается объективная или субъективная вероятность возникновения потерь. Объективная – это количественная

89

мера возможности наступления случайного события, полученная с помощью расчетов или опыта, позволяющая оценить вероятность выявления данного события. Субъективная представляет собой меру уверенности и истинности высказанного суждения и устанавливается экспертным путем.

Уровень рисков наиболее легко устанавливается при помощи атрибутивных оценок типа «высокий», «средний», «небольшой». Разновидностью атрибутивной оценки рисков является буквенная кодировка. При этом в порядке нарастания риска и падения надежности используются латинские буквы от А до D.

AAA – самая высокая надежность; AA – очень высокая надежность; A – высокая надежность; D – максимальный риск.

Оценивать уровень риска можно, используя показатели бухгалтерской и статистической отчетности.

Из всех возможных показателей лучше всего для этой цели подходит коэффициент текущей ликвидности (КТЛ) – отношение ликвидных средств партнера к его долгам, который отвечает на вопрос, сможет ли партнер покрыть долги своими активными ликвидными активами.

В результате анализа ситуации строятся причинно-следственные диаграммы («дерево причин») и диаграммы зависимостей. Причинно-следственная диаграмма является формальным отображением структуры проблемной ситуации в виде иерархически незамкнутого графа, вершины которого соответствуют элементам проблемы, отражающим причины ее возникновения, а дуги – связям между ними. Связь элементов-подпроблем отображается в виде отношения «причина – следствие» (рис. 11.1).

OLTR – средства складирования данных и оперативной обработки транзакций; OLAR – средства оперативной обработки информации.

Корпоративная БД, организованная в виде хранилища данных, заполняется информацией с использованием технологий OLTR и OLAR. Для разработки и реализации СППР слабоструктурированных проблем должны быть разработаны и адаптированы к ее условиям следующие методы и средства:

* система признаков для регистрации проблемных ситуаций; * методы оценки степени критичности проблемных ситуаций; * причинно-следственные диаграммы для диагностирования причин

возникновения проблемных ситуаций; * таблица принятия решений для формирования и выбора вариантов

решений; * методы прогнозирования результатов решений; * модели функционирования предприятия и внешней среды.

90

Рис.11.1. Модель системы поддержки принятия решений

Наиболее распространенной формой выявления проблем с использованием технико-экономических показателей является сравнение их фактических величин с нормативными и средними значениями.

Логический анализ проблем-причин, находящийся на нижних уровнях иерархии, показывает, что во многих случаях они позволяют сформировать варианты решения проблем более высокого уровня. Например, в качестве вариантов решения проблемы снижения объемов производства и сбыта продукции возможны альтернативы:

* варьирование ценами; * варьирование формами оплаты; * снижение численности работающих; * сокращение доли условно-постоянных расходов в себестоимости

продукции; * сокращение сроков выполнения заказов; * усиление службы маркетинга.

Когда отсутствуют статистические данные, необходимые для расчета объективной вероятности риска, прибегают к субъективным оценкам, основанным на интуиции и опыте экспертов. Дж. Кейнс ввел понятие субъективной вероятности. В соответствии с принципом безразличия одинаково правдоподобные события или суждения должны иметь одинаковую вероятность, что математически записывается так:

А ~ В ≡ Р(А) = Р(В), где ~ – знак, выражающий отношение безразличия или толерантности.

Более правдоподобное событие или суждение должно иметь большую вероятность, т.е. если А>В, то Р(А)>Р(В). Субъективные оценки вероятности связывают вербальные и количественные значения (табл. 4).

ЛПР

Подсистема формирования

отчетов и запросов к БД

Интеллектуальная поддержка решений

Банк моделей и методов

оптимизационных решений

Входные данные

OLTR Корпо-ративная

БД

OLAR Входные данные

91

Таблица 4

Вербальные выражения Количественная оценка

Практически невозможное Р<0,01 Маловероятное P<0,05 Более возможное, чем невозможное P>0,5 Очень вероятное P>0,8 Практически достоверное P>0,99

При осуществлении сделок на рынке ценных бумаг различают

формы рисков: Систематический риск – риск падения рынка ценных бумаг в целом.

Не связан с конкретной ценной бумагой. Несистематический риск – агрегированное понятие, объединяющее

все виды рисков, связанных с конкретной ценной бумагой. Страновой риск – риск вложения средств в ценные бумаги

предприятий, находящихся под юрисдикцией страны с неустойчивым социальным и экономическим положением, с недружественными отношениями к стране, резидентом которой является инвестор. В частности политический риск.

Риск законодательных изменений – риск потерь от вложений в ценные бумаги в связи с изменением их курсовой стоимости, вызванным появлением новых или изменением существующих законодательных норм.

Инфляционный риск – риск того, что при высокой инфляции доходы, получаемые инвесторами от ценных бумаг, обесцениваются.

Валютный риск – риск, связанный с вложениями в валютные ценные бумаги, обусловленный изменениями курса иностранной валюты.

Отраслевой риск – риск, связанный со спецификой отдельных отраслей.

Региональный риск – риск, свойственный монопродуктовым районам (с/х, военная, тяжелая, легкая отрасли промышленности).

Риск предприятия – риск финансовых потерь от вложения в ценные бумаги конкретного предприятия.

Кредитный риск – риск того, что эмитент, выпустивший ценные бумаги, окажется не в состоянии выплатить процент по ним.

Риск ликвидности – риск, связанный с возможностью потерь при реализации ценной бумаги из-за изменения ее оценки.

Процентный риск – риск потерь, которые могут понести инвесторы в связи с изменением процентных ставок.

Капитальный риск – риск существенного ухудшения качества портфеля ценных бумаг.

92

Существует несколько популярных подходов к принятию решений относительно выбора портфеля инвестиций и размещения средств. Наиболее простой – конформный – требует, чтобы портфель был сконструирован с целью удовлетворения специфических требований компании, осуществляющей инвестирование. В соответствии с этим подходом инвестор делает вклады фиксированной величины в различные категории ценных бумаг. Оценка качества ценных бумаг фирмы может основываться на размерах капитала компании, показателях ее эффективности и вкладах других организаций.

Стратегии, в которых активы смешиваются в соответствии с фазами национальной и глобальной экономики, называются тактическим размещением активов. Тактическое размещение активов бывает конформным, при этом средства вкладываются в те активы, которые упали в цене. Когда пропорция средств, вкладываемых в различные классы активов, основывается на некоторых прогнозных оценках макроэкономических параметров, такой подход называется размещением в соответствии со сценарием.

Наиболее широко распространенным подходом к выбору портфеля является подход «среднее-дисперсия», предложенный Гарри Марковитцем. Основная идея заключается в том, чтобы рассматривать будущий доход, приносимый финансовым инструментом, как случайную переменную, то есть доходы по отдельным инвестиционным объектам случайно изменяются в некоторых пределах. Тогда, если неким образом определить по каждому инвестиционному объекту вполне определенные вероятности реализации, можно получить распределение вероятностей получения дохода по каждой альтернативе вложения средств. Для упрощения модель Марковитца предполагает, что доходы по альтернативам инвестирования распределены нормально.

По модели Марковитца определяются показатели, характеризующие объем инвестиций и риск, что позволяет сравнивать между собой различные альтернативы вложения капитала с точки зрения поставленных целей и тем самым создавать масштаб для оценки различных комбинаций. В качестве масштаба ожидаемого дохода из ряда возможных доходов на практике используют наиболее вероятное значение, которое в случае нормального распределения совпадает с математическим ожиданием.

В основе модели Марковитца выбор портфеля представляется проблемой оптимизации:

n

i

n

jjiijpx

xxV1 1

min

93

при ограничениях

n

ipii RxR

1,

n

iii nixx

1,1,0,1 ,

где n – число доступных ценных бумаг; ix часть портфеля, содержащаяся в ценных бумагах вида i; Ri = Е(ri) – ожидаемая величина дохода по бумагам i; Rp= E(rp) – целевой уровень ожидаемого дохода портфеля; σij – ковариация дохода по ценным бумагам i и j; Vp – дисперсия дохода портфеля.

Эта задача является задачей квадратичного программирования.

11.2. Реализация ЭС инвестиционного проектирования Инвестиционное проектирование сводится к решению задач:

* определение целей инвестирования капитала; * оценка рынка и выбор типов инвестиций; * проектирование портфеля инвестиций; * мониторинг портфеля инвестиций.

Первая задача – аналитическая, предполагает оценку финансового состояния инвестора: выявление свободных финансовых ресурсов, оценку допустимой степени риска, необходимой степени доходности. Для выполнения всестороннего анализа целей инвестора осуществляются финансовые расчеты, после которых выполняется набор правил, интерпретирующий полученные финансовые показатели. В зависимости от определенного рейтинга инвестора и намерений ему выдаются рекомендации относительно степени риска, доходности и срочности инвестиций.

Во второй задаче исследуется состояние рынка капитала на текущий момент времени, прогнозируется его развитие и возможность участия на нем инвестора. Свободные денежные средства могут быть вложены в различные активы: государственные облигации, депозиты коммерческих банков, акции и облигации коммерческих структур, недвижимость, валюту, драгоценные металлы и др. Каждое инвестиционное средство (финансовый инструмент ФИ) имеет свою тенденцию развития, характеризуется определенными условиями вклада и получения дохода. На этом этапе ставится задача определить набор типов инвестиций, наилучшим образом соответствующих сформированным целям инвестирования и ограничениям инвестора.

Третья задача проектирования портфеля инвестиций подразумевает выбор для каждой из рекомендуемых форм инвестиций конкретных видов и определение их наиболее эффективных сочетаний. ЭС должна иметь

94

доступ к БД коммерческой информации и вычислять совокупный рейтинг предполагаемых инвестиций. Важно так подбирать состав портфеля, чтобы в среднем он удовлетворял определенным требованиям доходности, риска и срочности с учетом налогообложения и инфляционных процессов.

Четвертая задача предполагает динамическое регулирование состава портфеля инвестиций (мониторинг) исходя из потребностей инвестора и изменения текущей ситуации на рынке капиталов. В рамках определенного процентного соотношения безрисковых и рисковых финансовых инструментов портфеля конкретные виды инвестиций динамически изменяются.

Формирование и управление портфелем инвестиций относятся к задачам синтеза решений, зависящих от множества факторов, которые не могут быть заданы заранее каким-либо конечным множеством. Для ЭС проектирования инвестиций характерны следующие особенности:

взаимосвязь процессов решения задач, в которых отдельные этапы итерактивно связаны между собой;

множественность источников знаний, рассматривающих процесс принятия решений с различных точек зрения;

использование интегрированных БД, определяющих массовый характер многовариантных выводов решений;

автоматическая качественная интерпретация количественных данных в БД;

сочетание формализованных и эвристических методов решения задач, когда эвристические методы упрощают перебор вариантов, уточняют полученные решения и восполняют пробелы в памяти. * ЭС определения целей инвестирования капитала. Каждый тип инвестиционных средств характеризуется

определенным профилем в части доходности риска, срочности, типа дохода. Суть ЭС заключается в объективном выявлении профиля инвестора (на что он может претендовать) и сопоставлении полученного профиля с профилем инвестиционного средства. При полном или частичном совпадении клиенту выдается список подходящих типов инвестиционных средств. ЭС может работать в двух режимах: автономном и ручном. Решение задачи разбивается на этапы:

– определение целей; – определение возможностей размещения инвестиций; – выбор типа инвестиций. Каждый из этапов реализуется в виде самостоятельного набора

правил (БЗ). Переход от одного этапа к другому управляется метаправилами, содержащимися в специальном наборе правил.

95

Суть его заключается в следующем: последовательно проверяется известность значений переменных о требуемых налоговых льготах, типе рынка, типе получаемого дохода, финансовом основании клиента. В случае неизвестности значений клиенту выдается список возможностей (Putform), из которого он выбирает конкретные варианты (Getform).

Для запуска набора правил, определяющего цели инвестирования, должна быть выполнена проверка следующего метаправила:

IF: KNOWN (“Цели инвестиции определены”) = false / *не известны* / THEN: Consult Purpose of investment / * выполнить набор правил “Определение целей инвестиции”* / Набор правил “Purpose of investment” содержит следующие правила: IF: KNOWN (“Налоговые льготы”) = true AND KNOWN (“Тип рынка”) = true AND KNOWN (“Финансовое основание”) = true AND KNOWN (“Тип дохода”) = true THEN: Определение целей инвестиций = true IF: KNOWN (“Налоговые льготы”) = false THEN: PUTFORM Налоговые льготы;

GETFORM Налоговые льготы IF: KNOWN (“Тип рынка”) = false THEN: PUTFORM Тип рынка;

GETFORM Тип рынка и т.д. (В нотации ЭС Intelligence Service (Франция)) Для каждого профиля выполняется некоторое подмножество правил.

Обобщенное дерево целей определения каждого из профилей инвестиционных средств (потребностей клиента) может быть представлено в виде графа (рис.11.2).

Перечисленные факторы участвуют в правилах в различных комбинациях. Они могут быть скорректированы с учетом таких факторов, как возраст, социальный статус, семейное положение.

* ЭС проектирования портфеля инвестиций Одной из первых ЭС в области формирования портфеля инвестиций

является система Plan-Power, архитектура которой включает три основные подсистемы (рис. 11.3):

* диагностика существующей ситуации и целей; * разработка плана инвестиций; * формирование плановой документации.

96

Рис.11.2.Дерево целей «Оценка профиля клиента»

Рис.11.3.Архитектура ЭС Plan-Power

Определение проблемы

Диагностика ситуации и целей

Формирование плана

Формирование плановой

документации

Финансовые модели: вычисления, прогноз,

оценка

Ситуация клиента Описание инвестиций Макроэкономические факторы

Наблюдения

Рекомендации

Плановая документация

97

Исходная информация вводится во фреймы БЗ через экранные формы. В БЗ динамически поддерживается множество фреймов, описывающих инвестиционные средства. Во фреймах БЗ отражается также макроэкономическая ситуация: степень инфляции, налоговые ставки, процентные ставки по кредитам, ГКО и пр. Фреймы организованы в иерархическую систему с наследованием свойств.

Диагностическая подсистема анализирует финансовую ситуацию клиента, прогнозирует ее развитие и формирует список достоинств и недостатков. По этим данным формируются возможные цели инвестирования, которые сопоставляются с введенными пользователями.

Подсистема планирования (планировщик) включает модули размещения активов, страхования, налоговых платежей, продажи активов, которые в процессе планирования координируются между собой.

Подсистема оформления плановой документации включает: – результаты диагностики клиентской ситуации; – рекомендации по действиям; – объяснения рациональности этих действий. ЭС функционирует как посредством прямого вывода планируемых

рекомендаций, так и обратного вывода для проверки конкретных финансовых целей.

* ЭС мониторинга портфеля инвестиций Для решения задач мониторинга портфеля инвестиций чаще всего

используются методы технического анализа и прогнозирования рыночных цен, по которым можно предсказывать изменение доходности и надежности конкретных финансовых инструментов – ценных бумаг, валюты, драгоценных металлов. В техническом анализе рассматриваются тенденции в движении цен, например, предполагается периодическое колебание цен. Технический анализ осуществляется на основе:

– гистограмм цен и оборота ценных бумаг; – диаграмм скользящих средних; – графиков моделей движения цен. В результате анализа различных графиков пользователю выдаются

обобщенные рекомендации. Для более оперативного анализа рынка в течение торгового дня

могут использоваться ЭС реального времени, например J2. В системе FOREX-94 используемые нейронные сети прогнозируют

решения о покупке/продаже валюты на основе их обучения по изменениям курсов валют за определенные периоды времени.

98

Глава 12. Системы, ориентированные на естественно-языковые запросы. Машинное обучение

12.1. Естественно-языковые интерфейсы

Повышение уровня интеллекта компьютера – процесс бесконечный.

В процессе создания антропоморфной (подобной человеку) искусственной интеллектуальной системы разработчики стремятся заложить в нее то, на что способен человек [16]:

способность выделять существенное в накопленных знаниях; способность извлекать следствия из накопленных знаний, т.е.

способность к рассуждению; способность к оценке знаний и действий; способность к аргументированному принятию решений,

использующему результаты рассуждений; способность к рационализации идей; способность к целеполаганию и планированию; потребность и способность находить объяснения как ответ на вопрос

«почему?»; способность к адаптации в условиях изменения жизненной ситуации; способность к созданию целостной картины относительно предмета

мышления; способность к обучению.

В настоящее время наиболее интенсивные исследования проводятся в направлениях:

- внешняя интеллектуализация систем совершенствование диалоговых интерфейсов;

- внутренняя интеллектуализация систем создание компиляторов новой архитектуры;

- моделирование отдельных функций творческих процессов (игра в шахматы, доказательство теорем);

- целенаправленное поведение роботов, способных автономно совершать операции по достижению целей. В рамках первого направления разрабатываются естественно-

языковые (ЕЯ) интерфейсы «человек – компьютер», предполагающие применение БЗ.

Эксплицитные (осознанные) знания основываются на вербальных формах репрезентации (представления), а имплицитные

99

(бессознательные) базируются на вербальных и невербальных формах репрезентации (рис.12.1).

Под экспликацией понимается процедура уточнения знания терминов в рамках данной научной теории. Эксплицитные знания всегда дискретны, вербальны и структурированы. Второй формой эксплицитных вербальных знаний являются ассоциации, которые должны обладать всеми признаками формальных языков (входной алфавит, правила преобразований и образования выражений, правила интерпретации). Экспликация содержания ассоциаций предполагает, как и структурированные вербальные знания, наличие ролевых эталонных семантических структур, представляющих собой фреймы, в слотах которых находятся маркеры ролей элементов, составляющих сценарий. Подстановка ролей в слоты осуществляется во время обучения системы.

Вербальные знания структуриро-ванные

Вербальные ассоциации структуриро-ванные, распознава- емые

Вербальные ассоциации структуриро-ванные, нераспознава- емые

Вербальные ассоциации неструктури-рованные, нераспознава- емые

Невербальные ассоциации, образные

Эксплицитные знания Имплицитные знания

База эксплицитных

знаний База вербальных знаний

(активных) База невербальных

имплицитных знаний (пассивных)

База ролевых эталонных семантических структур

Вербальная семантическая сеть

Вербальная ассоциативная сеть

Невербальная ассоциативная

(коннекционистская) сеть

Рис.12.1. Связь между видами знаний и формами их репрезентации

Невербальные

Стимулы (раздражители)

Вербальные

100

Имплицитные знания могут быть как вербальными, так и невербальными. Имплицитность выражается в смутном представлении каких-либо объектов, их свойств или состояний и отличается отрывочностью, хаотичностью бессвязных нагромождений вербальных ассоциаций или невербальных образов. С формальной точки зрения имплицитность характеризуется отсутствием одного или нескольких признаков формальных систем.

По своей природе имплицитные знания делят на активные и пассивные. Активные – дискретные знания, форма представления которых позволяет обрабатывать их непосредственно формальными правилами комбинаторной семантики. Пассивные – недискретные и невербальные знания.

Первый уровень машинного понимания предполагает использование при ответе на вопросы содержания, отражаемого текстом. Модели, с помощью которых воссоздаются знания экспертов, характеризуются различным уровнем синтаксичности. Высокий уровень синтаксичности приводит к ошибочной автоматической интерпретации модели.

Естественно-языковое общение с ИИС предполагает выполнение следующих функций (рис.12.2):

ведение диалога – определение его структуры и той роли, которую система и пользователь выполняют на текущем шаге диалога;

понимание – преобразование поступающих от пользователя высказываний на ЕЯ в высказываниях на языке внутреннего представления;

обработка высказываний – формирование или определение знаний для решения задач на данном шаге диалога;

генерация – формирование выходных высказываний на ЕЯ.

Рис.12.2. Обобщенная схема ЕЯ-системы

Диалоговый компонент

Ведение диалога Обработка перехватов инициативы

Компонент понимания высказываний Компонент генерации высказываний

Анализ высказываний

Интерпретация высказываний

Генерация смысла

высказываний

Синтез высказываний

101

Ведение диалога состоит в том, чтобы обеспечить целесообразные действия системы на текущем шаге. При этом диалог может вести пользователь или система. Вторая задача диалогового компонента вызвана тем, что реакция одного участника может не соответствовать ожиданиям другого. В зависимости от того, кто осуществляет перехват инициативы, система либо формирует перехват, либо обрабатывает его.

Компонент понимания высказываний предназначен для выделения смысла входного высказывания и выражения этого смысла на внутреннем языке системы. Под смыслом системы понимается семантико-прагматическая информация, которую пользователь хотел передать системе. На этапе анализа выделяются описания сущностей, упомянутых во входном высказывании, выявляются свойства этих сущностей и отношения между ними. Анализ обычно выполняется отдельным блоком – анализатором. Интерпретация заключается в отображении входного высказывания на знания системы. Основными задачами данного этапа являются буквальная интерпретация высказывания в контексте диалога и интерпретация высказывания на намерения говорящего. Буквальная интерпретация состоит в том, чтобы, учитывая контекст диалога, идентифицировать образы тех сущностей области интерпретации, которые имел в виду говорящий. Вторая задача интерпретации состоит в том, чтобы, применяя имеющиеся у системы методы вывода, определить, как обрабатываемое высказывание соотносится с целями и планами участников диалога.

Компонент генерации высказываний решает в соответствии с результатами, полученными остальными компонентами системы, две основные задачи: генерация смысла, т.е. определение типа и смысла выходного высказывания системы во внутреннем представлении; синтез высказывания – преобладание смысла в высказывании на ЕЯ.

Диалог можно рассматривать на трех уровнях: общая структура, характеризующая тип диалога и класс решаемых задач; тематическая структура, отражающая структуру конкретной задачи; структура шага диалога, отражающая взаимодействие участников в элементном акте диалога. На уровне глобальной структуры действия системы обычно задаются в виде последовательности этапов, определяемых в зависимости от класса решаемых задач. В случае общения с ЭС глобальная структура включает этапы: инструктаж, определение задачи, решение задачи, объяснение в ходе решения задачи, выдача результатов и их оценка, объяснение после решения задачи, определение причин неудачи. Глобальная структура задается декларативно с помощью правил-продукций.

Тематическая структура диалога обычно представляется в виде сценария, в рамках которого определяется структура задачи (разбиение на подзадачи); распределение подзадач между участниками общения;

102

языковые средства. Для задания сценария диалога используются два основных класса: сценарий встроен в систему; сценарий генерируется системой. Готовый сценарий может быть задан в виде частично упорядоченного множества правил с параметрами, значения которых устанавливаются в процессе решения конкретной задачи. Использование готовых сценариев целесообразно в тех случаях, когда к системе предъявляются жесткие требования по быстродействию.

Если сценарий генерируется системой, то в диалоговый компонент включается специальный механизм вывода. Генерация сценариев диалога целесообразна в тех случаях, когда структура задачи зависит от контекста ситуации, в которой происходит ее решение, а полный перечень ситуаций не может быть определен заранее.

При задании локальной структуры шага диалог состоит из действия, реакции и характеризуется параметрами: тип инициирования, способ влияния действия на реакцию, способ спецификации подзадачи, решаемой на данном шаге.

Понимание высказываний включает анализ и интерпретацию. В методах анализа обычно выделяют анализ слов, предложений и текстов. Анализ слов сводится к морфологическому анализу, обнаружению и исправлению орфографических ошибок. Цель морфологического анализа состоит в получении основ (словоформ с отсеченным окончанием) со значениями грамматических категорий для каждой из словоформ ЕЯ- высказывания. Методы обнаружения и исправления орфографических ошибок подразделяются на методы, не использующие словари и использующие их. К методам, не использующим словари, относятся частотные и полиграммные. Частотные основаны на сортировке слов по частоте их встречаемости в текстах. Предполагается, что частота встречаемости слов, содержащих ошибки, низкая. В полиграммных методах для поиска ошибок применяют списки возможных сочетаний букв в словах. Методы, в которых используются словари, разделяются в зависимости от типа применяемой стратегии на абсолютные и относительные. К абсолютным относится «исторический» метод, основанный на словаре встречаемых ранее ошибок. Эффективность его зависит от размера проанализированных текстов. Относительный метод состоит в нахождении в словаре таких слов, которые наиболее похожи на искаженное слово, и выборе среди них правильного.

Анализ предложений обычно сводится к синтаксическому и семантическому анализу, выполняемому функциональным блоком-анализатором.

Существует несколько типов анализаторов: традиционные (не допускают отклонений от грамматических норм); концептуальные (позволяют анализировать ЕЯ-предложения в условиях пропуска и повтора слов); использующие сопоставление по образцам (позволяют

103

анализировать предложения, отклоняющиеся от традиционной грамматики в произвольной степени).

Методы анализа связного текста (дискурса). Связность текста достигается как лингвистическими средствами, имеющими языковое выражение, так и экстралингвистическими (ситуационными) средствами-«умолчаниями», не имеющими языкового выражения и основанными на общности знаний участников общения о цели общения и проблемной области. На этапе анализа связного текста решается задача выявления связей между предложениями, выражаемых лингвистическими средствами, а на этапе интерпретации ситуационными.

К основным лингвистическим средствам связи предложений относятся ссылки и эллипсис. В проблеме установления ссылок могут быть выделены две задачи: поиск в предыдущих предложениях (контексте) сущности (референта), обозначаемой данной ссылкой; определение соответствия между референтом и ссылкой.

Под эллипсисом понимается сжатая форма высказывания, смысл которой определяется либо предыдущими высказываниями (текстовый эллипсис), либо ситуацией, имеющей место в проблемной области (ситуативный эллипсис).

На этапе интерпретации решаются две основные задачи: буквальная интерпретация высказываний в контексте диалога; интерпретация целей участников общения. Для решения обеих задач в рамках фрейм-представлений используется единый механизм присвоения имени фреймов, при этом структура целей участников общения определяется структурой фрейма, описывающего данную задачу, а подцели состоят в заполнении слотов.

Процесс генерации высказываний состоит из генерации смысла высказывания и синтеза высказывания на ЕЯ. Первый этап называется внелингвистическим (концептуальным) синтезом, а второй лингвистическим синтезом. Результатом выполнения первого этапа является внутреннее представление смысла генерируемого высказывания (определение информации, которая должна быть сообщена пользователю, определение уровня общности информации, включаемой в высказывания, разбиение сообщаемой информации на части и др.). На втором этапе определяется последовательность построения синтаксической структуры отдельных предложений, морфологического синтеза словоформ. Наиболее простым методом генерации высказываний является метод, который основан на использовании заранее заготовленных шаблонов, содержащих текст на ЕЯ и переменные, вместо которых подставляются конкретные данные (описание сущностей). При методе шаблонов генерация высказываний осуществляется совместно с диалоговым компонентом, который идентифицирует стандартную ситуацию и определяет, какая информация должна быть включена в высказывание. Генерация

104

высказываний, которые не могут быть описаны с помощью шаблонов, представляет собой более сложную задачу. К таким высказываниям, в частности, относятся объяснения, генерируемые в качестве ответов на вопросы, областью интерпретации которых являются абстрактные знания и метазнания системы. Для генерации объяснений требуется достаточно тонкая классификация целей создания ЕЯ-текстов. Организация текста определяется дискурсными целями, например, дать определение, описать, сравнить, уточнить и прочее. Каждой дискурсной цели может быть сопоставлен определенный способ организации текста, называемый дискурсной стратегией. Предполагается, что, выявив дискурсные стратегии и выразив их подходящим формальным представлением, можно получить достаточно надежный и эффективный механизм генерации смыслопорождаемых текстов.

12.2. Машинное обучение

Машинное обучение – это синоним процедуры приобретения знаний, которая может быть использована, когда эксперт по знаниям:

не существует; недостаточно надежен; чересчур дорог; недоступен постоянно во времени.

Процесс обучения машины в общем случае поясняется на рис. 12.3 [1].

Рис. 12.3. Модель обучения

Среда

БЗ Система обучения

машины

Машина вывода

Выход

Сравнение

Реальная система

Выход

105

Система генерирует знания, полученные в результате изучения

среды. В процессе сравнения выходов ИИС и объекта информатизации в соответствии с критерием выявляется расхождение между результатами реального мира и выходом системы. Цель заключается в том, чтобы трансформировать реакцию среды и оценку в соответствии с критерием в форму знания.

Индуктивное обучение заключается в том, чтобы получить применимые правила из изучения прошлых специфических примеров. Таким образом, индуктивное обучение также называется обучением по примерам. В основу индуктивного обучения положены принципы индуктивных умозаключений. Индуктивным называется умозаключение, в котором на основании принадлежности признака отдельным предметам или частям некоторого класса делают вывод о его принадлежности классу в целом.

В связи с высокой трудоемкостью извлечения знаний по обычной технологии инженерии знаний в течение последних нескольких лет интенсивно разрабатываются методы автоматического извлечения знаний из накопленных фактов. В основе этих методов лежат известные из логики методы индуктивного вывода и ряд методов распознавания образов – «раскопка данных и открытие знаний». В отечественной литературе используется термин «интеллектуальный анализ данных (ИАД)» (рис. 12.4).

Рис.12.4. Классификация методов ИАД

Стадии ИАД

Прогностическое моделирование

Анализ исключений

Свободный поиск

Выявление законо-мерностей условной логики

Выявление отклонений

Выявление трендов и колебаний

Предсказа-ние неизвест-ных значений

Прогнози-рование развития процессов

Выявление законо-мерностей ассоциа-тивной логики

106

Классической основой извлечения знаний из накопленных данных является математическая статистика.

ИАД – это процесс поддержки принятия решений, основанный на поиске данных скрытых закономерностей, то есть извлечения информации, которая могла быть охарактеризована как знания. В основу современной технологии ИАД положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных отношений в данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки в виде распределений значений анализируемых показателей. Важное положение ИАД – нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные регулярности в данных, составляющие скрытые знания.

Все методы ИАД подразделяются на две группы по принципу работы с исходными обучающими данными.

В первом случае исходные данные могут храниться в явном детализированном виде и непосредственно использоваться для прогностического моделирования и анализа исключений (выявления аномалий в найденных закономерностях). Это так называемые методы рассуждений на основе анализа прецедентов. Главной проблемой этой группы методов является затруднительность их использования на больших объемах данных.

Во втором случае информация вначале извлекается из первичных данных и преобразуется в некоторые формальные конструкции. Сам процесс поиска зависимостей распадается на три этапа: обнаружение зависимостей, прогнозирование, анализ аномалий. Обнаружение зависимостей состоит в просмотре БД с целью их автоматического выявления. Проблема заключается в отборе действительно важных зависимостей из огромного числа существующих в БД. Прогнозирование предполагает, что пользователь может предъявить системе записи с незаполненными полями и запросить недостающие значения. Система сама анализирует содержимое БД и делает правдоподобные предсказания относительно этих значений. Анализ аномалий – это процесс поиска подозрительных данных, сильно отклоняющихся от устойчивых зависимостей.

При выборе системы ИАД следует учитывать следующее: Система ИАД должна предсказывать значения целевой переменной и

решать задачи классификации состояний объекта с тем, чтобы подбирать наилучшие модели для каждого класса состояний.

Система должна автоматически выполнять тесты, определяющие статистическую значимость развиваемой модели.

Полученная модель должна быть легко интерпретируема.

107

Система должна находить правила разнообразного вида. Контроль за процессом обработки данных усилится, если

воспользоваться ИАД-системой. Важное значение имеет время обработки данных.

Основу программных средств ИАД составляет автоматический генератор функциональных процедур, который служит для описания скрытых закономерностей в данных. Процесс построения гипотез идет автоматически, независимо от их сложности. Система ИАД позволяет представить обнаруженные закономерности в символической форме – как математические формулы, таблицы, алгоритмы.

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы ИАД: ассоциация, последовательность, классификация, кластеризация, прогнозирование.

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом.

Последовательность – если существует цепочка связанных во времени событий.

Классификация – выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы.

Прогнозирование – основой служит историческая информация, хранящаяся в БД в виде временных рядов. Глава 13. Современные методы исследования, моделирования и проектирования сложных систем 13.1. Интеллектуальные методы проектирования сложных систем Традиционное проектирование содержит задачи анализа систем, связанные с накоплением и исследованием необходимой информации, и задачи синтеза конкретных вариантов систем, удовлетворяющие заданным требованиям. Исследования проблем проектирования получили наибольшее развитие в области техники. Проектирование технического объекта может проводиться на основе прототипа или без него. Цель проектирования на основе прототипа заключается в его совершенствовании, которое ориентировано либо на улучшение качества выполнения уже существующих функций, либо на обеспечение новых функций. Кроме того, задача может ставиться как изобретательская, когда одной из важнейших целей является патентоспособность создаваемого устройства.

108

Задача совершенствования прототипа может включать дополнительные условия, связанные с технологическими возможностями конкретного предприятия для перехода от производства прототипа к выпуску нового образца. При проектировании экономических систем обычно не преследуются цели новизны. Проектированию без прототипа здесь соответствует задача создания новой экономической системы (корпорации), т.е. системы, которая не существовала прежде. При этом цели, функции, структура и многие свойства создаваемой системы могут быть известными. Задачи проектирования на основе прототипа имеют различные постановки:

проектирование не существовавшей прежде системы по образцу и подобию уже известной;

кардинальное перепроектирование существующей системы, которая при этом уничтожается, а на ее месте с использованием ряда прежних элементов предусматривается создание новой. Данная постановка возникает тогда, когда существующая система исчерпала свои ресурсы совершенствования, стала неустойчивой и неэффективной, т.е. достигла точки бифуркации;

кардинальное перепроектирование существующей, ориентированное на ее совершенствование и не допускающее ее уничтожения (реинжиниринг);

постоянное и постепенное совершенствование существующей системы на основе мониторинга ее окружения и тенденций развития организационных систем (концепция постоянно развивающегося предприятия).

С начала 90-х годов прошлого века концепция реинжиниринга бизнес-процессов приобрела особую популярность, что обусловлено согласованием в ее рамках противоречивых целей, а именно: существенное повышение эффективности и качества функционирования предприятия без снижения производительности. Реинжиниринг позволяет достичь многократного улучшения основных показателей качества деятельности компании за счет изменения принципов ее организации.

Основным методом исследования сложных систем является системный анализ. Этап формирования описания системы включает:

- декомпозицию системы на элементы; - выделение подсистем; - определение общей структуры системы; - определение связей системы со средой и выявление внешних факторов; - выбор подхода к представлению системы; - формирование вариантов представления системы.

109

Выделяют два класса системных задач: исследования и проектирования. Задача исследования систем состоит в накоплении знаний о свойствах и отношениях существующих объектов в соответствии с конкретными целями. Задача проектирования систем заключается в создании новых объектов с заданными свойствами.

Свойства сложных систем можно разделить на три группы.

1. Свойства, определяющие взаимодействие системы с внешней средой: устойчивость и характеристики состояний системы.

2. Свойства, характеризующие внутреннее строение системы. Параметром, характеризующим изменение структуры во времени, является энтропия.

3. Интегральные свойства, описывающие поведение системы: полезность, эффективность, надежность, управляемость, безопасность, живучесть. Для моделирования и проектирования сложных систем широко

применяются средства компьютерной поддержки автоматизированного проектирования.

Одной из ключевых проблем в процессах проектирования экономических систем является принятие решений. ИИС, используя заложенные в них знания, способны помочь специалисту поставить диагноз, построить прогноз, выбрать рациональный вариант действий. При проектировании социально-экономических систем возникают задачи коллективного многокритериального выбора, осложненные наличием взаимных требований его участников, которые порождают определенные конфликты. Обычно конфликты разрешаются либо путем взаимных уступок, либо путем изменения множества рассматриваемых решений. Для разрешения конфликтов между участниками коллективного выбора используются мультиагентные системы. В процессе разрешения конфликтов у агентов запрашивается информация о требованиях, выполнение которых является обязательным.

Задача проектирования заключается в создании модели некоторой системы, которая будет способна выполнять предписанные функции с заданным уровнем качества. Требования, предъявляемые к проектируемой системе, формируются в метасистеме более высокого уровня. Информация об изменениях метасистемы (внешней среды) используется для моделирования ее поведения. Задача проектирования сложной системы заключается в синтезе вариантов ее структуры и выборе варианта, который характеризуется совокупностью свойств, наилучшим образом удовлетворяющих внешним требованиям.

Эволюционный подход к синтезу заключается в построении целостной системы из более простых частей с позиций теории развития, а именно: сложная система синтезируется из элементов под контролем

110

факторов внешней среды, при этом структура системы и состав элементов подбираются так, чтобы обеспечить максимальное удовлетворение внешних требований. В процессе синтеза происходит соединение элементов (скрещивание), результатом которого являются более крупные объекты, обладающие новыми свойствами и наследующие некоторые свойства «родителей». Из множества возможных комбинаций элементов на каждом шаге синтеза отбираются только те, которые имеют высокие шансы «выживания» во внешней среде и не имеют внутренних противоречий.

Решение задач проектирования развивающихся систем требует построения прогнозов возможных изменений в окружающей их среде. Существует два принципиальных подхода к прогнозированию: прогнозирование будущего на основе прошлого и прогнозирование будущего с учетом появления новых тенденций и событий, которые могли не иметь места в прошлом. Прогнозы, получаемые первым способом, обычно имеют статистическое или теоретическое обоснование, однако они не способны описать новые ситуации. В отличие от них прогнозы, связанные с генерацией гипотез, не имеют строгого обоснования, но позволяют получить представление о новых вариантах возможного будущего, которые не встречались в прошлом.

Первый подход широко используется для прогнозирования крупномасштабных явлений, при описании которых обычно не выделяются активно и непредсказуемо действующие объекты. Второй подход чаще всего примеряется для описания возможных вариантов поведения систем, содержащих активных участников, которые, не имея информации о стратегиях противодействующих сторон, вынуждены их генерировать на основе доступных им знаний. Реализация второго подхода связана с синтезом сценариев.

Под сценарием понимается последовательность взаимосвязанных событий, которая может иметь место при определенных условиях. Между событиями существуют причинно-следственные связи, которые можно представить правилами, записанными на языке логики. Синтез сценария осуществляется с использованием базы знаний, содержащей описание элементов сценария и связей между ними. Результатом синтеза является множество возможных сценариев, качество и достоверность которых зависят от исходной информации.

На первом этапе представления знаний целесообразно построение когнитивной карты – математической модели, представленной в виде графа и позволяющей описывать субъективное восприятие человеком или группой людей какого-либо сложного объекта, проблемы или функционирования системы. Когнитивная карта предназначена для выявления структуры причинных связей между элементами сложного объекта и оценки последствий внешних воздействий на элементы и связи

111

между ними. Элементы изучаемой системы представляются набором вершин графа, связи – множеством направленных дуг, которым могут быть приписаны знаки, определяющие характер влияния. Графическое представление в виде карты наглядно показывает связи между элементами сценария. Перебор всех возможных путей на когнитивной карте дает количество возможных сценариев. Для большого количества знаний граф может стать необозримым. В этом случае прибегают к структуризации знаний, выделяя различные уровни описания информации.

В качестве базовой модели представления знаний для реализации синтеза сценариев на основе причинно-следственных связей может использоваться логика предикатов первого порядка. В простых случаях для представления знаний можно применять логику высказываний.

Важным вопросом при синтезе сценариев является представление темпоральной информации, т.е. описание атрибутов, изменяющихся с течением времени. Многие события имеют определенную длительность, а их последствия могут наступать с запаздыванием. В отличие от классических моделей динамических систем в виде систем дифференциальных уравнений, при моделировании сценариев происходит приближенная имитация динамических процессов, при которой важен качественный характер зависимостей и не выдвигается жестких требований к точности вычислений. Введение в рассмотрение времени необходимо также для указания параллельно протекающих событий. Более широкие возможности для отражения взаимосвязи между событиями, непрерывно протекающими во времени, предоставляют формальные модели времени, или Т-модели. Понятия Т-моделей реализуются наборами фреймов. Разработка и реализация семантических моделей с глубокой детализацией отношений времени и пространства – это отдельное направление исследований в ИИ. Механизм обработки знаний, хранящихся в БЗ, определяется на основе причинно-следственных связей и выявленных зависимостей между элементами сценария, которые формируются аналитиками, поставляющими знания в систему.

Сценарный подход к прогнозированию требует больших затрат труда и времени для сбора и представления знаний, а также для экспертной оценки элементов информации. Генерация сценариев актуальна для мультиагентных систем. Для оценки сценариев в БЗ необходимо добавить информацию о целях, критериях качества, предпочтениях экспертов. Желаемые цели могут иметь разную важность и оказаться противоречивыми. Экспертные оценки значимости целей используются в процессе формирования обобщенного показателя качества сценария.

Перспективным направлением является создание МАС для генерации сценариев развития различных ситуаций, в которых автономные агенты, имитирующие поведение субъектов, принимают решения о выборе действий по согласованию со своими пользователями.

112

13.2. Эвристические методы синтеза сложных систем Под эвристическим синтезом понимается способ решения какой-либо поставленной задачи, включающий совокупность приемов мыслительной деятельности, а также операций по сбору, анализу, обработке и хранению информации. Эвристические методы синтеза используются при необходимости как можно большего числа новых рациональных решений для реализации полезных функций системы и эффективного синтеза новых систем. Эвристический синтез базируется на эвристике – науке о творческом мышлении. Значимым признаком классификации методов эвристического синтеза является наличие или отсутствие алгоритма, организующего мыслительный процесс. По этому признаку можно выделить методы ненаправленного синтеза, опирающиеся только на простейшие приемы ассоциативного мышления и методы направленного синтеза, для которых характерны комплексный подход, системный анализ проблемы и алгоритмизация творческого процесса. К методам ненаправленного синтеза решений относятся:

метод аналогии, который предусматривает использование аналогичного известного решения;

метод инверсии основан на использовании принципов перестановки, переворачивания, выворачивания наизнанку. Этот метод приучает к гибкости мышления, отказу от традиционных стереотипных решений, преодолению психологической инерции;

метод эмпатии означает отождествление себя с разрабатываемой системой;

метод идеализации связан с желанием получить представление об идеальной системе, полностью отвечающей поставленной цели. В методах ненаправленного поиска учитываются особенности

человеческой психики. Наиболее эффективны для синтеза сложных систем методы

направленного синтеза, основанные на научно обоснованных алгоритмах творческого процесса. Современные методы направленного синтеза основаны на сложных алгоритмизированно-процедурных подходах, типизированных способах решения разнообразных изобретательских задачах.

«Мозговой штурм» наиболее известный и широко применяемый метод генерирования новых идей путем творческого сотрудничества группы специалистов.

Методы ассоциаций и аналогий предполагают активизацию в первую очередь ассоциативного мышления человека. К ним относятся:

113

метод фокальных объектов состоит в перенесении признаков случайно выбранных объектов на совершенствуемый объект, который лежит как бы в фокусе переноса и поэтому называется фокальным. Этот метод дает хорошие результаты при поиске новых модификаций известных систем;

метод гирлянд случайных ассоциаций предполагает вывод на каждой итерации очередной случайной ассоциации «объект–признаки случайный признак». Результатом работы является гирлянда ассоциаций. Последовательность объектов в гирлянде характерна тем, что соседние объекты имеют общий признак. Синектика – комплексный метод стимулирования творческой

деятельности, использующий приемы и принципы как «мозгового штурма», так и методы аналогий и ассоциаций. Само слово «синектика» неологизм (новое значение старого слова), означающий объединение разнородных элементов. В основе метода лежит поиск нужного решения благодаря преодолению психологической инерции, состоящей в стремлении решить проблему традиционным путем. Синектика позволяет выйти за рамки какого-то конкретного образа мыслей и значительно расширяет диапазон поиска новых идей за счет представления привычного непривычным и, наоборот, непривычного привычным.

Метод контрольных вопросов применяется для психологической активизации творческого процесса. Цель метода состоит в том, чтобы с помощью наводящих вопросов подвести к решению задачи.

Метод коллективного блокнота позволяет сочетать независимое выдвижение идей каждым членом рабочей группы с коллективной их оценкой и процессом выработки решения. Систематизация зафиксированных в блокнотах в течение месяца идей осуществляется руководителем группы, а заключительное творческое обсуждение – всеми членами группы. Выбор окончательного решения проводится методом «мозгового штурма».

Метод «матриц открытия» преследует цель систематически исследовать все мыслимые варианты, вытекающие из закономерностей строения (морфологии) совершенствуемой системы, выбрать и изучить поле возможных решений. Метод не дает законченных решений и служит для систематизации имеющегося материала и определения отправных пунктов дальнейшего исследования.

Эвристический метод решения изобретательских задач ориентирован на решение задач путем выявления и разрешения внутренних противоречий системы. Наибольшее распространение метод получил в области технического проектирования.

В настоящее время из эвристических методов наиболее подготовленными к автоматизации являются методы гирлянд случайных ассоциаций и решения изобретательских задач.

114

13.3. Интегрированные, гибридные и синергетические системы

Применение в ИИ однородных методов, т.е. методов, соответствующих одной научной парадигме, для решения сложных задач не всегда приводит к успеху. В гибридной архитектуре, объединяющей несколько парадигм, эффективность одного подхода может компенсировать слабость другого. Комбинируя различные подходы, можно обойти недостатки, присущие каждому из них в отдельности. Поэтому одной из ведущих тенденций в современной информатике стало развитие интегрированных, гибридных и синергетических систем. Синергетика междисциплинарное научное направление, изучающее универсальные закономерности процессов самоорганизации, эволюции и кооперации. Ее цель состоит в построении общей теории сложных систем, обладающих особыми свойствами. Интеграция и гибридизация различных методов и технологий позволяет решать сложные задачи, которые невозможно решить на основе каких-либо отдельных методов и технологий. Интегрированность как фундаментальное свойство сложной системы предполагает взаимную адаптацию и совместную эволюцию ее компонентов, что обеспечивает появление новых качеств. Интеграция всегда выступает как необходимое условие гибридизации. Гибридная система система, состоящая из двух или более интегрированных разнородных подсистем, объединенных общей целью. Понятие гибридной системы близко соотносится с понятием синергетической системы. Чаще всего синергетику отождествляют с общей теорией самоорганизации, теорией образования новых качеств или наукой о самоорганизации развивающихся систем. Термин «синергетика» происходит от слова «синергия», означающего совместное действие, сотрудничество. В гибридных интеллектуальных системах (ГИС) имитируются различные стороны интеллектуальной деятельности человека. На нижнем уровне развития ГИС предполагается интеграция различных моделей представления знаний (фреймово-продукционные модели, нейрологические, нейросемантические сети), различных моделей рассуждений (дедуктивных и абдуктивных).

Следующий уровень построения ГИС – интеграция различных информационных технологий, например создание гибридных ЭС. В таких системах должны поддерживаться не только различные модели знаний, но и различные средства и стратегии поиска, должны реализовываться как инженерия знаний, так и числовая обработка информации.

Верхним уровнем интеграции является объединение символьного и нейробионического направлений в ИИ, объединение непрерывных и

115

дискретных моделей, комбинирования моделей образного и вербального мышления. Бионика – раздел ИИ, в котором рассматриваются вопросы применения принципов действия живых организмов и использования биологических процессов для решения инженерных задач. В качестве основы таких ГИС могут выступать: ЭС, нечеткие системы, нейронные сети, генетические алгоритмы.

Одним из перспективных направлений создания ГИС является синергетический ИИ. В отличие от обычных ИИ-систем сложные ИИ-системы имеют следующие основные характеристики:

множество неоднородных компонентов; активность, автономность, целенаправленность, кооперативное

поведение компонентов, которые могут приобретать статус агентов; множество гибких, различных, трансформируемых взаимосвязей

между компонентами; семиотическая природа взаимосвязей (семиотика – наука о знаках); динамичность, неустойчивость, адаптивность; открытость, распределенность, сетевая организация; высокий эволюционный потенциал, обучаемость.

Область синергетического ИИ включает исследования процессов зарождения, формирования, деятельности, коммуникации, эволюции и кооперации сложных ИИ-ситстем различных классов. Примерами таких систем являются системы распределенного и децентрализованного ИИ.

Основные синергетические проблемы ИИ состоят: в исследовании путей и характера эволюции различных направлений

и подходов в ИИ, разработке открытых ИИ-систем; определении сценариев развития, принципов и механизмов

объединения различных интеллектуальных технологий; изучении проблем формирования неклассических ИИ-систем

(неоднородных, открытых, локально организованных, гибридных, распределенных, децентрализованных) с интегрированными архитектурами. Эволюционное моделирование можно определить как

воспроизведение процесса естественной эволюции с помощью компьютерных программ. К факторам, определяющим неизбежность эволюции, относятся:

наследственная изменчивость как предпосылка эволюции; борьба за существование как контролирующий и направляющий

фактор; естественный отбор как преобразующий фактор.

Современная теория эволюции базируется на теории общей и популяционной генетики – науки, изучающей наследственность организмов. Элементарным объектом эволюции является популяция –

116

сообщество свободно скрещивающихся особей. Преобразования генетического состава популяции происходит под действием элементарных эволюционных факторов. Хромосомы – это специфические структуры клеточного ядра, которые играют важнейшую роль в процессах деления клеток. Хромосомы состоят из генов. Геном называется реально существующая, независимая, комбинирующаяся и расщепляющаяся при скрещивании единица наследственности. Случайные структурные или функциональные изменения в генах, хромосомах называют мутациями, если они приводят к наследственному изменению какого-либо признака особи.

История эволюционных вычислений началась с разработки ряда независимых моделей, в частности генетических алгоритмов, в соответствии с которыми методы и модели развития органического мира используются в качестве механизма комбинаторного перебора вариантов при решении оптимизационных задач. В задачах поиска оптимальных решений каждое решение из множества возможных можно представить набором информации, который может быть изменен путем введения в него элементов другого решения. Возможные решения соответствуют хромосомам, состоящим из генов, причем в ходе оптимизации происходит обмен генами между хромосомами (рекомбинация). Одним из типов рекомбинации является кроссинговер, который соответствует рекомбинации, предусматривающей обмен определенными участками между хромосомами. Основная цель кроссинговера заключается в создании из имеющегося генетического материала желаемой комбинации признаков в одном решении.

При разработке генетических алгоритмов преследуются две цели: абстрактное и формальное объяснение процессов адаптации в

естественных системах; проектирование искусственных программных систем,

воспроизводящих механизм функционирования естественных систем. Основные отличия генетических алгоритмов оптимизации:

используются не параметры, а закодированные множества параметров;

поиск осуществляется не из единственной точки, а из популяции точек;

в процессе поиска используются значения целевой функции, а не ее приращения;

применяются вероятностные, а не детерминированные правила поиска и генерации решений;

выполняется одновременный анализ различных областей пространства решений, в связи с чем возможно нахождение новых областей с лучшими значениями целевой функции за счет

117

объединения квазиоптимальных решений из разных популяций [20, 23]. В настоящее время все большее распространение получают

нетрадиционные методы моделирования сложных систем на основе экспериментальных данных, в частности метод группового учета аргументов (МГУА), предполагающий в процессе идентификации моделей многократную обработку различных частей одних и тех же входных данных. Теория самоорганизации моделей, положенная в основу МГУА, отвергает путь расширения и усложнения модели, увеличения объема входных данных, постулируя при этом существование оптимального, ограниченного размера области моделирования и единственной модели оптимальной сложности. Их можно найти при помощи самоорганизации, то есть перебора многих моделей–претендентов (конкурирующих моделей) по целесообразно выбранным критериям. В отличие от традиционных методов структурно-параметрической идентификации, использующих критерий среднеквадратической ошибки, который является внутренним (рассчитанным по всем точкам исходной выборки), индуктивный метод самоорганизации основан на применении внешних критериев, для определения которых применяются входные данные, не использованные в процессе построения модели. Любой внутренний критерий сравнения конкурирующих моделей приводит к ложному правилу: чем сложнее структура модели, тем она точнее.

Согласно МГУА исходные данные делятся на обучающую, проверочную и экзаменационную последовательности. В качестве внешних используются критерии регулярности, минимума смещения и баланса переменных. Алгоритмы МГУА подразделяются на однорядные и многорядные. В однорядных (комбинаторных) алгоритмах реализуется процедура полного перебора всех возможных вариантов модели, которые можно получить из заданного полного описания. Комбинаторные алгоритмы МГУА применяются для решения определенных и переопределенных задач структурно-параметрической идентификации, в которых число параметров модели меньше объема выборки. Для решения недоопределенных задач используются многорядные алгоритмы МГУА. При этом итерационные генераторы реализуют специальную процедуру перцептронного типа для усложнения структуры моделей с помощью учета небольших групп переменных.

Как правило, в комбинаторных алгоритмах МГУА постулируется полиномиальная модель. В блоке перебора моделей выполняются следующие основные операции: формирование двоичного вектора, единичные элементы которого указывают структуру частной модели; формирование соответствующей системы нормальных уравнений и ее решение; вычисление значений внешних критериев; текущий отбор заданного числа лучших моделей. Задача структурно-параметрической

118

идентификации модели оптимальной сложности решается в два этапа. На первом этапе из полного набора моделей различной сложности отбираются по одному из внешних критериев N лучших структур, параметры которых на втором этапе пересчитываются по всей выборке. На основе сравнительного анализа полученных моделей конечный пользователь осуществляет выбор лучшей [9, 25, 26, 27].

119

Заключение Разработка и развитие интеллектуальных информационных

систем как одного из основных направлений искусственного интеллекта в настоящее время являются интенсивно развивающейся областью знаний и прикладных исследований в различных отраслях экономики. Значительные усилия ученых и специалистов направлены на решение проблемы, связанной с извлечением глубинных знаний экспертов на основе новых методов инженерии знаний (репертуарных решеток, многомерного шкалирования, метафорического подхода), а также разработки текстологических методов извлечения знаний. Перспективным является использование гибридных моделей представления знаний (фреймово- -продукционных, нейрологических, нейросемантических сетей). Постоянно совершенствуются инструментальные средства построения ИИС, в том числе естественно-языковые интерфейсы, интеллектуальные редакторы БЗ, интерпретаторы правил логического вывода.

Ежегодно в нашей стране и за рубежом проводятся многочисленные научно-технические конференции в области искусственного интеллекта, что подтверждает высокую актуальность данных исследований.

120

Библиографический список

1. Романов, В.П. Интеллектуальные информационные системы в экономике: учебное пособие / В.П. Романов; под ред. д.э.н. проф. Н.П. Тихомирова. М.: «Экзамен», 2003. 496 с.

2. Гаврилова, Т.А. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. СПб.: Питер, 2000. 384 с.

3. Тельнов, Ю.Ф. Интеллектуальные информационные системы в экономике: учебное пособие/Ю.Ф. Тельнов. Изд. третье. М.: СИНТЕГ, 2002. 316 с.

4. Джексон, П. Введение в экспертные системы: учебное пособие / П. Джексон. М.: «Вильямс», 2001. 624 с.

5. Андрейчиков, А.В. Анализ, синтез, планирование решений в экономике / А.В. Андрейчиков, О.Н. Андрейчикова. М.: Финансы и статистика, 2000. 363 с.

6. Романов, А.Н. Советующие информационные системы в экономике: учебное пособие / А.Н. Романов, Б.Е. Одинцов. М.: ЮНИТИ-ДАНА, 2000. 487 с.

7. Андрейчиков, А.В. Интеллектуальные информационные системы в экономике: учебное пособие / А.В. Андрейчиков, О.Н. Андрейчикова, С.И. Сергеев. Волгоград: ВолГТУ, 1998. 144 с.

8. Частиков, А.П. Разработка экспертных систем. Среда CLIPS / А.П. Частиков, Т.А. Гаврилова, Д.Л. Белов. СПб.: БХВ-Петербург, 2003. 608 с.

9. Семенов, Н.А. Программы регрессионного анализа и прогнозирования временных рядов. Пакеты ПАРИС и МАВР / Н.А. Семенов. М.: Финансы и статистика, 1990. 111 с.

10. Габитова, В.Р. Системы искусственного интеллекта и принятие решений: учебное пособие / В.Р. Габитова. Вологда: ВолгГТУ, 2002. 112 с.

11. Осуга, С. Обработка знаний / С. Осуга. М.: Мир, 1989. 293 с. 12. Минский, М. Фреймы для представления знаний / М. Минский. М.:

Энергия, 1979. 151 с. 13. Семенов, Н.А. Подход к выбору оптимального маршрута при

перевозке крупногабаритных грузов на основе нейросетевых технологий / Н.А. Семенов, А.Л. Борисов, А.А. Рожков // Программные продукты и системы. 2004. №2.

14. Base Group Labs Web: http://www.basegroup.ru 15. Тарасов, В.Б. От многоагентных систем к интеллектуальным

организациям: философия, психология, информатика / В.Б. Тарасов. М.: Эдиториал УРСС, 2002. 352 с.

121

16. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы: справочник / под ред. Э.В. Попова. М.: Радио и связь, 1990. 464 с.

17. Андрейчиков, А.В. Интеллектуальные информационные системы: учебник / А.В. Андрейчиков, О.Н. Андрейчикова. М.: Финансы и статистика, 2004. 424 с.

18. Матвеев, М.Г. Модели и методы искусственного интеллекта. Применение в экономике / М.Г. Матвеев, А.С. Свиридов, Н.А. Алейникова. М.: Финансы и статистика; ИНФРА. М., 2008. 448 с.

19. Вагин, В.Н. Достоверный и правдоподобный вывод в интеллектуальных системах / В.Н. Вагин, Е.Ю. Головина, А.А. Загорянская, М.В. Фомина. М.: Физматлит, 2004. 704 с.

20. Гладков, Л.А. Генетические алгоритмы / Л.А. Гладков, В.В. Курейчик, В.М. Курейчик. М.: Физматлит, 2006. 320 с.

21. Нечеткие гибридные системы. Теория и практика / под ред. Н.Г. Ярушкиной. М.: Физматлит, 2007. 208 с.

22. Рассел, С. Искусственный интеллект: современный подход / С. Рассел, П. Норвиг. М.: Вильямс, 2006. 1408 с.

23. Рутковская, Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рутковская, М. Пилиньский, Л. Рутковский. М.: Горячая линия – Телеком, 2004. 452 с.

24. Ярушкина, Н.Г. Основы теории нечетких и гибридных систем / Н.Г. Ярушкина. М.: Финансы и статистика, 2004. 320 с.

25. Ивахненко, А.Г. Индуктивный метод самоорганизации моделей сложных систем / А.Г. Ивахненко. Киев: Наукова думка, 1982. 350 с.

26. Ивахненко, А.Г. Помехоустойчивость моделирования / А.Г. Ивахненко, В.С. Степашко. Киев: Наукова думка, 1985. 214 с.

27. Ивахненко, А.Г. Моделирование сложных систем по экспериментальным данным / А.Г. Ивахненко, Ю.П. Юрачковский. М.: Радио и связь, 1987. 118 с.

122

ОГЛАВЛЕНИЕ

Введение…………………………………………………………………..….… 3 Глава 1. Интеллектуальные информационные системы как одно из направлений теории искусственного интеллекта…………………… 4

1.1 Основные направления в искусственном интеллекте ………………. 4 1.2 Данные и знания ………………………………………………………. 5 1.3 Эволюция развития информационных систем………………………. 6 1.4 Основные разновидности ИИС и характеристики решаемых

задач……...……………………………………………………………… 8 1.5 Классификация ИИС……………………………………………………. 11

Глава 2. Структура и этапы проектирования экспертных систем…….. 12 2.1 Структура статической и динамической ЭС………………………… 12 2.2 Характеристики, стадии существования и этапы проектирования

статических ЭС……………………………………………………… 14 Глава 3. Модели представления знаний……………………………..…….. 18

3.1 Продукционная модель……………………..………………………… 18 3.2 Формально-логическая модель………………………………………… 19 3.3 Фреймовая модель………………………………………………………. 22 3.4 Семантические сети……………………….…………………………… 25

Глава 4. Методы обработки знаний в интеллектуальных системах. Нечеткие знания……………………………………………………………… 27

4.1 Интерпретатор правил и управление выводом………………..……… 27 4.2 Нечеткие знания и нечеткая логика……..……………………………. 31

Глава 5. Теоретические основы инженерии знаний……………………… 34 5.1 Процедура извлечения знаний………………………………..……….. 34 5.2 Основные аспекты извлечения знаний………………………..………. 35 5.3 Методы извлечения знаний…………………………………..………… 39

Глава 6. Нейронные сети…………………………………………………….. 43 6.1 Искусственный нейрон и функции активации………………..……… 43 6.2 Нейронные сети с прямой связью………………………………..…….. 44 6.3 Алгоритмы обучения нейронных сетей..………………………..……. 47

Глава 7. Технология создания экономических советующих систем…… 52 7.1 Определение и виды информационных технологий…………..……… 52 7.2 Технология «Ресурс – Обучение – Цель»………….…………..…… 53 7.3 Определение коэффициента важности целей…………………..…….. 55

Глава 8. Программный инструментарий разработки систем, основанных на знаниях………………………………………………………. 56

8.1 Цели и принципы технологии разработки программных средств.….. 56 8.2 Технология и инструментарий разработки программных средств….. 57

Глава 9. Интеллектуальные интернет-технологии……………………… 62 9.1 Интеллектуальные агенты…..……………..…………………………… 62

123

9.2 Мультиагентные системы……………………………………………. 68 9.3 Мультиагентные системы различного функционального назначения 70

Глава 10. Новые тенденции инженерии знаний, хранилища данных и управление знаниями………………………………………………………… 76

10.1 Методы извлечения глубинных пластов экспертного знания……… 76 10.2 Хранилища данных………………….…………………..……………. 79 10.3 Управление знаниями………………………………………………… 80 10.4 Технология создания систем управления знаниями………………… 83

Глава 11. Интеллектуальные информационные системы в условиях неопределенности и риска…………………………………………………… 88

11.1 Понятие риска в СППР слабоструктурированных проблем……… 88 11.2 Реализация ЭС инвестиционного проектирования..……………….. 93

Глава 12. Системы, ориентированные на естественно-языковые запросы. Машинное обучение……………………………………………… 97

12.1 Естественно-языковые интерфейсы………………………………….. 97 12.2 Машинное обучение…………………………………………………… 104

Глава 13. Современные методы исследования, моделирования и проектирования сложных систем………………………………………. 107 13.1 Интеллектуальные методы проектирования сложных систем…… 107 13.2 Эвристические методы синтеза сложных систем………………….. 111 13.3 Интегрированные, гибридные и синергетические системы……….. 114 Заключение……………………………………………………………………. 119 Библиографический список…………………………………………………. 120

124

Николай Александрович Семенов

Интеллектуальные информационные системы

Учебное пособие Издание второе

Редактор Т.С. Синицына Корректор Е.С. Спиридонова Технический редактор Г.В. Комарова __________________________________ Подписано в печать 19.03.09 Формат 6084 1/16 Бумага писчая Физ.печ.л. 7,75 Усл.печ.л. 7,21 Уч.изд.л. 6,74 Тираж 150 экз. Заказ №26 С – 20 ________________

Редакционно-издательский центр ТГТУ 170026, г. Тверь, наб. Афанасия Никитина, 22

Documents

УДК 681.3.016 ББК 32.973-018.2 Учебное пособие содержит