Совершенствование методологии проектирования информационных систем.

Бабак В.Ф., Рыженко

В настоящее время в области разработки и реализации интеллектуальных систем сложилось следующее положение: с одной стороны, квалификация коллективов разработчиков здесь, как правило, достаточно высока, с другой стороны, одна из сложнейших проблем, препятствующих широкому внедрению ИС, является недостаточное знание системными аналитиками и программистами предметных областей, в рамках которых готовятся проекты [1]. Создание и внедрение интеллектуальных систем общения с базами данных и особенно экспертных систем, и их широкое распространение выдвинуло проблему совершенствования методологии создания информационных систем на передний план.

Анализ современного состояния программных средств, приобретения знаний и поддержки деятельности инженера по знаниям позволяет выявить две группы проблем.

Методологические проблемы:

  • размытость критериев выбора подходящей задачи;
  • слабая проработанность теоретических аспектов процессов извлечения знаний (философские, лингвистические, психологические, педагогические, дидактические и другие аспекты), а также отсутствие обоснованной классификации методов извлечения знаний и разброс терминологии;
  • отсутствие единого теоретического базиса процедуры структурирования знаний;
  • жесткость моделей представления знаний, заставляющая разработчиков обеднять и урезать реальные знания экспертов;
  • несовершенство математического базиса моделей представления знаний (дескриптивный, а не конструктивный характер большинства имеющихся математических моделей);
  • эмпиричность процедуры выбора программного инструментария и процесса тестирования (отсутствие критериев, разрозненные классификации).

Технологические проблемы:

  • отсутствие концептуальной целостности и согласованности между отдельными приемами и методами инженерии знаний;
  • недостаток или отсутствие квалифицированных специалистов в области инженерии знаний;
  • отсутствие технико-экономических показателей оценки эффективности ЭС;
  • несмотря на обилие методов извлечения знаний, практическая недоступность методических материалов по практике проведения сеансов извлечения знаний;
  • явная неполнота и недостаточность имеющихся методов структурирования знаний, отсутствие классификаций и рекомендаций по выбору подходящего метода;
  • несмотря на обилие программных средств, недостаток систем поддержки разработки в их узкой направленности (зависимость от платформы, языка реализации, ограничений предметной области), разрыв между ЯПЗ и языками, встроенными в "оболочки" ЭС;
  • жесткость программных средств, их низкая адаптивность, отсутствие индивидуальной настройки на пользователя и предметную область;
  • слабые графические возможности программных средств, недостаточный учет когнитивных и эргономических факторов;

сложность внедрения ЭС, обусловленная психологическими проблемами персонала и неприятия новой технологии решения задач.

Анализ используемых технологий разработки программного обеспечения показал, что наиболее совершенная и прогрессивная технология это клиент-сервер, с использованием возможности WEB/database.

WEB предлагает стандартизацию пользовательского интерфейса, возможность совместной работы разных приложений от разных платформ, простоту разработки приложений, легкость поддержки, хорошо стандартизированные отношения клиент-сервер, возможность использования интернет/интранет. Одновременно Базы данных предлагают мощный метод упорядочения и сопровождения информации, представляемой на WEB страницах, возможность использовать для поиска информации SQL-сервер.

Проведенный анализ существующих методологий исследования систем приобретения знаний показал, что методология KADS приобрела наибольшее распространение и является основой современных направлений исследований в СПЗ.

Методология KADS (Knowledge Acquisition and Documentation Structuring) [2], в основе которой лежит понятие интерпретационной модели, позволяющей процессы извлечения, структурирования и формализации знаний рассматривать как "интерпретацию" лингвистических знаний в другие представления и структуры. Результатом анализа является концептуальная модель, состоящая из четырех уровней (уровня области - уровня вывода - уровня задачи - стратегического уровня), которая затем вводится в пространство проектирования и преобразуется в трехуровневую модель проектирования.

При проведении анализа знаний о предметной области на лингвистическом уровне, исходным материалом являются тексты (протоколы) - записи интервью с экспертом, протоколы "мыслей вслух" и любые другие тексты. Затем происходит выделение фрагментов в анализируемом тексте, установление связей между фрагментами, группирование фрагментов, аннотирование фрагментов. Фрагменты могут иметь любую длину - от отдельного слова до протокола в целом. Фрагменты могут перекрывать друг друга. Возможны следующие типы связей между фрагментами:

  • аннотация (связь между фрагментом протокола и некоторым текстом);
  • член группы (связь между фрагментом и названием - именем группы фрагментов; объединение фрагментов в группу позволяет структурировать протоколы, при этом группа фрагментов получает уникальное имя);
  • поименованная связь (связь между двумя фрагментами);
  • понятийная связь (поименованная связь между фрагментом и понятием).

Следовательно, можно сделать вывод, что при построении концептуальной модели используются предметные знания в виде набора понятий и связывающих их отношений. Каждое понятие имеет имя и может иметь атрибуты, каждый атрибут может иметь значение с учетом специфики предметной области.

Данное положение является первым базисом совершенствования методологии проектирования информационных систем

В последнее время возрастает количество теоретических и практических работ, посвященных интеллектуальному поиску и анализу информации в Интернет. Основной идеей современных исследований в этой области становится превращение неструктурированных массивов данных в сети в знания и создание средств и приложений работы с ними. Архитектура таких систем [3], представляет информационные потребности пользователя в виде специальных баз знаний (онтологии), для поиска необходимой информации в сети интернет.

Основной характерной чертой онтологического исследования является, в частности, разделение реального мира на составляющие и классы объектов (at its joints) и определение их онтологий, или же совокупности фундаментальных свойств, которые определяют их изменения и поведение.

Стандарт онтологического исследования IDEF5 (INTEGRATED DEFintion) представитель семейства государственных стандартов США IDEFx включающих 14 стандартов, представляющих методологии исследования систем в различных отраслях знаний [4].

Принципы стандарта онтологического исследования:

1. Онтологический анализ начинается с составления словаря терминов, который используется при обсуждении и исследовании характеристик объектов и процессов, составляющих рассматриваемую систему, а также создания системы точных определений этих терминов. Кроме того, документируются основные логические взаимосвязи между соответствующими введенным терминам понятиями. Результатом этого анализа является онтология системы, или же совокупность словаря терминов, точных их определений взаимосвязей между ними.

2. В любой системе существует две основные категории предметов восприятия, такие как сами объекты, составляющие систему (физические и интеллектуальные) и взаимосвязи между этими объектами, характеризующие состояние системы. В терминах онтологии, понятие взаимосвязи, однозначно описывает или, другими словами, является точным дескриптором зависимости между объектами системы в реальном мире, а термины - являются, соответственно, точными дескрипторами самих реальных объектов.

Таким образом, онтология представляет собой некий словарь данных, включающий в себя терминологию и модель поведения системы.

Данное положение является вторым базисом совершенствования методологии проектирования информационных систем

Концепции IDEF5

Процесс построения онтологии, согласно методологии IDEF5 состоит из пяти основных действий:

1) Изучение и систематизирование начальных условий. Это действие устанавливает основные цели и контексты проекта разработки онтологии, а также распределяет роли между членами проекта

2) Сбор и накапливание данных. На этом этапе происходит сбор и накапливание необходимых начальных данных для построения онтологии

3) Анализ данных. Эта стадия заключается в анализе и группировке собранных данных и предназначена для облегчения построения терминологии.

4) Начальное развитие онтологии. На этом этапе формируется предварительная онтология, на основе отобранных данных.

5) Уточнение и утверждение онтологии - Заключительная стадия процесса.

Инструментальная среда, предлагаемая стандартом DEF5.

Для поддержания построения онтологии в IDEF5 существуют специальные онтологические языки: язык доработок и уточнений (Elaboration Language - EL) и схематический язык (Schematic Language - SL). EL представляет собой структурированный текстовый язык, который позволяет детально характеризовать элементы онтологии, и обеспечивает полноту представления структуры данных. SL является наглядным графическим языком, специально предназначенным для изложения компетентными специалистами в рассматриваемой области системы основных данных в форме онтологической информации. Язык SL позволяет строить разнообразные типы диаграмм и схем, наглядно и визуально представляющие основную онтологическую информацию. Наиболее важные и заметные зависимости между объектами описываются четырьмя видами основных видов схем, которые используются для накопления информации об онтологии в графической форме:

1. Диаграмма классификаций, обеспечивающая механизм для логической систематизации знаний, накопленных при изучении системы. Существует два типа таких диаграмм: Диаграмма строгой классификации (Description Subsumption - DS) и Диаграмма естественной или видовой классификации (Natural Kind Classification - NKC).

2. Композиционные схемы, являющиеся механизмом графического представления состава классов онтологии и фактически представляют собой инструменты онтологического исследования по принципу ``Что из чего состоит``.

3. Схемы взаимосвязей позволяют разработчикам визуализировать и изучать взаимосвязи между различными классами объектов в системе.

4. Диаграммы состояния объекта, позволяющие документировать тот или иной процесс с точки зрения изменения состояния или вида объекта.

В соответствии со стандартом IDEF5 и методологией KADS примем основные концепции исследований онтологии предметной области.

1. При построении концептуальной модели используются предметные знания в виде набора понятий и связывающих их отношений. Каждое понятие имеет имя и может иметь атрибуты, каждый атрибут может иметь значение с учетом специфики предметной области.

2. Модель может быть построена использованием следующих средств: словаря терминов, используемых при описании характеристик объектов и процессов, имеющих отношение к рассматриваемой системе, точных и однозначных определений всех терминов этого словаря и классификации логических взаимосвязей между этими терминами.

Базисом проектирования концептуальной модели ИС является:

"Предметная область, обладающая хорошо отработанным и выверенным понятийным аппаратом, корректно построенной иерархией определений предметно-ориентированных понятий, является базисом (или основой) для выполнения концептуального и информационного моделирования" [...онтология системы, или же совокупность словаря терминов, точных их определений взаимосвязей между ними IDEF5].

Концептуальной моделью предметной области будем называть:

"Описание (модель) предметной области, выполненное без ориентации на используемые в дальнейшем программные и технические средства - называется концептуальной (инфологической) моделью предметной области" […В любой системе существует две основные категории предметов восприятия, такие как сами объекты, составляющие систему (физические и интеллектуальные) и взаимосвязи между этими объектами, характеризующие состояние системы IDEF5.].

Концептуальная модель предметной области указывает, какая информация будет содержаться, и обрабатываться в проектируемой системе, не касаясь вопросов, как это будет реализовано. Структура данных, описывающая предметную область на инфологическом уровне, является проблемно-ориентированной и системно-независимой, то есть независимой от конкретной СУБД, операционной системы и аппаратного обеспечения.

Определим основные понятия необходимые, для построения концептуальной модели используя терминологию объектно-ориентированного анализа Shlaer - Mellor:

1. Понятие объекта.

Объект - это такое абстрактное множество предметов, в котором, все предметы в этом множестве - экземпляры - имеют одни и те же характеристики. Все экземпляры подчинены и согласованы с одним и тем же набором правил и линий поведения. Каждый объект в информационной модели должен быть обеспечен уникальным именем и идентификатором. Объекты могут абстрагироваться в класс объектов, для представления объектов специализированного назначения имеющих общие атрибуты.

2. Понятие атрибута.

Все предметы в реальном мире имеют характеристики. Каждая отдельная характеристика, которая является общей для всех возможных экземпляров объекта, абстрагируется в отдельный атрибут.

Атрибут - это абстракция одной характеристики, которой обладают все абстрагированные как объект сущности. Каждый атрибут обеспечивается именем, уникальным в пределах объекта. Множество атрибутов может объединяться в группу атрибутов и иметь идентификатор группы атрибутов. Множество идентификаторов групп могут быть объединены в класс и иметь идентификатор класса.

3. Представление

Объект, вместе со своими атрибутами, в информационной модели можно представить в графическом или текстовом виде.

4. Понятие связи

Связь - это абстракция набора отношений, которые систематически возникают между различными видами предметов в реальном мире. Реальные предметы должны быть сами абстрагированы как объекты. Каждая связь должна иметь уникальный идентификатор.

Представление связи в информационной модели может быть текстовым или графическим.

Безусловные связи

Существуют три вида связи: один - к - одному, один - ко - многим и многие - ко - многим.

Условные формы связей

В условной связи могут существовать экземпляры объектов, которые не принимают участие в процессе передачи информации.

Формализация связей

Для формализации связи к объекту добавляются вспомогательные атрибуты имеющие ссылки на идентификаторы связей.

Для формализации связи один - ко - многим создают ассоциативный объект, который содержит ссылки на идентификаторы каждого из участвующих в модели объектов.

Композиция связи

Некоторые связи образуются как неизбежное следствие существования других связей.

Выводы.

В результате проведенных исследований предложен подход концептуального моделирования информационных систем на основе трех составляющих "диаграммы объектов - дерево функций - сетевого представления". Выполнено проектирование информационной системы аудиторской деятельности.

Литература.

1. Бабак В.Ф., Рыженко И.Н., Аспекты проектирования информационных систем, Тезисы конференции посвященной 200-ю со дня рождения Пушкина, Бишкек- КРСУ июль 1999.

2. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. - С.Петербург: ПИТЕР, 2000.-384с.

3. Maikevich N. V., Khoroshevsky V. F., Intelligent Processing of Web Resources: Ontology-Based Approach and Multiagent Suppor, In: Proceedings of 1st International Workshop of Central and Eastern Europe on Multi-agent Systems (CEEMAS'99). - 1-4 June, 1999, St.-Petersburg, Russia.

4. Information integration for Concurrent Engineering (IICE). IDEF5 Method Report., Knowledge Based Systems, Inc. University Drive East, College Station, Texas 1994.



Опубликовал admin
31 Июл, Суббота 2004г.



Программирование для чайников.