Базы знаний

Содержание

1. Введение 4

2. Различные типы знаний и их представления 5

2.1. Различные типы знаний. 5

2.2. Различные представления знаний в существующих системах. 7

2.3. Способы использования знаний и доступ к ним. 9

2.4. Преимущества и недостатки продукционных систем 10

3. Метазнание 12

3.1. Метазнание объектов окружающего мира 12

3.2. Метазнание стратегий 13
Заключение 15
Литература 18


1. Введение

Задание на курсовую работу по дисциплине "Базы данных"

Студент группы ОИН 10913

Зубко Д.В.

Направление: "Информатика и ВТ", № контракта 19000010602071

Тема: Базы знаний

Задание выдано:______________


2. Различные типы знаний и их представления

В настоящее время целью исследований в области ИИ является создание таких систем, которые, с одной стороны, могут использовать большое количество знаний, передаваемых им специалистами, а с другой - способны вступать в диалог и объяснять свой собственные выводы. Это предполагает наличие эффективного управления большой по объему и хорошо структурированной базой знаний, строгое разграничение между различными уровнями знаний, наличие множества удобных представлений для правил, схем предикатов или прототипов и четко определенный процесс обмена информацией между различными источниками.

Необходимо, чтобы система знала, что она знает. Если попытаться провести аналогию с людьми, то подобное метазнание означает посто­янное использование в течение жизни информации о каждом прожитом дне. Если, например, вы забыли имя приятеля, встреченного на улице, то ваше метазнание состоит в том, что либо вы его имя знали, но забыли, либо этого имени никогда не знали. Впрочем, мы постоянно используем важные эвристические правила, основанные на подобном метазнаний, такие, как "если бы это была правда, то я бы это знал". Они зависят от двух важных параметров: значимости имеющего к ним отношения факта и степени нашей собственной компетентности в данной области. В действительности каждое человеческое знание сразу же требует метазнания, связанного с тем местом, которое мы отводим данному знанию в ряду другой информации, как мы к нему относимся, для каких целей оно нам полезно, к какому семейству принадлежит. Все эти моменты рассматриваются в следующих разделах, посвященных описанию реальных информационных систем.

2.1 Различные типы знаний

Выделим восемь основных типов знаний по следующим признакам.

1) Базовые элементы, объекты реального мира. Они связаны с непосредственным восприятием, не требует обсуждения, и добавляются к нашей базе фактов в том виде, в котором они получены.

2) Утверждения и определения. Они основаны на базовых элементах
и заранее рассматриваются как достоверные.

3) Концепции. Они представляют собой перегруппировки или обобщения базовых объектов. Для построения каждой концепции используются свои приемы. Например, в системах МЕСНО (Bundy, 1979) или AM (Lenat, 1977) они построены на основе примеров, контр­ примеров, частных случаев, более общих или аналогичных концепций.


4) Отношения. Они выражают как элементарные свойства базовых элементов, так и отношения между концепциями. Кроме того, к

свойствам отношений относятся их большее или меньшее правдоподобие, большая или меньшая связь с данной ситуацией. Еще раз отметим, что представление знаний в экспертных системах близко к моделям, используемым в базе данных. Таким путем построена ре­ляционная (обобщенная) модель базы данных в системах OPS, PROLOG, SNARK и TANGO.

Пара понятий "свойство - значение" (relationship - entity) хорошо известна в семантических сетях; фреймы и скрипты являются не чем иным, как наиболее простыми бинарными отношениями. Некоторые экспертные системы (INTERNIST, BAOBAB, SPHINX) в качестве базы факторов используют уже базы существующих данных.

5) Теоремы и правила перезаписи. Они являются частным случаем
продукционных правил с вполне определенными свойствами. Теоремы не представляют никакой пользы без экспертных правил их использования. Явное присутствие теорем в экспертных системах представляет главное отличие от систем управления классическими базами данных (СУБД), в которых они либо отсутствуют, либо про­граммируются. Модификация или добавление новых теорем явля­ется весьма трудоемкой, хотя и необходимой процедурой, так как нужно обеспечить хорошее структурированное управление базой данных и оптимизировать получение ответов (Gallaire, 1987).

6) Алгоритмы решений. Они необходимы для выполнения определенных задач. Во всех случаях они связанны со знанием особого типа, поскольку определяемая ими последовательность действий оказывается оформленной в блок в строго необходимом порядке в отличие от других типов знания, где элементы информации могут появляться и располагаться без связи друг с другом.

Очевидно что очень трудно работать с длинными процедурами, состоящими из большого числа различных действий. .Использование чистых алгоритмов ограниченно очень частными случаями, большая часть которых имеет дело с обработкой числовой информации. Человек же должен уметь работать со многими другими типами информации и оказывается, что ЭВМ в отличие от простого калькулятора может помочь человеку в подобных неалгоритмиче­ских ситуациях.


7) Стратегии и эвристика. Этот тип представляет собой врожденные
или приобретенные правила поведения, которые позволяют в дан­
ной конкретной ситуации принять решение о необходимых действиях. Он использует информацию в порядке, обратном тому, в ко­тором она была получена. В качестве примера можно привести рас­суждение типа: "Я знаю, что это действие приводит к такому-то результату (информация типа 4), поэтому, если я хочу получить именно этот результат, я могу рассмотреть это действие". Человек постоянно пользуется этим типом знаний при восприятии, форми­ровании концепций, решении задач и формальных рассуждениях.

Появление экспертных систем связанно с необходимостью при­нятия в расчет именно этого фундаментального типа человеческих знаний.

8) Метазнание. Без сомнения оно присутствует на многих уровнях и
представляет собой знание того, что известно и определяет значение коэффициента доверия к этому знанию, важность элементарной информации по отношению ко всему множеству знаний. Кроме то­го, сюда же относятся вопросы организации каждого типа знаний и указаний, когда и как они могут быть использованы.

2.2. Различные представления знаний в существующих системах.

Приведем краткий список наиболее распространенных в настоящее время методов. Фундаментальное различие между ними состоит в простоте модификации знания. В таблице ниже они приведены в порядке от наиболее процедурного (наиболее застывшего, структурированного) до наиболее декларативного (наиболее открытого, свободного, неупорядоченного) Такая классификация является несколько грубой, но правильно: отражает идею.


Напомним, что конечные автоматы, программы, исчисление предикатов и системы с продукционными правилами с теоретической точки зрения эквивалентны друг другу, поскольку их в принципе можно свести к универсальной машине Тьюринга, хотя их "эксплуатационные характеристики" сильно различаются.

Такие формальные понятия, как фреймы; скрипты, семантические сети, возникли из реальных потребностей искусственного интеллекта и приносят большую помощь в понимании языка.

Фреймы предложены Минским в 1975 г. и представляют собой слож­ные структуры данных, описывающих какую-либо типичную ситуацию, на­пример ожидание в аэропорту или участие в семейном обеде. Фрейм состоит из позиций для размещения объектов, характеризующих данную ситуацию. Позиция может быть передана другому фрейму. Кроме того, он содержит информацию о выполняемых действиях, о том, как следует поступать в типичных и нетипичных случаях, о влиянии соседних фреймов.

Скрипт или схема представляет собой описание стереотипного сцена­рия действий с участием определенных объектов. Скрипты связаны с теку­щей культурой и необходимым для понимания таких предложений, как "Я вошел в ресторан, официантка принесла мне меню". Они могут вызывать


другие скрипты и обладают большими, чем фреймы, возможностями для описания динамических аспектов знания.

Семантические сети - это графы, которые часто представляют собой объединение двух предыдущих понятий и объектом описания которых явля­ются элементы окружающего мира и связи между ними. Они имеют много общего с реляционными моделями баз данных.

Изображения и графы эффективно используются для доказательства теорем. Они оказывают большую помощь в проверке отсутствия зациклива­ния этапов, в полном и эффективном хранении задачи в памяти, в организа­ции ввода новых элементов.

2.3. Способы использования знаний и доступ к ним.

Имеются четыре способа использования простой информации в форме pÉq. Примером этого может служить "каждый человек ошибается".

Самый непосредственный способ состоит в прямом использовании его смысла в формулировках типа:

"Нечто ошибается, и я могу доказать, что это нечто - человек". Второй способ, использующий метазнание и обратный ход мыслей, состоит в сле­дующем:

"Если я хочу доказать, что нечто ошибается, то возможная подцель со­стоит в том, чтобы показать, что это нечто - человек". Оба первых способа используют модус поненс, два следующих используют отрицание пред­ложения q и модус толенс:

а) "Если нечто не ошибается, оно не может быть человеком". Б) "Если я хочу доказать, что нечто не является человеком, то я могу по­пытаться показать, что оно не ошибается".

Отметим, что принцип решения и, в частности, использующий его язык
Пролог применяют единый формальный подход к описанию этих способов вывода.

С практической точки зрения использование информации зависит от параметров, которые характеризуют ее правдоподобие. Каждая система
обработки информации должна быть в состоянии ответить на такие вопросы как:

• Какая часть утверждения А является истиной?

• С какой степенью уверенности эксперт согласен с заключением?

• Какова средняя вероятность достижения цели с использованием А?

• В какой мере следует оказать предпочтение А перед другими?

Некоторые системы, основанные на продукционных правилах, исполь­зуют процессы приближенного вывода, учитывающие эти обстоятель­ства. Системы, применяющие продукционные правила, описаны выше. В следующем разделе показано возможное различие между этими сис­темами и подходом к решению тех же проблем с помощью логики пер­вого порядка, отмечены также преимущества и недостатки подобного моделирования знаний.

2.4. Преимущества и недостатки продукционных систем

Начнем с недостатков. Выделим из них три главных, с которыми связа­ны определенные ограничения, лежащие в основе используемого формализ­ма. Они относятся к концепции, формулировке и использованию правил.

1. Трудность составления продукционного правила, соответ­ствующего элементу знания. Нужно, чтобы рассматриваемая область
уже была достаточно изучена и установлены хорошие примитивы и
чтобы уровень детализации не был излишне подробным, иначе по­
требовалось бы иметь по одному правилу на каждую ситуацию
и неясно, как: человек смог бы разобраться в таком обилии информации.

2. Трудность записи правила. Единый формат записи ЕСЛИТО-
приводит к громоздким выражениям в левой части и повторению
тех же посылок в схожих ситуациях; с его помощью трудно вы­
разить сложные правила. Но мы видели, что жесткий синтаксис,
громоздкие записи представляют и определенные преимущества.
Во всех случаях проблема «поймать знания» остается главной при
написании экспертной системы. Трудности использования. Связаны не с самими правилами, а с единой системой их связи. При этом база фактов играет роль кратковременной памяти, которая реально смоделирована в разработанной Ньюэллом (Newell, ( 1975) системе «познавательной психологии» PSC. В ней запрещен взаимный прямой вызов одного правила из другого, и она неудобна для вы­полнения алгоритмов в обычном смысле слова. Однако имен­но благодаря ей система в каждый момент времени точно знает, что она делает и что она знает

К преимуществам относится следующее.

1. Модульность. Системы устроены так, чтакаждая единица информации. может быть удалена, изменена или добавлена независимо от всех остальных. Знания вводятся неупорядоченно, как в сло­варе или энциклопедии. Практика показывает, что это является естествен­ным способом пополнения своих знаний для эксперта.

Как ни странно, многочисленные американские авторы (Дэвис, Ньюэлл, Куинлан, Стэфик) нарушают это правило, т. е. проблема реорганизации решается у них довольно плохо.

2. Модифицируемость. Если добавляется или модифицируется какое-либо правило, то все, что было уже сделано ранее, остается в силе и к но­вому правилу не относится. Таким образом, каждое изменение обладает свойством аддитивности и локальности.

В отличие от этого в процедурных программах подобные взаимодействия ограниченны, любая модификация является ерундой и может привести к непредсказуемым последствиям.

3. Доступность чтения.

• Для нас это преимущество, безусловно, имеет место. Как уже гово­рилось выше, наше собственное знание является модульным, поэтому продукционные системы нам кажутся более близкими, более легкими для чтения. Этим преимуществом нельзя пренебрегать, поскольку по­добные системы в первую очередь предназначены для врачей, биологов, архитекторов и т. д. Во многих областях реально существуют добавляе­мые знания и соответствующие базы правил. (Например, автоматизиро­ванные экспертные обучающие системы.)

• Для машины. Более простой проверке поддается база знаний, представленная в форме правил, а не в форме процедур. Противоречия или избыточность в действительности легко определяется с помощью синтак­сической обработки:

АÙВ®С и АÙВ®ùС одновременно невозможны; из DÙEÙF®G следует EÙF®G с помощью "подпосылки";

таким образом, первое правило является лишним.

Может быть также обнаружена семантическая несогласованность: АÙВ®С неприемлемо, если по определению и из свойств А и В с необходимостью А®ùВ.

4. Способность к самообъяснению. Это свойство связано одновременно и с правилами, и с их структурами внешнего управления. Система легко прослеживает цепочку правил, которую она использовала для получения вы­
вода, так же как и использовавшиеся метаправила.

Однородное представление знания, определяемое установленным форма­
том, разрешает создавать модели правил, которые позволяют получить ответы на некоторые вопросы и предусмотреть большую часть изменений ,в случае обнаружения ошибки в базе данных.

5. Эффективность. Практика доказала гибкость и компетентность таких
систем, как MYCIN, PROSPECTOR и R1. Эти системы являются уже не ла­бораторными игрушками, а высокопроизводительными устройствами. Они
оказались достаточно эффективными и выдерживают сравнение с процедурными системами во многих областях, примеры которых приведены, в частности, в работе (Rychener, 1978).

Их структура управления позволяет принимать в расчет многочисленные параметры, характеризующие ситуацию. Причина эффективности продукционных правил заключается в том, что эти правила учитывают кон­кретные данные в каждом случае.


3. Метазнание

Метазнание представляет собой любое знание о знании. Оно является фундаментальным понятием для систем, которые не только используют свою базу знаний такой, как она есть, но и умеют на ее основе делать вы­воды, структурировать ее, абстрагировать, обобщать, а также решать, в каких случаях она может быть полезна. Ввод знаний в систему являет­ся задачей не только специалистов в данной области но и самой системы, которая должна управлять этим процессом.

3.1. Метазнание объектов окружающего мира

Решение проблем, охватывающих большие объемы знаний, требует уме­ния обращаться с очень сложными и весьма различными типами данных, как по содержанию, так и по взаимосвязи с другими элементами системы. Требуемая информация должна не только присутствовать в программных комментариях и в мыслях разработчика, но и быть доступной самой сис­теме. Таким образом, с каждым элементарным объектом может быть связа­но смысловое значение — концепт. Например, в системах МЕСНО и MYCIN каждый из концептов содержит следующую информацию:

а) описательную часть, которая уточняет характеристики и структуру данных;

б) указатель на все известные примеры концепта;

в) связи с другими концептами;

г) указатель в иерархии схем на группу концептов того же семейства.

Когда формулируется новое правило, которое содержит слово или группу слов, неизвестных системе, она их анализирует с помощью имеющихся концептов, используя контекст и последовательность слов пра­вила. Более того, если некоторые свойства известны из других примеров того же концепта, то система в состоянии запросить у пользователя уточ­нения этого свойства для данного случая. При необходимости она также обнаруживает нарушения связи между концептами.

Подобные системы имеют возможность фиксировать все концепты одного и того же иерархического уровня, изменение, внесенное экспертом в, один из них, а также оценивать важность изменений, внесенных в базу данных, ес­ли в определенную структуру добавляется новый пример.

Кроме того, продукционные правила могут характеризоваться моделями правил. Эти модели создаются и управляются системой и учитывают перио­дичность использования правил. Они занимаются проверкой соответствия между новым правилом и базой, кроме того, именно они указывают экспер­ту на главные тенденции множества правил даже в том случае, когда самих правил эксперт не знает. Именно они обогащаются с каждым новым примером по мере роста множества правил. В системе МЕСНО, напри­мер, сами формулировки задач связаны с формой метазнания. Система по­стоянно пытается распознать в формулировке стандартную ситуацию. Ко­гда ей это удается, она дополняет множество фактов всеми физическими ги­потезами, справедливыми для данного случая.

3.2. Метазнание стратегий

В продукционных системах стратегии также представлены в форме метаправил, поскольку они затрагивают сами правила. Они являются изо­лированными и доступными для системы. Эвристические законы управления поиском решения используют эти метаправила в качественном и деклара­тивном виде, вместо того чтобы использовать количественные оценки. С применением числовых оценочных функций связан риск ошибки: они плохо читаемы, отражаемый ими частичный порядок приводит с слож­ным вычислениям, любая модификация приводит к возможности появления ошибки.

Стратегии, заданные в форме метаправил, являются более четкими и оп­ределенными. Выводы метаправил указывают на действия, которые необхо­димо предпринять в рассматриваемой ситуации. Таким образом они реа­лизуют полезный потенциал, заключенный в множестве правил, и дают двойной эффект:

1) исключают определенные правила, не подходящие к данной ситуа­ции, и тем самым уменьшают дерево поиска;

2) осуществляют частичную классификацию других правил, частично
упорядочивая ветви дерева поиска.

Конечно же, можно и дальше увеличивать


10-09-2015, 22:21


Страницы: 1 2
Разделы сайта