Основой прецедентной модели является предположение, что подобные проблемы имеют подобные решения. В статье предлагается новая модель подобия, состоящая из нечетких правил и оценки критериев подобия. Нечеткие правила в прецедентной модели используются в качестве сопоставляющего механизма, чтобы определить в какой степени текущий случай похож на случай из библиотеки прецедентов.
Модель, основанная на прецедентах (Case-Based Reasoning, CBR) - это подход, который позволяет решить новую задачу, используя или адаптируя решения уже ранее известной задачи. Карпов Л.Е. вводит следующее определение прецедента: «прецедент - это описание проблемы или ситуации в совокупности с подробным указанием действий, предпринимаемых в данной ситуации или для решения данной проблемы» [1]. Когда рассматривается новая ситуация, система находит подобный прецедент в базе знаний, как аналог и пытается использовать решение найденного прецедента, если необходимо, то адаптирует его к изменениям для текущего случая. Потом происходит обработка текущего случая, прецедент и его решение вносится в базу прецедентов для использования в будущем.
Рассмотрим, что должен включать прецедент:
• Описание ситуации,
Решение, которое было принято в этой ситуации,
Обоснование (результат) применения решения.
Описание ситуации содержит всю информацию, которая необходима для достижения цели (выбора наиболее подходящего решения). Решение содержит: набор операций, которые необходимо выполнить для получения успешного результата; полученные от выполнения операций результаты, набор действий, который можно сделать, чтобы избежать отказа. В описание результата могут входить ссылки на другие прецеденты, текстовая информация и т.п. Обоснование применения решения - это обратная связь, которая возникает при применении решения к ситуации.
Нечеткая логика - это обобщение традиционной логики, в случае, когда истинность рассматривается как лингвистическая переменная, принимающая значения типа «очень истинно», «более-менее истинно», «не очень ложно» [2].
Под лингвистической переменной будем понимать переменную, которая для своего задания использует лингвистические значения, которые являются качественными характеристиками. Например, температура воды и скорость - это лингвистические переменные; «холодная», «прохладная», «теплая», «горячая» - это лингвистические значения (характеристики); «примерно 45 градусов», «около 60 км/ч» - это значения нечетких чисел.
Для определения некоторой лингвистической переменной используется лингвистическое терм-множество, которое содержит в себе все лингвистические значения. Под областью значений переменной понимается множество всех числовых значений, которые могут относиться к определенному параметру изучаемой системы, а также множество значений, которые важны с точки зрения решаемой задачи.
Формально конечное нечеткое множество записывается в виде
Таким образом, нечеткая логика основана на рассуждениях, что решение является не точным, а приблизительным. Нечеткие логические переменные принимают значения истинности, которые расположены между 0 и 1 и не ограничиваются всего двумя значениями истинности, как в традиционной логике.
Нечеткие правила и рассуждения для оценки сходства.
Предположим, что имеется и свойств для проблем в базовом домене. Прецедент Ci в базе прецедентов индексируется как (и 1) кортеж: Ci=(Clb Cl2, Cl3, ... Сjn, SO, где Clb Cl2, Cl3, ... Cm можно обозначить значения атрибутов в этом прецеденте и - это соответствующее решение. Аналогичным образом мы используем n-кортеж (рь р2, ..., рп), чтобы представлять текущую проблему Р, с pj относящуюся к значению j-ro атрибута в проблеме. Для сопоставления прецедента Q и текущей проблемы Р, сначала мы должны вычислить значения разности Xj =р]-с^ на каждое свойство j между ними. Такие отличия свойств потом будут являться в качестве входов для условий в частях нечетких правил, по которым определяется схожесть прецедента С, по отношению к текущей проблеме Р.
Предположим, что нечеткие множества свойств Xj (j = 1 ... N) представлены в виде A (j, 1), A (j, 2), ..., A (j, q [j]) и q[j] есть число лингвистических термов для Xj. Н(.) обозначим целочисленную функцию принадлежности от {1, 2, ..., m (m =n)} до {1, 2, ..., п}, удовлетворяющую условию, что Vi Ф j,H(i) Ф H(J).
Нечеткие правила, используемые в данной работе для оценки сходства случаев, формулируются следующим образом:
and [xh(m) = UkeD(m) A(h(m),k)] then Сходство = V, (2)
где D(i) с {1,2, .. ,,q[h(i)]} для i=l ...m, и Ve{1.0, 0}. Обратите внимание, что вывод этого правила является однозначным либо 1, либо 0.
Однако, структура предположений, определенных выше, является очень общей, но она предлагает высокую степень гибкости в спецификации. Если в предположение, которое указано выше (2) входят все входные переменные (например, m=n), то мы говорим, что это правило обладает полной структурой, в противном случае его структура является неполной. Еще одной важной особенностью правила (2) является то, что операция объединения входных нечетких множеств допускается, их предположения.
При наличии набора правил в виде (2), степень сходства между прецедентом Ci и проблемой Р может быть вычислена следующим образом:
Вычисляется вектор различий (х1:Х2,... ,хп) между С, и Р, где Xj =pj- Cijl ДЛЯ ] =1 ... n.
Вычисляется мощность для каждого правила Rk для пары случаев (Ci,
Р)
(Q.P) = Мяк(хi,x2, -,хп), (3)
где iiRk(x1:X2: ...,хп), обозначает ранг вектора (х1?х2: ...,хп) относительно условной части правила R^
Рассуждения о схожести формируются путем агрегирования заключений правил в соответствии с их мощностью.
Предположим, что Vk- это единичный вывод для правила Rk, значение подобия между прецедентом Ci и проблемой Р выводится как:
Sim (Ci,Р) = (4)
1 ZvktkW) v '
Экспериментальные оценки. Продемонстрируем результаты оценки на известном эталонном наборе данных: «Ирис», который может быть загружен с веб-страницы archive.ics.uci.edu/ml/. 150 примеров в наборе «Ирис», которые характеризуются четырьмя атрибутами. Набор данных был классифицирован в три класса.:
1. Обучение небольшой базы прецедентов.
В экспериментах, из набора данных «Ирис» были случайным образом выбраны тестовые данные для обучения. Остальные данные были использованы в качестве тестовых данных. Нечеткие правила, извлеченные из базы прецедентов, были применены к прецедентам для классификации случаев на тестовых данных. Были сделаны такие эксперименты три раза для набора данных, каждый раз принимая разные части примеров в качестве базы прецедентов для обучения. Таблица 1 представленная ниже, показывает точность классификации на тестовых задачах для данных «Ирис».
Таблица 1. Тест на точность набора данных «Ирис»
Число испытаний
Точность классификации
1
0,93
2
0,87
3
0,93
Среднее
0,91
Из приведенной выше таблицы видно, что отличная классификационная точность была достигнута с помощью предложенной модели, основанной на прецедентном подходе, несмотря на небольшое количество случаев в базе прецедентов.
Таблица 2 Точность на наборе данных «Ирисы»
Число испытаний
Искомый размер базы
Точность на тестовых данных
1
60
0,900
2
60
0,860
3
60
0,860
Среднее
60
0,873
4
45
0,860
5
45
0,860
6
45
0,850
Среднее
45
0,857
7
30
0,780
8
30
0,870
9
30
0,880
Среднее
30
0,843
:
1. Устойчивость против резкого сокращения прецедентов В экспериментах, в которых после обучения нечетких правил, оригинальная база прецедентов была уменьшена до чрезвычайно малых размеров, предоставляла хорошую производительность для прецедентной системы. Это можно объяснить тем, что обучение прецедентной модели передает информацию в глобальной проекции, такой, что релевантность прецедентов для текущей проблемы может быть выявлена в отдаленных областях, учитывая рассредоточенный характер прецедентов.
Проведенные исследования оценки, показали превосходство предложенного метода в моделях подобия по сравнению с традиционными моделями, а также возможность обучения системы, на основе нечетких правил подобия из небольшого количества прецедентов.
Список литературы
Карпов Л.Е., Юдин В.Н. Методы добычи данных при построении локальной метрики в системах вывода по прецедентам. - М.: Питер, 2007
Штовба С.Д. «Введение в теорию нечетких множеств и нечеткую логику» [Электронный ресурс]: matlab.exponenta.ru/fuzzylogic/bookl (дата обращения 15.02.2016)
2. V. Marques, J. Т. Farinha, and A. Brito, “Case-based reasoning and fuzzy logic in fault diagnosis,” WSEAS Transactions on Computers, vol. 8, pp. 1408-1417, 2009.
УДК 004.89.27
МАКАРОВА ЕКАТЕРИНА СЕРГЕЕВНА Новосибирский государственный технический университет KATMC[AT]yandex.ru
набор данный ириса, прецедент текущий проблема, переменный принимать значение, ириса число испытание, нечеткий править оценка, данный ириса число, точность набор данный, предположить единичный вывод, единичный вывод править, мощность предположить единичный, данный ириса число испытание, набор данный ириса число, точность набор данный ириса, единичный вывод править значение, вывод править значение подобие, править значение подобие прецедент, предположить единичный вывод править, мощность предположить единичный вывод, заключение править соответствие мощность, править соответствие мощность предположить,