СТАТЬИ АРБИР
 

  2018

  Июль
  Август   
  Пн Вт Ср Чт Пт Сб Вс
30 31 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 1 2
   

  
Логин:
Пароль:
Забыли свой пароль?


Нечеткие правила для оценки сходства прецедентов


НЕЧЕТКИЕ ПРАВИЛА ДЛЯ ОЦЕНКИ СХОДСТВА ПРЕЦЕДЕНТОВ

Основой прецедентной модели является предположение, что подобные проблемы имеют подобные решения. В статье предлагается новая модель подобия, состоящая из нечетких правил и оценки критериев подобия. Нечеткие правила в прецедентной модели используются в качестве сопоставляющего механизма, чтобы определить в какой степени текущий случай похож на случай из библиотеки прецедентов.

Модель, основанная на прецедентах (Case-Based Reasoning, CBR) - это подход, который позволяет решить новую задачу, используя или адаптируя решения уже ранее известной задачи. Карпов Л.Е. вводит следующее определение прецедента: «прецедент - это описание проблемы или ситуации в совокупности с подробным указанием действий, предпринимаемых в данной ситуации или для решения данной проблемы» [1]. Когда рассматривается новая ситуация, система находит подобный прецедент в базе знаний, как аналог и пытается использовать решение найденного прецедента, если необходимо, то адаптирует его к изменениям для текущего случая. Потом происходит обработка текущего случая, прецедент и его решение вносится в базу прецедентов для использования в будущем.

Рассмотрим, что должен включать прецедент:

• Описание ситуации,

Решение, которое было принято в этой ситуации,

Обоснование (результат) применения решения.

Описание ситуации содержит всю информацию, которая необходима для достижения цели (выбора наиболее подходящего решения). Решение содержит: набор операций, которые необходимо выполнить для получения успешного результата; полученные от выполнения операций результаты, набор действий, который можно сделать, чтобы избежать отказа. В описание результата могут входить ссылки на другие прецеденты, текстовая информация и т.п. Обоснование применения решения - это обратная связь, которая возникает при применении решения к ситуации.

Нечеткая логика - это обобщение традиционной логики, в случае, когда истинность рассматривается как лингвистическая переменная, принимающая значения типа «очень истинно», «более-менее истинно», «не очень ложно» [2].

Под лингвистической переменной будем понимать переменную, которая для своего задания использует лингвистические значения, которые являются качественными характеристиками. Например, температура воды и скорость - это лингвистические переменные; «холодная», «прохладная», «теплая», «горячая» - это лингвистические значения (характеристики); «примерно 45 градусов», «около 60 км/ч» - это значения нечетких чисел.

Для определения некоторой лингвистической переменной используется лингвистическое терм-множество, которое содержит в себе все лингвистические значения. Под областью значений переменной понимается множество всех числовых значений, которые могут относиться к определенному параметру изучаемой системы, а также множество значений, которые важны с точки зрения решаемой задачи.

Формально конечное нечеткое множество записывается в виде

А={ хь цА(хО , х2, цА(х2) ,- ■■ , хп, Ца(хп) } (1)

Таким образом, нечеткая логика основана на рассуждениях, что решение является не точным, а приблизительным. Нечеткие логические переменные принимают значения истинности, которые расположены между 0 и 1 и не ограничиваются всего двумя значениями истинности, как в традиционной логике.

Нечеткие правила и рассуждения для оценки сходства.

Предположим, что имеется и свойств для проблем в базовом домене. Прецедент Ci в базе прецедентов индексируется как (и 1) кортеж: Ci=(Clb Cl2, Cl3, ... Сjn, SO, где Clb Cl2, Cl3, ... Cm можно обозначить значения атрибутов в этом прецеденте и - это соответствующее решение. Аналогичным образом мы используем n-кортеж (рь р2, ..., рп), чтобы представлять текущую проблему Р, с pj относящуюся к значению j-ro атрибута в проблеме. Для сопоставления прецедента Q и текущей проблемы Р, сначала мы должны вычислить значения разности Xj =р]-с^ на каждое свойство j между ними. Такие отличия свойств потом будут являться в качестве входов для условий в частях нечетких правил, по которым определяется схожесть прецедента С, по отношению к текущей проблеме Р.

Предположим, что нечеткие множества свойств Xj (j = 1 ... N) представлены в виде A (j, 1), A (j, 2), ..., A (j, q [j]) и q[j] есть число лингвистических термов для Xj. Н(.) обозначим целочисленную функцию принадлежности от {1, 2, ..., m (m =n)} до {1, 2, ..., п}, удовлетворяющую условию, что Vi Ф j,H(i) Ф H(J).

Нечеткие правила, используемые в данной работе для оценки сходства случаев, формулируются следующим образом:

and [xh(m) = UkeD(m) A(h(m),k)] then Сходство = V, (2)

где D(i) с {1,2, .. ,,q[h(i)]} для i=l ...m, и Ve{1.0, 0}. Обратите внимание, что вывод этого правила является однозначным либо 1, либо 0.

Однако, структура предположений, определенных выше, является очень общей, но она предлагает высокую степень гибкости в спецификации. Если в предположение, которое указано выше (2) входят все входные переменные (например, m=n), то мы говорим, что это правило обладает полной структурой, в противном случае его структура является неполной. Еще одной важной особенностью правила (2) является то, что операция объединения входных нечетких множеств допускается, их предположения.

При наличии набора правил в виде (2), степень сходства между прецедентом Ci и проблемой Р может быть вычислена следующим образом:

Вычисляется вектор различий (х1:Х2,... ,хп) между С, и Р, где Xj =pj- Cijl ДЛЯ ] =1 ... n.

Вычисляется мощность для каждого правила Rk для пары случаев (Ci,

Р)

(Q.P) = Мяк(хi,x2, -,хп), (3)

где iiRk(x1:X2: ...,хп), обозначает ранг вектора (х1?х2: ...,хп) относительно условной части правила R^

Рассуждения о схожести формируются путем агрегирования заключений правил в соответствии с их мощностью.

Предположим, что Vk- это единичный вывод для правила Rk, значение подобия между прецедентом Ci и проблемой Р выводится как:

Sim (Ci,Р) = (4)

1 ZvktkW) v '

Экспериментальные оценки. Продемонстрируем результаты оценки на известном эталонном наборе данных: «Ирис», который может быть загружен с веб-страницы archive.ics.uci.edu/ml/. 150 примеров в наборе «Ирис», которые характеризуются четырьмя атрибутами. Набор данных был классифицирован в три класса.:

1. Обучение небольшой базы прецедентов.

В экспериментах, из набора данных «Ирис» были случайным образом выбраны тестовые данные для обучения. Остальные данные были использованы в качестве тестовых данных. Нечеткие правила, извлеченные из базы прецедентов, были применены к прецедентам для классификации случаев на тестовых данных. Были сделаны такие эксперименты три раза для набора данных, каждый раз принимая разные части примеров в качестве базы прецедентов для обучения. Таблица 1 представленная ниже, показывает точность классификации на тестовых задачах для данных «Ирис».

Таблица 1. Тест на точность набора данных «Ирис»

Число испытаний
Точность классификации
1
0,93
2
0,87
3
0,93
Среднее
0,91

Из приведенной выше таблицы видно, что отличная классификационная точность была достигнута с помощью предложенной модели, основанной на прецедентном подходе, несмотря на небольшое количество случаев в базе прецедентов.

Таблица 2 Точность на наборе данных «Ирисы»

Число испытаний
Искомый размер базы
Точность на тестовых данных
1
60
0,900
2
60
0,860
3
60
0,860
Среднее
60
0,873
4
45
0,860
5
45
0,860
6
45
0,850
Среднее
45
0,857
7
30
0,780
8
30
0,870
9
30
0,880
Среднее
30
0,843

:

1. Устойчивость против резкого сокращения прецедентов В экспериментах, в которых после обучения нечетких правил, оригинальная база прецедентов была уменьшена до чрезвычайно малых размеров, предоставляла хорошую производительность для прецедентной системы. Это можно объяснить тем, что обучение прецедентной модели передает информацию в глобальной проекции, такой, что релевантность прецедентов для текущей проблемы может быть выявлена в отдаленных областях, учитывая рассредоточенный характер прецедентов.

Проведенные исследования оценки, показали превосходство предложенного метода в моделях подобия по сравнению с традиционными моделями, а также возможность обучения системы, на основе нечетких правил подобия из небольшого количества прецедентов.

Список литературы

Карпов Л.Е., Юдин В.Н. Методы добычи данных при построении локальной метрики в системах вывода по прецедентам. - М.: Питер, 2007

Штовба С.Д. «Введение в теорию нечетких множеств и нечеткую логику» [Электронный ресурс]: matlab.exponenta.ru/fuzzylogic/bookl (дата обращения 15.02.2016)

2. V. Marques, J. Т. Farinha, and A. Brito, “Case-based reasoning and fuzzy logic in fault diagnosis,” WSEAS Transactions on Computers, vol. 8, pp. 1408-1417, 2009.

УДК 004.89.27


МАКАРОВА ЕКАТЕРИНА СЕРГЕЕВНА Новосибирский государственный технический университет KATMC[AT]yandex.ru





МОЙ АРБИТР. ПОДАЧА ДОКУМЕНТОВ В АРБИТРАЖНЫЕ СУДЫ
КАРТОТЕКА АРБИТРАЖНЫХ ДЕЛ
БАНК РЕШЕНИЙ АРБИТРАЖНЫХ СУДОВ
КАЛЕНДАРЬ СУДЕБНЫХ ЗАСЕДАНИЙ

ПОИСК ПО САЙТУ