Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.2
Методы ИАД являются дополнением традиционных методов статистической обработки данных (факторного, корреляционного, регрессионного и других видов анализа). Основной их особенностью является выявление логических связей между данными и представление результатов не в виде абстрактных математических формул, а в форме, позволяющей наглядно отобразить, интерпретировать и объяснить полученные знания. Именно эта наглядность найденных знаний объясняет практическую важность методов ИАД в реальных задачах принятия решений. Среди технологий выявления и отображения логических закономерностей в данных выделим следующие:
- технологии деревьев решений (decision trees) – построение по анализу описаний объектов дерева, каждая вершина которого есть правило для сравнения некоторого параметра Х с заданным значением А. Эти правила связаны между собой ребрами дерева так, что в зависимости от ответа на вопрос о параметре Х задается вопрос о значении параметра Y или Z. Конечные вершины дерева соответствуют некоторым решениям, например, указывают на принадлежность объекта к тому или иному классу (например, клиент – платежеспособный или нет; ситуация – конфликтная, потенциально конфликтная или неконфликтная). Для лучшего понимания приведем иллюстративный пример. Пусть известно некоторый достаточно большой перечень автомобилей, в котором выделяются три класса: класс 1 – автомобили, требующие косметического ремонта; класс 2 – автомобили не требующие ремонта; класс 3 – автомобили, требующие капитального ремонта. Каждый из автомобилей описывается набором параметров и их значениями. Система ИАД анализируя эти параметры может выбрать те из них, по значениям которых можно оценить принадлежность автомобиля к одному из классов. Эти параметры и их значения образуют систему – дерево решений (см. пример на рис. 6.2, который, однако, является сугубо иллюстративным и не претендует на точность).
Рис.6.2. Иллюстративный пример дерева решений
для распознавания класса автомобиля
Тогда, если имеется описание нового автомобиля, класс которого неизвестен, построенное компьютерной системой дерево решения позволит с большой долей уверенности сделать вывод о принадлежности к тому или иному классу, т.е. по существу - о необходимости капитального или косметического ремонта;
- технологии обнаружения и построения правил “Если… То” – на основании анализа имеющихся в базах данных событий вида “параметр Х больше (меньше, равно) константы А” строится система продукционных правил, позволяющих устанавливать ассоциации в данных, решать задачи классификации, прогнозирования и т.п.
К числу наиболее известных программных продуктов ИАД следует отнести систему See5 (производитель – RuleQuest, www.rulequest.com), WizWhy (производитель – WizSoft, www.wizsoft.com). Подробная информация об этих системах имеется в [Дюк, 2001], а прилагаемый к этой книге компакт-диск содержит демонстрационные версии программ с примерами. Следует отметить также отечественную разработку – многофункциональный пакет программ для интеллектуального анализа данных Deductor. Облегченная версия Deductor, а также полезные сведения из области ИАД имеются на сайте производителя – www.basegroup.ru.
Читать дальше:
Похожие статьи:
Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.1 |
05 июня 2012, |
Технологии интеллектуального анализа данных (ИАД, другие термины - Data Mining, Knowledge discovery in databases) предназначены для выявления знаний – закономерностей и логических взаимосвязе ... Читать полностью |
Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии систем, основанных на знаниях (СОЗ). ч.4 |
05 июня 2012, |
Общий процесс вывода решения в ситуационной системе может быть представлен следующими этапами: - идентификация текущей ситуации (т.е. оценивание значений ее параметров); - сравнение текущей сит ... Читать полностью |
4.3 Системы интеллектуального анализа данных. Извлечение знаний из данных. ч.1 |
25 июня 2012, |
При написании этого пункта учебного пособия использован материал статьи, подготовленной автором для подписной электронной рассылки «Интернет для бизнеса» в 2007 году. В свою очередь при ... Читать полностью |
Заключение |
25 июня 2012, |
В заключение изложения теоретического материала по дисци-плине можно сформулировать следующие выводы. 1. Дисциплина «Интеллектуальные информационные систе-мы» содержит в себе те сведе ... Читать полностью |
Литература |
05 июня 2012, |
В текстах лекций указаны ссылки на конкретные учебники, которые полезно прочитать и/или материал которых использован при написании. Ссылки-обозначения приведены в квадратных скобках. [Венд ... Читать полностью |