Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.2

Методы ИАД являются дополнением традиционных методов статистической обработки данных (факторного, корреляционного, регрессионного и других видов анализа). Основной их особенностью является выявление логических связей между данными и представление результатов не в виде абстрактных математических формул, а в форме, позволяющей наглядно отобразить, интерпретировать и объяснить полученные знания. Именно эта наглядность найденных знаний объясняет практическую важность методов ИАД в реальных задачах принятия решений. Среди технологий выявления и отображения логических закономерностей в данных выделим следующие:
- технологии деревьев решений (decision trees) – построение по анализу описаний объектов дерева, каждая вершина которого есть правило для сравнения некоторого параметра Х с заданным значением А. Эти правила связаны между собой ребрами дерева так, что в зависимости от ответа на вопрос о параметре Х задается вопрос о значении параметра Y или Z. Конечные вершины дерева соответствуют некоторым решениям, например, указывают на принадлежность объекта к тому или иному классу (например, клиент – платежеспособный или нет; ситуация – конфликтная, потенциально конфликтная или неконфликтная). Для лучшего понимания приведем иллюстративный пример. Пусть известно некоторый достаточно большой перечень автомобилей, в котором выделяются три класса: класс 1 – автомобили, требующие косметического ремонта; класс 2 – автомобили не требующие ремонта; класс 3 – автомобили, требующие капитального ремонта. Каждый из автомобилей описывается набором параметров и их значениями. Система ИАД анализируя эти параметры может выбрать те из них, по значениям которых можно оценить принадлежность автомобиля к одному из классов. Эти параметры и их значения образуют систему – дерево решений (см. пример на рис. 6.2, который, однако, является сугубо иллюстративным и не претендует на точность).

 


Рис.6.2. Иллюстративный пример дерева решений
для распознавания класса автомобиля

Тогда, если имеется описание нового автомобиля, класс которого неизвестен, построенное компьютерной системой дерево решения позволит с большой долей уверенности сделать вывод о принадлежности к тому или иному классу, т.е. по существу - о необходимости капитального или косметического ремонта;
- технологии обнаружения и построения правил “Если… То” – на основании анализа имеющихся в базах данных событий вида “параметр Х больше (меньше, равно) константы А” строится система продукционных правил, позволяющих устанавливать ассоциации в данных, решать задачи классификации, прогнозирования и т.п.
К числу наиболее известных программных продуктов ИАД следует отнести систему See5 (производитель – RuleQuest, www.rulequest.com), WizWhy (производитель – WizSoft, www.wizsoft.com). Подробная информация об этих системах имеется в [Дюк, 2001], а прилагаемый к этой книге компакт-диск содержит демонстрационные версии программ с примерами. Следует отметить также отечественную разработку – многофункциональный пакет программ для интеллектуального анализа данных Deductor. Облегченная версия Deductor, а также полезные сведения из области ИАД имеются на сайте производителя – www.basegroup.ru.

Читать дальше:

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии распознавания образов и понимания текстов.



Похожие статьи:

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.1
05 июня 2012,
Технологии интеллектуального анализа данных (ИАД, другие термины - Data Mining, Knowledge discovery in databases) предназначены для выявления знаний – закономерностей и логических взаимосвязе ... Читать полностью

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии систем, основанных на знаниях (СОЗ). ч.4
05 июня 2012,
Общий процесс вывода решения в ситуационной системе может быть представлен следующими этапами: - идентификация текущей ситуации (т.е. оценивание значений ее параметров); - сравнение текущей сит ... Читать полностью

4.3 Системы интеллектуального анализа данных. Извлечение знаний из данных. ч.1
25 июня 2012,
При написании этого пункта учебного пособия использован материал статьи, подготовленной автором для подписной электронной рассылки «Интернет для бизнеса» в 2007 году. В свою очередь при ... Читать полностью

Заключение
25 июня 2012,
В заключение изложения теоретического материала по дисци-плине можно сформулировать следующие выводы. 1. Дисциплина «Интеллектуальные информационные систе-мы» содержит в себе те сведе ... Читать полностью

Литература
05 июня 2012,
В текстах лекций указаны ссылки на конкретные учебники, которые полезно прочитать и/или материал которых использован при написании. Ссылки-обозначения приведены в квадратных скобках. [Венд ... Читать полностью