Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.1



Технологии интеллектуального анализа данных (ИАД, другие термины - Data Mining, Knowledge discovery in databases) предназначены для выявления знаний – закономерностей и логических взаимосвязей в больших объемах данных различного формата и происхождения. Методы ИАД стали активно развиваться в 90-х годах. К этому времени на крупных предприятиях “скопились” большие объемы сведений (фактуальных, документальных), хранимых в разном виде, различных форматах и базах данных. Чтобы эти сведения не лежали «мертвым грузом», а приносили пользу, были предложены концепция внедрения информационных хранилищ данных (Data Wаrehousing) и применение методов ИАД.
Методы ИАД имеют основной целью выявление закономерностей на основе анализа данных для последующего обоснования и принятия решений. Выделяют следующие основные типы таких закономерностей (см. [Дюк,2001]):
- ассоциация – связь между событиями. Например, исследование в супермаркете может показать, что 65% купивших кукурузные чипсы берут также и “коку-колу”, а при наличии скидки за такой комплект колу приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко ценить, насколько действенна предоставляемая скидка;
- последовательность – цепочка связанных во времени событий. Например, после покупки дома в 45% случаев в течение месяца приобретается новая кухонная плита, а в пределах двух недель 60% новоселов приобретают холодильник;
- классификация – выявление среди параметров, описывающих объекты, тех признаков и их взаимосвязей, которые позволяют отнести новый объект к той или иной группе. Пусть, например, имеются данные о покупателях, которые обслуживались фирмой. Известно, что все множество этих покупателей условно можно разделить на классы: “бедный”, “богатый”, “богатый, но прижимистый”. Оценивая параметры покупателей система ИАД может вывести закономерности между их значениями и принадлежностью покупателя к одному из классов. Тогда, получая характеристики потенциальных покупателей, можно заранее отнести их к тому или иному классу и предложить определенные рекомендации по работе с ними;
- кластеризация – выявление устойчивых групп в множестве объектов, описываемых набором данных. В отличие от классификации сами группы - кластеры здесь неизвестны, их требуется определить. Возможно, что при анализе некоторого множества данных о покупателях сформируются группы и признаки покупателей, предпочитающих определенный вид товара и способ обслуживания;
- прогнозирование – выявление на основе исторической информации закономерностей, отражающих динамику поведения объектов и позволяющих прогнозировать их будущее.

Читать дальше:

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.2





Похожие статьи:

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии систем, основанных на знаниях (СОЗ). ч.4
05 июня 2012,
Общий процесс вывода решения в ситуационной системе может быть представлен следующими этапами: - идентификация текущей ситуации (т.е. оценивание значений ее параметров); - сравнение текущей сит ... Читать полностью

4.3 Системы интеллектуального анализа данных. Извлечение знаний из данных. ч.1
25 июня 2012,
При написании этого пункта учебного пособия использован материал статьи, подготовленной автором для подписной электронной рассылки «Интернет для бизнеса» в 2007 году. В свою очередь при ... Читать полностью

Заключение
25 июня 2012,
В заключение изложения теоретического материала по дисци-плине можно сформулировать следующие выводы. 1. Дисциплина «Интеллектуальные информационные систе-мы» содержит в себе те сведе ... Читать полностью

4.3 Системы интеллектуального анализа данных. Извлечение знаний из данных. ч.2
25 июня 2012,
Сравните с точки зрения наглядности и объяснимости два способа представления знаний, которые выявил компьютер на основе анализа результатов деятельности интернет-магазина (это еще одно пояснение те ... Читать полностью

Литература
05 июня 2012,
В текстах лекций указаны ссылки на конкретные учебники, которые полезно прочитать и/или материал которых использован при написании. Ссылки-обозначения приведены в квадратных скобках. [Венд ... Читать полностью