Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.1
Технологии интеллектуального анализа данных (ИАД, другие термины - Data Mining, Knowledge discovery in databases) предназначены для выявления знаний – закономерностей и логических взаимосвязей в больших объемах данных различного формата и происхождения. Методы ИАД стали активно развиваться в 90-х годах. К этому времени на крупных предприятиях “скопились” большие объемы сведений (фактуальных, документальных), хранимых в разном виде, различных форматах и базах данных. Чтобы эти сведения не лежали «мертвым грузом», а приносили пользу, были предложены концепция внедрения информационных хранилищ данных (Data Wаrehousing) и применение методов ИАД.
Методы ИАД имеют основной целью выявление закономерностей на основе анализа данных для последующего обоснования и принятия решений. Выделяют следующие основные типы таких закономерностей (см. [Дюк,2001]):
- ассоциация – связь между событиями. Например, исследование в супермаркете может показать, что 65% купивших кукурузные чипсы берут также и “коку-колу”, а при наличии скидки за такой комплект колу приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко ценить, насколько действенна предоставляемая скидка;
- последовательность – цепочка связанных во времени событий. Например, после покупки дома в 45% случаев в течение месяца приобретается новая кухонная плита, а в пределах двух недель 60% новоселов приобретают холодильник;
- классификация – выявление среди параметров, описывающих объекты, тех признаков и их взаимосвязей, которые позволяют отнести новый объект к той или иной группе. Пусть, например, имеются данные о покупателях, которые обслуживались фирмой. Известно, что все множество этих покупателей условно можно разделить на классы: “бедный”, “богатый”, “богатый, но прижимистый”. Оценивая параметры покупателей система ИАД может вывести закономерности между их значениями и принадлежностью покупателя к одному из классов. Тогда, получая характеристики потенциальных покупателей, можно заранее отнести их к тому или иному классу и предложить определенные рекомендации по работе с ними;
- кластеризация – выявление устойчивых групп в множестве объектов, описываемых набором данных. В отличие от классификации сами группы - кластеры здесь неизвестны, их требуется определить. Возможно, что при анализе некоторого множества данных о покупателях сформируются группы и признаки покупателей, предпочитающих определенный вид товара и способ обслуживания;
- прогнозирование – выявление на основе исторической информации закономерностей, отражающих динамику поведения объектов и позволяющих прогнозировать их будущее.
Читать дальше:
Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.2