Модели проблемно-ориентированных корпоративных баз знаний на основе case-based reasoning подхода



И.Н. Глухих1, Р.К. Ахмадулин2

1 Tyumen State University, 6 Volodarskogo st., Tyumen, 625003, Russia

2 Tyumen Industrial University, 38 Volodarskogo st., Tyumen, 625000, Russia

Аннотация

Одним из актуальных направлений повышения эффективности производственных процессов и управления деятельностью предприятий является создание и использование корпоративных баз знаний. В статье предлагается концепция проблемно-ориентированных корпоративных баз знаний (ПО КБЗ), в которых знания организуются вокруг возможных проблемных ситуаций и представляют собой инструмент для принятия и исполнения решений в таких ситуациях. Для представления знаний в ПО КБЗ предлагается использовать а case-based reasoning approach. В рамках данного подхода определено содержание кейса как компонента базы знаний, разработана модель знаний ПО КБЗ на основе дерева ситуаций, в которой представляются знания о типовых ситуациях, а также конкретные примеры ситуаций и решений. Предложена обобщённая структурная схема проблемно-ориентированных корпоративных баз знаний и возможные режимы ее работы. Полученные модели позволяют создавать и использовать корпоративные базы знаний как для поддержки принятия и исполнения решений, так и для обучения, повышения квалификации сотрудников, анализа принятых решений.

Принятое в работе универсальное толкование терминов «ситуация», «решение» позволяет  использовать предложенные модели для разработки проблемно-ориентированных корпоративных баз знаний в различных предметных областях.

 

1.Введение

Одним из актуальных направлений развития автоматизации производственных процессов и управления деятельностью предприятий различного профиля в последние десятилетия стало создание систем корпоративных знаний [1-7]. Корпоративные базы знаний (КБЗ) позволяют сохранять и использовать знания, имеющиеся у коллектива предприятия, для решения многих задач – от проектирования и выпуска новой продукции, до обеспечения коммерческой деятельности и принятия управленческих решений.

Несмотря на актуальность систем управления знаниями до сих пор отсутствуют единые технологические решения для построения КБЗ. Популярный сегодня подход использует для этого платформы для управления контентом (content management system, CMS), где знания могут выступать в виде текстов, изображений и иных компонентов контента, создаваемых сотрудниками корпорации [7-9]. Полученная в результате такого взаимодействия корпоративная база знаний представляется сетью с множеством смысловых связей и ассоциаций, которые зачастую не поддаются точному определению.

В силу многообразия связей и компонентов контента, отсутствия четко выраженной целенаправленной структуры поиск и использование знаний для решения конкретных задач, которые могут возникать перед пользователями предприятия, представляет определенные трудности. Как следствие снижается эффективность КБЗ, и возникают сомнения в полезности системы управления знаниями в целом.

В данной статье предлагается новая концептуальная модель – проблемно-ориентированных корпоративных баз знаний (ПО КБЗ), которая позволяет сделать систему знаний предприятия более конструктивной и целенаправленной.

В ПО КБЗ корпоративные знания (контент) организуются вокруг проблемных ситуаций, возникающих в ходе деятельности корпорации (предприятия).

Эти ситуации характерны тем, что а) в имеющейся ситуации отсутствует очевидный и единственный способ действий, б) ситуации требуют от персонала (специалистов) творческого принятия решений, что связано с порождением и анализом вариантов возможных действий; в) исполнение этих решений предполагает комплекс  действий и документов, осуществляется по определенным, возможно, различным  сценариям.

Основная идея КБЗ, ориентированных на проблемные ситуации, состоит в том, чтобы создать систему, где будут представлены знания для принятия и реализации решений в подобных ситуациях (готовые варианты решений,  сценарии действий, регламентирующие документы, спецификации, сметы, шаблоны договоров и др.).
Наличие проблемно-ориентированных КБЗ позволяет не только осуществлять поддержку лиц, принимающих решения, но и использовать корпоративные знания и опыт корпорации для обучения, повышения квалификации, ввода в строй новых сотрудников, а также для ретроспективного анализа результатов деятельности корпорации.

Для реализации этой концепции далее предложена предметно-независимая модель представления знаний и разработана обобщенная структурная схема ПО КБЗ.

2. Метод и модели

2.1. Case-based reasoning

Теоретической основой построения проблемно-ориентированных КБЗ является метод вывода решений в интеллектуальных системах, который получил название «case-based reasoning» (CBR) [10, 11].

Основная идея CBR состоит в том, чтобы для решения вновь возникающих проблем использовать уже известные из прошлого опыта решения, которые ранее использовались на практике или были предложены экспертами для подобных проблем.

Компонентами баз знаний в CBR-системах выступают кейсы, которые хранятся в базе (библиотеке) кейсов - case-base (CB).

Каждый кейс представляется парой <Ситуация, Решение (solution)>. Под ситуацией понимается формализованное описание проблемы, требующей решения.

В качестве решения в общем случае выступает все, что может быть использовано или рекомендовано в данной ситуации.

Работа CBR-системы включает такие основные этапы, как: [12]

- «retrieve» – поиск и отбор в CB того кейса, который наиболее подходит для решения текущей проблемы. Ключом поиска является описание текущей ситуации пользователя Sit, которая сравнивается с ситуациями S из базы кейсов. На выходе этого этапа отбирается одна или несколько S*, которые наиболее похожи (similar) на ситуацию Sit;

- «reuse» – извлечение и повторное использование решения R*, которое входит в один кейс с S*.

При необходимости решение R* адаптируется к условиям новой ситуации. Если при этом было получено новое решение для новой проблемы, то после ревизии (анализа) результатов CB пополняется новым кейсом.

Case base reasoning для поиска решений показал свою результативность в разных проблемных областях. Например, этот метод используется для управления дорожным движением на перекрестках [13], в системах поддержки разработки программного обеспечения [14], для идентификации повреждений и прогнозирования состояний механических систем [15, 16], для классификации текстов [17], в медицинских системах [18-21], для прогнозирования стоимости строительства [22, 23] и др.

К числу наиболее важных задач в CBR относится задача оценки  близости ситуаций Sit  и S на этапе ”retrieve” . Решение этой задачи зависит от выбранного способа формализованного представления ситуаций. Есть два основных подхода для сравнения ситуаций [11] – отбор наиболее близких ситуаций на основе измерения расстояний в пространстве параметров, и отбор ситуаций на основе дерева решений (Decision tree).

В работе [24] предложена модификация дерева решений – дерево ситуаций (Situations tree) (ST), которое далее будет дополнено новыми элементами специально для представления знаний в ПО КБЗ.

Дерево ситуаций является бинарным графом отношения ρ(Sj,Sj+1) «тип-подтип», где ситуация на (j+1)-м уровне Sj+1 является уточнением описания  ситуации Sj, расположенной на предыдущем, j-м уровне. Это означает, что множество атрибутов – признаков ситуации Aj включается в множество Aj+1 описания ситуаций на следующем уровне.

При этом две ситуации Sji, Sjr одного уровня различаются областями допустимых значений в пространстве параметров Aji € Dji , Aji € Djr, где Dji ≠ Djr.

Особенностью дерева ситуаций является то, что его вершины на каждом уровне представляют не абстрактный набор переменных, а соответствуют  некоторым практически значимым типам ситуаций. Каждому из них можно сопоставить свое решение. При этом решения на верхних уровнях обладают более высоким уровнем обобщения и меньшей подробностью, чем решения нижних уровней, но справедливы для всех ситуаций – подтипов данной ситуации верхнего уровня.

2.2. Модель знаний ПО КБЗ

В проблемно-ориентированной КБЗ на основе CBR в качестве базы знаний выступает база кейсов (case-base). Формализованная модель знаний предназначена для предметно-независимого представления кейсов, взаимосвязей между ними, а также для обеспечения поиска и выбора кейсов. При построении такой модели в ПО КБЗ мы учитываем следующие особенности:

- в деятельности предприятия могут быть выделены типовые, повторяющиеся проблемные ситуации. Они характеризуются общим набором признаков, часть из которых является значимыми для классификации ситуаций, а часть определяет контекст проблемы (уточняет место, время возникновения, внешние условия, исполнителя решения и т.п.);

- решения в этих ситуациях и полученные результаты могут различаться. Оценка эффективности решений дается путем последующего анализа результатов с привлечением экспертов;

- в корпоративной базе знаний целесообразно сохранять как примеры ситуаций и решений, так и некоторые обобщения, т.е. описания типовых ситуаций и типовые решения, которые включают в себя шаблоны действий, документов, типовые сценарии и т.п.

Таким образом, в ПО КБЗ будем различать ситуации-примеры и типовые ситуации. Типовая ситуация характеризуется областью D возможных значений вектора атрибутов, а ситуация-пример – точкой в области D.

Модель знаний в ПО КБЗ, реализованная на основе дерева ситуаций, должна представлять как типовые ситуации, так и связанные с ними ситуации-примеры.

В частном случае ситуации-примеры сопоставляются нижним уровням, а верхние используются для получения обобщенных решений и последовательного поиска по значениям атрибутов (см. рисунок 1). В общем случае множество примеров может быть сопоставлено каждой вершине S.

case based reasoning, вывод на основе прецедентов, корпоративные базы знаний


С учетом сказанного кейс C в базе кейсов представляется следующим множеством компонентов, ассоциированных с вершинами дерева ситуаций:
C = {S, R k | k = 1,…, M},

где S – описание типовой ситуации, заданное через множество допустимых значений атрибутов D  = {d1, d2, …, dn}, где n – число атрибутов-признаков данной ситуации ;
R – типовое решение для данной ситуации, которое включает в себя следующее:
R1 – императивная часть – руководство к действию в данной ситуации, отвечает на вопрос «Что делать?»
R2 – нормативно-технологическая часть,  отвечающая на вопрос «Как делать?»
R3 – справочная часть, дополнительная информация , которая может потребоваться для реализации  решений (справочные данные, иллюстрации, модели  и т.п.), «С помощью чего делать?»;
R4 – рекомендательная часть, которая содержит рекомендации экспертов по выполнению предлагаемых решений;
– пример ситуации данного типа, решение, принятое в данной ситуации и полученный результат соответственно.
M – количество примеров в кейсе.

Для описания ситуаций-примеров в ПО КБЗ и расширенных возможностей поиска в CB целесообразно уточнение множества атрибутов [4]:

S €  {A, AC, T, I }, где A – вектор атрибутов-признаков ситуации, позволяющий отнести ситуацию к данному типу A = (a1, a2, …, an) €D; AC – дополнительные атрибуты для описания контекста, которые не используются при определении типа, T – текстовое метаописание ситуации; I – графический образ ситуации (фото, иллюстрации, снимок карты и т.п.).

В ПО КБЗ под ситуацией Sit понимается некоторая ситуация, интересная пользователю – пользовательская ситуация. Это может быть текущая проблемная ситуация, требующая своего решения, или гипотетическая ситуация, представляющая интерес в целях обучения, или ситуация из прошлого опыта корпорации.
В общем случае у пользователя отсутствует не только точное описание Sit, но и полная информация о тех атрибутах, значения которых  нужно выяснить для сравнения с примерами в CB. В case-based reasoning это порождает задачу идентификации Sit, которая осложняется при увеличении объема CB и наличии в ней ситуаций с различными наборами  атрибутов-признаков. Это может стать серьезным препятствием для практической реализации CBR-систем.

Предложенная модель позволяет преодолеть эту трудность путем последовательного поиска по дереву ситуаций сверху вниз. Здесь каждая вершина S дерева представляет собой тот набор атрибутов, который должен быть опрошен для дальнейшего движения. Таким образом, одновременно с поиском по дереву выполняется идентификация Sit, причем опрашиваются только те атрибуты, которые имеют значение для данного типа. В итоге поиск приводит к искомой вершине S* с множеством допустимых значений D*, для которой выполняется A(Sit)€ D*, где A(Sit) – вектор значений атрибутов ситуации пользователя.

2.3. Структурная модель

На основе разработанной модели знаний для представления кейсов нами предложена обобщенная структурная схема ПО КБЗ (рисунок 2). Так как на действующих предприятиях, как правило, уже существуют различные базы данных и документов, ПО КБЗ реализуется в качестве надстройки над уже имеющимися корпоративными учетными системами и системами управления контентом. При этом описания ситуаций-примеров и их решений включают ссылки на  известные данные и документы или процедуры, необходимые для их получения в существующих системах.

Как показано на рисунке 2, кроме конечного пользователя системы для пополнения CB необходим также редактор базы кейсов. В системе предусмотрены следующие основные режимы работы:

- Режимы поиска по запросу: поиск типовой ситуации и (или) подмножества ситуаций-примеров по значениям атрибутов (поиск по дереву ситуаций); полнотекстовый поиск по текстовому описанию T, ручной или автоматический поиск по графическому образу ситуации I;

- Режим обучения (пополнения) базы кейсов. При появлении новых ситуаций и новых решений в базу кейсов заносится новый или обновляется существующий кейс. Если эта новая ситуация-пример является примером ситуации уже имеющегося  в CB типа, то дополняется имеющийся кейс. Если это ситуация нового типа, то добавляется описание типовой ситуации и формируется кейс с новыми примерами. При этом в дерево ситуаций должна быть добавлена новая вершина, место которой будет определяться связями новой типовой ситуации с уже существующими.

структурная модель системы с выводом на основе прецедентов

Структурная модель может быть дополнена подсистемой мониторинга  и анализа текущей ситуации, которая по заданному набору параметров, поступающих из учетных систем, сможет автоматически определять ситуации, требующие вмешательства. Таким образом, обеспечивается еще один режим работы – «Режим советующей системы», при котором конечный пользователь будет получать готовые кейсы для решения возникающей проблемы.

3. Заключение

В этой работе мы предложили концепцию проблемно-ориентированных корпоративных баз знаний. В них знания организуются вокруг проблемных ситуаций, возникающих в корпорации, и используются для поддержки принятия и исполнения решений в этих ситуациях.

Для разработки модели представления знаний в ПО КБЗ мы использовали case-based reasoning  подход. В результате исследования предложена структура для представления кейса, которая содержит описание типовой ситуации, типового решения, а также конкретные ситуации-примеры и решения-примеры. Для организации хранения и поиска кейсов предложена инвариантная предметной области модель представления знаний на основе дерева ситуаций.

Принятое в работе универсальное толкование терминов «ситуация», «решение» позволяет  использовать предложенные модели для разработки ПО КБЗ и поддержки принятия решений в различных предметных областях. Кроме собственно поддержки принятия решений  базы кейсов могут быть использованы для ретроспективного анализа деятельности корпорации, для обучения сотрудников и распространения передового опыта корпорации.

Литература
[1] Debora Suryawan, E. Putra and A. Pratiwi 2015 Knowledge management strategy model for small to medium enterprises International Conference on Science in Information Technology (ICSITech), Yogyakarta, 2015, pp. 219-224. DOI: 10.1109/ICSITech.2015.7407807
[2] Roberto Cerchione and Emilio Esposito 2017 Using knowledge management systems: A taxonomy of SME strategies International Journal of Information Management Volume 37, Issue 1, Part B, pp. 1551–1562. DOI: 10.1016/j.ijinfomgt.2016.10.007
[3] Gluhih, I.N., Piankov, V.N. and Zabolotnov, A.R. 2002 Situational models in corporative knowledge base on geological-technical measures' know-how Neftyanoe hozyaystvo – Oil Industry 6 p. 45
[4] H. Ping Tserng, Meng-Hsueh Lee, Shang-Hsien Hsieh, and Hsiang-Ling Liu 2016 The measurement factor of employee participation for Knowledge Management System in engineering consulting firms Journal Of Civil Engineering And Management Vol. 22 , Iss. 2, pp. 154-167. DOI: 10.3846/13923730.2014.897963
[5] Edgar Serna M., Oscar Bachiller S., Alexei Serna A. 2017 Knowledge meaning and management in requirements engineering International Journal of Information Management Volume 37, Issue 3, pp. 155–161. DOI: 10.1016/j.ijinfomgt.2017.01.005
[6] Rainer Weinreich, Iris Groher 2016 Software architecture knowledge management approaches and their support for knowledge management activities: A systematic literature review Information and Software Technology Volume 80, pp. 265–286. DOI: 10.1016/j.infsof.2016.09.007
[7] Shan Wana, Dongbo Lia and James Gaob 2016 Exploring the Advantages of Content Management Systems for Managing Engineering Knowledge in Product-service Systems Procedia CIRP Volume 56, pp. 446–450. DOI: 10.1016/j.procir.2016.10.087
[8] Jaffar A. Alalwana, Manoj A. Thomasb, H. Roland Weistroffer 2004 Decision support capabilities of enterprise content management systems: An empirical investigation Decision Support Systems Volume 68, pp. 39–48. DOI: 10.1016/j.dss.2014.09.002
[9] Benjamin Wehner, Christian Ritter, Susanne Leist 2017 Enterprise social networks: A literature review and research agenda Computer Networks Volume 114, pp. 125–142. DOI: 10.1016/j.comnet.2016.09.001
[10] J.L. Kolodner 1992 An Introduction to Case-Based Reasoning Artificial Intelligence Review vol. 6, 1992, pp. 3-34.
[11] I.D. Watson and F. Marir 1994 Case-based reasoning: A review The Knowledge Engineering Review vol. 9, num. 4, pp. 355-381.
[12] Ramon López De Mántaras, David Mcsherry, Derek Bridge, David Leake, Barry Smyth, Susan Craw, Boi Faltings, Mary Lou Maher, Michael T. Cox, Kenneth Forbus, Mark Keane, Agnar Aamodt and Ian Watson 2005 Retrieval, reuse, revision, and retention in case-based reasoning The Knowledge Engineering Review Vol. 20:3, 215–240. DOI: 10.1017/S0269888906000646
[13] Ali Louati, Sabeur Elkosantini, Saber Darmoul, Lamjed Ben Said 2016 A Case-Based Reasoning System to Control Traffic at Signalized Intersections. IFAC-PapersOnLine 49-5, pp. 149–154.
[14] Rodrigo G. C. Rocha, Ryan R. Azevedo, Ygor Cesar Sousa, Eduardo de A. Tavares, Silvio Meira 2014 A case-based reasoning system to support the global software development 18th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems - KES2014. Procedia Computer Science 2014. №35. Pp. 194 – 202
[15] T Olsson, P Funk 2012 Case-based reasoning combined with statistics for diagnostics and prognosis 25th International Congress on Condition Monitoring and Diagnostic Engineering IOP Publishing. Journal of Physics: Conference Series 364 012061 DOI:10.1088/1742-6596/364/1/012061
[16] L.E.Mujica, J. Vehı, J. Rodellar, P. Kolakowski 2005 A hybrid approach of knowledge-based reasoning for structural assessment Institute of physics publishing smart materials and structures, 14, pp.1554–1562, DOI:10.1088/0964-1726/14/6/048
[17] Y. Li, S.C.K. Shiu, S.K. Pal, J.N.K. Liu. 2006 A rough set-based case-based reasoner for text categorization International Journal of Approximate Reasoning, 41, pp. 229–255
[18] Gómez-Vallejo H.J., Uriel-Latorre B., Sande-Meijide M.,  Villamarín-Bello B., Pavón R., Fdez-Riverola F., Glez-Peña D. 2016 Case-based reasoning system for aiding detection and classification of nosocomial infections Decision Support Systems Vol. 84 Pp. 104-116.
[19] Douali, N.a , De Roo, J.b, Jaulent, M.-C.a 2012 Clinical Diagnosis Support System based on Case Based Fuzzy Cognitive Maps and Semantic Web 24th Medical Informatics in Europe Conference, MIE 2012; Pisa; Italy; 26 August 2012 through 29 August 2012 Volume 180, 2012, Pp. 295-299.
[20] López, B., Pous, C., Gay, P., Pla, A., Sanz, J., Brunet, J. 2011 EXiT CBR: A framework for case-based medical diagnosis development and experimentation Artificial Intelligence in Medicine Volume 51, Issue 2, Pp. 81-91.
[21] Sreeparna Banerjee, Amrita Roy Chowdhury 2015 Case Based Reasoning in the Detection of Retinal Abnormalities using Decision Trees Procedia Computer Science 46, pp. 402 – 408.
[22] Mohamed M. Marzouk, Rasha M. Ahmed. 2011 A case-based reasoning approach for estimating the costs of pump station projects Journal of Advanced Research 2, pp. 289–295.
[23] Naderpajouh, N. and Afshar, A. 2008 A case-based reasoning approach to application of value engineering methodology in the construction industry Construction Management and Economics № 26(4). Pp. 363–372.
[24] Ruslan К. Akhmadulin,  Igor N.Gluhih, Ivan Y. Karyakin 2016 Аn object-oriented model of case-based reasoning system using situations tree 10th International Conference on Application of Information and Communication Technologies (AICT). 12-14 October 2016, Baku, Azerbaijan. Сonference proceedings P. 124-127





Похожие статьи:

3.8 Ситуационный подход в представлении знаний и выводе решений. ч.1
26 июня 2012,
Ситуационный подход к управлению сложными объектами сформировался в 70-80-х годах 20 века в научных работах отечественных ученых, в частности, Д.А.Поспелова (см. например, [19]). Концептуальной осн ... Читать полностью

Резюме к 3 главе
26 июня 2012,
1. Модели представления знаний делятся на два типа – фор-мальные логические и эвристические модели. Соответственно определяется логический и эвристический метод рассуждений в СОЗ. Логически ... Читать полностью

Резюме к 2 главе
11 июля 2012,
1. Знания (в компьютерной системе) – закодированные некото-рым образом сведения об объектах предметной области, их взаи-мосвязях и особенностях поведения, а также о способах решения задач. Эт ... Читать полностью

Тема 4. Информационное моделирование предметной области при построении ЭИС. Информационное моделирование при построении СОД.ч.2
01 июня 2012,
Совокупность подобных показателей – может быть логично выражена в виде набора или одной таблицы в зависимости от вложенности СЕИ. Описание показателей или целого документа в терминах показ ... Читать полностью

Тема 4. Информационное моделирования при построении ИПС. Информационное моделирование при построении АСУ ч.1
02 июня 2012,
Класс АСУ, по-видимому, является наиболее полным по своим функциональным возможностям классом ЭИС. Комплексная автоматизация управления предполагает использование методов систем хранения и обработк ... Читать полностью