Тема 4. Информационное моделирования при построении ИПС. Гипертекстовые ИПС. ч.3
Основные компоненты гипертекста
Гипертекстовый документ образуется следующими основными компонентами:
1) Информационная статья – собственно описание данного фрагмента, ее можно представить в виде следующей формулы:
Информационная статья = заголовок + текст + ссылки на родственные статьи.
Физически ссылки представляют из себя гиперссылки (как в документах WWW), они могут быть как прямо по тексту, так и в конце статьи. 2) Тезаурусная статья – именование объекта (фрагмента гипертекста) со списком других объектов (фрагментов), связанных с данным определенными отношениями и с указанием видов этих отношений. Каждое наименование фрагмента в тезаурусной статье содержит гиперссылку на соответствующую информационную статью.
3) Список главных тем гипертекста – перечень главных, относительно самостоятельных тем (фрагментов), которые не связываются между собой ссылками. Список главных тем не должен занимать, как правило, больше 1 страницы (идеально- 5-7 пунктов);
4) Оглавление – алфавитно-упорядоченный перечень всех статей (со ссылками на эти статьи). Вместо оглавления в качестве дополнение в качестве элемента гипертекста может выступать словарь – упорядоченный по алфавиту набор всех основных терминов данного гипертекста.
Множество всех информационных статей составляет собственно текстовый объем гипертекста; множество всех тезаурусных статей – тезаурус гипертекста; пара «информационная статья – тезаурусная статья» называется гипертекстовой статьей.
Итак, подводя итог, можно записать следующую концептуальную формулу гипертекстового документа:
Гипертекст = тезаурус + текстовая информация + список главных тем + оглавление (словарь)
или
Гипертекст = множество гипертекстовых статей + список главных тем + оглавление (словарь).
Тезаурусная статья
Тезаурусная статья представляет собой важный инструмент организации информации в гипертексте для последующего поиска необходимых сведений. По существу, тезаурусная статья является воплощением той модели темы, которая разрабатывается на этапе информационного моделирования предметной области гипертекстовой ИПС (см., например, рис.4.5). Наличие такой статьи позволяет пользователю быстро увидеть связи данного объекта с другими, присутствующими в гипертекстовом документе. Как правило, тезаурусная статья содержит ссылки на ближайшего соседа, т.е. на те фрагменты, которые в сетевой модели непосредственно связаны с данным дугой (см. рис.4.4). Для представленной на рис.4.5 модели можно предложить две тезаурусные статьи: «Производство апельсинов» и «Апельсиновый завод» .
Для упорядочения разработки и использования гипертекста рекомендуется использовать известный набор отношений (связей между фрагментами), которые при графическом отображении модели обозначаются каждая своими стрелками. Приведем следующие типовые отношения и их символьные обозначения в тезаурусной статье, которые в литературе рекомендуется использовать при разработке гипертекстовых ИПС (см. табл.4.1.).
В качестве примера на рис.4.6, из литературы приведены фрагменты тезауруса гипертекста по материально-техническому обеспечению (более полное описание данного гипертекста имеется в [Морозов, 1997])
Гипертекстовая ИПС кроме собственно гипертекста может содержать программную надстройку, позволяющую автоматизировать поиск необходимых информационных статей в соответствии с запросами пользователя. В качестве критериев поиска могут быть использованы следующие:
- поиск статьи, наиболее полно удовлетворяющей заданному свойству, например, количеству упоминаний в статье некоторого термина;
- поиск статьи, связанной с данной некоторым отношением или цепочкой таких отношений, например, отношением «часть-целое», а также другие критерии.
Примечание. С помощью математических символов модели поиска можно формализовать следующим образом (здесь Гi, Гa – обозначения гипертекстовых статей, Гi – некоторая i-я; Гa – заданная статья.
1) 1) поиск ближайшей статьи.
p(Гi, Гa) ® min
p(Гi, Гa) – некоторая характеристика близости с вводимой статьей или статьей, которую ищут Га.
2) 2) Поиск статей с наиболее желательными свойствами f:
f(Гi) ® max
3) 3) Комбинированный поиск
f(Гi) ® max
при p(Гi, Гa) < Порог
Расстояние – количество дуг между данной статьей и искомой по заданному отношению
В качестве желательных свойств могут быть:
– – наличие связи по некоторому виду отношения;
– – наличие ключевых слов.
Читать дальше:
Тема 4. Информационное моделирования при построении ИПС. Гипертекстовые ИПС. ч.4