Михайлов И.С. Математическое и программное обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей - файл n1.doc

приобрести
Михайлов И.С. Математическое и программное обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей
скачать (726 kb.)
Доступные файлы (1):
n1.doc726kb.30.05.2012 00:07скачать

n1.doc



На правах рукописи

Михайлов Илья Сергеевич
МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СТРУКТУРНОЙ И СЕМАНТИЧЕСКОЙ ИНТЕРОПЕРАБЕЛЬНОСТИ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ МЕТАМОДЕЛЕЙ

Специальность 05.13.11 – Математическое и программное обеспечение

вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук
Москва – 2008

Работа выполнена на кафедре Прикладной математики Московского энергетического института (Технического университета).


Научный руководитель: кандидат технических наук, профессор

Игорь Александрович Башмаков

лауреат премии Президента РФ

в области образования

доктор технических наук, профессор

Вадим Николаевич Вагин
Официальные оппоненты: доктор физико-математических наук,

профессор

Геннадий Семенович Осипов
кандидат технических наук, доцент

Тарасов Валерий Борисович
Ведущая организация: Государственное учреждение «Российский

научно-исследовательский институт

информационных технологий и систем

автоматизированного проектирования» (ГУ

РосНИИ ИТ и АП)

Защита состоится «_20__» ___июня_________ 2008 г. в __18___час. __00___мин. на заседании диссертационного совета Д 212.157.01 при Московском энергетическом институте (Техническом университете) по адресу 111250, Москва, Красноказарменная ул., 13 (ауд. М-704).


С диссертацией можно ознакомиться в библиотеке Московского энергетического института (Технического университета).


Автореферат разослан «_19__» ____мая________ 2008 г.


Ученый секретарь

диссертационного совета Д 212.157.01

кандидат технических наук,

доцент

М.В. Фомина

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследований. Обеспечение интероперабельности информационных систем (ИС) представляет собой актуальную и вместе с тем весьма сложную проблему, возникающую при создании, эволюционировании и интеграции информационных систем. Эта проблема особенно обострилась в настоящее время, поскольку объём сведений, обрабатываемых информационными системами, постоянно увеличивается и необходимо обеспечивать обмен информацией между различными ИС. Актуальность этой проблемы определяется также необходимостью повышения эффективности и упрощения формирования правил указанного обмена.

Сложность этой проблемы состоит в том, что информационные системы, как правило, представляют собой сложные программные комплексы, состоящие из значительного количества информационных единиц (сущностей, атрибутов, связей между ними и т.д.). Для организации обмена данными между ИС необходимо передавать не только отдельные значения конкретных переменных, но и большие массивы связанных между собой информационных единиц. Они должны сохранить свою внутреннюю связность и быть внедрены в систему сущностей другой информационной системы. Также в ходе процесса интеграции необходимо выполнять необходимые преобразования типов данных.

Традиционные методы и средства интеграции информационных систем, основанные на ручном построении правил обмена между ИС и создании соответствующих приложений-конверторов, не отвечают сегодняшним потребностям отрасли и современному уровню развития информационных технологий.

Применяемые приложения-конверторы требуют проведения предварительного детального анализа интегрируемых информационных систем (ИС), что является сложным и длительным процессом. К тому же, используемые программные продукты не обеспечивают гибкости обмена между ИС при изменении их состава, структуры или требований к ним, что приводит к необходимости повторной разработки такого рода приложений. Существенным недостатком такого подхода является невозможность повторного использования знаний об ИС. В результате при возможном осуществлении повторной интеграции ИС потребуется заново провести анализ систем. Отсутствие адаптивности указанного метода к изменяющимся входным условиям объединения ИС может привести к задержке, несвоевременной передаче или даже потере важной информации и создает предпосылки к возникновению аварийных ситуаций в ходе функционирования интегрируемых систем.

В настоящее время активно развивается подход, предполагающий использование метаданных для описания информационных ресурсов. Однако в том виде, в котором данный подход используется многими разработчиками, он обеспечивает лишь описание структур информационных единиц, без анализа их смысла и назначения. На основании такого описания невозможно делать корректные выводы об идентичности информационных единиц и их связей различных систем, функционирующих в одной предметной области. Для формирования заключений необходимо оперировать не только структурными характеристиками объектов информационных систем, но оценивать их смысловое назначение, погружённое в единое информационное пространство определённой предметной области.

Таким образом, можно сделать вывод, что задача разработки методов и средств обеспечения структурной и семантической интероперабельности информационных систем весьма остро стоит перед специалистами. Необходимо создание приемлемых по стоимости, простых и надежных программных продуктов, обеспечивающих интеллектуальную интеграцию информационных систем, функционирующих в рамках одной предметной области.

Следует отметить, что успешное решение задачи обеспечения структурной и семантической интероперабельности информационных систем на основе метамоделей связано с выполнением следующих основных требований:

К числу наиболее перспективных методов интеграции информационных систем, на базе которых может быть разработан программный комплекс, в значительной мере отвечающий перечисленным выше требованиям, относятся методы метаописания семантики информационных ресурсов. Эти методы были положены в основу вновь разработанного программного продукта обеспечения структурной и семантической интероперабельности информационных систем.

Выполненные исследования опираются на результаты работ в области искусственного интеллекта и интеграции информационных систем Д.А. Поспелова, И.А. Башмакова, А. И. Башмакова, Д.О. Брюхова, В.Н. Вагина, Т.А. Гавриловой, А.П. Еремеева, В.Ф. Хорошевского, А.С. Клещева, М.Р. Когаловского, Ю.Ф. Тельнова, В.И. Задорожного, Л.А Калиниченко, М.Ю. Курошева, С.С. Шумилова, И.П. Кузнецова, О.И. Россеевой и др., а также зарубежных учёных T.R. Gruber, M. Uslar, J.F. Sowa, P. Warren, V.R. Benjamins, D. Fensel, M.R. Genesereth, R.E. Fikes, A. Tannenbaum, H. Takeda, J. Ambrosio, T. Wendt, S. Barresi, Y. Rezgui, C. Lima, F. Meziane, M. Ushold, M. Gruninger, G. Van Heijst, A.T. Schreiber, B.J. Wielinga.

Объектом исследования данной работы являются методы обеспечения структурной и семантической интероперабельности информационных систем.

Предмет исследования – информационные системы, модели и методы интеграции информационных систем.

Цель работы. Целью работы является исследование и разработка методов и программных средств обеспечения структурной и семантической интероперабельности информационных систем на основе метамоделей, повышающих эффективность процесса интеграции систем и расширяющих возможности взаимодействия между ними.

Для достижения этой главной цели в диссертационной работе были поставлены и решены следующие основные задачи:

Методы исследования. Поставленные задачи решаются с использованием методов математической логики, искусственного интеллекта, онтологического подхода к описанию семантики информационных ресурсов, теории языков программирования.

Достоверность результатов. Обоснованность и достоверность научных положений, методов и выводов подтверждается использованием методов математического моделирования онтологий предметных областей, описания метаданных информационных ресурсов, данными компьютерного моделирования, а также результатами вычислительных экспериментов с помощью разработанного программного комплекса.

Научная новизна. Новые результаты, полученные в работе, заключаются в следующем:

  1. Предложен новый метод обеспечения структурной и семантической интероперабельности информационных систем, основанный на использовании метаданных и онтологии предметной области.

  2. Разработана информационная модель для связи объектов различных ИС, функционирующих в рамках одной предметной области. Предложен новый метод интеграции информационных систем, предусматривающий определение их концептуальных моделей и формирование на этой основе единой метамодели интегрируемых ИС, базирующейся на онтологии предметной области.

  3. Обоснована двухуровневая схема организации концептуальных моделей метаданных информационных систем, создающая эффективные возможности для интеграции и обеспечения взаимодействия данных систем.

  4. Разработаны и исследованы новые алгоритмы интеграции информационных систем и разрешения возможных противоречий при объединении концептуальных моделей информационных систем как на структурном, так и на семантическом уровне.

  5. Разработана и обоснована структура программного комплекса, выполняющего интеграцию информационных систем.

Практическая ценность и реализация результатов работы в промышленности.

Практическая значимость работы заключается в решении задачи интеграции ИС и обеспечении взаимодействия между системами с меньшими затратами, на качественно новом уровне технологических возможностей. Реализованный метод позволяет при однократно выполненной интеграции ИС организовать гибкую трансляцию данных в условиях возможных изменений структуры или состава систем, в отличие от существующих подходов, предусматривающих создание приложений-конверторов для каждой конкретной задачи.

Создан программный комплекс Var Pro Integrator в составе разработанной информационной системы Var Pro измерительной установки «Ультрафлоу», предназначенной для определения расхода компонентов нефтеводогазового потока. В программном комплексе достигнуто существенное улучшение возможности интеграции ИС Var Pro в состав штатных информационных систем нефтяных месторождений на основе: обеспечения автоматизированного построения концептуальных моделей интегрируемых ИС; реализации формирования единой метамодели информационных систем; использования онтологии предметной области с целью разрешения возможных противоречий, возникающих в процессе интеграции; создания правил преобразования систем связанных информационных ресурсов при их трансляции между ИС. В рамках данного проекта разработана онтология предметной области «Нефтедобыча».

Разработанный программный комплекс и измерительная система «Ультрафлоу» были установлены на кусте скважин Уньвинского и Чернушинского месторождений Пермского края и внедрены в состав информационной систем нефтяного месторождения, прошли опытно-промысловую эксплуатацию в течение четырёх лет и в настоящее время используются как штатная информационно-измерительная система. Система сертифицирована Федеральным агентством по техническому регулированию и метрологии РФ и включена в Государственный реестр средств измерений. ОАО «Арзамасский приборостроительный завод» приступил к серийному производству измерительных систем «Ультрафлоу», которые востребованы нефтедобывающими предприятиями.

На основе разработанных методов создан программный комплекс Var Pro Integrator, предназначенный для автоматизированной интеграции информационной системы Var Pro в состав информационных систем нефтяных месторождений. Тем самым решена важная научно-техническая проблема, имеющая большое значение для отрасли информационных технологий.

Результаты работы использованы в НИР, выполняемых в рамках грантов РФФИ: проект №05-07-90232 «Исследование и разработка инструментальных средств создания экспертных систем поддержки принятия решений» (Научные руководители д.т.н., проф. Вагин В.Н., д.т.н., проф. Еремеев А.П.).

Апробация работы. Основные результаты диссертации докладывались и обсуждались на 8-й, 9-й, 10-й, 11-й, 12-й, 13-й научных конференциях аспирантов и студентов «Радиотехника, электроника, энергетика» в МЭИ (ТУ), г. Москва, 2002-2007 гг.; на «Научных сессиях МИФИ», г. Москва, 2002-2007гг.; на международных формуах информатизации МФИ-2003, МФИ-2004, МФИ-2005, МФИ-2006, МФИ-2007, международные конференции «Информационные средства и технологии», г. Москва, 2003-2007 гг.; на семинаре «Multiphase Flow Measurement Seminar». Франция, Париж (Кламар), 14-19 декабря, 2004; на 13-ой Международной выставке «Нефтегаз – 2005». Россия, Москва, Экспоцентр, 21-25 июня, 2005; на конференции «Нечёткие Системы и Мягкие Вычисления». Россия, Тверь, 20-22 сентября, 2006; на XV Международной студенческой школе-семинаре «Новые информационные технологии». Украина, Крым, Судак, 20-27 мая, 2007; на конференции «Dependability of Computer Systems». Poland, Szklarska Poręba, June 13-17, 2007; на конференции «Технологии Microsoft в теории и практике программирования», Россия, Москва, 2-3 апреля 2007.

Публикации. Основные результаты, полученные при выполнении диссертационной работы, опубликованы в 17 печатных работах, включая 2 работы в изданиях, рекомендуемых ВАК.

Структура диссертационной работы. Диссертация состоит из введения, четырёх глав, заключения, списка использованной литературы (119 наименований) и приложений. Диссертация содержит 196 страниц машинописного текста (без приложений) и 41 страницу приложений.
СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, её научная новизна и практическая значимость, сформулирована цель работы и приведено краткое содержание диссертации по главам.
В первой главе рассматриваются понятия интеграции и интероперабельности информационных ресурсов. В большинстве энциклопедических источников понятие интероперабельности определяется, как способность информационных ресурсов к совместному использованию, совместной деятельности для решения задач. Под интероперабельностью ИС понимается её способность взаимодействовать с другими ИС. Такое взаимодействие может выражаться в виде обмена данными, распределенного выполнения поисковых запросов, согласованного изменения баз данных (БД) и т.д.. Выделяется два аспекта интероперабельности: структурный и семантический. Структурный аспект интероперабельности систем означает способность к структурному согласованию сущностей систем. Семантический аспект означает возможность установления соответствия между смыслами единиц информационных систем.

Показана необходимость выполнения свойства интероперабельности для успешной интеграции информационных систем.

Формулируются проблемы, возникающие при интеграции информационных систем.

Во-первых, необходимость обеспечения систематиза­ции и структуризации исходной информации. Ин­формация, хранящаяся по частям в различных сис­темах, может частично дублироваться или иметь пробелы.

Во-вторых, максимальная унификация доступа к гетерогенным информационным ресур­сам.

В третьих, создание нового информа­ционно-технологического пласта, обеспечивающего ин­теграцию всех остальных систем, выполняющего роль диспетчера в ИТ-инфраструктуре компании.

Проведено исследование проблем связанных с интеграцией информационных систем, выявлены их причины и способы преодоления указанных трудностей.

Проведённый анализ подходов к интеграции информационных систем показал, что наиболее перспективным является подход, предполагающий применение метаданных в качестве базиса интеграции ИС. Учитывая сложность поставленной задачи, сделан вывод о том, что решение должно базироваться на использовании метаданных и базы общих знаний о предметной области.

Во второй главе исследуются языки, методы и модели представления знаний об информационных системах, предложен метод описания двухуровневой концептуальной модели информационных систем на основе схемы данных и онтологии предметной области. Рассмотрены методы описания метаданных и сделано обоснование для выбора конкретных методов в данной работе.

Вводится понятие онтологии предметной области, как точной (выраженной формальными средствами) спецификации концептуализации. Формальная модель онтологии представляет множество терминов предметной области (ПО), которую описывает онтология, множество отношений между терминами заданной ПО и функции интерпретации, заданные на терминах и/или отношениях онтологии. Обосновывается необходимость использования онтологического подхода для автоматизированного решения задачи интеграции информационных систем, как механизма создания непрерывного информационного поля.

Проводится классификация моделей и языков представления метаданных, на основе которой выделяется язык XML и модель RDF для описания метаданных информационных систем.

Показано, что для описания структуры информационных систем достаточно использование языка XML, как универсального синтаксиса, который лег в основу передачи информации между различными программами. Важным качеством указанного стандарта является его открытость и независимость от конкретных сфер применения. Таким образом, XML становится удобным средством для обеспечения синтаксической интероперабельности ИС. Однако при всех своих достоинствах XML не в состоянии адекватно справиться с задачей семантической интероперабельности. Основное ограничение XML состоит в том, что XML лишь описывает грамматику, и невозможно выделение семантических единиц в конкретной предметной области. Затем, XML является неоднозначным средством описания данных и позволяет одну и ту же информацию разметить различными способами. Также XML не подходит для задания метаданных по причине значимого порядка элементов.

Показано, что указанные проблемы могут быть решены, если для определения метаданных и правил преобразования данных при переходе от одной интегрируемой ИС к другой ИС использовать XML вместе с другой моделью данных, например, моделью семантической сети. Формально семантическую сеть можно определить при помощи модели RDF. В модели RDF имена концептов выбираются из определённого словаря концептов и определённого пространства имён, поэтому их представление более унифицировано, в отличие от XML разметки. Также, в семантической сети порядок элементов не важен, поскольку она представляет собой размеченный граф. Таким образом, совместное использование с технологией XML модели RDF позволит отразить семантику концептуальных моделей информационных систем, а также избежать изложенных ограничений XML.

Показано, что модель метаданных для ИС должна представлять собой двухуровневую систему: базовый - структурный уровень (технология XML), и опирающийся на него семантический уровень (модель RDF). Предложен метод описания метаданных для интегрируемых информационных систем. Он заключается в построении RDF-утверждений на основе информации, извлечённой из базы данных информационной системы, и онтологии предметной области. Данные утверждения описывают связи сущностей внутри ИС. В разработанном формате каждый концепт характеризуется своим уникальным идентификатором id (именем концепта) и типом type. Далее внутри описания концепта описываются ссылки на его концепты-потомки (rdf:subConceptOf), и на концепты-предки (rdf:hasSubConcept). Затем описываются концепты-атрибуты данного концепта. Также вводится поле “семантическая метка” (sv). В данном поле хранится описание концепта, указывающее соответствующее место концепта в онтологии предметной области.

Приводятся примеры использования разработанного формата для описания метаданных информационной системы Клуба Выпускников МЭИ.

В третьей главе, учитывая достоинства и недостатки проанализированных моделей, рассматривается разработка модели описания метаданных информационных систем и алгоритмов интеграции информационных систем.

Формальное описание разработанных концептуальных моделей информационных систем будет иметь следующий вид: S = (X, R),где: X = { Ci | i=1, 2, …, n } – непустое множество концептов (объектов предметной области), R = { Rj | j=1, 2, …, k } – семейство отношений на множестве X.

Каждый концепт C информационной системы определяется следующим образом , где: N – имя концепта C (уникальное имя концепта в конкретной информационной системе), T – тип концепта C, SV – семантическая метка концепта C, P – множество предков концепта C, P = { Cl | l=1, 2, …, nl }, Ch – множество потомков концепта C, Ch = { Cm | l=1, 2, …, nm }, <A> – кортеж атрибутов концепта C.

Каждый атрибут A разработанной модели представлен следующей тройкой , где: N – имя атрибута A, T – тип атрибута A, SV – семантическая метка атрибута A, K – ключ атрибута, V – значение атрибута.

В данной модели семейство отношений представляется множеством R = { R1 , R2 }, где: R1 – отношение «зависимость», R1XЧX, С1R1С2 : С1P2 & С2Ch1, где Ch1 – множество потомков концепта С1, P2 – множество предков концепта С2; R2 – отношение агрегации («целое-часть»), R2XЧAt, At – множество атрибутов в рассматриваемой предметной области, At = { Aq | q=1, 2, …, nq}, С R2 Ai : Ai входит в <A>, где <A> – кортеж атрибутов концепта C.

Для описания правил преобразования концептов при интеграции информационных систем вводится функция интерпретации: Z(W)=Y, где W может принимать значения Ci, Ni, Ti, SVi, i[1,n], n – количество соответствующих элементов в концептуальной модели. Данная функция в качестве результата своей работы возвращает значение конкретного элемента модели, к которому она была применена.

Концептуальная модель каждой информационной системы строится из наборов утверждений, сформулированных в терминах разработанной модели. Построение единой метамодели осуществляется по аналогичным принципам. Для рассматриваемого в работе примера интеграции ИС ВУЗов описание концепта «Институт» будет выглядеть следующим образом:

















Рассматривается процесс интеграции информационных систем. Пусть существуют две информационных системы ИС-А и ИС-В, функционирующие в рамках одной предметной области и необходимо провести интеграцию ИС-А и ИС-В. На рисунке 1 приводится схема разработанного процесса интеграции ИС. Задачей интеграции является обеспечение взаимодействия между ИС. Для этого необходимо определить соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования. С этой целью вначале из информационных систем извлекаются их схемы данных. Схема данных представляет структурную схему базы данных, систему типизированных связанных сущностей и их атрибутов. При помощи анализа схем данных в отдельности, возможно установление лишь структурной интероперабельности, то есть правил преобразования типов полей и сущностей ИС друг в друга.

Для обеспечения семантической интероперабельности, требуется понимание назначения элементов ИС. Поэтому необходимо использовать вторую составляющую часть метаданных – концептуальную модель предметной области. Концептуальная модель является надстройкой над схемой данных и задаёт систему связей между концептами предметной области, установленную в данной ИС.

П
Рис. 1. Процесс интеграции

информационных систем.

остроение данной модели осуществляется при помощи онтологии предметной области. Онтол
огия содержит словарь концептов ПО и хранит общую сеть связей между этими концептами. То есть каждая концептуальная модель является подмножеством онтологии ПО. Использование онтологии позволяет определять концептуальные модели в одних терминах и анализировать связи между их концептами. Для упрощения работы с онтологией предметной области были разработаны следующие простые функции, определённые на концептах онтологии: функция склеивания, функция разделения, функция преобразования. Данные функции определяют правила перехода от концептов нижнего уровня к концепту верхнего уровня и наоборот.

Далее на базе концептуальных моделей ИС-А и ИС-В осуществляется построение метамодели предметной области интегрируемых ИС. Данная метамодель объединяет и согласует в себе обе концептуальные модели. На этапе её построения также используется онтология. Метамодель определяет соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования, что позволяет установить взаимодействие между указанными информационными системами.

Формально метамодель интегрируемых ИС определяется следующим образом: M = (S1 , S2 , Rs), где S1 – концептуальная модель ИС-А, S2 – концептуальная модель ИС-В, Rs – правила преобразования совокупностей концептов при их трансляции из ИС-А в ИС-В, построенные согласно рассматриваемому далее разработанному алгоритму интеграции ИС.

В результате, обеспечивается интероперабельность, а, следовательно, необходимый уровень интеграции информационных систем.

Таким образом, разработанный процесс интеграции информационных систем состоит из выполнения следующих алгоритмов:

1. Анализ сущностей баз данных, их атрибутов и отношений между ними. На данном этапе приложением осуществляется построение схем данных.

2. Анализ семантических меток сущностей и атрибутов. На данном этапе строятся концептуальные модели информационных систем. Для получения и анализа семантических меток используется онтология предметной области.

3. Уточнение семантических соответствий. С помощью онтологии определяются недостающие связи между концептами.

4. Построение единой метамодели. Данная метамодель строится как объединение двух концептуальных моделей информационных систем. На данном этапе онтология используется для разрешения возможных противоречий.

5. Вывод результирующих отображений между сущностями и атрибутами информационных систем.

Наиболее сложным этапом является построение результирующих правил преобразования концептов в рамках формирования единой метамодели ИС, в ходе которого могут возникать различные ситуации сопоставления концептов. Они были рассмотрены, проанализированы и сгруппированы в следующие 6 классов:

  1. Однозначное соответствие концептов ИС-А и ИС-В.

Для концепта первой информационной системы (A) найдено однозначное его отражение (B) в системе концептов второй ИС. Данные концепты имеют одинаковые типы и одинаковые семантические метки. То есть они обладают структурной и семантической интероперабельностью по отношению друг к другу. В этом случае осуществляется простая трансляция значения концепта А в концепт В. В терминах разработанных концептуальных моделей она имеет вид: .

Здесь и далее, стрелка означает перевод указанных систем объектов из ИС-А в ИС-В, нижний индекс 1 означает принадлежность элемента к ИС-А, 2 – к ИС-В, индекс i[1,n], j[1,m], n – количество концептов в ИС-А, m – количество концептов в ИС-B.

  1. Неполное соответствие концептов ИС-А и ИС-В.

В данной ситуации возможны два случая:

а) Названия концептов А1,i и A2,j отличаются, типы совпадают, семантические метки также совпадают:



б) Типы концептов А1,i и A2,j отличаются, семантические метки совпадают.



Поскольку семантические метки в случае а) совпадают, то, невзирая на различие названий концептов, возможно осуществление трансляции их значений. В случае б) необходимо осуществить преобразование типов по одному из разработанных правил преобразований типов.

  1. Совокупность концептов ИС-А соответствует одному концепту ИС-В.

Такая ситуация означает, что согласно онтологии ПО было установлено соответствие совокупности концептов-потомков в ИС-А одному концепту-родителю в ИС-В.



В этом случае для перевода значений концептов ИС-А в значение концепта ИС-В используются функции, определённые на концептах онтологии. В данном случае используется функция склеивания концептов: , , где Fs – функция склеивания, <A1,i> – кортеж входных атрибутов ИС-А, 0?i?n, n – количество используемых при склеивании атрибутов; R – символ-разделитель значений атрибутов; A2 – результирующий атрибут ИС-B.

  1. Одному концепту ИС-А соответствует совокупность концептов ИС-В.

В терминах разработанной модели случай найденного соответствия одному концепту в ИС-А совокупности концептов в ИС-В будет выглядеть следующим образом:

,

Ситуация аналогична пункту 3. Для осуществления преобразований используется функция разделения концептов:, , где Fr – функция разделения, A1 – входной атрибут ИС-A, R – символ-разделитель значений атрибутов, – кортеж выходных атрибутов ИС-B, i[0, n], n – количество используемых при разделении атрибутов.

  1. Установление соответствия значений пары концептов ИС-А и ИС-В.

В связи с необходимостью интеграции данных из ИС-А в существующие данные в ИС-В, необходимо определять не только новые значения концептов в ИС-В, но и их связи со старыми значениями (по системе первичных и внешних ключей). Для э


Рис. 2. Пример установления соответствия значений пары концептов.
того при переводе значения концепта А1,i,p в его отражение – концепт A2,j,q – необходимо устанавливать значения концептов, находящихся на одном уровне с концептом A2,j,q.

Разработанная схема трансляции показана на примере (рис. 2).

Поскольку кафедры в различных ИС могут иметь различные номера, но одинаковые названия, необходимо:

  1. найти семантически связанные параметры в родительской сущности – «Кафедра»-ИС-А: «Название кафедры» (и «Название института»)

  2. обратиться к сущности «Кафедра»-ИС-А, извлечь значение её свойства «Название кафедры» (и «Название института» в случае возможной неоднозначности).

  3. извлечь «№_кафедры» из сущности «Кафедра ИС-В», которому соответствует указанное в пункте 2 значение.

  4. выдать «№_кафедры»-ИС-В в качестве результата.

  1. Отсутствие соответствия концепта в ИС-В концепту из ИС-А.

Возможно возникновение ситуации, при которой необходимо полностью ввести значения всех свойств (At) сущности в ИС-В, но ИС-А не обладает этим набором свойств. В этом случае следует найти сущность в ИС-В, обладающую свойством, для которого найдено соответствие с ИС-А, и по связям которой можно п


Рис. 3. Пример установления значения отсутствующего свойства.
олучить недостающее значение свойства из At ИС-В. Например, для определения свойства «№_института» (рис. 3) в ИС-В, необходимо:

  1. найти сущность в ИС-В, в которой есть свойство «Название института», и по связям которой можно получить свойство «№_института» - «Институт»-ИС-В.

  2. извлечь из ИС-В «№_института», которому соответствует «Название института»-ИС-А.

Необходимо подчеркнуть, что при функционировании разработанного алгоритма интеграции информационных систем фундаментальную роль играет использование семантики интегрируемых данных. Она участвует в решении поставленной задачи на основных этапах его выполнения:

  1. При автоматизированном определении концептуальных моделей ИС алгоритм формирования метаданных выдаёт рекомендации пользователю.

  2. При формировании гипотез о значении семантической метки концептов производится их подбор по типу хранимой в них информации. Например, концепт «название кафедры» хранит значения строкового типа, поэтому велика вероятность, что он соответствует концептам онтологии такого же типа. Также производится структурный анализ иерархии данных в ИС и в онтологии. На основе такого рода заключений, предоставляемый пользователю список возможных семантических меток для каждого концепта сортируется по степени предполагаемой алгоритмом релевантности.

  3. Формирование правил структурного и семантического преобразования концептов ИС осуществляется на основе их концептуальных моделей, хранящих определённую семантическую информацию о находящихся в ИС данных. В этом процессе участвует онтология, к которой алгоритм обращается для разрешения сложных ситуаций преобразования концептов.

В главе приводятся алгоритмы разрешения возможных противоречий: конфликт типов, конфликт преобразования групп концептов в один концепт, конфликт преобразования одного концепта в группу концептов, отсутствие необходимого значения концепта.

Проведена оценка вычислительной сложности процесса интеграции информационных систем. Согласно полученным результатам общая оценка сложности (C) не будет превышать следующей величины: С~N1+N2+ + N1·N2+N1·N2+Const+N1·N2·C(FO)+ N1·N2·C(FO) +N1·N2+(N1–1)·(N2–1)·(1+Const1·Const2)+N1·N2+(N1–1)·(N2–1)+ (N1–1)·Const1·Const2·[N22 ·(N2 –1)– N2 ·(N2–1) 2+2·N2/3+1/3+(N2–1)3/3– N22], где N1 – количество концептов ИС-А, N2 – количество концептов ИС-B, FO – функция, определённая на концепте онтологии, NO – количество концептов в онтологии предметной области. Отсюда видно, что вычислительная сложность разработанных алгоритмов имеет полиномиальную оценку. Данный факт показывает возможность практического применения разработанных методик при решении задач интеграции.

В завершении главы подробно рассмотрено функционирование данных методов на примере интеграции информационных систем ВУЗа.

В четвёртой главе рассмотрено практическое применение разработанных концепций и проведён анализ результатов исследований на примере интеграции базы данных системы измерений параметров нефте-водо-газовой смеси “Ультрафлоу” и информационной системы АДКУ 2000.

ИС Var Pro (рис. 4, 5) представляет собой информационную систему измерительного прибора “Ультрафлоу”. Данная система в режиме мониторинга о


Рис.4. Схема работы измерительной системы.
прашивает нефте-водо-газовый расходомер “Ультрафлоу”, установленный на кусте скважин, и ведёт архив измерений. Система предоставляет пользователю результаты измерений за отчётный период в табличных или графических формах.


ИС АДКУ 2000 (рис. 6) является штатной ИС нефтяного месторождения “Уньва” (Пермская область). Данная система объединяет показания измерительных систем кустов скважин, управляемых контрольной автоматикой, и предоставляет операторам Контрольно-Измерительного Пункта (КИП) результаты их измерений.

В данном случае под задачей интеграции понимается внедрение ИС Var Pro с базой данных UltraBase в ИС АДКУ 2000. То есть определение структурных и семантических отображений концептов и связей между ними ИС Var Pro, в концепты и связи между ними ИС АДКУ 2000. Данные о


Рис. 5. Пример представления данных в ИС VarPro.



Рис. 6. Пример представления данных в АДКУ 2000.
тображения определяются в терминах языка XML и модели RDF.


Рассмотрено создание онтологии предметной области «Нефтедобыча» в соответствии с методологией стандарта IDEF5.

В


Рис.7. Примеры экранных форм программы Var Pro Integrator.
главе рассматриваются инфологические и даталогические модели интегрируемых ИС, извлечение их схем данных из соответствующих серверов баз данных и формирование концептуальных моделей для каждой ИС.
Приведено подробное описание процесса интеграции информационной системы Var Pro и штатной ИС нефтяного месторождения АДКУ 2000 при помощи разработанного программного средства Var Pro Integrator (рис. 7).

Вначале программа позволяет пользователю определить метаданные для ИС с использованием онтологии предметной области. Затем на основе введённых метаданных устанавливаются структурные и семантические соответствия для трансляции информации между ИС. Далее выполняется алгоритм, согласно которому на основе знаний о правилах преобразований, программа Var Pro Integrator формирует SQL-запрос на добавление информации из ИС Var Pro в БД АДКУ2000, с соблюдением всех уровней иерархии связей её таблиц. При выполнении данного запроса указанная информация из ИС VarPro будет транслирована в БД АДКУ 2000.

Таким образом, обеспечена интероперабельность ИС Var Pro, заключающаяся в том, что при установке на нефтяное месторождение нефтеводогазового расходомера “Ультрафлоу”, процесс интеграции его ИС в АСУ ТП месторождения выполняется в полуавтоматическом режиме за достаточно малый временной период.

В заключении приведены основные результаты, полученные в диссертационной работе.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ


  1. Проведен анализ и классификация существующих подходов к интеграции ИС, а также языков и моделей представления метаданных, и обосновано применение технологии XML/RDF(RDFS) для описания метаданных ИС. Обоснована двухуровневая схема организации концептуальных моделей метаданных, создающая эффективные возможности для интеграции и обеспечения взаимодействия ИС.

  2. Разработана информационная модель для связи объектов различных ИС, функционирующих в рамках одной предметной области.

  3. Предложен новый метод интеграции информационных систем, предусматривающий определение их концептуальных моделей и формирование на этой основе единой метамодели интегрируемых ИС, базирующейся на онтологии предметной области.

  4. Разработан процесс интеграции информационных систем, состоящий из совокупности следующих алгоритмов: поиска структурных и семантических отображений систем связных сущностей и их атрибутов интегрируемых ИС; уточнения семантических соответствий; анализа и дополнения связности системы сущностей; расширения концептов; разрешения конфликтов структурных преобразований; построения результирующих правил преобразования.

  5. Проведён анализ и классификация возможных вариантов соответствия концептов интегрируемых ИС, и разработаны относящиеся к ним действия алгоритма.

  6. Разработаны и исследованы новые алгоритмы разрешения возможных противоречий при объединении концептуальных моделей информационных систем на структурном и семантическом уровнях.

  7. Разработанные модели и методы использованы при создании программного комплекса Var Pro нефтеводогазового расходомера «Ультрафлоу», оснащённого базой данных UltraBase. Он включает в себя разработанное приложение Var Pro Integrator, предназначенное для интеграции ИС расходомера в состав штатных хранилищ данных нефтяных месторождений.

  8. Рассмотрена интеграция ИС Var Pro в хранилище данных АДКУ 2000. Разработаны модели интегрируемых информационных систем Var Pro и АДКУ2000 и онтология «Нефтедобыча» для предметной области функционирования интегрируемых ИС. Подтверждена эффективность разработанных алгоритмов.


СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

  1. Михайлов И.С. Подход концептуального метамоделирования для обеспечения структурной и семантической интероперабельности информационных систем // Ученые записки РГСУ, №1, 2007, – М.: РГСУ, стр. 93-100.

  2. Вагин В.Н., Михайлов И.С. Разработка метода интеграции информационных систем на основе метамоделирования и онтологии предметной области. // Программные продукты и системы. 1’2008. стр 22-26.

  3. Михайлов И.С. Обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей. Труды международной конференции «Информационные средства и технологии». 12-14 октября 2004 г., 3-х т.т. Т1. – М.: Москва, Янус-К, 2004. – 226 с. ISBN 5-8037-0207-2, с. 223-226.

  4. Mikhaylov I.S. Var Pro, Intellectual Information System in the Oil Industry. // Multiphase Flow Measurement Seminar. Paris (Clamart), France, December 14-19, 2004.

Михайлов И.С. Var Pro, интеллектуальная информационная система в нефтяной промышленности. // Семинар по многофазным измерительным системам. Париж (Кламар), Франция, Декабрь 14-19, 2004.

  1. Михайлов И.С. Исследование методов обеспечения семантической интероперабельности информационных систем. РАДИОЭЛЕКТРОНИКА, ЭЛЕКТРОНИКА И ЭНЕРГЕТИКА // Одиннадцатая Междунар. науч.-техн. конф. студентов и аспирантов: Тез. докл. В 3-х т. – М.: МЭИ, 2005. Т. 1. – 452 с. ISBN 5-87789-019-0, Издательство ЗАО «Знак». с. 345.

  2. Михайлов И.С. Разработка системы Var Pro Integrator, обеспечивающей интеграцию БД СИ “Ультрафлоу” и штатной БД нефтяного месторождения с использованием онтологии предметной области и метамоделей. НАУЧНАЯ СЕССИЯ МИФИ-2005. Сборник научных трудов. В 15 томах. Т.3. Интеллектуальные системы и технологии. М.: МИФИ, 2005. 232 с. ISBN 5-7262-0555-3, с. 112-113.

  3. Михайлов И.С. Интеграция информационных систем на основе метамоделирования. "РАДИОЭЛЕКТРОНИКА, ЭЛЕКТРОТЕХНИКА И ЭНЕРГЕТИКА" (2 - 3 марта 2006г.). // Двенадцатая Междунар. науч.-техн. конф. студентов и аспирантов: Тез. докл. В 3-х т. – М.: МЭИ, 2005. Издательство ЗАО «Знак».

  4. Михайлов И.С. Обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей. // Вычислительные сети. Теория и практика. 2’2005.

  5. Михайлов И.С. Применение нейронных сетей для автоматизированной интеграции хранилищ данных. // Первая общегородская научно-практическая конференция «Студенческая Наука», МГТУ им. Н.Э. Баумана (21-22 ноября 2006 года).

  6. Михайлов И.С. Разработка метамоделей информационных систем для обеспечения структурной и семантической интероперабельности. // Всероссийская научная конференция по нечетким системам и мягким вычислениям НСМВ-2006 (20 – 22 сентября 2006г., Тверь): Труды конференции. – М.: Физматлит, 2006. – 384 с.

  7. Михайлов И.С. Применение метамоделирования для интеграции информационных систем // Международный форум информатизации МФИ-2006. Труды Международной научно-технической конференции «Информационные средства и технологии».Т.3.–М.:Янус-К, 2006, с.122-126.

  8. Михайлов И.С. Разработка универсального алгоритма интеграции информационных систем на основе метаданных // Труды международной научно-технической конференции «Информационные средства и технологии». 16-18 октября 2007 г., Т.3. - М.: МЭИ, 2007, – с. 56-59.

  9. Вагин В.Н., Михайлов И.С. Построение модульных информационных систем с использованием метаданных в сфере учёта нефтяной продукции. // Вычислительные сети. Теория и практика. 1’2007.

  10. Михайлов И.С. Создание интеллектуального программного комплекса с возможностью автоматизированной интеграции в области нефтяной промышленности // Научная сессия МИФИ-2007. Сборник научных трудов. В 17 томах. Т.3 – М.:МИФИ, 2007, –С. 201-203.

  11. Михайлов И.С. Проектирование и реализация информационной системы VarPro для учёта продукции нефтяных скважин // Технологии Microsoft в теории и практике программирования: труды IV Всероссийской конференции студентов, аспирантов и молодых учёных. Москва, 2-3 апреля 2007 г. Т. 1, –М.: Вузовская книга, 2007. стр. 117-118.

  12. Михайлов И.С. Обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей // Тезисы докладов XV Международной студенческой школы-семинар «Новые информационные технологии». Т. 1, –М.: МИЭМ, 2007, стр.164-165.

  13. Mikhaylov I.S. Information Systems Metamodels Developing for Providing Structural and Semantic Interoperability. // International Conference on Dependability of Computer Systems DepCoS – RELCOMEX 2007, Szklarska Poreba, Poland, 14 – 16 June, 2007. pp. 59 - 64.

Михайлов И.С. Разработка метамоделей информационных систем для обеспечения структурной и семантической интероперабельности. // Международная конференция по надёжности компьютерных систем DepCoS – RELCOMEX 2007, Скларска Пореба, Польша, 14 – 16 июня, 2007. с. 59-64.

  1. Разработка и интеграция информационной системы нефтяного месторождения в штатный программный комплекс. Радиоэлектроника, Электроника и Энергетика // Четырнадцатая Международная научо-техническая конференция студентов и аспирантов: Тез. докл. В 3-х т. – М.: Издательский дом МЭИ. 2008. Т. 1. – 412 с. с. 302.


Подписано в печать __.__.08 Зак. Тир. _____ П.л. 1,5

Полиграфический центр МЭИ (ТУ)

Красноказарменная ул., д.13



Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации