Слайд 1Разработка и сопровождение информационных систем, базирующихся на онтологии и Wiki-технологии
Шестаков В.К.,
аспирант НГУ
Научный руководитель: Загорулько Ю.А.
Слайд 2Wiki-технология
Wiki — технология взаимодействия пользователя с веб-сайтом, предназначенная для коллективной разработки,
хранения, структуризации информации.
Достоинства
удобство сбора и хранения информации различного
типа
простота доступа и освоения
Недостатки
позволяет отслеживать в создаваемых информационных системах только структурную целостность ссылок, не обеспечивая при этом логической непротиворечивости и семантической согласованности используемых в них понятий
затруднено построение сложных информационных систем (в том числе путем построения сложно-структурированной информационной Wiki-системы на основе нескольких близких по тематике систем)
Слайд 3Подход к построению ИС
Идея предлагаемого подхода состоит в создании инструментария, который
бы обеспечивал заполнение Wiki-системы информацией с согласованной системой понятий, а также предоставлял средства для ее сопровождения и развития.
Такую семантически согласованную информационную Wiki-систему можно получить, если заполнять ее на основе логически непротиворечивой онтологии, описывающей предметную область будущей системы.
Для контроля, сопровождения, развития и трансформации уже существующих информационных Wiki-систем в этот инструментарий должна входить обратная процедура — метод извлечения онтологий из Wiki-систем.
Слайд 4Онтология
Онтология — формальная, явная спецификация концептуализации (Tom Gruber)
Онтология обеспечивает:
строгую формализацию знаний;
явную
концептуализацию предметной области (ПО), позволяющую описывать семантику данных;
совместное использование разнородных данных и знаний в рамках одной системы;
формирование и фиксацию общего разделяемого всеми экспертами знания о ПО;
переиспользование знаний.
Слайд 5Обзор средств создания Wiki-систем с использованием семантических технологий
OntolingeWiki
Создание Wiki-интерфейса по онтологии
и визуальная навигация по нему.
Semantic MediaWiki
Расширение MediaWiki, добавление семантической информации за счет расширенной Wiki-разметки.
BOWiki
Расширение MediaWiki, семантический Wiki-движок, специализирующийся на био-онтологиях.
RDFIO
Расширение MediaWiki, импорт произвольных RDF-триплетов.
LinkedWiki
Расширение MediaWiki, получение данных с внешнего сервиса и отображение этих данных в Wiki-системе.
Слайд 6Обзор подходов к извлечению знаний и онтологий из Wiki-систем
YAGO
Автоматическое построение онтологии
верхнего уровня значительного объема, включающую факты, извлеченные из Википедии с высокой точностью.
DBpedia
Извлечение структурированной информации из Википедии и предоставление доступа к ней.
Constructing Large-Scale Person Ontology from Wikipedia
Построение крупномасштабной онтологии людей.
Harvesting Wiki Consensus – Using Wikipedia Entries as Ontology Elements
Использование Википедии в качестве среды для разработки онтологий.
Слайд 7Обзор подходов к извлечению знаний и онтологий из Wiki-систем
Corpus Exploitation from
Wikipedia for Ontology Construction
Использование Википедии как источника корпуса текстов для построения онтологии конкретной предметной области.
Building and Using Geospatial Ontology in the BioCaster Surveillance System
Выявление и отслеживание вспышек инфекционных заболеваний на основе новостных сообщений.
Wikipedia2Onto --- Adding Wikipedia Semantics to Web Image Retrieval
Попытка автоматического построения крупномасштабной мульти-модальной онтологии для классификации веб-изображений.
Слайд 8Предлагаемый подход: Onto2Wiki & Wiki2Onto
Две составляющие:
Onto2Wiki — отображение онтологии в Wiki-систему
Wiki2Onto
— извлечение онтологии из Wiki-системы
Слайд 9Onto2Wiki: общая схема заполнения информационной Wiki-системы на основе онтологии
Онтология предметной области
Wiki
Эксперты
Пользователи
Эксперт
предметной области
Onto2Wiki
Слайд 10Отличительные особенности такого подхода
Получается семантически согласованная информационная Wiki-система.
Онтология полностью определяет всю
структуру Wiki-системы
Независимость от изначальной онтологии, т.е. есть возможность изменения и дополнения структуры средствами самой Wiki-системы.
Слайд 11Средства реализации
Wiki-движок — комплекс программных средств для преобразования Wiki-разметки в код,
предназначенный для отображения в браузере.
Wiki-движок: MediaWiki
Расширение: Semantic MediaWiki
Слайд 12Wiki-разметка
Обычная Wiki-ссылка:
[[название_страницы]]
Свойство (Semantic MediaWiki):
[[имя_свойства::значение_свойства]]
На странице свойства:
[[Имеет тип::тип]]
Слайд 13Средства реализации
Бот — специальное клиентское приложение для выполнения заданного набора операций.
Применение
в Википедии:
переименование категорий и статей,
расстановка интервики ссылок,
исправление ссылок,
удаление спама,
и т.п.
Python WikipediaBot Framework — библиотека для написания ботов на языке Python.
MediaWiki API — специальный интерфейс прикладного программирования) для взаимодействия с MediaWiki-системой.
RDFLib — библиотека Python для работы с RDF.
Слайд 16Пример: Технология создания экспертных систем
Рассмотрим работу Onto2Wiki на примере построения учебной
информационной системы «Технология создания экспертных систем»:
Построение онтологии в редакторе Protégé.
Отображение полученной онтологии в Wiki-систему.
Слайд 17Построение онтологии предметной области
Слайд 18Онтология ПО Технология создания экспертных систем
Слайд 23Пример страницы (экземпляр категории Литература по ЭС)
Слайд 24Wiki2Onto: извлечение онтологии из Wiki-системы
Wiki2Onto — модуль для извлечения онтологий из
Wiki-систем.
Wiki2Onto обеспечивает извлечение онтологии из Wiki-систем, построенных как с использованием расширения Semantic MediaWiki, так и без него.
Слайд 27Wiki2Onto: соответствие при извлечении стандартных типов
Слайд 28Отличительные особенности Wiki2Onto
Позволяет получить в виде онтологии структуру конкретной Wiki-системы.
Может извлекать
как явно размеченные семантические данные, так и другую имеющуюся в Wiki-системе информацию.
Не требует внесения изменений на стороне сервера.
Слайд 29Пример извлечения онтологии
Заглавная страница
[[Индивид::Человек|Статья о человеке]]
Слайд 31Пример извлечения онтологии
Человек
Его зовут [[Имя::Эдуард]].
Количество сыновей: [[Количество сыновей::2]]
Он [[Женат::false|не женат]].
Родился
[[Дата рождения::4 декабря 1976]]
Характеристика: [[Описание::характер стойкий, нордический]]
Пример кода: [[Отрывок кода::
Слайд 33Пример извлечения онтологии
@prefix owl: .
@prefix rdf: .
@prefix rdfs:
.
@prefix xsd:
.
@prefix ex: .
rdf:type owl:Ontology .
ex:Дата_рождения rdf:type owl:DatatypeProperty .
ex:Женат rdf:type owl:DatatypeProperty .
ex:Заглавная_страница rdf:type owl:NamedIndividual;
:Индивид ex:Человек .
ex:Имя rdf:type owl:DatatypeProperty .
ex:Индивид rdf:type owl:ObjectProperty .
ex:Количество_сыновей rdf:type owl:DatatypeProperty .
ex:Несуществующие_страницы rdf:type owl:Class;
rdfs:comment "Служебный класс"^^xsd:string .
ex:Номер_мобильного_телефона rdf:type owl:AnnotationProperty,
owl:DatatypeProperty .
ex:Описание rdf:type owl:DatatypeProperty .
Онтология, записанная в нотации Turtle:
Слайд 34Пример извлечения онтологии
ex:Отрывок_кода rdf:type owl:DatatypeProperty .
ex:Сайт rdf:type owl:AnnotationProperty,
owl:DatatypeProperty .
ex:См_также rdf:type owl:AnnotationProperty,
owl:DatatypeProperty .
ex:Электронная_почта rdf:type owl:AnnotationProperty,
owl:DatatypeProperty .
ex:Люди rdf:type owl:Class .
ex:Человек :Дата_рождения "1976-12-04T00:00:00"^^xsd:dateTime;
:Женат "false"^^xsd:boolean;
:Имя "Эдуард"^^xsd:string;
:Количество_сыновей "2"^^xsd:double;
:Номер_мобильного_телефона ;
:Описание "характер стойкий, нордический"^^xsd:string;
:Отрывок_кода "
Слайд 35Варианты применения подхода
Контроль качества заполненной на основе онтологии Wiki-системы в течение
всего ее жизненного цикла.
Wiki
Wiki2Onto
Онтология
Анализ
Слайд 36Варианты применения подхода
Возможность реинжиниринга информационных Wiki-систем.
Wiki
Wiki2Onto
Онтология
Onto2Wiki
Онтология'
Слайд 37Варианты применения подхода
Возможность построения предварительных вариантов онтологий предметных областей на основе
существующих Wiki-систем.
Wiki 1
Wiki2Onto
Онтология 1
Онтология
Wiki 2
Wiki2Onto
Онтология 2
Wiki n
Wiki2Onto
Онтология n
…
Слайд 38Варианты применения подхода
Возможность построения обобщенной информационной Wiki-системы на основе нескольких близких
по тематике Wiki-систем.
Wiki 1
Wiki2Onto
Онтология 1
Wiki 2
Wiki2Onto
Онтология 2
Онтология
Onto2Wiki
Wiki
Слайд 39Результаты
Рассмотрен подход к построению информационных систем на основе Wiki-технологии и онтологий
предметных областей.
Предложены метод заполнения Wiki-систем на основе онтологий и метод извлечения онтологий из существующих Wiki-систем.
Разработан прототип инструментальной системы.
Рассмотрены варианты применения этой системы.