Слайд 1ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ
Рубашкин В. Ш., Пивоварова
Л. М.
Санкт-Петербургский государственный университет
Кафедра информационных систем
факультета филологии и искусств
Слайд 2Онторедактор – инструментальная среда, предназначенная для создания онтологии или работы с
ней.
Слайд 3Основные проблемы которые должна решать инструментальная среда:
Методология формализации знаний
Унификация онтологий
Пополнение онтологий
Достоверность
и целостность
Слайд 4InTez – еще один онторедактор?
(Protégé, ODE, … + еще 92?)
2 подхода:
Инструмент для "выравнивания", слияния, (merging & mapping) и пополнения разнородных и даже основанных на разных моделях знаний частных онтологий.
Инструментальная среда, ориентированная на:
определенную функциональность онтологии;
определенную модель знаний;
построение единой "многодоменной" онтологии,
опирающейся на онтологию верхнего уровня (TopLevel)
Слайд 5Функциональность онтологии
Унификация терминологии
Представление и логическая обработка таксономических отношений
Представление и логическая обработка
отношений объемной совместимости/несовместимости
Представление и логическая обработка предметно-ассоциативных отношений
Поддержка представления и логической обработки количественных данных
Регламентация процедур описания объектов
Аксиоматизация описаний процессов, причинных связей, процедур
Слайд 6Модель знаний
Модель знаний - язык представления знаний (ЯПЗ) вместе с некоторым
набором схем аксиом, определяющих дополнительные возможности системы вывода.
Используется для формального описания понятийно-терминологической системы: термины и связи между ними представляются как конструкты выбранного ЯПЗ (в идеале – как логические формулы некоторого логического исчисления).
Отсутствует разработанная методология формализации знаний.
Слайд 7
Что, в часности, требует последовательной формализации в ЯПЗ:
Ограничения на сочетаемость терминов:
*жидкая пирамида, *идеи спят,*медь смертна
Систематическое описание связи признаков по условиям применимости
Порядок деления на классы (расхожий пример: пол и возраст) vs фасетизация
Различение семантических примитивов и терминов, вводимых формальными толкованиями; средства определения терминов в ЯПЗ.
Слайд 8Конкретный пример – определение несовместимости понятий через использование таких конструкций как
DisjointWith, DisjointUnionOf и др.
Создается явное впечатление, что предлагается описывать отношение объемной несовместимости способом «каждый с каждым»
Слайд 9Что следовало бы сделать:
Продукты питания
по консистенции:
Твердые
Жидкие (напитки)
Кашеобразные
Неоднородной консистенции*
культивируемость:
Культурного происхождения
Природного происхождения
Слайд 10 по происхождению:
Животного происхождения
Виды продуктов животного происхождения:
Мясо /птица, говядина, свинина,
…/
Продукты водной среды (животного происхождения)
Молочные продукты
Яйца
Растительного происхождения
Виды продуктов растительного
происхождения:
Овощи /зеленые, красные, другие;
листовые, плодовые, корнеплоды; …/
Фрукты
Смешанные
Синтетические
Слайд 11NB: Внетаксономические импликативы:
Мясо → Твердая консистенция
Дичь =df Мясо & Природного происхождения
Водка
– алкогольный напиток
-----------------------------------------
Мясо → ¬ Водка
Слайд 12Функциональность онторедактора
Общие характеристики:
операционная среда (СУБД)
графический редактор таксономий
толковый словарь
представление связей
Слайд 13Функциональность онторедактора
Навигация и поиск:
Вербальный поиск концепта
Просмотр дерева признаков
Установка фильтров
Навигация по
связям
Навигация по лексическим вариантам
Слайд 14Функциональность онторедактора
Ввод и редактирование
«Ручной» ввод концептов
Пакетный ввод концептов
Ввод связей между концептами
Ввод
лексических вариантов концепта
Графическое редактирование
Редактирование словарных описаний
Логический контроль данных при вводе
Слайд 15Обеспечение достоверности
Формальная и содержательная правильность
Процедура ввода должна обнаруживать и блокировать ввод,
например, концепта, определяемого И-толкованием вида
Тигр ≡ животное And металлический
(определяющие концепты должны быть объемно совместимы)
Но:
Лед ≡ квазиобъект And цилиндрической формы
- формально правильно (содержательная ошибка).
.
Слайд 16Формальная и содержательная правильность
Еще пример:
формально неправильно:
БАЗОВЫЙ ПРИЗНАК (метр) = перемещение
категориальная ошибка (базовым признаком может быть только концепт класса наименование признака сочетающееся с числом);
правильно:
БАЗОВЫЙ ПРИЗНАК (метр) = линейный размер
Но:
БАЗОВЫЙ ПРИЗНАК (метр) = масса
- формально правильно (содержательная ошибка).
Слайд 17Условия формальной достоверности
Неизбыточность и полнота описания - должны предъявляться и определяться
те и только те словарные признаки, которые релевантны для концептов данного типа
Непротиворечивость описания - словарные характеристики не должны противоречить друг другу. (в терминах OWL – не должны находиться в отношении Disjoint).
Правильность означивания - вводимые значения определяемых словарных признаков должны принадлежать области их допустимых значений.
Слайд 18Обеспечение достоверности
Конечная цель при проектировании процедур ввода состоит в том, чтобы
полностью исключить формально определимые ошибки.
При этом технологически "хорошее" решение будет состоять не в том, чтобы уметь обнаруживать формальные ошибки post factum, а в том, чтобы сама процедура ввода была спроектирована так, чтобы ввод логически некорректных элементов описания оказывался вообще невозможным.
Слайд 19Тестирование
Проверить содержательную правильность описаний концептов можно только путем организации "лабораторных" испытаний
и экспертной оценки их результатов администратором.
Окончательную проверку и отладку ("бета-тестирование") онтология может пройти в рамках целевых информационных технологий.
"Тестирование" отдельных концептов сводится к просмотру и проверке содержимого словарных статей и, следовательно, относится к компетенции подсистемы навигации и броузинга.
Собственно тестирование как отличающаяся от броузинга процедура может состоять только в тестировании отношений между концептами – как объемных, так и ассоциативных.