Некоторые проблемы широкого внедрения онтологий в IT презентация

Содержание

Кафедра математики, логики и ИС, РГГУ 2008 Цель доклада Охарактеризовать состояние и развитие систем онтологий в Веб с 1995 года; Определить некоторые трудности внедрения и использования таких систем; Определить некоторые

Слайд 1Некоторые проблемы широкого внедрения онтологий в IT
Евгений Михайлович Бениаминов
http://beniaminov.rsuh.ru
зав. кафедрой математики,

логики и интеллектуальных систем
Института лингвистики РГГУ

Слайд 2Кафедра математики, логики и ИС, РГГУ 2008
Цель доклада
Охарактеризовать состояние и

развитие систем онтологий в Веб с 1995 года;
Определить некоторые трудности внедрения и использования таких систем;
Определить некоторые направления развития систем и преодоления трудностей.


Слайд 3Кафедра математики, логики и ИС, РГГУ 2008
Мое первое знакомство с

онтологиями

Много лет назад я занимался алгебраическими моделями баз данных, и стало понятно, что схемы баз данных являются элементами особых структур, которые позже были названы онтологиями, и нужны специализированные системы, поддерживающие процессы формирования и отладки многомодульных библиотек онтологий. Я стал заниматься приложением математической теории категорий к моделированию онтологий и разработкой принципов построения системы формирования и отладки онтологий;
10 лет назад Леонид Андреевич Калиниченко указал мне на систему Ontolingua – первую систему в Web для работы с онтологиями. С тех пор я с большим интересом слежу за этой темой.


Слайд 4Кафедра МЛиИС РГГУ 2007
Онтологии
Онтологии представляют собой спецификации на формальном языке, в

которых фиксируются договоренности группы специалистов о том, что как называется в их области и каким свойствам (соотношениям) удовлетворяет.
На логическом уровне каждой онтологии соответствует некоторая теория (сигнатура+аксиомы), а иногда и некоторая фиксированная модель (множества+операции). Вопросы к онтологии интерпретируются как запросы к соответствующей ей теории (модели).
Онтологии, как правило, строятся по модульному принципу: при определении новой онтологии могут использоваться уже ранее построенные онтологии.
Онтологии должны быть удобны для понимания специалистами и интерпретироваться системами при использовании.

Слайд 5Кафедра математики, логики и ИС, РГГУ 2008
Простейшие онтологии – системы

классификаций

Классификационные системы являются распространенными (но ограниченными) примерами онтологий.
Важность классификационных систем. Классификационные системы в медицине, биологии, общие (верхние) классификационные системы, рубрикаторы по областям знаний.
Protégé, как наиболее распространенный инструмент формирования классификационных онтологий.


Слайд 6Кафедра математики, логики и ИС, РГГУ 2008
Онтологии, как микротеории
В общем

случае в онтологии задаются имена классов, имена свойства, типы значений свойств, некоторые элементы классов, функции (операции) и отношения между классами и элементами, а также аксиомы, связывающие элементы онтологий.
Сложные онтологии строятся по модульному принципу.
Поддержка многоверсионности онтологий.
Тестирование и отладка онтологий.
Контекстность (взаимная противоречивость) онтологий.
Примеры онтологий: онтологии определений, схем БД и задач.
Логическая неполнота микротеорий, соответствующих онтологиям, как одно из основных свойств.

Слайд 7Кафедра математики, логики и ИС, РГГУ 2008
Основные примеры серверов онтологий

и систем, использующих онтологии в Веб

Cус – большой проект системы, основанный на знаниях.
Ontoligua – Web-сервер онтологий и ОКВС.
Инструменты для работы с онтологиями: Protégé, Chimaera.
The World FactBook – пример распределенной базы данных в Web, использующей онтологии.
Проект Semantic Web.
Системы, поддерживаемые DARPA.
Онтологии верхнего уровня и специализированные онтологии.
Корпоративные системы.


Слайд 8Кафедра математики, логики и ИС, РГГУ 2008
Система Cyc
Cyc — это

закрытый проект по созданию объёмной онтологической базы знаний, позволяющей программам решать сложные задачи из области искусственного интеллекта. Автор: Дуглас Ленат. Начало разработки: 1984 г.
На текущий момент база знаний Cyc содержит 2,2 миллиона утверждений (фактов и правил), описывающих более 250 тысяч термов, включая почти 15,000 предикатов. Модули представлены в виде микротеорий.
Имеется открытый фрагмент онтологии OpenCyc (http://www.opencyc.org/) и его представление в Web (http://www.cycfoundation.org/concepts).


Слайд 9Кафедра математики, логики и ИС, РГГУ 2008
Система Ontolingua
Web-сервер Ontolingua для

хранения онтологий и межмашинного обмена онтологиями разработан в 1995 г. лабораторией KSL Стэнфордского университета.
Большая библиотека онтологий в открытом доступе для произвольных пользователей представлена на станице: http://www.ksl.stanford.edu/software/ontolingua/
Интересные демонстрационные примеры применения системы указаны на странице: http://www.ksl.stanford.edu/htw/htw-demos.html
В этих примерах показывается, как строятся онтологии задач на основании библиотек онтологий из различных областей знаний.

Слайд 10Кафедра математики, логики и ИС, РГГУ 2008
The World FactBook
The World

FactBook – пример распределенной базы данных в Web, использующей онтологии.
Данные The World FactBook формируются Central Intelligence Agency US для правительства США на основании различных источников и баз данных. При интеграции баз данных используются онтологии.
В The World FactBook представлена географическая, демографическая, историческая и экономическая информация о странах мира.
The World FactBook представлена по адресу: https://www.cia.gov/library/publications/the-world-factbook/index.html

Слайд 11Кафедра математики, логики и ИС, РГГУ 2008
Проект Semantic Web
Владимир Федорович

Хорошевский сделал подробный доклад на эту тему.
Особо в этой теме следует обратить внимание на стандарты языков представления онтологий:
OWL Lite; OWL DL; OWL Full;
языка запросов SPARQL и языка правил SWRL.

Слайд 12Кафедра математики, логики и ИС, РГГУ 2008
Системы, поддерживаемые DARPA
Многие системы,

работающие с онтологиями (включая перечисленные ранее), поддерживаются DARPA и созданы благодаря финансированию в больших размерах.
Некоторые системы частично открывают и переводят на коммерческую основу, например Cyc.
Особое внимание уделяется обеспечению взаимодействия систем в Интернет и стандартам межмашинного взаимодействия (KIF, OWL).

Слайд 13Кафедра математики, логики и ИС, РГГУ 2008
Инструменты для работы с

онтологиями: Protégé и Chimaera

Protégé первоначально разрабатывалась в КSL Стэнфордского университета, как программное инструментальное средство для формирования словарей в области медицины. Оно оказалось полезным для применений и в других областях.
Protégé 2000 разработана для работы в Web – браузерах. В настоящее время она читает и формирует OWL-файлы. На конференции в Будапеште (июль 2007г.) определены проблемы и некоторые направления развития Protégé (http://protege.stanford.edu/conference/2007/schedule.html).
Система Chimaera (также разработка подразделения КSL Стэнфордского университета ) предназначена для программной поддержки процесса объединения больших онтологий.


Слайд 14Кафедра математики, логики и ИС, РГГУ 2008
Другие примеры разработок онтологий
Онтологии

верхнего уровня: DOLCE, BFO, WordNet, SUMO.
http://en.wikipedia.org/wiki/Upper_ontology_(computer_science)
Специализированные онтологии. Примеры:
http://protegewiki.stanford.edu/index.php/Protege_Ontology_Library
Онтологии в корпоративных системах.




Слайд 15Кафедра математики, логики и ИС, РГГУ 2008
Онтологии в корпоративных системах
В

больших корпоративных системах онтологии используются в трех целях:
для унификации ведущихся в корпорации документов и сбора на их основе данных для ввода в базу данных корпорации;
для представления и организации метаинформации в системах типа «хранилища данных» с целью использования ее при формировании запросов для экономического анализа данных работы корпорации;
для ведения, поиска и организации нормативно-справочной информации.
В некоторых больших российских корпорациях, например, «Интегра», «Татнефть», «Норникель», «Сибур», ТНК-ВР, также уже созданы и используются онтологии для нормативно-справочной информации (фирма проектировщик: НЦИТ ИНТЕРТЕХ, система ONTOLOGIC).

Онтологии в СУБД: Oracle® Database Semantic Technologies Developer's Guide
http://download-uk.oracle.com/docs/cd/B28359_01/appdev.111/b28397/toc.htm

Слайд 16Кафедра математики, логики и ИС, РГГУ 2008
Причины медленного внедрения проектов,

использующих онтологии:

Сложность и техничность языков представления онтологий.
Массового использования онтологий нет, так как пользователи не видят непосредственного эффекта от их использования (в отличие от использования, например, HTML и XML).


Слайд 17Кафедра математики, логики и ИС, РГГУ 2008
Проблемы формирования и использования

библиотек онтологий:

Так как онтология есть фиксация в формальном виде договоренностей группы специалистов в определенной области о системе используемых ими понятий, их свойствах и аксиомах, то каждая система онтологий имеет смысл только для группы людей, принимающих эти договоренности (социальный характер онтологий).
Так как науки и представления в областях знаний меняются, то в компьютерных системах онтологий требуются средства поддержки целостности и версионности онтологий при изменениях и постепенном накоплении онтологий.
Так как в онтологиях фиксируются договоренности специалистов, представлять онтологии должны специалисты в предметных областях. Поэтому язык представления онтологий должен быть удобен для этих специалистов. Заметим, что в каждой области знания при формировании понятий этой области формируются специализированные языки для работа с этими понятиями. Поэтому язык представления онтологий должен быть открытым для пользователей. При этом внутреннее представление онтологий должно быть стандартизованным для компьютерного использования и межмашинного обмена.


Слайд 18Кафедра математики, логики и ИС, РГГУ 2008
Проблемы реализации
Большие онтологии и

большие библиотеки онтологий.
Формирование сложных систем онтологий требует соответствующих средств опробования и отладки онтологий.
Для сложных онтологий полностью отделить непроцедурные и процедурные знания не удается (эффективность использования онтологий, прагматика).
Поддержка модульности построения онтологий и использования библиотек онтологий. Контекстность онтологий (взаимная противоречивость различных онтологий). Целевое создание и многоцелевое, многоразовое использование.
Проблема интеграции онтологий, представленных на разных языках в разных логиках и моделях.


Слайд 19Кафедра математики, логики и ИС, РГГУ 2008
Предлагаемые направления для преодоления

трудностей внедрения онтологий:

Использование Web 2.0-технологии для создания социальных сетей и сред в Web, наполняемых самими пользователями (пример – Wikipedia), но для онтологий.
Открытый язык представления онтологий для пользователя и стандартный для внутреннего представления.
Предоставление пользователям Web удобных средств модульного (с использованием чужих модулей) формирования внутреннего (семантического) представления данных своих страниц и языка запросов к странице.
Алгебраический подход к моделированию онтологий, как средство для интеграции разнородных онтологий.


Слайд 20Кафедра математики, логики и ИС, РГГУ 2008
Новая функциональность (Web-сервис) на

страницах Web и онтологии

Поддержка новой функциональности: построение ответов на вопросы к тексту страницы, требует представления семантики текста с использованием онтологий и фиксации языка вопросов для данного класса страниц.
Эта же функциональность требует разработки удобных сред, в которых пользователи могли бы создавать такие страницы и разрабатывать формальные языки запросов к ним.


Слайд 21Кафедра математики, логики и ИС, РГГУ 2008
Semantic Wiki
Это новое направление,

которое вобрало в себя идеи Semantic Web, но дополнило идеями Wiki: http://en.wikipedia.org/wiki/Semantic_wiki
Wikipedia – достижение современности. Достоинства технологий Wikipedia для создания и использования библиотек онтологий: социальность и шаблонность.
Семантическая разметка страниц и язык запросов в Wiki:
http://semantic-mediawiki.org/wiki/Semantic_MediaWiki
Запросы на естественном языке: http://trueknowledge.com

Слайд 22Кафедра математики, логики и ИС, РГГУ 2008
Гипотетический пример использования онтологий

в Wiki

Создание семантически размеченной страницы-шаблона «Person».
Создание дополненной страницы-шаблона правители России.
Создание дополненной страницы «Правитель из династии Романовых».
Создание страницы «Родственные отношения» на основе онтологии «Реrsons», с шаблонами и формулами запросов: «брат», «сестра», «дядя»…
Создание страницы «Престолонаследник».
Создание страницы «Династия Романовых», часть которой заполняется ответом на запрос. Язык запросов этой страницы.


Слайд 23Кафедра математики, логики и ИС, РГГУ 2008
Выводы
Онтосистемы и онтопроекты создаются

и развиваются уже более 10 лет. Успех и значимость этого направления очевидны.
Однако, темп внедрения онтотехнологий все еще невелик. Пока практические успехи получены при финансовой поддержке государственных органов, либо внутри больших корпораций.
Для широкого внедрения онтотехнологий предлагается строить онтосистемы с использованием следующих трех принципов.



Слайд 24Кафедра математики, логики и ИС, РГГУ 2008
Три принципа построения новых

баз онтологий

Онтологии строятся в стиле Wikipedia с поддержкой модульности, коллективной работы, версий и системы согласований;
В системе поддерживается среда открытого языка работы с онтологиями, который формируется самими пользователями, по мере пополнения базы онтологий.
Вместе с текстом страницы и онтологии в системе формируется внутреннее представление онтологии, которое используется при семантическом анализе выражений языка, при формировании ответов на запросы к онтологии и ее отладке, при межмашинном обмене онтологиями в некотором стандарте и при использовании онтологий в приложениях.


Слайд 25Кафедра МЛиИС РГГУ 2007
Цели нового проекта
Разработать среду в Интернет, в которой

произвольные пользователи могут коллективно наполнять систему своими онтологиями и формировать свои языки для представления онтологий и работы с ними.
Эта система должна использовать опыт систем: Wikipedia, Ontolingua, Mathematica (по разным качествам).
Разработка открытого проекта:
http://ezop-project.wiki.sourceforge.net/

Слайд 2608/07/2018
Кафедра математики, логики и интеллектуальных систем ИЛ РГГУ
Особенности системы
Интеграция свойств систем-аналогов

в одной системе.
Разработка системы на основе технологии Web 2.0
Основное отличие разрабатываемой системы от систем подобного рода, например системы Ontolingua (см. www.ksl.stanford.edu), состоит в возможности подстройки языка системы к языку представляемой области знаний по мере пополнения библиотеки онтологий онтологиями и языковыми шаблонами этой области знаний.
Грамматические правила вводятся в онтологиях, хранятся отдельно от универсальной программы грамматического анализа. Язык контекстен (видимость правил зависит от текущей, загруженной онтологии). Семантические ограничения правил грамматики проверяются по внутреннему представлению текущей онтологии.

Слайд 27Кафедра МЛиИС РГГУ 2007
Онтологии
Онтологии представляют собой спецификации на формальном языке, в

которых фиксируются договоренности группы специалистов о том, что как называется в их области и каким свойствам удовлетворяет.
На логическом уровне каждой онтологии соответствует некоторая теория (сигнатура+аксиомы), а иногда и некоторая фиксированная модель (множества+операции). Вопросы к онтологии интерпретируются как запросы к соответствующей ей теории (модели).
Онтологии строятся по модульному принципу: при определении новой онтологии могут использоваться уже ранее построенные онтологии.
Онтологии должны быть удобны для понимания специалистами и интерпретироваться системами при использовании.

Слайд 28Кафедра математики, логики и ИС, РГГУ 2008
Структура системы

Сервер
Базы онтологий
(понятий)
База

данных
«Пользователи,
сеансы»

Клиентская часть
ЭЗОП

Клиентская часть
ЭЗОП

Клиентская часть
ЭЗОП

Удаленные пользователи


Слайд 29Кафедра математики, логики и ИС, РГГУ 2008
Функции проектируемой системы при

работе с библиотекой онтологий

Регистрация пользователей и их прав доступа.
Поддержка процессов многопользовательского ведения, поиска и просмотра баз онтологий, самих онтологий и их версий. Возможность удаления неиспользуемых версий онтологий.
Поддержка процессов формирования, ведения, поиска и просмотра словарей языков системы.
Загрузка онтологий в качестве текущих для пользователя, к которым пользователь может обращаться с вопросами. Текущая онтология определяет свой язык вопросов. Система представляет полную контекстную информацию о языке, доступном из текущего понятия.
Эти пункты являются стандартными для Web 2.0 технологий и могут быть разработаны ее инструментами (например, Drupal или Wiki)
Работа пользователя с текущей онтологией.


Слайд 30Кафедра математики, логики и ИС, РГГУ 2008
Функции системы при работе

с текущей онтологией

Просмотр текста текущей онтологии, ее среды, текстов онтологий, используемых в текущей онтологии.
Система представляет полную контекстную информацию о языке, доступном из текущего понятия, и поддерживает процесс формирования пользователем вопросов к текущему понятию.
Синтаксический анализ текста вопроса на основании грамматики и семантики, связанной с текущим понятием. Диагностика ошибок. Формирование и представление ответа на вопрос на основе внутреннего представления семантики текста онтологии, написанном на формальном открытом языке представления онтологий.
Формирование новых онтологий в среде любой онтологии и редактирование старых с поддержкой версий онтологий. Онтология-среда определяет язык среды, на котором формируется новая онтология и видимость онтологий-модулей, которые могут использоваться при построении новой онтологии. Система обеспечивает загрузку копий онтологий-модулей в текущую онтологию при обращении к ним средствами языка.
Проверка корректности текста новой или отредактированной онтологии. Диагностика ошибок. Формирование внутреннего представления семантики онтологии. Локальное изменение словаря и грамматики системы по ее тексту.
Сохранение новой онтологии (с новым именем) или новой версии текущей онтологии в базе онтологий с внесением соответствующих изменений в словари системы.


Слайд 3108/07/2018
Кафедра математики, логики и интеллектуальных систем ИЛ РГГУ
База онтологий
Система предназначена

для работы со специализированными базами (библиотеками) онтологий .
База онтологий - это организованная совокупность онтологий предметной области.
Каждая онтология имеет наименование, текст онтологии, внутреннее представление. Кроме того, в онтологии могут быть введены шаблоны языка, с помощью которых пользователь может работать с онтологиями, и правила переписывания, по которым система может обрабатывать элементы онтологии при вычислениях.
Онтологии связываются в базе онтологий отношением использования одной онтологии в другой и его частными случаями: отношения общее-частное между онтологиями; онтология, разработанная в среде другой онтологии.
В системе должна поддерживаться режимы коллективной разработки отологии и многоверсионности

Слайд 32Кафедра математики, логики и ИС, РГГУ 2008
Структура базы онтологий
База онтологий
(имя)
Онтология_1
...
Онтология_N
Фрагменты

задач

Схемы вопросов

Отношение
использования

Словарь шаблонов

Шаблон 1




Шаблон_К

Введен в онтологии

Разделы, папки

Хранится в папке

Папка - подпапка


Слайд 33Кафедра математики, логики и ИС, РГГУ 2008
Структура онтологии


Слайд 34Кафедра МЛиИС РГГУ 2007
Состояние разработки
Разработана (дипломная работа А. Зайцевой) экспериментальная версия

сервера онтологий в технологии Web 2.0 с использованием средств: Apache+MySQL+Drupal.
Разработано (дипломная работа А. Кальченко) Web-приложение для работы с текущими онтологиями.
Разработаны ядро языка системы и примеры онтологий, демонстрирующие возможности системы: модульность представления знаний, проверка синтаксической и семантической корректности текстов онтологий, вычисление в онтологиях и настройка языка для конкретных приложений.


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика