Санкт-Петербургский Государственный Университет презентация

Содержание

Цели проекта Легко расширяемый каркас Поддержка разных языков Интеграция с Knowledge.Net

Слайд 1ИЗВЛЕЧЕНИЕ ЗНАНИЙ ИЗ ТЕКСТОВОЙ ИНФОРМАЦИИ С ПОМОЩЬЮ ШАБЛОНОВ. KNOWLEDGE PROSPECTOR.NET
Участники

проекта (Knowledge.Net) Новиков Антон Владимирович Сигалин Максим Владимирович Смоляков Алексей Леонидович
Черепанов Дмитрий Геннадьевич

Санкт-Петербургский Государственный Университет

Докладчик Смоляков Алексей Леонидович

Научный руководитель Сафонов Владимир Олегович, проф., д.т.н.


Слайд 2Цели проекта
Легко расширяемый каркас
Поддержка разных языков
Интеграция с Knowledge.Net


Слайд 3Алгоритм работы
Получение документов и первичный анализ текста
Морфологический анализ текстовых блоков
Семантический анализ

наборов сущностей с применением шаблонов
Анализ построенного графа
Сохранение результата


Слайд 4Получение документов и первичный анализ текста
Получение документов от “поставщиков”
Разбиение документа на

статьи (текст, список, таблица и т.д.)
Разбиение текста на блоки





Текстовый формат – это
очень гибкий путь для
описания различных
типов информации…

1) Один
2) Два
3) Три

Страна. Столица.
Англия. Лондон.
Украина. Киев.






Слайд 5Морфологический анализ текста
Определение языка
Определение морфологической формы слов
Создание сущностей
Слово(«Знания»)
«Знания» текущая м. ф.:
существительное

среднего рода,
множественное число, вн. падеж

«Знание» основная м. ф.:
существительное среднего рода,
единственное число, им. падеж

Русский

English


MRD

XML






Сущность Класс(«Знание»)


Слайд 6Морфологический анализ > Типы сущностей > “Простые” сущности
Сущность "разделитель" (separator). Например «.,;:!?()[]{}…»
Сущность

"неизвестная" (unknown).
Сущность "меняющаяся" (changeable). Например «17-го АВГУСТА»
Сущность "связь" (relationship). Например «Земля МЕНЬШЕ Солнца»

Слайд 7Морфологический анализ > Типы сущностей > “Настоящие” сущности
Сущность "класс" (class). Например «знание».
Сущность "свойство"

(property). Например «полезное».
Сущность "тип данных" (datatype).
Дата и время (datetime)
Целое число (Integer)

Слайд 8Семантический анализ > Цели
Создание отношений между сущностями
Создание новых сущностей
Добавление настоящих сущностей

в граф

Свойство(«удобный»)

Класс(«дом»)

Класс(«строение»)

Свойство(«кирпичный»)

Подкласс

Свойство-Класс

Свойство-Класс


Слайд 9Семантический анализ > Типы отношений
Отношение между свойством и классом
Отношение “подкласс”
Отношение “подсвойство”
Отношение “эквивалентность”
Отношение

между двумя классами
Отношение “условное правило”

Слайд 10Семантический анализ > Описание шаблона
Приоритет
Паттерн
Обработчики

Name=“PropertyRelationship" Arguments="0, 1" />




Слайд 11Семантический анализ > Описание паттернов
Логические операнды: «&»(и), «|»(или), «^»(не).
Встречаемость: не указано, «+»,

«*», «?»
#E.P, #E.C, #E.S, #E.U, #E.Int, #E.DateTime
#M.Noun, #M.Adjective, #M.Verb, …
#W.Month, #W.Number, … - держатель слов
#H.Class, …- держатель клауз

[#E.P #M.Adjective]+ [#E.C #M.Noun]


Слайд 12Семантический анализ > Описание паттернов > Держатель слов

Index="1" />


Держатель Клауз





...


Слайд 13Семантический анализ > Обработчики
Заменить (replace)
Создать сущность время
Создать отношение «свойство-класс»
Создать отношение «подкласс»
Создать отношение

«подсвойство»
Создать отношение «условное правило»
Создать отношение «класс-класс»

Слайд 14Семантический анализ > Создание отношений
Класс(«полезное»)
Класс(«знание»)
+

1" />

=

Свойство(«полезное»)

Класс(«знание»)

Отношение «свойство-класс»


Слайд 15Семантический анализ > Создание новых сущностей
Число(«17»)
Класс(«ноябрь»)
+

From="0" Count="4" >



=

Время (17.11.2006)

Число(«2006»)

Класс(«год»)


Слайд 16Анализ построенного графа
Удаление избыточных отношений типа подкласс.
Удаление избыточных отношений между свойствами

и классами.

Класс(«автобус»)

Класс(«транспорт»)

Свойство(«быстрое»)

Подкласс

Свойство-Класс

Класс(«средство передвижения»)

Подкласс

Подкласс

Свойство-Класс


Слайд 17Сохранение результата
Сохранение знаний в формат Knowledge.Net
Сохранение в формат OWL
Сохранение и извлечение

знаний из бинарного файла


Слайд 18Текущее состояние проекта
Разработан работающий прототип
Созданы тестовые шаблоны для анализа сущностей
Подключен «Mrd»

словарь русского и английского языка



Слайд 19Планы
Поддержка создания «составных» сущностей (состоящих из нескольких слов: «творение рук человека»)
Расширение

функциональности (добавление новых сущностей, отношений, шаблонов, обработчиков, …)
Программа генерации шаблонов
Разработка наглядных примеров


Слайд 20?

Контактная информация:
smlkvalex@mail.ru
http://www.knowledge-net.ru
http://polyhimnie.math.spbu.ru


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика