Документальные базы данных презентация

Содержание

Слайд 1


Документальные
базы данных

Дисциплина: «Базы данных»
Специальность: №08080165
«Прикладная информатика (в экономике)»
Институт

информатики, инноваций и бизнес систем
Кафедра Информационных систем и прикладной информатики
Старший преподаватель Богданова О.Б.

Слайд 2Поскольку информация не всегда представлена в виде
структурированных данных, существует необходимость


организации данных, отличных от фактографических.

Информационные системы, которые хранят документы
разных форматов носят название документальных
информационных поисковых систем (ДИПС).

Основные понятия


Слайд 3Базы данных документального типа могут быть организованы:

с хранением исходного документа (полнотекстовые);
(библиографические,

реферативные)‏
без хранения документов (БД-указатели).

Основные понятия


Слайд 4Информационный поиск в таких системах представляет
собой поиск документов, содержащих ответ

на заданный
пользователем запрос. или информации из документов

Информационный запрос пользователя представляет
собой частное значение информации, потребовавшейся в определенный момент времени и выраженный на
естественном языке.

Основные понятия


Слайд 5Пертинентность – соответствие смыслового содержания
документа информационной потребности пользователя.
Релевантность – соответствие

содержания документа
информационному запросу.

Основные понятия












Слайд 6Формальное представление информационного
содержания запроса — поисковое предписание (ПП)‏
Основные понятия
Формальное представление

основного информационного
содержания документа — поисковый образ
документа (ПОД)‏

Набор правил, определяющий степень смысловой

близости ПОД и ПП — критерий смыслового

соответствия


Слайд 7





Запрос
Поисковый образ
Поисковое предписание
=
Критерий смыслового соответствия
Нет
Да
Сообщение
Автоматизация процесса


Слайд 8








Запрос
Подсистема ввода и регистрации
Подсистема обработки
Подсистема поиска
Словарь
Индекс
КСС

Подсистема хранения
База данных
Поисковое предписание
Поисковый образ
Функциональная структура
Поисковый

образ

Слайд 9Функциональная структура
Подсистема хранения никогда не хранит простую
совокупность фактов, распределенную по

каталогам, так как
это может вызвать проблемы поиска информации и
неэффективное использование дискового пространства.

Эта подсистема всегда применяет средства сжатия и
представляет собой совокупность СУБД,
средств архивации и т.д.


Слайд 10Функциональная структура
Подсистема обработки создает для каждого документа его
поисковый образ, который

сохраняется с индексе.


Логически индекс представляет собой таблицу, где строки
соответствуют документам, а столбцы информационным
признакам.

Слайд 11Функциональная структура
Подсистема поиска предназначена для отыскания в индексе
поискового образа документа, удовлетворяющего

поисковому
предписанию с точки зрения критерия смыслового
соответствия.


Идентификаторы найденных релевантных документов с
выхода подсистемы поиска передаются на вход
подсистемы хранения, которая обеспечивает выдачу самих
документов пользователю.


Слайд 12Информационно-поисковые языки


Слайд 13Информационно-поисковые языки
Информационно-поисковым языком называется
специализированный язык, предназначенный для описания
смыслового содержания

поступивших в систему сообщений с
целью обеспечения возможности их последовательного поиска.

Два основных типа:
Классификационные языки;
Дескрипторные языки
с граматикой и без граматики
с контролируемой и свободной лексикой


Слайд 14Обработка входящей текстовой информации
Процесс перевода документа с естественного языка на информационно-поисковый

язык носит название рубрицирования или индексирования.

Автоматическое индексирование
Автоматическое индексирование документов может основываться на про­стых, однословных или многословных составных терминах (фразах). Термины-фразы более осмысленны, обладают большей дискриминирующей мощью.


Слайд 15Обработка входящей текстовой информации
Процесс перевода документа с естественного языка на информационно-поисковый

язык носит название рубрицирования или индексирования.

В рубрицировании документа выделяют 2 основных
подхода:

Рубрицирование, основанное на знаниях;
Рубрицирование, основанное на обучении на примерах.


Слайд 16Обработка входящей текстовой информации
Две основные модели представления знаний:
1. Семантическая сеть (СС)‏
Тезаурус

– иерархическая сеть понятий и отношений между ними.

Выделяют 2 группы:
Статическое рубрицирование
Нейросетевые методы

2. Продукционная модель (ПМ)‏


Слайд 17Обработка входящей текстовой информации
Статистическое рубрицирование — определение степени соответствия терминологического портрета

документа и терминологического портрета рубрики на основе статистических характеристик субъектов сравнения

Нейросетевые методы рубрицирования используют нейронную сеть в качестве обучающего классификатора. Существует подборка текстов, каждый из которых помечен как релевантный или нерелевантный для рубрики.


Слайд 18Поиск текстовой информации
Любая модель поиска информации
характеризуется следующими параметрами:


Представление документов и запросов
Критерий

смыслового соответствия
Методы ранжирования редакторов поиска
Механизм образования связи

Слайд 19Основные модели поиска
Булева модель представляет документы с помощью набора терминов,

присутствующих в индексе, каждый из которых рассматривается как булева переменная

Модель нечетных множеств допускает частичную принадлежность элемента множеству

Пространственно-векторная рассматривает совокупность документов как набор векторов в пространстве, определяемом из n нормализованных векторов терминов

Вероятностная модель определяет вероятность вхожения термина в документ

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика