Лекция 4 “Информационно-поисковые языки, интерфейсы пользователей ИПС” презентация

© ElVisti Лингвистическое обеспечение ИПС Информационно-поисковый язык - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. (Глоссарий.ru)    

Слайд 1© ElVisti
Лекция 4
“Информационно-поисковые
языки, интерфейсы
пользователей ИПС”
Дмитрий Владимирович ЛАНДЭ
МЕЖДУНАРОДНЫЙ СОЛОМОНОВ

УНИВЕРСИТЕТ

Слайд 2© ElVisti

Лингвистическое обеспечение ИПС
Информационно-поисковый язык - формализованный искусственный язык, предназначенный

для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска. (Глоссарий.ru)

    Информационно-поисковые языки (ИПЯ), то есть языки, на которых обращаются пользователи к системе.
Языки представления данных в ИПС.
Естественные языки и языки разметки, на которых представлены документы- первоисточники.


Слайд 3© ElVisti

Возможности ИПЯ:
поиск по словам и словоформам
Все поисковые системы обеспечивают

поиск хотя бы по одному слову.
Некоторые системы рассматривают все слова запроса как правые усечения.
У некоторых такая возможность не реализована, например у Google, Alltheweb. В Рамблер и в Яndex, морфологический инструментарий позволяет искать по всем словоформам исходного терма.


Слайд 4© ElVisti

Возможности ИПЯ:
поиск по словам и словоформам
Поиск по словоформам является

результатом серьезного лингвистического анализа и реализован в русскоязычных системах Апорт, Яndex и Рамблер, а также в укранской системе META.
Большинство современных систем способно реализовывать контекстный поиск заключенной в кавычки фразы (Google, Alltheweb, AltaVista, Lycos и др.). Такая способность - это реализация неявно указанных с помощью кавычек операторов контекстной близости.

Слайд 5© ElVisti

Возможности ИПЯ: операторы
В большинстве современных систем реализованы булевы операторы

AND, OR и NOT, а также работа со скобками.
Можно отметить, что у самой популярной в мире системы Google - самый лаконичный набор логических операторов - "+", OR и "-".



Слайд 6© ElVisti

Возможности ИПЯ: операторы
Большинство поисковых систем обеспечивает выполнение операций контекстной

близости, одна из реализаций которой - поиск выражений в кавычках.
Слова запроса, заключенного в двойные кавычки, ищутся в документах в том порядке и в тех формах, в которых они встретились в запросе.
В свое время функции контекстной близости получили наибольшее развитие в системе Lycos, где были реализованы с помощью четырех операторов: ADJ, NEAR, FAR и BEFORE.
При построении запросов может быть реализована возможность объединения слов в группы, которые будут аргументами некоторого оператора. Такие группы заключаются в скобки. Использование скобок позволяет создавать вложенные запросы, а также изменять приоритеты операторов, принятые по умолчанию.



Слайд 7© ElVisti

Возможности ИПЯ:
поиск по параметрам документов
Возможность поиска по параметрам

документов зачастую позволяет ограничивать диапазон поиска значениями URL, датам, заглавий и т.п. Чаще всего выйти на возможность поиска по параметрам можно из режима расширенного поиска.

Во многих системах обеспечивается поиск по данным в форматах: HTML, PDF, RTF, MsWord.
В Google, например, обеспечивается поиск по сайту ("site:"), определение ссылок на сайт ("admission site:"), поиск по ценам, например "DVD player $250..350", странам, датам, доменам и т.д.


Слайд 8© ElVisti

Адаптивные поисковые механизмы
В последнее время получили распространение адаптивные интерфейсы

уточнения запросов, чаще всего реализуемые путем кластеризации результатов первичного поиска. Появилось такое понятие, как метод "папок поиска" (Custom Search Folders), который представляет собой множество подходов, общее у которых - попытка сгруппировать результаты поиска и представить кластеры в удобном для пользователей виде.

Слайд 9© ElVisti

Адаптивные поисковые механизмы


Слайд 10© ElVisti

Информационный альбом InfoStream – совокупность нескольких показателей
Слова и словосочетания

в информационных портретах, применяемых, например, в системах Галактика Zoom и InfoStream, также позволяют адаптивно уточнять первичные запросы.

В системе InfoStream информационный портрет расширен многочисленными дополнительными парметрами.


Слайд 11© ElVisti

Классификатор-навигатор InfoStream


Слайд 12© ElVisti






Алгоритм построения классификатора-навигатора


Слайд 13© ElVisti

Практические рекомендации по поиску
Начинайте поиск с наиболее

известных и мощных поисковых серверов.

Используйте специализированные видовые, тематические или региональные поисковые серверы, если они Вам известны.

Внимательно прочтите инструкцию (help, FAQ) по выбранной поисковой системе.

Выделяйте ключевые слова для поиска, наиболее точно отражающие интересующую Вас проблематику.

Используйте поиск по параметрам, чаще всего предлагаемый в режимах расширенного поиска - это обеспечит фильтрацию документов по форматам, датам, размерам, странам, языкам и т.д.

Слайд 14© ElVisti

Практические рекомендации по поиску
Начинайте поиск с простых

запросов в режимах простого поиска. По мере получения результатов расширяйте или уточняйте запросы с помощью дополнительных возможностей - используя логические и контекстные операторы, поиск по параметрам, переходя в режим расширенного поиска.

Если Вас интересует достаточно широкий спектр информации, имеющей отношение к первичному запросу (например, при составлении обзора), смело используйте режим "поиск подобных документов".

В случае наличия средств ранжирования выдачи по релевантности обязательно используйте их. Это позволит Вам достаточно быстро оценить результаты поиска в случаях, когда общие объемы выдачи могут превышать все разумные рамки.

Слайд 15© ElVisti
Спасибо за внимание!
Ландэ Д.В
dwl@visti.net
http://poiskbook.kiev.ua


МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ
Киев, Украина


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика