Слайд 1Поиск информации в интернете
Занятие 8. Сложные запросы в ПС Яндекс
Слайд 2Неранжирующее «И»
Оператор неранжирующее «И»
в одном документе &&, с той лишь разницей, что слово, которое находится справа, влияет на возможность документов попасть в результаты поиска, но не влияет на ранжирование.
Слайд 3Неранжирующее «И» (пример)
Например, запрос
Трутнев && биография
найдет документы, где
указанные слова будут расположены в пределах одного документа. При этом одно из первых мест в результатах займет, например, документ, в котором будет словосочетание «биография Трутнева».
Слайд 4Неранжирующее «И» (пример)
А на запрос
Трутнев
документы, где будут присутствовать оба слова, но слово «биография» не будет влиять на ранжирование и первые места в списке результатов поиска займут документы со словом «Трутнев».
Слайд 5Поиск текста в заголовке страниц
Поиск текста в заголовке страниц (title):
$title (запрос)
На
запрос Максвелл << $title (биография) будут найдены документы со словом «биография» в заголовке и словом «Максвелл» в тексте.
Причем слово «Максвелл» будет определяющим.
Слайд 6Поиск текста на сайте
Поиск ограничивается группой страниц, с заданным адресом.
url=«www.url.ru/cat/*»
Пример:
«кот
Бублик» << url=«www.exler.ru*»
Будет найдены все упоминания о коте Бублике на сайте www.exler.ru
Слайд 7Поиск файлов
Позволяет ограничить поиск определенным типом файла: HTML, PDF, DOC, PPT,
XLS, RTF, SWF.
mime=«тип_файла»
На запрос:
(инструкция && микроволновая печь) << (mime=«pdf» | mime=«rtf»)
будет найдены документы PDF и RTF, в теле которых присутствуют слова «инструкция» и «микроволновая печь».
Слайд 8Определение языка текста
Можно отобрать для поиска документы, написанные на определенном языке:
русском
(ru),
украинском (uk),
белорусском (be),
английском (en),
французском (fr),
немецком (de).
lang=«язык»
Пример: DAAD << lang=«de»
Слайд 9Поиск по дате
Поиск производится только по страницам, дата которых удовлетворяет заданному
условию
date=«ГГГГ{*|ММ{*|ДД}}»
Пример: date=«200310*»
По запросу будет производится поиск документов, датированных октябрем 2003 года.
Слайд 10Сложные запросы: выручат скобки
Вы можете строить сколь угодно сложные конструкции, подставляя
в каждом из операторов вместо отдельного слова целые выражения.
Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.
Слайд 11Сложные запросы
Чтобы пореже натыкаться на уменьшение количества результатов, вызванные неверным синтаксисом,
используйте несколько правил:
1. Всегда ставьте перед стоп-словами «+»;
2. Отделяйте операторы поиска в элементах от слов запроса символами «&&»;
3. По возможности, используйте в сложных запросах «/+1» вместо кавычек.
Слайд 13Пример запроса 1
Общий запрос на тему бокса не совсем релевантен:
(бокс|боксер|боксерский)
Очевидно, что
по результатам поиска будет найдено довольно много документов в том числе и не относящихся к спорту.
Улучшим запрос…
Слайд 14Пример запроса 1
Отсечем анекдоты, собак, чехлы для техники, душевые, больничную тему.
Запрос
(бокс|боксер|боксерский) ~~ (анекдот|собака|больничный|медицинский|душевая|чехол)
выдаст более релевантные документы. После нескольких проверок запрос можно улучшить еще.
Слайд 15Пример запроса 2
Например, нужно найти резюме жителей Москвы со знанием французского языка,
имеющих опыт работы с Windows, Linux. При этом уровень знания французского языка имеет первостепенное значение.
Строим запрос — $title(резюме) && +(москва | !495) && +французский && +linux && +windows
Слайд 16Пример запроса 2
$title(резюме) && +(москва | !495) && +французский && +linux
&& +windows
=«В заголовке должно быть слово «резюме», а в пределах одного документа – слова: «москва» (или код города 495), «французский», «linux», «windows» в точной словоформе»
Слайд 17Проблема
ПС так выбирает слова для аннотации результатов поиска, что слово «французский»
попадает в них редко — придется открывать все страницы.
Или слово «французский» играет второстепенное значение, так что смысл документов не соответствует запросу.
Переформулируем…
Слайд 18Пример запроса 2
Можно воспользоваться оператором
!495) && +linux && +windows)
Теперь слово «французский» будет иметь первостепенное значение для ранжирования, но при этом остальные слова тоже играют роль в результатах поиска.
Слайд 19Пример запроса 3
Если вы ищете описание мумие, но не хотите наталкиваться
на прайсы интернет-магазинов, можете задать такой запрос:
мумие << (лечение|лечебный|болезни) ~~ (цена|прайс|рубль|доллар|фирма|магазин)
Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.
Слайд 20Практическое задание
Создайте запрос для поиска резюме жителя Перми, обладающего опытом верстки
и предпечатной подготовки, владеющего программами графического пакета Adobe.
Создайте запрос для поиска вакансии в пермских СМИ, службах PR и рекламных агентствах для работы по гибкому графику.
Слайд 21Пример запроса 4
«Запрос пресс-службы»: у журналистов и работников служб PR существует
необходимость создавать запросы для отслеживания публикаций и документов в интернете, связанных с определенной компанией и ее руководителем.
Очевидно, что в запросе должны присутствовать все варианты названия компании и имя руководителя.
Слайд 22Пример запроса 4
Сформулируем запрос для ПГУ:
(пгу|пермгу|(пермский /+1 (государственный|классический) /+1 университет)) &&
(маланин|(владимир /1 маланин))
Как видно, запрос учитывает четыре варианта названия вуза и два варианта упоминания имени ректора.
Слайд 23Пример запроса 4
Существует один нюанс: в результатах поиска присутствуют документы с
официального сайта университета www.psu.ru
Чтобы отсечь эти документы, добавим в конце запроса
~~ url=«www.psu.ru*»
Слайд 24Практическое задание
Создайте «запрос пресс-службы» для известной Вам компании.
Учитывайте русской и
английское написание названия, аббревиатуры, сокращенное и полное имя руководителя.
Кроме этого, можно ограничить запрос темой документа, упоминанием региона и т.п.
Слайд 25Практическое задание
«Переведи запрос»
Слайд 26«Переведи запрос»
Сначала перед Вами появится запрос, описанный «естественным» языком. Ваша задача
– «перевести» описание на язык запросов.
После этого Вы увидите, наоборот, формализованный запрос. Ваша задача – сделать обратный перевод на «естественный» язык.
Слайд 27Запрос 1
Необходимо найти документы со словами «новый» или «анонсировал», или «представил»,
или «появился» и словами «гаджет» или «устройство», или «девайс», или «аппарат».
Слайд 28Запрос 2
тхэквандо|тэквадно|таэквандо|тхек-вандо
Слайд 29Запрос 3
Необходимо найти документы со словами «биография» или «жизнь» в заголовке,
чтобы в тексте были слова «розинг» или «зворыкин» в точной словоформе; слова «изобретение», «телевидение», «электронно-лучевая трубка» в любой словоформе.
Слайд 30Запрос 4
((фехтование|фехтовальщик|фехто-вать) && сабля) | саблист
Слайд 31Запрос 5
Необходимо найти документы со словами «прежнее» и «название» друг за
другом или «называлась», или «переименовали» и
словами «советский» и «спорт» друг за другом – в одном предложении.
Слайд 32Запрос 6
(спортивная /1 гимнастика | (гимнаст|гимнастка|гимнастика)) && (конь|кольца|брусья|опорный /1 прыжок)
Слайд 33Источники информации
Язык запросов. Как искать? Помощь Яндекса. http://www.yandex.ru/search/?id=481939
© И.М. Печищев