Схема работы поисковой системы презентация

Содержание

О модуле «Поисковые системы»

Слайд 1Схема работы поисковой системы

1 занятие блока «Поисковые системы»


Слайд 2О модуле
«Поисковые системы»



Слайд 3Программа модуля
Схема поисковой системы
Лингвистика
Ранжирование
Спам и антиспам
Фильтры поисковых систем
Консультация + разбор экзамена


Слайд 4Основные термины и понятия



Слайд 5Поисковая система – это
система для поиска информации, отвечающей потребности пользователя (!),


осуществляющего поиск в ограниченном объеме неструктурированных данных (коллекции документов)

Слайд 6Поисковая система – это


Слайд 7Поисковая система – это


Слайд 8Поисковая система – это


Слайд 9Поисковая система – это


Слайд 10Схема работы (алгоритм) ПС


Слайд 11Схема работы (алгоритм) ПС


Слайд 12Схема работы (алгоритм) ПС


Слайд 13Схема работы (алгоритм) ПС


Слайд 14адаптация под смену алгоритмов
исследования в области поисковой оптимизации
внутренний поиск на сайте
разработка

рекомендательных систем
Data Mining
ответы на вопросы заказчика/фильтрация идей (а давайте сделаем еще один сайт и займем выдачу!)





Зачем мне это знать?


Слайд 15Внутренний поиск по сайту



Зачем мне это знать?
Интересные ссылки:
http://ekaterinburg.hh.ru/article/1175 - HH учит

пользователей языку поисковых запросов
http://ya-recruiter.blogspot.ru/2013/06/blog-post_16.html - рекрутер «прокачивается» в информационном поиске

Слайд 16Data mining - совокупность методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных

и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.






Зачем мне это знать?

Интересные ссылки:
https://ru.wikipedia.org/wiki/Data_mining - определение
https://yandex.ru/support/search/query-language/qlanguage.xml - язык поисковых запросов Яндекса


Слайд 17Найти все поддомены сайта – “site:”
Найти все страницы раздела сайта –

“url:”
Найти все страницы, измененные за последнее время – “date:”
Найти файлы для скачивания – “mime:”







Зачем мне это знать?

Интересные ссылки:
https://ru.wikipedia.org/wiki/Data_mining - определение
https://yandex.ru/support/search/query-language/search-operators.xml - документные операторы Яндекса


Слайд 18

Для SEO-шника:
“mime:pdf + yandex-team.ru”







Зачем мне это знать?
Интересные ссылки:
https://ru.wikipedia.org/wiki/Data_mining - определение
https://yandex.ru/support/search/query-language/search-operators.xml

- документные операторы Яндекса

Слайд 19Зарождение поисковых систем
Первые поисковые системы были каталогами сайтов с рубрикаторами
Полезные ссылки:
http://yaca.yandex.ru/

- Каталог Яндекса
http://www.rukv.ru/ - исследование "количество сайтов рунета"

Слайд 20Булев поиск
Умеет
находить документы по поисковым запросам с простыми логическими операторами:
И

(AND)
ИЛИ (OR)
НЕ (NOT)

Не умеет
ранжировать документы по степени релевантности
учитывать словоформы, синонимы
учитывать местоположение слова в документе
учитывать неполные вхождения (2 из 3 слов запроса)
и т.д.

Полезные ссылки:
https://ru.wikipedia.org/wiki/%D0%91%D1%83%D0%BB%D0%B5%D0%B2%D0%B0_%D0%B0%D0%BB%D0%B3%D0%B5%D0%B1%D1%80%D0%B0 – Булева алгебра
https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%B5%D0%B1%D1%80%D0%B0_%D0%BB%D0%BE%D0%B3%D0%B8%D0%BA%D0%B8 – алгебра логики


Слайд 21Булев поиск


Слайд 22Булев поиск


Слайд 23Булев поиск
запрос: «apple OR iwatch»


Слайд 24Булев поиск
запрос: «apple AND iwatch»


Слайд 25Булев поиск
запрос: «alberto OR (NOT cavalli)»
запрос: «apple AND (NOT watch)»


Слайд 26Индекс
индекс – это  структура данных, используемая поисковыми системами для компактного хранения

копий документов коллекции и осуществления поиска по ним 

Виды индекса:

Прямой/Инвертированный
Некоординатный/Координатный

Полезные ссылки:
https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D1%8B%D0%B9_%D0%B8%D0%BD%D0%B4%D0%B5%D0%BA%D1%81 – поисковый индекс


Слайд 27Прямой индекс - это
- таблица, в которой для каждого документа представлен

список слов, в него входящих 

Слайд 28Инвертированный индекс - это
таблица, в которой каждому слову из словаря сопоставлен

список документов, его содержащих 

Слайд 29Координатный индекс - это
индекс, учитывающий координату слова в документе (словопозицию)


Слайд 30Современный поиск



Слайд 31 Современные ПС
Яндекс, Google, Mail….
Поиск по новостям
Поиск по картинкам, видео, аудио
YouTube
Поиск

по блогам, форумам, отзывам
Специализированные поисковые системы
Поиск в Excel
Поиск по базам данных
Локальный поиск от Яндекс и Google

Слайд 32 Ранжированный поиск
- поиск, который, помимо нахождения документов, отвечающих информационной потребности

пользователя, осуществляет сортировку (ранжирование) документов по степени их релевантности (соответствия) этой потребности.

Слайд 33 Неточный поиск, кворум
Неточный поиск – поиск по документам, не содержащим

все слова запроса.

Кворум — необходимая доля суммарного веса слов из поискового запроса, которая должна присутствовать в тексте документа и/или текстах входящих на него ссылок для попадания в результаты поиска.

Слайд 34Схема работы поисковой системы



Слайд 35Работа поисковой системы


Слайд 36Работа поисковой системы


Слайд 37Работа поисковой системы


Слайд 38Обработка запроса
геозависимость запроса


Слайд 39Обработка запроса
геозависимость запроса
тип запроса


Слайд 40Обработка запроса
геозависимость запроса
тип запроса
многозначность


Слайд 41Обработка запроса
геозависимость запроса
тип запроса
многозначность
колдунщики


Слайд 42Обработка запроса
геозависимость запроса
тип запроса
многозначность
колдунщики
машинное обучение


Слайд 43Обработка запроса
геозависимость запроса
тип запроса
многозначность
колдунщики
машинное обучение
опечаточник


Слайд 44Обработка запроса
геозависимость запроса
тип запроса
многозначность
колдунщики
машинное обучение
опечаточник
синонимы и аббревиатуры


Слайд 45Работа поисковой системы


Слайд 46Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)


Слайд 47Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама


Слайд 48Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)


Слайд 49Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)
Объектный ответ


Слайд 50Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)
Объектный ответ
Колдунщики


Слайд 51Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)
Объектный ответ
Колдунщики
Новости


Слайд 52Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)
Объектный ответ
Колдунщики
Новости
Сниппеты


Слайд 53Матрица результатов поиска
Яндекс.Маркет (другие сервисы Яндекса)
Контекстная реклама
Яндекс.Карты (Яндекс.Справочник)
Объектный ответ
Колдунщики
Новости
Сниппеты
Диалоговые

подсказки

Слайд 54Для какого типа запроса подходит матрица?
Варианты матриц


Слайд 55Для какого типа запроса подходит матрица?
Варианты матриц


Слайд 56Для какого типа запроса подходит матрица?
Варианты матриц


Слайд 57Работа поисковой системы


Слайд 58Работа поисковой системы


Слайд 59Работа поисковой системы


Слайд 60Работа поисковой системы


Слайд 61Работа поисковой системы


Слайд 62Работа поисковой системы


Слайд 63Работа поисковой системы


Слайд 64Работа поисковой системы


Слайд 65Работа поисковой системы


Слайд 66Поисковый алгоритм
Поисковый индекс


Слайд 67Поисковый алгоритм
Поисковый индекс
Тематика сайта


Слайд 68Поисковый алгоритм
Поисковый индекс
Тематика сайта
Регион сайта


Слайд 69Поисковый алгоритм
Поисковый индекс
Тематика сайта
Регион сайта
Тип сайта


Слайд 70Поисковый алгоритм
Поисковый индекс
Тематика сайта
Регион сайта
Тип сайта
Фильтры и санкции


Слайд 71Поисковый алгоритм
Поисковый индекс
Тематика сайта
Регион сайта
Тип сайта
Фильтры и санкции
Асессорская оценка
Поведение пользователя

на выдаче

Слайд 72Поисковый алгоритм
Поисковый индекс
Тематика сайта
Регион сайта
Тип сайта
Фильтры и санкции
Асессорская оценка
Поведение пользователя

на выдаче
Требования к скорости и качеству
ступенчатое включение алгоритмов (1000 отбирается)
распределение нагрузки
кэш поиска

Слайд 73Домашнее задание
Найти интересные поисковые системы, протестировать на разных типах запросов, выбрать

и описать примеры:
системы с Булевым поиском
системы с более сложным поиском (синонимы, тематические кластеры и пр.) + найти тип запросов, которые она все же не умеет обрабатывать
системы, которую вы нашли полезной и планируете использовать на практике (и почему?)

Представьте, что в Интернете есть сайты, посвященные только одной теме – товарам/услугам, представленным на вашем сайте. На основании базовых схем поисковых систем (см. примеры) нарисуйте схему поисковой системы, которая бы идеально подходила для поиска информации об этих товарах/услугах. В ходе работы вам необходимо ответить на вопросы:
какие типы запросов ваша поисковая система должна отрабатывать?
какую информацию она для этого должна индексировать?
на какие зоны поисковая система должна разделить документы вашего сайта и сайтов-конкурентов?
какие модули из базовой схемы поисковой системы вы не взяли и почему?
какие новые модули вы добавили в свою поисковую систему, которых не было в базовой схеме и почему?

Книгу «Введение в информационный поиск», прочита ть главу №1 «Булев поиск», поделиться впечатлениями.

Слайд 74Схема работы (алгоритм) ПС


Слайд 75Сервисы для составления схем
https://www.draw.io (тип Flowcharts)
https://www.gliffy.com/ (тип Блоксхема)
https://docs.google.com (Вставка -> Рисунок)
MS

Word (Вставка -> Фигуры)


Слайд 76Правила составления схем
Блоки одного типа оформляются одинаково
Используются только однонаправленные стрелки (от

отдающего информацию блока к принимающему ее)
Детализация частей схемы должна быть одинаковой
Схема выкладывается в формате JPG, PNG



Слайд 77Как составлять схему
Читаем:
https://yandex.ru/company/technologies/searchindex/


Слайд 78Как составлять схему
Отражаем на схеме:


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика