Слайд 1
По представленной презентации составить список незнакомых и непонятных слов.
Слайд 2Что такое Яндекс, Апорт, Рамблер, Гугл, Яхо?
Слайд 3
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в
Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Слайд 4Виды поисковых систем
условно
По способу поиска делятся на две группы:
– поисковые каталоги (или
просто каталоги);
– поисковые машины (или указатели).
- указание адреса страницы (нужно точно знать адрес документа)
Слайд 5Поисковые каталоги
В поисковых каталогах систематизируется информация о документах, хранящаяся в World
Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например, финансы и экономика, государство и право, наука и образование, компьютеры, политика и т.д. Каждое имя в этом списке является внутренней гиперссылкой поискового каталога. Щелчок мыши по гиперссылке вызывает на экран список заголовков следующего подраздела и т.д. Очевидно, такая система подобна дереву иерархии. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые web-документы.
Слайд 6Поисковая машина
Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска
информации. Обычно является частью поисковой системы.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота базы, учёт морфологии языка.
В поисковых машинах специальные программы, называемые поисковыми роботами, сканируют весь Интернет, интересуются абсолютно всеми встречающимися им ссылками, классифицируют их и добавляют в специальную базу данных. Когда мы хотим что-нибудь найти, поисковые машины выдают результат как раз из этой огромной базы данных. Поиск в этом случае осуществляется по ключевым словам, которые мы вводим и которые программа находит в тексте веб-страниц, разбросанных по Интернету.
Рамблер сортирует их по количеству обращений за сегодняшний день (то есть те сайты, к которым сегодня чаще всего обращались посетители Рамблера, располагаются вверху списка).
Яндекс располагает сайты в списке, исходя из так называемого индекса цитирования, то есть в зависимости от количества ссылок на этот сайт с других сайтов. Имеется в виду, что, если кто-то уже решил, что данный сайт содержит что-то полезное, и дал на него ссылку, значит, информация действительно достойна внимания. Чем больше таких ссылок с других сайтов, тем выше индекс цитирования, а следовательно, и рейтинг сайта в базе Яндекса.
Слайд 7Классификация по области поиска
Локальные
Предназначены для поиска информации по какой-либо части всемирной
сети, например по одному или нескольким сайтам, либо по локальной сети.
Глобальные
Предназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем GoogleПредназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем Google,Yahoo и т. д.
Поисковые машины осуществляют поиск информации различного типа, например текстов, видео, изображений, географических объектов, персональных данных и др
Слайд 8Функции поисковых машин
Поиск ссылок
На страницы и другие документы сайтов
2. Автоматически
Поисковая машина
ищет ссылки со страниц сайтов.
3. Ручной режим
Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов
4. Индексация документов сайтов
Извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины
5. Поиск по базе данных проиндексированных документов
Может состоять из нескольких этапов
6. Нахождение документов, соответствующих поисковому запросу
7. Ранжирование документов в соответствии с их релевантностью поисковым запросам
8. Кластеризация документов
Одна из задач информационного поиска. Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов.
Слайд 9История
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой
поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» - бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице - с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов. Nigma тоже экспериментировала с визуальной кластеризацией.
Слайд 10Зеркало сайта
Зеркало сайта (mirror) – это копия веб-сайта, которая доступна под
другим доменным именем и физически расположена на другом сервере. Зеркала часто используют для очень загруженных веб-ресурсов, чтобы разделить потоки посетителей. Например какой-нибудь известный веб сайт может иметь зеркала в разных странах мира, чтобы пользователь мог выбрать зеркало, которое максимально положительно отразится на скорости передачи данных.
Основные причины создания зеркал
Защита данных от повреждения. Например при сбое работы жестких дисков
Сохранение копии сайта. Часто когда сайт закрыт или планирует закрыться
Обеспечение доступа к недоступной информации. Например в 2002 году власти Китая приказали заблокировать доступ к Google. Его зеркало elgooG использовалось для обхода блокировки.
Наиболее часто зеркала сайтов используются для предоставления нескольких источников одной и той же информации. Часто большие или популярные файлы располагают на нескольких зеркалах для ускорения скачивания и распределения нагрузки.
Слайд 11Наиболее известные поисковые сайты
Российские поисковые системы и каталоги
• Yandex.ru(яндекс) — крупнейший российский интернет-поисковик;
• Rambler.ru(рамблер) — информац.-поисковая система в России;
• Google.ru(гугл) — поиск-система, расширенный поиск в интернете;
• Mail.ru (мейл) — бесплатная почта, веб-рейтинг, интернет-сервисы;
• ru.Wikipedia.org (википедия.ру) — мировая энциклопедия;
• Nigma.ru(нигма) — мульти-поисковая система МГУ;
• MSN.ru (microsoft МСН) — поисковая система, почта, новости;
• ru.Yahoo.com (яху) — поисков. каталог, почта, интернет-сервисы;
• Aport.ru (апорт) — поисковая система, интернет-каталог России;
• Metabot.ru (метабот) — российская мульти-мета поисковая система;
• LiveInternet.ru (лайф интернет) — рейтинг сайтов, статистика;
• Yellow-Pages.ru (желтые страницы) — телефон. база, адреса фирм;
• NOL9.ru (ноль девять) — информ.-поисковая система, веб-рейтинг;
• Webalta.ru (вебальта) — рейтинг сайтов, беспл. электронная почта;
• Gogo.ru (гоугоу) — от mail.ru, расширенный поиск по интернету;
• Zone.ru (зона ру) — мультипортал, поиск сайтов, новости, сми;
• Filesearch.ru (файлсёрч) — ищет файлы на FTP-серверах;
• Spylog.ru (спайлог) — рейтинг сайтов, сервис интернет статистики;
• Km.ru (портал Кирилл и Мефодий) — энциклопедия, беспл. почта.
Слайд 12
Необычные поисковые системы
Koogle - с его помощью ортодоксальные иудеи могут найти
контент, признанный раввинами удовлетворяющим религиозным требованиям;
Yauba - индийский поиск «для параноиков» - в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера;
TinEye - поисковая система, специализирующаяся на поиске изображений в Интернете;
Генон - поисковая система, собирающая и создающая контент у себя на сайте.
Слайд 13Поисковый запрос
Исходная информация для осуществления поиска с помощью поисковой системы. Формат
поискового запроса зависит как от устройства поисковой системы, так и от типа информации для поиска. Чаще всего поисковый запрос задаётся в виде набора слов или фразы, иногда — используя расширенные возможности языка запросов поисковой системы.
Чтобы получить лучшие результаты поиска, необходимо запомнить несколько простых правил:
Не искать информацию только по одному ключевому слову.
Лучше не вводить ключевые слова с прописной буквы, так как это может привести к тому, что не будут найдены те же слова , написанные со строчной буквы.
Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок.
Современные поисковые системы предоставляют возможность подключения к сформированному запросу семантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встречаются производные от этого слова в различных падежах, временах и пр.
Слайд 14Результат поиска
Результаты запроса в поисковом сервере представляются в виде списка ссылок
с небольшими комментариями. После описания выводится URL найденной страницы, ее размер, дату обновления и язык. Это помогает Вам понять, о чем идет речь. Кроме того, размер страницы и географическое положение сервера, на котором она находятся, помогут сделать предположения о времени ее загрузки. На некоторых серверах (например, на Altavista) рядом со ссылкой имеется кнопка Translate. Это ссылка на один из новых механизмов Altavista - переводчик. Вы можете переводить любые страницы Web на 5 европейских языков.