Технологии добывания (сбора) информации презентация

Содержание

Вопросы: Информационный поиск Способы добывания информации из документальных источников Добывание информации из сети Internet

Слайд 1ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В АНАЛИТИЧЕСКОЙ РАЗВЕДКЕ
ТЕМА № 4 ТЕХНОЛОГИИ ДОБЫВАНИЯ (СБОРА) ИНФОРМАЦИИ.


Слайд 2Вопросы:
Информационный поиск
Способы добывания информации из документальных источников
Добывание информации из сети Internet


Слайд 3ИНФОРМАЦИОННЫЙ ПОИСК.
Поиск - процесс, в ходе которого в той или иной

последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.
Основные критериальные характеристиками информационного поиска:
Критерий соответствия - признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

Слайд 4Критерий смыслового соответствия, критерий релевантности (документов, данных) - признак или совокупность признаков,

по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

Слайд 5Критерий формального соответствия - признак или совокупность признаков, по которым определяется

степень формального соответствия между поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

Слайд 6Релевантность - характеристика степени соответствия смыслового содержания документа, найденного в результате

поиска, содержанию информационного запроса.

Пертинентность - характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе.


Слайд 7Точность поиска, коэффициент точности поиска/выдачи - количественная характеристика результатов информационного поиска.

Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных документов на общее число выданных документов (релевантных и не релевантных).
Полнота поиска, коэффициент полноты поиска - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных).

Слайд 8Коэффициент информационного шума, коэффициент шума -количественная характеристика информационного поиска.

Коэффициент потерь - количественная

характеристика результатов информационного поиска.

Оперативность (время) поиска - время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов.


Слайд 9Информационный поиск подразумевает использование определённых стратегий, методов, механизмов и средств.
Стратегия поиска

- общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными решениями - архитектурой БД, методами и средствами поиска в конкретной АИПС.
Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса (ПОЗ), отбора документов (сопоставление поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.

Слайд 10Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса

формирования выдачи документов в ответ на поисковый запрос.
Средства поиска, с одной стороны, - взаимозависимый комплекс информационно-поисковых языков и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов конкретной поисковой системы.


Слайд 11ИПС - представляет систему, предназначенную для поиска и хранения информации; пакет

программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных.


Слайд 122. СПОСОБЫ ДОБЫВАНИЯ ИНФОРМАЦИИ ИЗ ДОКУМЕНТАЛЬНЫХ ИСТОЧНИКОВ.
К основным видам информационного поиска

документов относятся:
Адресный поиск представляет собой процесс поиска данных по формальным признакам, указанным в поисковом запросе.
Семантический поиск представляет собой процесс поиска документов по их содержанию.
Документальный поиск представляет собой процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Слайд 13Фактографический поиск представляет собой процесс поиска фактов (информационных признаков), соответствующих информационному

запросу.
К основным видам электронного поиска относятся:
Полнотекстовый поиск — поиск по всему содержимому документа.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д.
Поиск изображений — поиск по содержанию изображения.


Слайд 14Добывание информации из документальных источников осуществляется при помощи, информационно-поисковых систем, которые

можно разделить на два типа:
фактографические;
документографические системы.


Слайд 153. ДОБЫВАНИЕ ИНФОРМАЦИИ ИЗ СЕТИ INTERNET.
Основные способы использования Интернет-ресурсов для решения

задач аналитической разведки:
Получение новостей по целевой тематике.
Выявление тенденций.
Получение рассылки целевых документов по электронной почте.
Построение сетей информационных связей.
Получение ответов на вопросы.
Фильтрация «мусора».


Слайд 16Основные недостатки сети Интернет при сборе информации:
непропорциональный рост уровня информационного шума;
засилье

паразитной информации;
слабая структурированность и связность информации;
динамичность информации;
отсутствие целостности информации;
многократное дублирование информации;
отсутствие возможности смыслового поиска;
ограниченность доступа к «скрытому» веб.


Слайд 17Средства поиска информации в Интернете:
средства поиска информации на отдельных сайтах;
подборки ссылок;
каталоги;
поисковые

системы;
метапоисковые системы;
системы мониторинга и контент-анализа;
экстракторы объектов, событий и фактов;
системы Knowledge Discovery, Data Mining, Text Mining;
специализированные системы конкурентной разведки;
интегрированные системы.


Слайд 18Скрытое веб-пространство.
полнотекстовые информационные системы типа LexisNexis или Factiva.
пиринговые сети, такие как

BitTorrent, EDonkey, EMule, Gnutella, Kazaa.
системы интерактивного взаимодействия с пользователями - помощи, консультирования, обучения, требующие участия людей для формирования динамических ответов от серверов.
категория так называемых «серых» сайтов, функционирующих на основе динамических систем управления контентом (Dynamic Content Management Systems).


Слайд 19Социальные медиа ресурсы
Выделяют семь разновидностей социальных медиа:
социальные сети;
блоги;
форумы;
сайты

отзывов;
серверы фото - и видеохостинга;
виртуальные службы знакомств
геосоциальные сети.


Слайд 20Подходы к анализу социальных сетей.

Рис. Структура сети:
1) полная карта сети

социальных коммуникаций;
2) социальная сеть, из которой изъяты слабые связи;
3) сеть, из которой изъяты сильные связи: структура сохраняет связность.

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика