Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН презентация

Содержание

Принципы контентной фильтрации 1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого Интернет-ресурсов 2. Релевантный поиск и проблемный анализ содержимого Интернет-ресурсов должен выполняться специальным программно-аппаратным комплексом 3. Задача комплекса –

Слайд 1Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН


Слайд 2Принципы контентной фильтрации

1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого

Интернет-ресурсов
2. Релевантный поиск и проблемный анализ содержимого Интернет-ресурсов должен выполняться специальным программно-аппаратным комплексом
3. Задача комплекса – формирование и «веерное» распространение базы данных запрещенных ресурсов для их последующего блокирования
4. Ресурсы, относящиеся к запрещенной тематике, должны быть классифицированы в соответствии с их информационной направленностью
5. Для каждой категории пользователи может задаваться свой перечень запрещенных классов ресурсов

Слайд 3Платформа – ИАС «АРИОН»


Слайд 4Ключевые технологии

1. Автономный поиск и автоматическая загрузка текстового содержания ресурсов Интернета
2.

Фактографический разбор и тональный анализ текстов на естественном языке
3. Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов

Слайд 5

Концептуальная схема


Слайд 6Аналитическая часть



Слайд 7Сбор информации - Краулер

Назначение
поиск в Интернете ресурсов по заданным критериям

Основные возможности
автономный

переход по ссылкам
использование поисковых машин
извлечение текста из различных форматов: txt, html, rtf, doc, pdf
первичный анализ текстового содержимого (с помощью фильтров)

Слайд 8Сбор информации


Слайд 9Сбор информации


Слайд 10
Назначение
анализ текстового содержания найденных ресурсов
Основные возможности
Полнотекстовый отбор
мощный язык запросов
учет морфологии
поддержка синонимов

и опечаток
Фактографический анализ
графематический анализ
морфологический анализ
синтаксический анализ
логико-семантический анализ
Тональный анализ

Модуль индексирования


Слайд 11Индексирование


Слайд 12Индексирование


Слайд 13Индексирование


Слайд 14
Назначение
автоматическое рубрицирование ресурсов на основании выполненного анализа

Способы рубрицирования
анализ характерных слов и

выражений (полнотекстовый поиск).
анализ описываемых ситуаций (фактографический поиск)
анализ отношения автора текста к предмету (анализ тональности высказываний)

Модуль рубрикации


Слайд 15Запросы рубрикации


Слайд 16Рубрикация на основе полнотекстового поиска


Слайд 17Рубрикация на основе полнотекстового поиска


Слайд 18Запросы рубрикации


Слайд 19Рубрикация на основе фактографического поиска


Слайд 20Рубрикация на основе фактографического поиска


Слайд 21Рубрикация на основе фактографического поиска


Слайд 22Рубрикация на основе фактографического поиска


Слайд 23Рубрикация на основе фактографического поиска


Слайд 24Запросы рубрикации


Слайд 25Рубрикация на основе тональности высказываний


Слайд 26Рубрикация на основе тональности высказываний


Слайд 27Рубрикация на основе тональности высказываний


Слайд 28Рубрикация на основе тональности высказываний


Слайд 30Список запрещенных ресурсов
Формирование и выгрузка списка запрещенных ресурсов


Слайд 31Формирование списка запрещенных ресурсов


Слайд 32Формирование списка запрещенных ресурсов


Слайд 33Формирование списка запрещенных ресурсов


Слайд 34Заключение

Технологии ИАС «АРИОН» в рамках системы контентной фильтрации Интернет-ресурсов обеспечили решение

следующих задач:

Сбор и загрузка текстового содержания искомых ресурсов Интернета
Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов
Тональный анализ текстов на естественном языке
Формирование списка запрещенных ресурсов


Слайд 35Адрес: 115230, Россия, Москва, Электролитный проезд, дом 5Б, строение 8
Телефон: +7

(495) 589-3929
Факс: +7 (499) 317-4663
Электронная почта: info@sytech.ru
Web: www.sytech.ru

Контактная информация


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика