ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ презентация

Сюжеты VS Новые события Конференция «Диалог 2007» ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ Запрос пользователя О чем больше всего говорят Учет времени и

Слайд 1ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ
Ландэ Д.В., Брайчевский С.М., Григорьев

А.Н., Дармохвал А.Т., Радецкий А.Б.

Информационный центр «ЭЛВИСТИ», Киев

Конференция «Диалог 2007»


Слайд 2Сюжеты VS Новые события
Конференция «Диалог

2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ

Запрос
пользователя

О чем больше
всего говорят

Учет времени
и количества
публикаций

О каких
«актуальных»
событиях
говорят в
последнее
время
«солидные»
источники

Учет …


Слайд 3Популярность документа Di за небольшой промежуток времени (локальная популярность- ni) и

за значительный промежуток (глобальная популярность - Ni). Вычисляются по количеству «подобных» документов в оперативной и ретроспективной базах данных.

Конференция «Диалог 2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ

Ni

ni


Слайд 4Предположение, о том, что документ соответствует новому событию, если выполняются условия:

минимальное время, прошедшее с момента публикации документа; близость лексического состава документа к лексическому составу массива документов за небольшой промежуток времени (массив оперативных новостей); существенное различие лексического состава документа от лексического состава массива документов за значительный период времени – окна наблюдения; наличие в документе терминов, входящих в плюс-словарь (включающий важные для содержания новостей слова типа «теракт», «конфликт», «сенсация» и т.п.); высокий ранг «авторитетности» источника, а также допустимости лексики заглавий новостей (определяемых экспертами).

Конференция «Диалог 2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ


Слайд 5Формула для расчета ранга новостного документа:
Конференция «Диалог 2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ

ПОТОКА НОВОСТЕЙ

N – величина окна наблюдения потока новостей;

n – величина массива оперативных новостей (n < N);

Di – i-й документ;

PlusDic – плюс-словарь;

sim(Di, Dj) – мера близости документа i документу j;

sim(Di, PlusDic) – мера близости документа i плюс-словарю;

Rangi – ранг источника, соответствующего i-му документу.


Слайд 6Интерфейс пользователя
Конференция «Диалог 2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ


Слайд 7Спасибо за внимание!
Ландэ Д.В., Брайчевский С.М., Григорьев А.Н., Дармохвал А.Т., Радецкий

А.Б.



Информационный центр «ЭЛВИСТИ», Киев

stream@visti.net

Конференция «Диалог 2007»

ВЫЯВЛЕНИЕ НОВЫХ СОБЫТИЙ ИЗ ПОТОКА НОВОСТЕЙ


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика