Алгоритм построенияоценок весов интентов для многозначных запросов презентация

Содержание

1. Алгоритм построенияоценок весов интентов для многозначных запросов
2. Предметная область Многозначный запрос – запрос, по
3. Сейчас: Расчёт весов для IA-метрик производится вручную.
4. Алгоритм Формирование множества связанных запросов Кластеризация
5. Построение графа Вершины – запросы (Q)
6. Результаты Разработан алгоритм 65% наборов интентов
7. Дальнейшая работа Создание полуавтоматической системы проверки

Главная
Разное
Алгоритм построенияоценок весов интентов для многозначных запросов

Слайд 1Алгоритм построения оценок весов интентов для многозначных запросов
Артём Григорьев
445-ая группа

Кафедра Системного

программирования
Математико-механический факультет СПбГУ

Научный руководитель: к. ф.-м. н. Грауэр Л.В.
ООО «Яндекс»

Слайд 2Предметная область
Многозначный запрос – запрос, по которому возможны несколько пользовательских интентов

(намерений пользователя).
Примеры: ягуар, наполеон, титаник…
IA-метрики (intent-aware) – метрики качества поиска, учитывающие различные интенты по многозначным запросам.

Слайд 3Сейчас: Расчёт весов для IA-метрик производится вручную. Асессоры получают небольшой набор

случайных сессий, должны определить по сессии интент. Доля сессий с данным интентом = вес.
Минусы: ограниченные возможности асессоров, => малое количество сессий по запросу, редкие обновления.
Задача: Придумать и реализовать алгоритм, вычисляющий по заданному на вход запросу набор пользовательских интентов и оценки их весов.

Постановка задачи

Слайд 4Алгоритм

Формирование множества связанных запросов
Кластеризация
Построение графа запросов и документов
Случайное блуждание по графу
Кластеризация

по векторам предельных вероятностей документов
Распределение сессий по кластерам и расчёт весов

Слайд 5Построение графа

Вершины – запросы (Q) и документы (D)
Рёбра:
Q1 -> Q2 (вес

= вероятность переформулировки)
Q -> D (вес = вероятность клика)
Петли D -> D (вес = 1)
Полученный граф – марковская цепь
Документы – конечные состояния

Слайд 6Результаты

Разработан алгоритм
65% наборов интентов найдено полностью
94% без одного интента
Ошибки в точности

в среднем <= 0.17
Создан веб-инструмент для запуска и анализа результатов
Утилита для расчёта данных по переформулировкам на кластере MapReduce

Слайд 7Дальнейшая работа

Создание полуавтоматической системы проверки точности и полноты
«Правильная» фильтрация «мусорных» данных
Использование

лингвистических данных при распределении сессий по кластерам
Определение интентов из коротких, малоинформативных сессий
Другие алгоритмы кластеризации и функции сходства

Скачать презентацию

Алгоритм построенияоценок весов интентов для многозначных запросов презентация

Содержание

Слайд 1Алгоритм построения оценок весов интентов для многозначных запросов
Артём Григорьев
445-ая группа

Кафедра Системного

Слайд 2Предметная область
Многозначный запрос – запрос, по которому возможны несколько пользовательских интентов

Слайд 3Сейчас: Расчёт весов для IA-метрик производится вручную. Асессоры получают небольшой набор

Слайд 4Алгоритм

Формирование множества связанных запросов
Кластеризация
Построение графа запросов и документов
Случайное блуждание по графу
Кластеризация

Слайд 5Построение графа

Вершины – запросы (Q) и документы (D)
Рёбра:
Q1 -> Q2 (вес

Слайд 6Результаты

Разработан алгоритм
65% наборов интентов найдено полностью
94% без одного интента
Ошибки в точности

Слайд 7Дальнейшая работа

Создание полуавтоматической системы проверки точности и полноты
«Правильная» фильтрация «мусорных» данных
Использование

Обратная связь

Что такое ThePresentation.ru?

Алгоритм построенияоценок весов интентов для многозначных запросов презентация

Содержание

Слайд 1Алгоритм построения оценок весов интентов для многозначных запросовАртём Григорьев 445-ая группаКафедра Системного

Слайд 2Предметная областьМногозначный запрос – запрос, по которому возможны несколько пользовательских интентов

Слайд 3Сейчас: Расчёт весов для IA-метрик производится вручную. Асессоры получают небольшой набор

Слайд 4АлгоритмФормирование множества связанных запросовКластеризацияПостроение графа запросов и документовСлучайное блуждание по графуКластеризация

Слайд 5Построение графаВершины – запросы (Q) и документы (D)Рёбра:Q1 -> Q2 (вес

Слайд 6РезультатыРазработан алгоритм65% наборов интентов найдено полностью94% без одного интентаОшибки в точности

Слайд 7Дальнейшая работаСоздание полуавтоматической системы проверки точности и полноты«Правильная» фильтрация «мусорных» данныхИспользование

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1Алгоритм построения оценок весов интентов для многозначных запросов
Артём Григорьев
445-ая группа

Кафедра Системного

Слайд 2Предметная область
Многозначный запрос – запрос, по которому возможны несколько пользовательских интентов

Слайд 4Алгоритм

Формирование множества связанных запросов
Кластеризация
Построение графа запросов и документов
Случайное блуждание по графу
Кластеризация

Слайд 5Построение графа

Вершины – запросы (Q) и документы (D)
Рёбра:
Q1 -> Q2 (вес

Слайд 6Результаты

Разработан алгоритм
65% наборов интентов найдено полностью
94% без одного интента
Ошибки в точности

Слайд 7Дальнейшая работа

Создание полуавтоматической системы проверки точности и полноты
«Правильная» фильтрация «мусорных» данных
Использование