Веб-система агрегации и интеллектуального анализа проектов фриланс-бирж презентация

Содержание

Состояние фриланса на сегодня Фриланс – удаленная разовая работа Фриланс-биржа – веб-площадка публикации заказов Особенности: Идеальный путь быстрого заработка и накопления опыта Широкое распространение с развитием интернета Максимально гибкие условия

Слайд 1Веб-система агрегации и интеллектуального анализа проектов фриланс-бирж
Докладчик:
Савин И.И.


Слайд 2Состояние фриланса на сегодня
Фриланс – удаленная разовая работа
Фриланс-биржа – веб-площадка публикации

заказов

Особенности:
Идеальный путь быстрого заработка и накопления опыта
Широкое распространение с развитием интернета
Максимально гибкие условия работы

Проблемы:
Много источников заказов (фриланс-бирж)
Конкуренция с фриланс-компаниями
Требуется быстрый анализ сложности и бюджета заказа

Слайд 3Существующие помощники фрилансера


Слайд 4Структура комплекса Lancery
База
данных
Сборщик проектов
Биржи
Нормализатор
Кластеризатор
Фильтры Кластеры
Проекты

Запуск каждую минуту
Запуск после сборщика
Запуск каждый час
Фрилансер
Оперативный

ответ

Слайд 5Структура комплекса Lancery
База
данных
Сборщик проектов
Биржи
Нормализатор
Кластеризатор
Фильтры Кластеры
Проекты

Запуск каждую минуту
Запуск после сборщика
Запуск каждый час
Фрилансер
Оперативный

ответ

Слайд 6Особенности агрегации проектов
Технологии и приемы:
Really Simple Syndication (RSS)
Полиморфизм модулей для индивидуальных

правил обработки источника

Особенности:
Независимость модулей бирж друг от друга
Простота модификации и добавления новых источников

Результат работы:
Оперативное добавление новых проектов с бирж в Lancery

Слайд 7Структура комплекса Lancery
База
данных
Сборщик проектов
Биржи
Нормализатор
Кластеризатор
Фильтры Кластеры
Проекты

Запуск каждую минуту
Запуск после сборщика
Запуск каждый час
Фрилансер
Оперативный

ответ

Слайд 8Нормализация проектов
Этапы нормализации:
Разбиение текста на зоны важности
Разбиение на термы, леммизация
Фильтрация по

части речи (сущ., глаг., прил.)
Подсчет частоты термов в документе
Отброс стоп-слов

Итоги нормализации:
Ключевые слова проекта
Поиск по навыкам, технологиям
Векторная модель документа (ВМД) подойдет для более глубокого анализа


Слайд 9Структура комплекса Lancery
База
данных
Сборщик проектов
Биржи
Нормализатор
Кластеризатор
Фильтры Кластеры
Проекты

Запуск каждую минуту
Запуск после сборщика
Запуск каждый час
Фрилансер
Оперативный

ответ

Слайд 10Особенности кластеризации
Особенности ВМД:
Объекты имеют различное количество атрибутов
Всех возможных атрибутов много

Метрика Жаккара:

Адекватное

сравнение неоднородных множеств
Быстрота вычисления

Итоговая метрика:




Слайд 11Особенности кластеризации
A
B
C
D
Алгоритм ROCK:
Количества общих соседей (ссылок) как мера близости двух объектов


Свойства:
Поиск

похожих фактов, изложенных разными словами
Иммунитет к выбросам
Быстрое вычисление итераций кластеризации
Вычислительная сложность этапа подготовки данных О(n³)

Слайд 12Особенности кластеризации
Проблема: Большая вычислительная сложность вызывает проблемы с масштабированием

(в Lancery уже более 60 000 проектов)
Решение: периодическая кластеризация небольшими порциями




Преимущества:
Каждый объект участвует в нескольких распределениях
Результаты готовы через 2-5 минут
Низкие требования к ресурсам сервера




Проекты за 24 часа

3ч 2ч 1ч сейчас


Слайд 13Результаты кластеризации
Прогноз бюджета проекта на основе наблюдений за схожими проектами того

же периода
Возможность прогнозировать любые другие частично неопределенные свойства объектов (сложность, риски)
Составление рекомендаций проектов на основании интересов пользователя

Слайд 14Структура комплекса Lancery
База
данных
Сборщик проектов
Биржи
Нормализатор
Кластеризатор
Фильтры Кластеры
Проекты

Запуск каждую минуту
Запуск после сборщика
Запуск каждый час
Фрилансер
Оперативный

ответ

Слайд 15Оперативная реакция
В подавляющем большинстве случаев исполнитель выбирается из авторов первых 1-3

ответов

Система оперативной реакции:
Отправить ответ прямо с ленты проектов Lancery на биржу
Мобильная версия
Автоматическая авторизация на нужной бирже

Агрегатор

Страница проекта

Авторизация на бирже

Ответ отправлен

Страница ответа





Слайд 16Резюме проекта
Методика анализа текста отмечена на конференциях «Телематика 2010», «МИЭМ 2010»,

«МИЭМ 2011» и других
Участник конкурса «УМНИК-Сколковец»
Победитель программы «У.М.Н.И.К. 2011»

Докладчик:
Савин Иван
ivan.savin@2011.auditory.ru

Спасибо за внимание

Адрес проекта: http://lancery.ru
Мобильная версия: http://m.lancery.ru


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика