Презентация на тему Geocoding – методы получения гео-координат изновостных потоков

Презентация на тему Geocoding – методы получения гео-координат изновостных потоков, предмет презентации: Образование. Этот материал содержит 11 слайдов. Красочные слайды и илюстрации помогут Вам заинтересовать свою аудиторию. Для просмотра воспользуйтесь проигрывателем, если материал оказался полезным для Вас - поделитесь им с друзьями с помощью социальных кнопок и добавьте наш сайт презентаций ThePresentation.ru в закладки!

Слайды и текст этой презентации

Слайд 1
Текст слайда:

Geocoding – методы получения гео-координат из новостных потоков

Выполнил: Баклыков Денис Григорьевич
denis.baklikov@gmail.com

Научный руководитель: Намиот Дмитрий Евгеньевич
dnamiot@abavanet.ru


Слайд 2
Текст слайда:

Известные аналоги

Яндекс.Новости
Lenta.ru

GeoNames.org
База данных гео-объектов
8 миллионов записей
Yahoo GeoPlanet
Поиск гео-объектов по критериям
Альтернативные названия



Слайд 3
Текст слайда:

Требования к системе

Выявление описания гео-объектов в новостных потоках (RSS, Atom)

Прозрачная конвертация RSS лент в GeoRSS

Обеспечение высокой производительности системы


Слайд 4
Текст слайда:

Трудности реализации

Сложность обработки данных
большой размер БД, нагрузка на сервер
Нет открытых алгоритмов поиска гео-объектов
Поддержка множества подписчиков
Нет единой базы гео-объектов
Различные варианты названия гео-объектов


Слайд 5
Текст слайда:

Исходные данные


Нижний угол


Верхний угол


Центр


Слайд 6
Текст слайда:

Архитектура

Распределённая система
База данных
Гео-объекты, альтернативные названия
Исторические данные новостных потоков

Кластеризация системы
Горизонтальная – дополнительные «ноды»
Вертикальная – наращивание мощности сервера


Слайд 7
Текст слайда:

Реализация


Слайд 8
Текст слайда:

Определение гео-объектов по маске

Пример:

Ключевые слова для поиска:

Маска:

Результат поиска:

В честь для факультета ВМК, студенческий парад прошёл от метро Университет до улицы Лебедева

улица, площадь, проспект, набережная, бульвар, просек, переулок, шоссе, аллея, тупик, холм, проезд, район, метро

(.*?) (улиц*|ул\.) (.*?) = все словосочетания, в которых встречается слово «улица», либо «ул.»

Метро Университет, улица Лебедева


Слайд 9
Текст слайда:

Определение гео-объектов по словарю

Пример с предлогом:

Без предлога:

Маска:

Результат:

Неглинная за последние 10 лет очень сильно изменилась

([А-Я]{1}[а-я]*) = все слова, начинающиеся с заглавной буквы

На Тверской стояли десятки военных машин, ожидая команды начала парада

Тверской, Неглинная


Слайд 10
Текст слайда:

Заключение

Реализована система, позволяющая:
Определять около 90% гео-объектов
Скорость обработки текста ~ 10KB/s (на 1 узле)
Адрес проекта: geo-rss-demo.appspot.com

Дальнейшее развитие
Поиск по области
История новостей в заданной области


Слайд 11
Текст слайда:

Спасибо за внимание!

Ваши вопросы

Денис Баклыков


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика