Извлечение фактов из текста. Математическая лингвистика презентация

Содержание

1. Извлечение фактов из текста. Математическая лингвистика
2. Что такое компьютерная лингвистика? Компьютерная лингвистика изучает
3. Задачи компьютерной лингвистики: автоматическое составление словарей и
4. Извлечение фактов (структурированной информации) из
5. Где применяются технологии извлечения фактов? Яндекс – Почта, Новости, Карты и др. сервисы.
6. Где применяются технологии извлечения фактов?
7. Где применяются технологии извлечения фактов? В поисковых
8. Пример извлечения фактов
9. Задача проекта: извлечение фактов из текстов для
10. Примеры неструктурированного текста: В 1771 году Карл
11. Получаем на выходе:
12. Инструменты для работы Томита-парсер — это инструмент
13. Грамматика томита-парсера Так выглядит часть грамматики для
14. Грамматика томита-парсера Язык описания грамматик для томита-парсера построен на основе порождающих грамматик.
15. Источники: Блог Яндекса на Хабре http://habrahabr.ru/company/yandex/blog/219311/ http://habrahabr.ru/company/yandex/blog/205198/ Скриншоты с Яндекс Почты
16. Спасибо за внимание!

Главная
Информатика
Извлечение фактов из текста. Математическая лингвистика

Слайд 1Проект
Извлечение фактов
из текста

Лаборатория
математической лингвистики

Слайд 2Что такое компьютерная лингвистика?
Компьютерная лингвистика изучает язык с позиции его использования

в компьютерных системах.

Слайд 3Задачи компьютерной лингвистики:
автоматическое составление словарей и грамматик;
анализ естественно-языковых текстов;
создание и использование

текстовых корпусов;
машинный перевод;
информационный поиск;
автореферирование;
создание систем искуственного интеллекта и др.

Слайд 4
Извлечение фактов (структурированной информации) из неструктурированного текста - Text Mining.
С

помощью этой технологии можно представлять данные из текстов на естественном языке в формализованном виде для дальнейшей машинной обработки.
Извлечение фактов - одна из задач компьютерной лингвистики.

Слайд 5Где применяются технологии извлечения фактов?
Яндекс – Почта, Новости, Карты и др.

сервисы.

Слайд 6Где применяются технологии извлечения фактов?

Слайд 7Где применяются технологии извлечения фактов?
В поисковых системах, например Google и Yandex,

для сбора информации о пользователе.
При автоматическом построении предметных областей.
Для представления текстовой информации в удобном виде для машинной обработки.

Слайд 8Пример извлечения фактов

Слайд 9Задача проекта:
извлечение фактов из текстов для структурирования информации.
Под «фактом» понимается набор

извлеченных сущностей, связанных определенным отношением.
Источник: научные тексты по химии.

Слайд 10Примеры неструктурированного текста:
В 1771 году Карл Шееле получил плавиковую кислоту.
В природе

значимые скопления фтора содержатся в основном в минерале флюорите (CaF2).
Глюкоза - бесцветное кристаллическое вещество сладкого вкуса, растворимое в воде.
При окислении образует глюконовую кислоту.

Слайд 11Получаем на выходе:

Слайд 12Инструменты для работы
Томита-парсер — это инструмент для извлечения структурированных данных (фактов)

из текста на естественном языке. Это технология, разработанная Яндексом.
Для извлечения информации из текста с помощью томита-парсера нужно писать грамматики.

Слайд 13Грамматика томита-парсера
Так выглядит часть грамматики для томита-парсера (для извлечения места рождения

человека):

Born -> Verb;
City -> Noun;
Person -> AnyWord;
S -> Person interp(BornFact.Person) Born "в" City interp(BornFact.Place);

Слайд 14Грамматика томита-парсера
Язык описания грамматик для томита-парсера построен на основе порождающих грамматик.

Слайд 15Источники:
Блог Яндекса на Хабре http://habrahabr.ru/company/yandex/blog/219311/
http://habrahabr.ru/company/yandex/blog/205198/
Скриншоты с Яндекс Почты

Слайд 16Спасибо за внимание!

Скачать презентацию

Извлечение фактов из текста. Математическая лингвистика презентация

Содержание

Слайд 1Проект
Извлечение фактов
из текста

Лаборатория
математической лингвистики

Слайд 2Что такое компьютерная лингвистика?
Компьютерная лингвистика изучает язык с позиции его использования

Слайд 3Задачи компьютерной лингвистики:
автоматическое составление словарей и грамматик;
анализ естественно-языковых текстов;
создание и использование

Слайд 4
Извлечение фактов (структурированной информации) из неструктурированного текста - Text Mining.
С

Слайд 5Где применяются технологии извлечения фактов?
Яндекс – Почта, Новости, Карты и др.

Слайд 6Где применяются технологии извлечения фактов?

Слайд 7Где применяются технологии извлечения фактов?
В поисковых системах, например Google и Yandex,

Слайд 8Пример извлечения фактов

Слайд 9Задача проекта:
извлечение фактов из текстов для структурирования информации.
Под «фактом» понимается набор

Слайд 10Примеры неструктурированного текста:
В 1771 году Карл Шееле получил плавиковую кислоту.
В природе

Слайд 11Получаем на выходе:

Слайд 12Инструменты для работы
Томита-парсер — это инструмент для извлечения структурированных данных (фактов)

Слайд 13Грамматика томита-парсера
Так выглядит часть грамматики для томита-парсера (для извлечения места рождения

Слайд 14Грамматика томита-парсера
Язык описания грамматик для томита-парсера построен на основе порождающих грамматик.

Слайд 15Источники:
Блог Яндекса на Хабре http://habrahabr.ru/company/yandex/blog/219311/
http://habrahabr.ru/company/yandex/blog/205198/
Скриншоты с Яндекс Почты

Слайд 16Спасибо за внимание!

Обратная связь

Что такое ThePresentation.ru?

Извлечение фактов из текста. Математическая лингвистика презентация

Содержание

Слайд 1ПроектИзвлечение фактовиз текстаЛабораторияматематической лингвистики

Слайд 2Что такое компьютерная лингвистика?Компьютерная лингвистика изучает язык с позиции его использования

Слайд 3Задачи компьютерной лингвистики:автоматическое составление словарей и грамматик;анализ естественно-языковых текстов;создание и использование

Слайд 4 Извлечение фактов (структурированной информации) из неструктурированного текста - Text Mining.С

Слайд 5Где применяются технологии извлечения фактов?Яндекс – Почта, Новости, Карты и др.

Слайд 6Где применяются технологии извлечения фактов?

Слайд 7Где применяются технологии извлечения фактов?В поисковых системах, например Google и Yandex,

Слайд 8Пример извлечения фактов

Слайд 9Задача проекта:извлечение фактов из текстов для структурирования информации.Под «фактом» понимается набор

Слайд 10Примеры неструктурированного текста:В 1771 году Карл Шееле получил плавиковую кислоту.В природе

Слайд 11Получаем на выходе:

Слайд 12Инструменты для работыТомита-парсер — это инструмент для извлечения структурированных данных (фактов)

Слайд 13Грамматика томита-парсераТак выглядит часть грамматики для томита-парсера (для извлечения места рождения

Слайд 14Грамматика томита-парсераЯзык описания грамматик для томита-парсера построен на основе порождающих грамматик.

Слайд 15Источники:Блог Яндекса на Хабре http://habrahabr.ru/company/yandex/blog/219311/http://habrahabr.ru/company/yandex/blog/205198/Скриншоты с Яндекс Почты

Слайд 16Спасибо за внимание!

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1Проект
Извлечение фактов
из текста

Лаборатория
математической лингвистики

Слайд 2Что такое компьютерная лингвистика?
Компьютерная лингвистика изучает язык с позиции его использования

Слайд 3Задачи компьютерной лингвистики:
автоматическое составление словарей и грамматик;
анализ естественно-языковых текстов;
создание и использование

Слайд 4
Извлечение фактов (структурированной информации) из неструктурированного текста - Text Mining.
С

Слайд 5Где применяются технологии извлечения фактов?
Яндекс – Почта, Новости, Карты и др.

Слайд 7Где применяются технологии извлечения фактов?
В поисковых системах, например Google и Yandex,

Слайд 9Задача проекта:
извлечение фактов из текстов для структурирования информации.
Под «фактом» понимается набор

Слайд 10Примеры неструктурированного текста:
В 1771 году Карл Шееле получил плавиковую кислоту.
В природе

Слайд 12Инструменты для работы
Томита-парсер — это инструмент для извлечения структурированных данных (фактов)

Слайд 13Грамматика томита-парсера
Так выглядит часть грамматики для томита-парсера (для извлечения места рождения

Слайд 14Грамматика томита-парсера
Язык описания грамматик для томита-парсера построен на основе порождающих грамматик.

Слайд 15Источники:
Блог Яндекса на Хабре http://habrahabr.ru/company/yandex/blog/219311/
http://habrahabr.ru/company/yandex/blog/205198/
Скриншоты с Яндекс Почты