Дипломная работаПрограммная поддержка морфемного словаря презентация

Терминология Морфема – наименьшая языковая единица, обладающая значением: Корень: стол, един Аффикс: при (приставка), от (суффикс) Морф – конкретная реализация морфемы в тексте; Пример: пер, пир, ставл Алломорф - совокупность морфов

Слайд 1 Дипломная работа Программная поддержка морфемного словаря
Швейкина О.А., 525 гр.
Научный руководитель:
к.ф.-м.н. доцент

Большакова Е.И.

Слайд 2Терминология
Морфема – наименьшая языковая единица, обладающая значением:
Корень: стол, един
Аффикс: при (приставка),

от (суффикс)
Морф – конкретная реализация морфемы в тексте;
Пример: пер, пир, ставл
Алломорф - совокупность морфов одной морфемы;
Пример: бр, бер, бор
Морфемный разбор слова – нахождение минимальных значимых единиц, из которых оно составлено
Пример: положение, полагать

/14


Слайд 3Морфемные словари и подходы к их построению
Морфемные словари (МС):
Печатные: (словарь А.Н.

Тихонова)
Тяжело вносить дополнения
Медленный поиск
Электронные: («Яндекс. Словари», «Ариадна»)
Нет прикладного интерфейса
Подходы к построению:
Составление вручную (высокая точность)
Автоматизированный (точность около 80%)
Генетический алгоритм
Построение правил разбиения на морфы
Вероятностный метод

/14


Слайд 4Постановка задачи

Цель:
разработка компьютерного морфемного словаря русского языка и поддерживающих его программ
Исходные

данные составлены вручную (текст. файлы)
Требуется разработать:
схему хранения однокоренных и многокоренных слов;
программы загрузки исходных данных;
процедуры, выполняющие:
Морфемный разбор слов, содержащихся в БД;
Морфемный разбор слов, отсутствующих в БД;
Поиск слов с заданной морфемой;
пользовательский и прикладной интерфейсы.

/14


Слайд 5Принципы организации словарных данных
Исходные данные – текстовые файлы со словами, разбитыми

на морфы (типы морфов помечены): + бетон % о + меш – алк * а
Хранимые данные:
для каждого слова хранится:
1) Строковое представление
2) Связи с морфами (морфемный состав)
для каждого морфа хранится:
1) Строковое представление
2) Тип (соединит. гласная является отдельным типом)
3) Связи с морфами (алломорфы)

/14


Слайд 6Схема базы данных словаря
words
word_morphs
morphs
allomorphs
/14


Слайд 7Функции словаря
1) Осуществление морфемного разбора слов, хранящихся в БД словаря
Пример:

запрос: одичавший
результат: -О+ДИЧ-АВШ*ИЙ

2) Поиск возможного морфемного разбора слов, отсутствующих в БД словаря

3) Поиск групп слов, содержащих заданную морфему (с учетом возможных алломорфов)
Пример: запрос: -бер- (корень)
результат: слова с корнями
-бер-, -бир-, -бр-, -бор-.

/14


Слайд 8Поиск вариантов морфемного разбиения (для отсутствующих в БД слов)
Шаг поиска:
1) Отщепляются

очередные несколько букв. Они рассматриваются как кандидаты в морфы
2) Проверяется, являются ли эти буквы нужным морфом
3) Если да –
эти буквы считаются морфом слова, продолжается поиск разбиения для остатка
Если нет –
отщепляется еще одна буква, либо ищется след. тип

Строится дерево поиска, в узлах:
Разобранная и неразобранная части слова,
Текущий тип морфа

/14


Слайд 9Дерево поиска. Пример

1)«»
2) Столик
3) Приставка

1)«»
2) Столик
3) корень

Приставка = « »
1)«+Стол»
2) ик
3)

суффикс

Корень = «Стол»

1)«+Стол-и»
2) к
3) суффикс

1)«+Стол-ик»
2) -
3) -

Суффикс = «ик»

Суффикс = «и»

Суффикс = « »

1)«+Стол-и-к»
2) -
3) -

Суффикс = «к»

/14


1)«-С»
2) толик
3) корень


1)«+Стол»
2) ик
3) окончание

Приставка = « С»


Слайд 10Программная реализация
Язык реализации – С++
Среда разработки – Visual Studio 2005
Библиотека графического

интерфейса – MFC
Реляционная база данных – SQLITE
Язык для работы с базой данных – SQL

Прикладной интерфейс, поддерживающий:
Загрузку исходных файлов;
Поиск морфемного состава слов из БД, не из БД;
Поиск слов с заданной морфемой

/14


Слайд 11Пользовательский интерфейс. Поиск морфемного состава

/14


Слайд 12Пользовательский интерфейс. Поиск слов с заданной морфемой

/14


Слайд 13Результаты работы

Изучены существующие морфемные словари и способы их построения.
Предложена модель хранения

словарных данных.
Разработаны программные средства поддержки:
загрузки словарных данных из текстовых файлов;
поиска морфемного разбора заданного слова
из БД
не из БД;
поиска слов, содержащих заданную морфему.
Реализован прикладной и пользовательский интерфейсы.

/14


Слайд 14/14
Благодарю за внимание!


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика