НКРЯ: постоянно пополняемый мега-ресурс. Часть 1. Простой поиск в НКРЯ презентация

Содержание

 Виды решаемых лингвистических задач: поиск контекстов с заданными лингвистическими характеристиками, получение лингвистических данных по размеченным коллекциям текстов (корпусам текстов), получение количественных данных, поиск контекстов заданной структуры,

Слайд 1НКРЯ: постоянно пополняемый мега-ресурс. Часть 1. Простой поиск в НКРЯ. www.ruscorpora.ru


Слайд 2 Виды решаемых лингвистических задач:

поиск контекстов с заданными лингвистическими характеристиками,

получение лингвистических данных

по размеченным коллекциям текстов (корпусам текстов),

получение количественных данных,

поиск контекстов заданной структуры,

поиск вариантов заданной структуры,

получение KWIC





Слайд 3Определения: корпус, корпус 1-го порядка
ЛИНГВИСТИЧЕСКИЙ КОРПУС ТЕКСТОВ – унифицированный, структурированный, представленный

в электронном виде филологически компетентный массив языковых данных, отвечающий следующим формальным требованиям:
– объем не менее 100 млн. словоупотр.,
– наличие одного и более видов [выполненной по некоторому стандарту] разметки [например: метаразметки; просодической, семантической, морфологической, синтаксической], такой, что интерпретируется корпус-менеджером для извлечения фрагмента текста с заданными значениями разметки/разметок, заданной длины.

КОРПУС ПЕРВОГО ПОРЯДКА – электронная текстовая коллекция (объединение по признаку языка, жанра, времени создания), интерпретируемая ~корпус-менеджером.

Слайд 4Структура корпуса
Размеченная коллекция текстов
+
Корпус-менеджер


Слайд 5Определения: конкорданс
[англ. concordance - согласие, соответствие < лат. concordare - согласовываться,

приводить к согласию]
1. Расположенный в алфавитном порядке перечень всех встречающихся в книге слов (или сходных по содержанию мест) с минимальным контекстом (в несколько слов). Имеются к. многих значительных текстов: "Библии", сочинений Шекспира, Пушкина и др.;
2. Особый тип словаря, в котором каждое слово приводится с минимальным контекстом.
(Словарь иностранных слов. Комлев Н.Г., 2006)

1. Алфавитный указатель слов, встречающихся в какой-либо книге, с приведением цитат, в которых эти слова встречаются. Термин отмечается в истории перевода и истории лексикографии у некоторых авторов.
2. Словарь, в котором словарные единицы сгруппированы по ключевым словам, взятым в контекстном окружении.
(Толковый переводоведческий словарь. Л.Л. Нелюбин. 2003)



Слайд 6/!Зачем лингвисту нужны контексты
Исследования по семантике,
Исторической семантике,
Культуре речи,
Грамматические исследования

/ Ex-1.


Слайд 7Та же выдача в форматe KWIC (Key Word In Context)


Слайд 9
Запрос: рухлядь; сортировка= по дате создания; формат= обычный


Слайд 10Запрос: рухлядь; сортировка= по дате создания; формат= KWIC


Слайд 12Запрос: Adj+человек; сортировка= по дате создания; формат= KWIC; цель: …; недостаток

(см. MI)

Слайд 13Ex: выдача НКРЯ: адаптированный просмотр тегов словоформы

!принципиальная особенность корпуса: лингв. разметка

? возможность поиска по тегам лингворазметки

Слайд 14А здесь – не адаптированный


Слайд 15Структура морфологической пометы
акад`емиев
поле лексемы
поле грамматических признаков:
признаки лексемы
признаки

словоформы
информация о нестандартности формы и/или способе записи
поле словоформы (в корпусе со снятой омонимией большинство словоформ автоматически акцентуировано)

Цитата из лекции Д.В.Сичинавы: Морфологическая информация в НКРЯ, 2010


Слайд 16Образец текста с морфологической разметкой
,
к
тому
же

lex='его' gr='A-PRO='>его
уч`ение
б`ыло
пон`ятно
люб`ому
нев`ежде,
к`аждый
станов`ился
посвящённым.

Цитата из лекции Д.В.Сичинавы: Морфологическая информация в НКРЯ, 2010


Слайд 17? Демонстрация
Животолюбивый человек
----------------
Что с кофе?
---------------
Экстракт из …
---------------
Графики в НКРЯ





Слайд 23Параллельный корпус НКРЯ
Параллельный корпус текстов - совокупность документов, переведенных на

два или более языков,
выровненных по предложениям и размеченных,
написанных на одну тему и на одном языке авторами с разными родными языками


Слайд 24Применение параллельного корпуса для изучения практики перевода экзотизмов


Слайд 26/Переводчик один и тот же


Слайд 27Применение параллельного корпуса для изучения культурно-специфичного употребления слов


Слайд 30? Другие корпусы


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика