Слайд 1Так ли нам нужен флот?
Проблема "язык или диалект"
и попытка
лексикостатистического подхода
Коряков Ю.Б.
Слайд 2Язык или диалект?
Один из вечных вопросов лингвистики.
Причем последствия такого решения могут
выходить и далеко за её пределы.
Слайд 3Для чего?
Лингвисты сами постоянно оперируют, используют или ссылаются на понятие «язык»,
но всячески открещиваются от попыток определить, чем он отличается от диалекта
Когда нас интересует «точка» – всё равно как называть: язык бесермян, говор/язык села такого-го, китайский язык
Когда же рассматривается цельное множество, важны как относительная иерархия, так абсолютный вес идиомов в сравнении с другим множествами.
Слайд 4Для чего?
В прикладной аспектах:
для подсчёта индексов типа LDI, ILD;
программы по
сохранению языков;
выработка литературных норм;
создание стройной терминологии, чтоб не было «диалект Х диалекта Y диалектной группы Z»
Инвентаризация объектов:
сколько языков в стране, регионе, семье/группе, в мире? сколько языков описано в какой-либо работе:
для составления баз данных (Ethnologue, Glottolog, Linguasphere);
присвоение ISO-кодов;
при рисовании карт.
Слайд 5Для чего?
Часто это нужно не самим лингвистам, а другим областям:
Демографам/статистикам –
для проведения переписей
Этнографам – для понимания/описания этнических процессов
Да просто: как должна называться статья в «Языках мира» – язык, диалект или "язык/диалект" ?
Слайд 6Требования к критериям
Каким требованиям должен отвечать критерий определения яз/д-т, чтобы можно
было ответить на вышепоставленные вопросы?
Слайд 7Требования к критериям
Универсальность
Постоянство во времени
Непротиворечивость
Генетическая последовательность
Слайд 8Требования:
Универсальность
Критерий должен быть применим к любой паре идиомов.
Наиболее
важное требование: про любой идиом мы должны уметь сказать является он самостоятельным или нет.
Слайд 9Требования:
Постоянство во времени
Отнесение идиома к тому или иному языку не
должно быстро меняться.
Т.е. понятно, что со временем языки развиваются, и, скажем, два диалекта через 500-1000 лет могут стать разными языками.
Но если новые языки могу возникнуть в любой момент, то это неудобно.
Слайд 10Требования:
Непротиворечивость
Один идиом может относиться только к одному языку.
Не должно
быть так, что при использовании одного критерия один и тот же диалект входит и туда, и туда.
Слайд 11Требования: Генетическая последовательность
Генетически родственные диалекты не должны резаться на разные языки.
Не должно
быть,
скажем,
так:
Слайд 12Критерии
две основные группы критериев:
внешние (социо-этно-политические)
внутренние (структурные).
Лучше не использовать термины «субъективные» и
«объективные»: разное понимание.
Слайд 13Внешние критерии
(социо-этно-политические)
Наиболее популярны в отечественной лингвистике:
Эдельман, Алпатов, Мечковская, и др.
На
западе в меньшей степени.
Слайд 14Внешние критерии
(социо-этно-политические)
Обычная логика: смотрим реальные различия – они плохо соотносятся
с принятыми границами языков. Вывод: нужно использовать внешние критерии.
Иной вариант: внешние критерии не работают – значит надо использовать языковые различия.
Слайд 15Внешние критерии
(социо-этно-политические)
Часто считаются как более важные по сравнению с чисто
языковыми:
Алпатов В.М.: «Таким образом, на основе лишь лингвистических данных различить диалект и язык невозможно»
Слайд 16Внешние критерии
(социо-этно-политические)
Общая наддиалектная норма
Этническая ориентация
Мнение носителей
Политический фактор
Слайд 17Общая
наддиалектная норма
Два идиома считаются диалектами одного языка, если у них:
общий письменный стандарт (литературная норма), независимый от других языков (нем. Dachsprache — «язык-крыша»);
или общее наддиалектное койне.
Слайд 18Не применим к бесписьменным регионам.
Общая письменная традиция часто объединяет довольно
далеко разошедшиеся идиомы: итальянские, немецкие, арабские, китайские «диалекты»;
или даже слабо родственные языки: латынь в средние века.
Общая
наддиалектная норма
Слайд 19У разных частей одного идиома могут оказаться разные «крыши»:
белорусский Смоленщины,
западнополесские, торлакские (3 крыши), нижнесаксонские Нидерландов/Германии.
Общая
наддиалектная норма
Слайд 20Используя этот критерий, мы всё равно ориентируемся на степень близости между
идиомами: норма ведь наддиалектная.
Если баски, бретонцы или эльзасцы пользуются лит.французским – мы ведь не называем их языки диалектами французского.
Σλαβικά διάλεκτος в Греции: греки-славофоны.
Т.е. всё равно нужно определить, где граница между языком и диалектом.
Общая
наддиалектная норма
Слайд 21Изменчивость. Как только возникает отд. лит. норма – получается отд. язык.
Черногорский,
славянские микроязыки, региональные языки в Европе, …
Общая
наддиалектная норма
Слайд 22Выполнимость критериев:
Универсальность — ✘
Постоянство во времени – ✘
Непротиворечивость –
~
Генет. последовательность — ✘
Общая
наддиалектная норма
Слайд 23Этническая ориентация
Если носители обоих идиомов относятся к одному этносу, значит это
один язык, если к разным — разные:
Один народ = один язык (то, на чём говорят русские – это русский язык; белорусы – белорусский).
Слайд 24Этническая ориентация
Однако определение народа является ещё более сложным: скорее, одним из
параметров для классификации народов является языковой, а не наоборот.
Связь между этносом и языком довольно искусственна, она характерна либо для:
родо-племенного строя: племя ⇔ язык
«социалистических» наций:
нация ⇔ язык
Слайд 25Этническая ориентация
Во многих регионах:
либо вообще нет чёткого этнического самосознания (часть Зап.Европы,
арабские страны, ..)
либо соответствие между «народами» и языками отсутствует (Индия, Лат.Америка, ..).
Слайд 26Этническая ориентация
Но даже там где оно есть, постоянны общепризнанные нарушения:
1 народ
⇒ несколько языков:
Россия: мордва, аварцы,
Европа: французы, ирландцы, грузины, греки
1 язык ⇒ несколько народов:
Россия: карачаево-балкарский, кабардино-черкесский
Европа: немецкий, английский, сх
Слайд 27Этническая ориентация
В пределах одного народа м.б. много самоназваний, и наоборот, одно
самоназвание может использоваться для нескольких народов.
ханты: χɑnti / kɑntəɣ / хандэ
адыгейцы / кабардинцы: adɨɣə
курды: Kurd, Kurmancî и др.
Чему тогда следовать?
Слайд 28Этническая ориентация
Выполнимость критериев: ☑
Универсальность — ✘
Постоянство во времени – ☑
Непротиворечивость
– ~
Генет. последовательность — ✘
Слайд 29Мнение носителей
Спрашиваем у носителя, на каком языке он говорит – так
и считаем.
Но…
Слайд 30Мнение носителей
Знание о «собственно языке» и его границах с другими языками
не является частью наивной картины мира.
Спрашивать у носителя про «собственно язык» – это всё равно, что спрашивать сколько у него в языке падежей или какая используется морфосинтаксическая стратегия. Либо он не знает, либо повторит то, что выучил в школе, услышал по радио и т.д.
Большинству "неразвитых" обществ это не важно и многие просто говорят "наш/обычный/простой язык".
Поэтому мнение носителей в целом малозначимо.
Слайд 31Мнение носителей
Примеры самоназваний = «наш/обычный язык» :
тутэйши / по-просту – Полесье
našinski
– горане (торлакское наречие)
naš jezik – молизские хорваты
qatô:k ("наш язык") – язык мочо (майяские языки)
lishán didán ("наш язык") – еврейско-арамейские языки
ombeayiiüts ("наш язык") – язык уаве (Мексика)
nou ling ("наш язык") – индо-португальский креол
ŋyeshaŋ ("наш язык") – язык мананг (Непал, ТБ языки)
meänkieli ("наш язык") – финский диалект в Швеции
и т.д.
Слайд 32Мнение носителей
В пределах языка/народа м.б. много самоназваний, и наоборот, одно самоназвание
может использоваться для нескольких языков.
пушту: пашто, пахто, пухто, пушту, ..
(см. также примеры выше про народы)
Слайд 33Мнение носителей
Мнение о языках легко формируется государством и сми.
Молдавский/румынский язык в
Молдавии: в 2004 г. 17% назвало своим родным языком румынский, а 60% – молдавский.
Черногорский язык: 22% в 2003, 37% в 2011.
Боснийский/босняцкий/босанский язык.
Слайд 34Мнение носителей
Как говорят многие носители:
«Ты лингвист, ты и скажи нам,
диалект это или язык».
Слайд 35Выполнимость критериев:
Универсальность — ✘
Постоянство во времени – ~
Непротиворечивость – ✘
Генет.
последовательность — ~
Мнение носителей
Слайд 36Политический фактор
Законы могут влиять на …
названия гос.языков и тем самым самоиндентификацию
носителей (сх, молд, индонез.)
признание тех или иных идиомов (региональными) языками (Европейская хартия)
непризнание языков языками (Китай)
Слайд 37Политический фактор
молдавский и румынский языки в советское время считались разными языками,
сейчас в Молдавии используются то одно, то другое название;
малайский язык в Индонезии официально именуется индонезийским, в Малайзии используются оба названия: «малайский» и «малайзийский»;
1. Названия языков часто определяются гос.актами, что может повлиять на самоиндентификацию носителей:
Слайд 38Политический фактор
2. Признание тех или иных идиомов (региональными) языками (Европейская хартия)
не
все страны хотят её принимать (Франция)
идиом м.б. признан в одном гос-ве языком, а в другом оставаться диалектом (лимбургский в Нидерландах и Бельгии)
Слайд 39Политический фактор
3. Непризнание языков языками.
Однако в одних случаях лингвисты обращают
внимание на мнение государства (Китай), в других считают его реактивным (Грузия – мегрелы, сваны) .
Слайд 40«Язык — это диалект
с армией и флотом»
Шутливая фраза, популяризованная Максом
Вайнрайхом, имеет мало смысла. Есть много государств с армиями (США, Бразилия, арабские страны), диалекты которых ничуть не становятся языками, и наоборот.
Единственный её возможный смысл: когда возникает новое государство, местный идиом может быть провозглашён отдельным языкам (иногда со сменой названия): Югославия, Индонезия.
Обратный случай: Молдавия.
Слайд 41Сводная таблица требований критериев
Слайд 42Примеры сложных ситуаций
На практике используется некоторое мозаичное переплетение разных критериев. В
одних случаях мы ориентируемся на то, в других на это.
Но нередко консенсус среди лингвистов признаёт наличие отд. языка, даже когда ни один из внешних критериев не работает.
Слайд 44Черногория
В 2011 году:
45% считало себя черногорцами
37% назвало свой язык черногорским.
Эти цифры
меняются с каждым годом:
Слайд 45Примеры сложных ситуаций
Во всех этих случаях играют роль только лингвистические различия.
Слайд 46Внутренние критерии (структурные)
Опираются на фактические различия между идиомами. Должны быть независимы
от мнения людей.
Требуется сначала определить признаки сравнения, а затем пороговый уровень отличий.
Возможны несколько подходов.
Слайд 47Сравнительно-исторический метод
Взаимопонятность
Измерение структурных различий
Внутренние критерии (структурные)
Слайд 48Сравнительно-исторический метод – хорош для определения степени близости диалектов и границ
между ними.
Позволяет определить относительные различия, но не даёт ответа на вопрос, где начинается уже отдельный язык.
Можно использовать как дополнительный к другим способам.
Сравнительно-исторический метод
Слайд 49Взаимопонятность
Наиболее популярный лингвистический критерий: если носители разных идиомов достаточно хорошо понимают
друг друга (говоря каждый на своем идиоме), значит они говорят на диалектах одного языка, если же нет — на разных языках.
Слайд 50Взаимопонятность
На практике осложняется многими другими факторами: предварительное знакомство с языком собеседника,
тема общения, само желание или нежелание понимать собеседника и прочее.
Поэтому этот структурный критерий становится социально обусловленным.
Кроме того, нередки ситуации «полукоммуникации», когда каждый из собеседников говорит на родном языке, но при этом свободно воспринимает язык собеседника.
Слайд 51Взаимопонятность
Сложен в применении: обычно определяется на глазок.
Существует сложные методики, которые
требуют значительных усилий и всё равно не убирают до конца субъективности.
Слайд 52Измерение
структурных различий
Можно предположить, что степени взаимопонятности соответствует степень структурных различий.
Однако, как их измерить?
Неизвестно универсального способа сравнить разницу в грамматике для всех языков в мире.
Остаётся лексика.
Слайд 53Измерение
структурных различий
Но лексики тоже много и всю её сравнивать тоже
будет не универсально.
Остаётся базовая лексика.
И здесь наиболее оптимально использовать 100-словный список Сводеша, по которому уже накоплен большой опыт сбора и большое количество собранных списков.
Слайд 54Лексикостатистика
Гипотеза:
Предположим, что есть такой порог, что если процент совпадений (ПС)
по списку базовой лексики между двумя идиомами ниже его, то их можно считать двумя разными языками, если выше – диалектами одного языка.
Слайд 55Лексикостатистика
Идея не новая:
Сводеш / Вурм: 80%
Кауфманн (индейские языки)
Предлагаемая ниже система призвана
привнести некоторый порядок в этот хаос, как некогда Линней – в систематику живых существ.
Слайд 56Лексикостатистика
Для проверки нужны много качественно собранных и обработанных списков.
Лучший источник: Глобальная
лексикостатистическая база данных (GLD) — http://starling.rinet.ru/cgi-bin/main.cgi?root=new100&encoding=utf-rus созданная силами московских компаративистов под руководством Г.Старостина и А.Касьяна. На февраль 2016 включала списки по 412 языкам из 87 групп и продолжает развиваться.
Использовались также другие источники, но они менее надёжны.
Слайд 57Лексикостатистика
Попробуем определить этот порог.
Возьмём ПС для 130 пар близкородственных идиомов
(ПС > 80).
Расположим их по двум осям:
y – процент совпадений
x – наше представление о том, между какими парами есть взаимопонимание.
Для части пар мы заранее не знаем – серая зона.
Слайд 58серая зона – мы не знаем, языки это или диалекты.
Слайд 64Сравнение
Итак, мы видим, что границу между диалектами и языками (если не
брать во внимание пары в серой зоне) можно провести между 90 и 89 %.
Возможно лучше считать 89-90% переходной зоной и учитывать в таких случаях дополнительные факторы.
Слайд 65Соотношение 2 типов «языка» и терминология
Традиционный "язык" и лингвистический "язык "
могут соотноситься тремя способами:
языктрад > языклинг (макроязык)
язык = язык
языктрад < языклинг (язык. кластер)
Слайд 66языктрад > языклинг
Один традиционный «язык» на самом деле состоит из нескольких
языков.
Может употребляться термин «макроязык», чтобы показать их социальное единство:
арабские, китайские, даргинские, хантыйские, греческие, итальянский…
Слайд 67Итальянский
Чётко разбиваются ретороманские, причём фриульский объединяется с венетским.
Хорошо выделяются:
сев.-итальянский ареал
тосканский язык
южно-итальянский язык
Слайд 68Итальянский
Североитальянский (без «н») представляет собой типичный диалектный континуум. Приблизительно его можно
разделить на 3 части:
Запад: пьемонтско-лигурийский
Север: ломбардский
Юго-восток: эмильяно-романьольско-венетско-фриульский
Эмильянская зона
Романьольско-нижневенетская зона
Верхневенетско-фриульская зона
Слайд 69Обско-угорские языки
Выделяются три хантыйских языка:
северный
южный
восточный
Мансийский: континуум из трёх компонентов
Слайд 70Китайские языки
Один из камней преткновения.
Даже по традиционным методам неоднозначно.
Взаимопонимание отсутствует.
Лексикостатистика даёт
огромные расхождения: больше чем для германских или романских.
Однако данных по отдельным идиомам пока очень мало, поэтому сказать сколько именно языков пока нельзя.
Слайд 71Другие случаи
Пары с ПС < 90 % (т.е. языки):
греческие языки: отдельно
цаконский, каппадокийский, фарасский; другие пока не посчитаны;
арабские языки – ПС между меккским и ливанским «д-тами» = 83%, требуется дальнейшее изучение.
Слайд 72языктрад < языклинг
Несколько традиционных языков на самом деле являются диалектами/наречиями одного
языка.
Этот случай более тяжело воспринимается как лингвистами, так и носителями.
По сути он не так важен, как первый случай.
Слайд 73языктрад < языклинг
Таксономически в таких случаях вводиться несколько иная терминология:
Слайд 74Скандинавские языки
Состоят из двух языковых кластеров (=языков):
островной кластер с двумя традиционными
«языками» (=наречиями): исландским и фарерским
континентальный кластер с тремя «языками»: норвежским, шведским, датским (вкл. букмол)
Слайд 75Восточнославянские языки
Наиболее близки оказываются белорусский и украинский (ПС = 95), а
у русского усреднённый ПС с ними = 88,7.
Т.е. можно говорить о белорусско-украинском языковом кластере с двумя «языками».
Слайд 76Другие примеры
Пары с ПС > 90 % (т.е. диалекты):
96: коми-зырянский /
пермяцкий
96: ульчский / орокский
95: украинский / белорусский
95: кетский / югский
93: корякский / алюторский
91: чешский/словацкий
Слайд 77Сложные ситуации
Диалектный континуум
Пиджинизация и смешанные языки
Сильное иноязычное или межъязычное влияние: количество
заимстований извне или между сравниваемыми идиомами зашкаливает (балкано-романские)
Слайд 78Выводы
Существует две сущности под названием «язык»:
собственно язык – набор лингвистических характеристик,
сидящий в голове у носителя
социальный язык – это проекция собственно языка, на которую наложены другие факторы, типа этнического сознания, лит. языка, политики и т.д.
Слайд 79Выводы
Не существует единых критериев для решения проблемы «язык или диалект».
Поэтому,
утверждая, что некий идиом является именно языком или именно диалектом, необходимо оговаривать, какой «язык» имеется в виду и на основании каких критериев делается этот вывод. Это значит, что на вопрос «язык или диалект?» нельзя ответить просто «да» или «нет», не оговаривая, что имеется в виду.
Слайд 80Выводы
Для разных целей может быть востребовано то или иное понимание языка.
Для целей, описанных в начале, важно скорее структурное понимание.
Но «социальный язык» тоже очень интересен и должен изучаться.
Присылайте вопросы и предложения: ybkoryakov@gmail.com
СПАСИБО!