Слайд 1гетероскедастичность
лекция 13
Слайд 2Цели лекции
Природа проблемы гетероскедастичности
Последствия гетероскедастичности
Средства обнаружения гетероскедастичности
Средства для решения или смягчения
проблемы гетероскедастичности
Слайд 3ГЕТЕРОСКЕДАСТИЧНОСТЬ
Ортогональность – ошибки некоррелированы с регрессорами
Сферичность – ошибки независимы, случайны
Нормальность
– ошибки распределены нормально с нулевым средним
Идентичность – ошибки одинаково распределены
ВЫПОЛНЕНИЕ ЭТИХ УСЛОВИЙ- ГОМОСКЕДАСТИЧНОСТЬ
Слайд 4ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Гетероскедастичность – это неоднородность
наблюдений. Она характеризуется тем, что не
выполняется предпосылка
20 использования МНК:
Выполнимость предпосылки 20 называется
гомоскедастичностью.
Слайд 5ИЛЛЮСТРАЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 6ГЕТЕРОСКЕДАСТИЧНОСТЬ ОШИБОК
Причиной непостоянства дисперсии
эконометрической модели часто является ее зависимость
от масштаба рассматриваемых
явлений.
В модель ошибка входит как аддитивное слагаемое. В то же время часто она имеет относительный характер и определяется по отношению к измеренному уровню рассматриваемых факторов.
Слайд 7ПРИМЕР
(зависимость выпуска промышленного сектора от ВВП в 2000г. по странам)
y
x
Слайд 8Примеры моделей с гетероскедастичным случайным членом
а)
в)
б)
а) Дисперсия σε2 растет по мере
увеличения значений объясняющей переменной X
б) Дисперсия σε2 имеет наибольшие значения при средних значениях X, уменьшаясь по мере приближения к крайним значениям
в) Дисперсия ошибки наибольшая при малых значениях X, быстро уменьшается и становится однородной по мере увеличения X
Слайд 9ИСТИННАЯ И ЛОЖНАЯ ГЕТЕРОСКЕДАСТИЧНОСТЬ
1. Истинная гетероскедастичность
Вызывается непостоянством дисперсии случайного
члена, ее зависимостью
от различных факторов.
2. Ложная гетероскедастичность
Вызывается ошибочной спецификацией модели регрессии.
Слайд 10Источники гетероскедастичности – 1
Истинная гетероскедастичность возникает в перекрестных выборках при зависимости
масштаба изменений зависимой переменной от некоторой переменной, называемой фактором пропорциональности (Z).
Слайд 11Источники гетероскедастичности – 1
Наиболее распространенный случай истинной
гетероскедастичности – 1: дисперсия растет
с
ростом одного из факторов.
Слайд 12Источники гетероскедастичности – 2
Истинная гетероскедастичность возникает также и
во временных рядах, когда
зависимая переменная
имеет большой интервал качественно
неоднородных значений или высокий темп
изменения (инфляция, технологические сдвиги,
изменения в законодательстве, потребительские
предпочтения и т.д.).
Слайд 13Гетероскедастичность как следствие ошибки спецификации модели. Пример
Если вместо истинной (гомоскедастичной) модели
используется
линейная модель ,
то дисперсия остатков линейной модели пропорциональна
квадрату переменной Xj:
Слайд 14
20
Гетероскедастичность как следствие ошибки спецификации модели. Пример
Слайд 15Гетероскедастичность простейшего вида
Мы в дальнейшем будем рассматривать, главным
образом, только гетероскедастичность простейшего
вида:
Слайд 16СЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
1. Истинная гетероскедастичность не приводит к
смещению оценок коэффициентов регрессии
2. Стандартные
ошибки коэффициентов
(вычисленные в предположении.
гомоскедастичности) будут занижены. Это
приведет к завышению t-статистик и даст
неправильное (завышенное) представление о
точности оценок.
Слайд 17ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Обнаружение гетероскедастичности в каждом конкретном
случае – довольно сложная задача.
Для знания
необходимо знать распределение случайной
величины Y/X=xi . На практике часто для каждого
конкретного значения xi известно лишь одно yi, что не
позволяет оценить дисперсию случайной величины Y/X=xi.
Не существует какого-либо однозначного метода определения гетероскедастичности.
Слайд 18Предварительная работа:
1. Нет ли очевидных ошибок спецификации?
2. Можно ли содержательно предполагать
какой-то
вид гетероскедастичности?
3. Рассмотрение графиков остатков:
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 19In the scatter diagram manufacturing output is plotted against GDP, both
measured in U.S. $ millions, for 30 countries for 1997. (Data are from the UNIDO Yearbook. The sample is restricted to countries with GDP at least $10 billion and GDP per capita at least $2000.)
The scatter diagram is dominated by the observations for Japan and the USA and it is difficult to detect any kind of pattern.
17
Japan
USA
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 20
However it those two countries are dropped and the scatter diagram
rescaled, a clear picture of heteroscedasticity emerges.
The reason for the heteroscedasticity is that variations in the size of the manufacturing sector around the trend relationship increase with the size of GDP.
19
South Korea
Mexico
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 21
Singapore and Greece are another pair of countries with relatively large
and small manufacturing sectors. However, because the GDP of both countries is small, their variations from the trend relationship are also small.
21
Singapore
Greece
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 22Тесты:
1. Тест ранговой корреляции Спирмена.
2. Тест Парка.
3. Тест Глейзера.
4. Тест Голдфелда-Квандта.
5.
Тест Уайта.
6. Тест Бреуша-Пагана.
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Слайд 23ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
При использовании данного теста
предполагается, что дисперсии отклонений
остатков будут
монотонно изменятьcя
(увеличиваться или уменьшаться) с увеличением
фактора пропорциональности Z.
Поэтому значения ei и zi будут коррелированы (возможно, нелинейно!).
Слайд 24ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения
1. Рассчитываются ранги (порядковые номера)
значений фактора
пропорциональности zi = xik.
2. Рассчитывается уравнение
и вычисляются остатки .
3. Рассчитываются ранги остатков ei.
Слайд 25ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА. Алгоритм применения
4. Рассчитывается коэффициент ранговой корреляции Спирмена
, Di – разность рангов z и e.
5. Рассчитывают статистику ,
распределенную нормально N(0,1) при отсутствии
гетероскедастичности.
Слайд 26ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
. spearman gdppop resid
Number of obs =
28
Spearman's rho = 0.0285
Test of Ho:
gdppop and resid are independent
Prob > |t| = 0.8857
Слайд 27ТЕСТ ПАРКА
Здесь предполагается, что дисперсии связаны
с фактором
пропорциональности Z в виде:
Т.к. дисперсии неизвестны, то их заменяют
оценками квадратов отклонений ei2.
Слайд 28ТЕСТ ПАРКА.
Алгоритм применения
1. Строится уравнение регрессии:
и вычисляются остатки
.
2. Выбирается фактор пропорциональности Z и
оценивают вспомогательное уравнение регрессии:
3. Проверяют значимость коэффициента при
Слайд 29ТЕСТ ГЛЕЙЗЕРА
Здесь предполагается, что дисперсии связаны
с фактором
пропорциональности Z в виде:
Т.к. средние квадратические отклонения
неизвестны, то их заменяют модулями оценок
отклонений .
Слайд 30ТЕСТ ГЛЕЙЗЕРА.
Алгоритм применения
1. Строится уравнение регрессии:
и вычисляются остатки
.
2. Выбирается фактор пропорциональности Z и оценивают
вспомогательное уравнение регрессии:
Изменяя γ, строят несколько моделей:
3. Статистическая значимость коэффициента α1 в каждом случае
означает наличие гетероскедастичности.
4. Если для нескольких моделей будет получена значимая
оценка α1 , то характер гетероскедастичности определяют по
наиболее значимой из них.
Слайд 31ТЕСТЫ ПАРКА и ГЛЕЙЗЕРА.
Выводы
Отметим, что как в тесте Парка, так
и в тесте
Глейзера для отклонений ηi может нарушаться
условие гомоскедастичности.
Однако, во многих случаях используемые в
тестах модели являются достаточно хорошими
для определения гетероскедастичности.
Слайд 32ТЕСТ БРЕУШ-ПАГАНА
Тест применим в предположении, что:
Дисперсии зависят
от некоторых
дополнительных переменных :
Слайд 33ТЕСТ БРЕУШ-ПАГАНА.
Алгоритм применения
1. Строится уравнение регрессии:
и вычисляются остатки:
2. Вычисляют оценку
дисперсии остатков:
3. Строят вспомогательное уравнение регрессии:
Слайд 34ТЕСТ БРЕУШ-ПАГАНА.
Алгоритм применения
4. Для вспомогательного уравнения регрессии определяют
объясненную часть вариации
RSS.
5. Находим тестовую статистику:
6. Если верна гипотеза H0: гомоскедастичность остатков, то
статистика BP имеет распределение . Т.е. о наличии
гетероскедастичности остатков на уровне значимости α
свидетельствует:
Слайд 35ТЕСТ БРЕУШ-ПАГАНА. Замечания
При
не существует естественного
преобразования, корректирующего гетероскедастичность
При гетероскедастичность может быть
скорректирована:
Слайд 36ТЕСТ БРЕУШ-ПАГАНА
. bpagan gdppop gdp pop
Breusch-Pagan LM statistic: 5.870285
Chi-sq( 3) P-value = .1181
var(y) = s^2 exp( b1z1 + b2z2 + ... + bkzk)
Слайд 37ТЕСТ ГОЛДФЕЛДА-КВАНДТА
В этом тесте предполагается:
1. Стандартные отклонения остатков
пропорциональны фактору пропорциональности
Z, т.е.
2.
Случайный член ε имеет нормальное распределение и отсутствует автокорреляция остатков (предпосылка 30).
Слайд 38ТЕСТ ГОЛДФЕЛДА-КВАНДТА.
Алгоритм применения
1. Выделяют фактор пропорциональности Z = Xk.
Данные упорядочиваются
в порядке возрастания
величины Z.
2. Отбрасывают среднюю треть упорядоченных
наблюдений. Для первой и последней третей
строятся две отдельные регрессии, используя ту же
спецификацию модели регрессии.
3. Количество наблюдений в этих подвыборках
должно быть одинаково. Обозначим его l.
Слайд 39ТЕСТ ГОЛДФЕЛДА-КВАНДТА.
Алгоритм применения
4. Берутся суммы квадратов остатков для регрессий по
первой
трети RSS1 и последней трети RSS3. Рассчитывают
их отношение:
5. Используем F-тест для проверки гомоскедастичности.
Если статистика GQ удовлетворяет неравенству
то гипотеза гомоскедастичности остатков отвергается на
уровне значимости α.
Слайд 40ТЕСТ ГОЛДФЕЛДА-КВАНДТА.
Замечание
Тест Голдфелда-Квандта применим и для случая
обратной пропорциональности:
При этом используется
та же процедура, но тестовая
статистика равна:
Слайд 41
13
RSS2 = 13,518,000,000
RSS1 = 157,000,000
ТЕСТ ГОЛДФЕЛДА-КВАНДТА
Пример.
Слайд 42
11
RSS2 = 13,518,000,000
RSS1 = 157,000,000
ТЕСТ ГОЛДФЕЛДА-КВАНДТА
Пример.
Слайд 43ТЕСТ УАЙТА
Предполагается, что дисперсии связаны
с объясняющими переменными
в виде:
где f(⋅) – квадратичная функция от аргументов.
Т.к. дисперсии неизвестны, то их заменяют
оценками квадратов отклонений ei2.
Слайд 44ТЕСТ УАЙТА.
Алгоритм применения
(на примере трех переменных)
1. Строится уравнение регрессии:
и
вычисляются остатки .
2. Оценивают вспомогательное уравнение регрессии:
Слайд 453. Определяют из вспомогательного уравнения тестовую
статистику
4. Проверяют общую значимость уравнения с
помощью
критерия χ2. Если
то гипотеза гомоскедастичности отвергается. Число
степеней свободы k равно числу объясняющих
Переменных вспомогательного уравнения. В частности,
Для рассматриваемого случая k = 9.
ТЕСТ УАЙТА.
Алгоритм применения
(на примере трех переменных)
Слайд 46ТЕСТ УАЙТА.
Замечания
Тест Уайта является более общим чем тест
Голдфелда-Квандта.
Неудобство использования теста
Уайта:
Если отвергается нулевая гипотеза о наличии гомоскедастичности
то неясно, что делать дальше.
Слайд 47ТЕСТ УАЙТА
. white
White's test for
Ho: homoscedasticity
against Ha: unrestricted heteroscedasticity
test statistic W = 3.616674
Pr(chi2(2) > W) = 0.1639
---------------------------------------------------
Слайд 48КОРРЕКЦИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
1. Использовать обобщенный метод наименьших
квадратов.
2. Переопределить переменные.
3. Вычисление стандартных ошибок
с поправкой на
гетероскедастичность (метод Уайта).
Слайд 49ОБОБЩЕННЫЙ
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
При нарушении гомоскедастичности и наличии автокорреляции
остатков рекомендуется вместо
традиционного МНК
использовать обобщенный МНК. Его для случая устранения
гетероскедастичности часто называют методом взвешенных
наименьших квадратов.
Основан на делении каждого наблюдаемого значения на соответствующее ему стандартное отклонение остатков.
Метод применим, если известны дисперсии для каждого наблюдения.
Слайд 50МЕТОД
ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии
Получили уравнение регрессии без свободного
члена, но с
дополнительной объясняющей переменной Z и с
«преобразованным» остатком ν. Можно показать, что для
него выполняются предпосылки 10 – 50 МНК.
Слайд 51На практике, значения дисперсии остатков, как
правило, не известны. Для применения метода
ВНК
необходимо сделать реалистичные предположения об этих
значениях. Например:
Дисперсии пропорциональны Xi:
Дисперсии пропорциональны Xi2:
МЕТОД
ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ. Случай парной регрессии