Тема 16. Непараметрические критерии. Факторный анализ. презентация

Содержание

Параметрические и непараметрические критерии Такие статистические критерии, как z, t и F называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез

Слайд 1Тема 16. Непараметрические критерии. Факторный анализ.
16.1. Однофакторный непараметрический анализ. Критерий

Краскела-Уоллиса
16.2. Двухфакторный непараметрический анализ. Критерий Фридмана

Слайд 2Параметрические и непараметрические критерии
Такие статистические критерии, как z, t и F

называются параметрическими.
Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез о типе распределения.

Кроме этого, статистики разработали направление, которое развивает непараметрические критерии. В этом случае вид и параметры распределения не рассматриваются. Эти критерии используют, в частности, для исследования генеральных совокупностей, которые не распределены нормально.

Слайд 316.1. Критерий Краскела-Уоллиса
Kruskal-Wallis Test


Слайд 4Пример данных
Имеется ли разница в среднем возрасте учителей, администрации и обслуживающего

персонала школы? Взяты выборки из трех генеральных совокупностей.

Слайд 5Критерий Краскела-Уоллиса
В дисперсионном анализе используется F-критерий, чтобы сравнивать средние трех и

более совокупностей. Для критерия ANOVA предполагается, что совокупности нормально распределены и что дисперсии совокупностей равны. Когда эти условия не выполняются, то для сравнения трех и более средних может использоваться непараметрический критерий Краскeла–Уоллиса.

Критерий Краскела-Уоллиса – непараметрический тест, который использует ранги трех и более независимых выборок. Применяется для проверки гипотезы о том, что выборки получены из генеральных совокупностей, имеющих одинаковый закон распределения:
H0: распределения генеральных совокупностей совпадают
H1: распределения отличаются


Слайд 6Условия применения
Выборки независимы и получены случайным образом.
Размер каждой выборки должен быть

не меньше пяти. В этом случае исследуемое распределение приближается к χ2-распределению с (k – 1) степенями свободы, где k – число градаций признака.
Для выборок меньшего размера требуются специальные таблицы.
Нет ограничений на то, что генеральная совокупность имеет нормальный закон распределения или любой иной определенный закон.

Слайд 7Суть критерия
1. В критерии Краскела–Уоллиса все выборки перемешиваются и значения ранжируются.

Далее вычисляются средние ранги для каждой выборки и средний ранг по всем данным.
2. Если выборки взяты из различных совокупностей, средние ранги выборок будут сильно различаться, значение Н будет велико, нулевая гипотеза будет отвергнута.
3. Для двух выборок критерий совпадает с критерием Вилкоксона.

Слайд 8Вычисления в таблице


Слайд 9Критическая область
Критерий использует правостороннюю критическую область.

Для нахождения критических значений используем

таблицу χ2-распределения с количеством степеней свободы df = (k – 1).



χ2(α; k -1)


Слайд 10Статистика
Формула статистики Краскела-Уоллиса:

где: – средние ранги выборок (i = 1,2,3,…,k)

– средний ранг по всем выборкам:



– объемы выборок



Слайд 11Вычисляем значение статистики





Слайд 12Находим границу критической области
Снова воспользуемся таблицами EXCEL для нахождения границы критической

области:
ХИ2ОБР (0,05; 2) = 5,991



Слайд 13Сравниваем и делаем вывод
Полученное значение статистики не попало в критическую область:







Вывод.

Мы не имеем оснований отклонить основную гипотезу. Значит, не существует значимого различия между выборками.



5,991

2,602


Слайд 14Находим в SPSS
Kruskal-Wallis Test

Значение критерия
Имеется небольшое отличие от вычисленного нами вручную

2,602

Слайд 15Статистика – вторая формула
Формула статистики Краскела-Уоллиса:

где: Ri – сумма рангов

i-ой выборки (i = 1,2,3,…,k)
ni – размер i-ой выборки
k – количество уровней фактора



Слайд 16Вычисления в таблице
Ранжируем выборки от 1 до 19 и затем суммируем

ранги каждой выборки отдельно.

Слайд 17Вычисляем значение статистики

Очевидно, мы получили то же самое значение статистики H.


Слайд 1816.2. Критерий Джонкхиера
Jonckheere Test


Слайд 19Критерий Джонкхиера
Не изучаем!
Ура!


Слайд 2016.3. Критерий Фридмана
Friedman Test


Слайд 21Факторы A и B
На результаты наблюдений могут оказывать два и более

факторов.
Рассмотрим двухфакторную модель.

Будем считать, что:
A – главный фактор
B – мешающий фактор

Уровни основного фактора – обработки
уровни мешающего фактора – блоки

Влияние основного фактора – эффекты обработки
Влияние мешающего фактора – эффекты блоков


Слайд 22Таблица двухфакторного анализа
Фактор А имеет n уровней, фактор В имеет k

уровней. Таблица содержит nk наблюдений – по одному наблюдению в каждой клетке.


Слайд 23Модель двухфакторного анализа
Результат наблюдения является суммой самостоятельных вкладов соответствующих уровней каждого

фактора и случайности эксперимента:


Влияние фактора B

Влияние фактора A

Среднее

Влияние случайности


Слайд 24Гипотезы
Проверяемая гипотеза:
H0: влияние фактора A отсутствует
H1: влияние фактора имеется

В другой формулировке:
H0:

α1 = α2 = … = αk = 0
H1: не все αi равны нулю


Слайд 25Переход к таблице рангов
Ранжируем значения в каждой строке. Переходим к таблице

рангов.

Слайд 26Суть критерия
При ранжировании результатов наблюдений по строкам, мы устраняем влияние мешающего

фактора В, значение которого для каждой строки таблицы постоянно.
Если гипотеза верна и воздействие фактора А отсутствует, то любая последовательность рангов в строке одинаково вероятна.


Слайд 27Статистика Фридмана
Формула статистики Фридмана:

где: – средние ранги по столбцу (i

= 1,2,3,…,k)

– средний ранг по таблице рангов:



Слайд 28Статистика Фридмана – вторая формула
Формула статистики Фридмана:

где: – все ранги

в таблице



Слайд 29Пример
На уровне α=0,05 проверить влияние каждого из факторов на результаты измерений.


Слайд 30Решение. Ранжируем по строкам


Слайд 31Хорошо ли перемешаны ранги?


Слайд 32Находим средние ранги по столбцам


Слайд 33Хорошо ли перемешаны ранги?
Это покажет критерий!


Слайд 34Вычисляем статистику




Слайд 35Считаем в SPSS
Критическое значение равно 5,99.

Это означает, что нет оснований отвергать

основную гипотезу.

Мы получили, что такой фактор как «тип коробки передач» не оказывает существенного влияния на время разгона автомобилей.


Задача составлена в учебных целях.
Данные взяты «с потолка».

Friedman Test



Слайд 36Вторая проверка
Критерий Фридмана используется для второй проверки. В этом случае, мы

считаем уже, что:
A – мешающий фактор
B – главный фактор

Ранжирование приводим по столбцам, чтобы устранить влияние мешающего фактора.



Слайд 37Решение. Ранжируем по столбцам


Слайд 38Решение. Ранжируем по столбцам
Далее как обычно


Слайд 3917. Как проводить исследование
Классификация методов курса


Слайд 40Выбор метода
Какой тип
данных?
Интервальные
данные
Порядковые
данные
Номинальные
данные
1.1. Одна совокупность
1.2. Две совокупности
1.3.

Более двух

2.2. Одна совокупность

2.3. Две совокупности

2.4. Более двух

3.1. Таблицы сопряженности

3.2. Доли признака


Слайд 411.1. Интервальные данные, одна совокупность
1.1. Одна совокупность
Среднее
Дисперсия
Доверительный
интервал
Проверка
гипотезы
Доверительный
интервал
Проверка
гипотезы


Слайд 421.1. Интервальные данные, одна совокупность
1.1. Одна совокупность
Среднее
Дисперсия
Доверительный
интервал
Проверка
гипотезы
Доверительный
интервал
Проверка
гипотезы
8.2.


8.4.

9.1.

9.4.


Слайд 431.2. Интервальные данные, две совокупности
1.2. Две совокупности
Средние
Дисперсии
Корреляция,
регрессия


Слайд 441.2. Интервальные данные, две совокупности
1.2. Две совокупности
Средние
Дисперсии
Корреляция,
регрессия
10.1-4.
10.5.
12.1-3.


Слайд 45Порядковые данные
Порядковые
данные
2.2. Одна совокупность
2.3. Две совокупности
2.4. Более двух
Независимые выборки
Парные

выборки

Слайд 46Порядковые данные
Порядковые
данные
2.2. Одна совокупность
2.3. Две совокупности
2.4. Более двух
Независимые выборки
Парные

выборки

16.1.

14.1.

14.3-4.

14.1-2.


Слайд 47Номинальные данные
Номинальные
данные
3.1. Таблицы сопряженности
3.2. Доли признака
Две совокупности
Одна совокупность


Слайд 48Номинальные данные
Номинальные
данные
3.1. Таблицы сопряженности
3.2. Доли признака
Две совокупности
Одна совокупность
8.3.
9.3.
10.6-7.


11.3.


Слайд 49Понятия и термины


Слайд 50Задание на 5 минут
Чем коэффициент Спирмена отличается от коэффициента Пирсона?


Слайд 51Задачи
16-1. Измеряется самооценка в трех различных выборках индивидов по порядку

рождения. Количество набранных баллов ранжируется от 0 до 50. Существует ли разница в количестве набранных баллов на уровне значимости α = 0,05?

Слайд 52Задачи
16-2. Крупный овощной магазин решает начать рекламировать продукт тремя различными способами:

по радио, по телевидению, в газетах. По результатам продаж в течение одной недели в случайно выбранных магазинах были получены следующие данные. Существует ли разница в продажах в связи с типом рекламирования товара на уровне значимости α = 0,01?

Слайд 53Задачи
16-3. Клубнику выращивают на трех различных типах почвы. Урожай (в квартах)

на одинаковых участках представлен ниже. Существует ли различие в количестве урожая для трех участков на уровне значимости α = 0,01?

Слайд 54Задачи
16-4. Недавно проведенное исследование установило количество предложений о работе, принимаемых выпускниками

инженерами-химиками в трех различных колледжах. Существует ли на уровне значимости α = 0,01 различие между средним количеством принятых предложений о работе в этих колледжах ?

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика