Тема 14. Непараметрические критерии. Проверка однородности презентация

Содержание

Параметрические и непараметрические критерии Такие статистические критерии, как z, t и F называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез о

Слайд 1Тема 14. Непараметрические критерии. Проверка однородности
14.1. Критерий знаков
14.2. Знако-ранговый критерий
14.3. Критерий

Манна-Уитни
14.4. Критерий Вилкоксона

Слайд 2Параметрические и непараметрические критерии
Такие статистические критерии, как z, t и F

называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности - среднем, дисперсии, доли; либо гипотез о типе распределения.
Кроме этого, статистики разработали направление, которое развивает непараметрические критерии. В этом случае вид и параметры распределения не рассматриваются. Эти критерии используют, в частности, для исследования генеральных совокупностей, которые не распределены нормально.

Слайд 3Четыре преимущества непараметрических методов
Они могут использоваться для проверки гипотез о параметрах

генеральной совокупности, когда переменная не распределена нормально.
Они могут использоваться для номинальных и порядковых данных.
Они могут использоваться для проверки гипотез, которые не связаны с параметрами генеральной совокупности.
В большинстве случаев для непараметрических методов подсчеты проще, чем для параметрических. Они более понятны.

Слайд 4Три недостатка непараметрических методов
Они менее точны, чем соответствующие параметрические методы. Следовательно,

требуются более значительные отклонения, чтобы отвергнуть нулевую гипотезу.
Они менее информативны, чем параметрические критерии. Например, критерий знаков позволяет исследователю определить, превосходит значение данных медиану или нет, но не отвечает – на сколько именно.
Они менее эффективны, чем соответствующие параметрические критерии. Например, непараметрический критерий знаков дает лишь 60% эффективности от того, что можно получить, используя его параметрическое соответствие – z-критерий. Требуется больший объем выборки, чтобы компенсировать утрату информации: нужна выборка из 100 человек для критерия знаков, в то время, как для аналогичных результатов при использовании z-критерия достаточно было бы выборки из 60 человек.

Слайд 5Сравнение эффективности
Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально

распределенной генеральной совокупности.

Слайд 614.1. Критерий знаков
Sign Test


Слайд 7Пример 1. Кадровые предпочтения
Руководство сети ресторанов быстрого обслуживания обратило внимание, что

кадровая служба сети отдает большее предпочтение на должность менеджера девушкам, нежели, чем юношам.
Среди менеджеров оказалось 30 юношей и 70 девушек. Усомнившись в разумности сложившихся пропорций, руководство запросило объяснений. Кадровая служба объяснила сложившуюся пропорцию результатом случайности, а не итогом определенных предпочтений.
Проверить на уровне значимости α=0,05, может ли такая пропорция оказаться результатом случайности.

Слайд 8Пример 2. Строительство башни
Несколько детей попросили из предоставленных им кубиков собрать

башню. Эксперимент повторили с этими же детьми через месяц, результаты времени (в секундах) представлены в таблице ниже.





На уровне значимости α=0,05 проверить предположение о том, что нет существенной разницы между результатами.

Слайд 9Пример 3. В день 40 леденцов
Владелец продуктового магазина строит гипотезу о

том, что медианное количество продаваемых им за день леденцов равно 40. Случайная выборка за 20 дней дает следующие данные по количеству леденцов, продаваемых каждый день.





При α = 0,05 проверить гипотезу владельца магазина.

Слайд 10Кадровые
предпочтения
В день
40 леденцов
Строительство
башни
Критерий знаков
Критерий знаков
Гипотеза
об однородности для


парных выборок

Гипотеза
о значении медианы

Гипотеза
о доли признака





Слайд 11На чем основан критерий
Последовательность n знаков разностей представляет собой последовательность случайных

величин - результатов независимых испытаний с двумя возможными исходами: “плюс” или “минус”. Если распределения совпадают, то в каждом испытании выполнено:



Количество плюсов и количество минусов есть случайные величины, которые распределены по биноминальному закону.
Малое количество одинаковых знаков (плюсов или минусов) или, наоборот, очень большое будет означать, что наша гипотеза неверна, поскольку, исходя их ситуации, количество плюсов и количество минусов должно быть в среднем одинаково.



Слайд 12Условия для применения критерия
1. Данные должны быть получены случайным образом.

2. Нет

никаких требований относительно закона распределения генеральных совокупностей, из которых эти данные получены.



Слайд 13Статистика
1. Объем выборки n≤25. Выбираем в качестве критерия:
x = min

(количество минусов, количество плюсов).

Критические значения находятся по таблице. Если x окажется меньше или равен критическому значению из таблицы, то гипотеза отвергается.

2. Объем выборки n>25. Тогда в качестве критерия выберем:




Критические значения находятся по таблице нормального закона.



Слайд 14Решение примера. Строительство башни
Гипотезы:
H0: изменений не произошло
H1: есть изменения

Имеем 12 плюсов,

2 минуса и 1 совпадение. Совпадение отбрасываем.
n=14
α=0,05
х = min(2,12) = 2

По таблице находим критическое значение 2.

Вывод. Результаты улучшились.

Слайд 15Решение примера. Кадровые предпочтения
Гипотезы:
H0: доля юношей в генеральной совокупности равна 0,5
H1:

доля юношей значимо отличается от 0,5

Выборка составила 100 человек: n=100. Статистика: x = min (30, 70) = 30
Поскольку n>25, вычислим значение критерия по формуле:



Для α=0,05 находим z = -1,96. (Двустороння область)





0

-3,9

-1,96


Слайд 16Решение примера. Кадровые предпочтения
Вывод. Поскольку значение статистики попало в критическую область,

мы отвергаем основную гипотезу и считаем, что кадровые предпочтения имеются.

Дополнительный вопрос. Имеется возможность ответить на вопрос – какое соотношение юношей и девушек не приведет к отклонению нулевой гипотезы? Элементарный подсчет приведет к тому, что граничной окажется ситуация с пропорцией, близкой к 40÷60 или 60÷40. В этих границах отклонение может рассматриваться как результат случайности.


Слайд 17Решение примера. В день 40 леденцов
Гипотезы:
H0: медиана равна 40
H1: медиана значимо

отливается от 40

Совпадения отбрасываем.
n=18, α=0,05, х = min (3,15) = 3

По таблице находим критическое значение 4.

Вывод. У нас достаточно оснований, чтобы отказаться от заявления, о том, что медиана продаваемых в день леденцов равна 40.


3 плюса, 15 минусов,
2 совпадения


Слайд 18Критические значения для критерия знаков


0
14
2
Критическая
область
для α=0,05

Таблица А-7.


Слайд 1914.2. Знако-ранговый критерий
Wilcoxon Signed-Ranks Test
for Matched Pairs


Слайд 20Что проверяет критерий
Знако-ранговый критерий проверяет гипотезу об однородности для парных выборок.

Требуется проверить, совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Часто проверяют наличие эффекта обработки: совпадение распределений «до» и «после» обработки.

Гипотезы формулируются следующим образом:
H0: выборки имеют одинаковый закон распределения
H1: законы распределения различаются



Слайд 21Условия применения критерия
1. Исследуются парные (зависимые) выборки, проверяется эффект обработки –

эксперименты «до» и «после».

2. Данные должны быть получены случайным образом.

3. Генеральная совокупность разностей имеет симметричное распределение, в том смысле, что правая часть графика является зеркальным отражением левой. При этом не требуется, чтобы данные имели нормальное распределение.

Слайд 22Последовательность действий
Шаг 1. Для каждой пары (x, y) рассматриваются разности d

= x – y. Устраняются пары, в которых разность равна нулю.
Шаг 2. Ранжируем полученные разности по абсолютной величине (игнорируя знаки).
Шаг 3. Находим сумму отрицательных рангов и сумму положительных рангов. Если выборки однородны, то эти суммы не могут сильно отличаться. Обозначим T – наименьшую из полученных сумм, n – число пар, в которых разности не равны нулю.
Шаг 4. Определим статистику:
если n≤30, статистика есть T,
если n>30, статистика есть:



Слайд 23Последовательность действий (2)
Шаг 5. Определим критические значения:
если n≤30, критические точки T

находятся по таблице А-8,
если n>30, критические z-точки находятся по таблице А-2.

Шаг 6. Получим вывод: если значение статистики попадает в критическую область, мы отклоняем нулевую гипотезу.



Слайд 24Решение примера. Строительство башни


Слайд 25Решение
Шаг 1. В таблице заполнен столбец разностей d = Исп.1 –

Исп.2. Устранена первая пара, в которой разность равна нулю.
Шаг 2. Следующий столбец заполняем рангами разностей по абсолютной величине (игнорируя знаки).
Шаг 3. Далее: сумма отрицательных рангов = 5,5
сумма положительных рангов = 99,5
число пар, в которых разности не равны нулю, n =14
Шаг 4. Определим статистику. Поскольку n≤30, статистика есть T=5,5
Шаг 5. Определим критическое значение. Поскольку n≤30, критическое значение 21.
Шаг 6. Вывод: значение статистики попало в критическую область. Отклоняем нулевую гипотезу.



Слайд 26Критические значения знако-рангового критерия
Таблица А-8.


26
Критическая
область
для α=0,05

0


Слайд 2714.3. Критерий Манна-Уитни
Mann-Whitney Test
for Two Independent Samples


Слайд 28Что проверяет критерий Манна-Уитни
Критерий Манна-Уитни проверяет гипотезу об однородности для двух

независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки.

Гипотезы формулируются следующим образом:
H0: выборки взяты из одной генеральной совокупности
H1: выборки взяты из разных генеральных совокупностей



Слайд 29Последовательность действий
Шаг 1. В критерии Манна-Уитни сравниваются все элементы первой выборки

со всеми элементами второй. Всего есть mn пар сравнений. Не рассматриваются пары, в которых разность равна нулю.
Шаг 2. Количества положительных разностей, полученных в результате таких сравнений для каждой выборки, сравниваются между собой и минимальное есть U - статистика Манна-Уитни.
Шаг 3. Зададим уровень значимости α (как правило 0,1; 0.05; 0.01).
Шаг 4. По таблицам найдем границу правосторонней критической области, которая зависит от объемов выборок и заданного нами уровня значимости.
Шаг 5. Сравним полученное по выборкам значение статистики с границей критической области и сделаем вывод.



Слайд 30Задача. Длина побегов
Исследователь интересуется, имеется ли разница между всхожестью семян на

двух соседних участках земли. Имеются следующие данные:

Слайд 31От данных к анализу


Слайд 32Выбор переменных для анализа
Указываем группы для анализа


Слайд 33Отчет об анализе
Mann-Whitney Test


99
0

41


Слайд 34Вычисление U в таблице
Ведем подсчет случаев уч.1 > уч.2 при сравнениях

по всем парам чисел. Заполняем столбец 2. Если пара совпадает, принимаем при подсчете за 0,5.

Выбираем минимальное из чисел 58 и 41.

41 есть значение U критерия, полученное по выборкам.



Слайд 3514.4. Критерий Вилкоксона
Wilcoxon Rank-Sum Test
for Two Independent Samples


Слайд 36Что проверяет критерий Вилкоксона
Критерий Вилкоксона проверяет гипотезу об однородности для

двух независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки.

Гипотезы формулируются следующим образом:
H0: выборки взяты из одной генеральной совокупности
H1: выборки взяты из разных генеральных совокупностей



Слайд 37Последовательность действий
Шаг 1. Перемешиваем две выборки и ранжируем их значения.

Шаг

2. Найдем сумму рангов первой и сумму рангов второй выборки. Если выборки однородны, то суммы не должны сильно отличаться. На этом основано действие критерия Вилкоксона.

Шаг 3. Определим критерий:
если n≤10, статистика W есть сумма рангов первой выборки.
если n>10, статистика есть:





Слайд 38Последовательность действий (2)
- объемы выборок, R – сумма рангов первой

выборки.







есть среднее значение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения

есть стандартное отклонение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения


Слайд 39Последовательность действий (3)
Шаг 4. Зададим уровень значимости α (как правило 0,1;

0.05; 0.01).

Шаг 5. Определим критическую область:
если n≤10, критические точки W находятся по специальной таблице, которую мы не приводим.
если n>10, критические z-точки находятся по таблице А-2 (поскольку статистика основывается на нормальном распределении)

Шаг 6. Сравним полученное по выборкам значение статистики с границей критической области и сделаем вывод.



Слайд 40Пример. Простота чтения
Проверить гипотезу об однородности двух независимых выборок.

Можно

ли считать, что простота чтения одинакова для произведений двух исследуемых писателей?

Слайд 41Решение примера



Ранжировали две выборки, перемешав.

Нашли сумму рангов каждой выборки.

Сумма рангов

первой выборки равна 236,5.

Слайд 42Вычисления
Находим следующие величины:





Слайд 43Получение вывода
Критическая область является двусторонней и при α=0.05 критические точки z=-1,96

и z=-1,96. Полученное нами значение попадает в критическую область.

Вывод. Выборки не однородны, получены из разных генеральных совокупностей.

Слайд 44Решаем в SPSS



Слайд 45Вновь вспомним о растениях
Mann-Whitney Test


210
0

86





-1,96
1,96
-0,646


Слайд 46Сравнение эффективности
Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально

распределенной генеральной совокупности.

Слайд 47Понятия и термины


Слайд 48Задание на 5 минут
Как вы понимаете, что такое эффект взаимодействия. Что

с чем взаимодействует? Поясните на любом примере, где можно наблюдать эффект взаимодействия.

Слайд 49Задачи
14-1. Кворум избирателей. При опросе 1002 человек 701 из них сказал,

что собирается идти голосовать на выборах президента. Можно ли полагать, что большинство населения придет на выборы?

14-2. Аренда квартиры. Агент по продаже недвижимости предполагает, что средняя арендная плата за однокомнатную квартиру в городе составляет $325 в месяц. Выборка 12 однокомнатных квартир показала следующие месячные расценки. При α=0,05 достаточно ли у нас оснований, чтобы опровергнуть заявление агента по продаже недвижимости?

Слайд 50Задачи
14-3. Один дома. Из 50 опрошенных студентов 29 предпочитали бы жить

в общежитиях в одноместной комнате. При α=0,02 проверьте гипотезу о том, что более 50% студентов предпочитают жить в общежитиях в одиночку. Применить критерий знаков.

14-4. Повлияло ли лечение? Было проведено исследование, чтобы выяснить, повлияют ли новые диетические медикаменты на женщин, желающих сбросить вес. Вес 8 пациенток был измерен до лечения и через 6 недель ежедневного применения лечения. Данные приведены ниже. При α = 0,05 можно ли сделать вывод, что лечение повлияло (увеличило или уменьшило) на вес этих женщин? Применить критерий знаков.

Слайд 51Задачи
14-5. Изменения в отношениях. Восьми супружеским парам была предложена анкета на

супружескую совместимость. После прохождения парами семинара, им дали вторую анкету, чтобы выяснить, произошли ли какие-либо изменения в их поведении по отношению друг к другу. Данные приведены ниже. При α = 0,10 есть ли различия в результатах пар?

Слайд 52Задачи
14-6. Мужчины и женщины. Для сравнения уровня заработной платы были отобраны

(в соответствии со стажем) работники-мужчины и работники-женщины. В таблице ниже приведены получившиеся данные (в тысячах рублей). При α = 0,10 есть ли различие в зарплатах мужчин и женщин?

Слайд 53Задачи
14-7. Однородность. Проверить гипотезу об однородности следующих выборок:


Слайд 54Задачи
14-8. Читают ли замужние? Исследователь опросил замужних и одиноких женщин, чтобы

проверить, есть ли разница в том, сколько книг те и другие прочитали в течение прошлого года. Данные приведены ниже. При α=0,10 проверьте заявление о том, что обе группы прочли одинаковое количество книг.

Слайд 55Задачи
14-9. Кто больше любит свою работу? Двум группам рабочих дали вопросники,

чтобы установить степень их удовлетворенности работой. Задавалась шкала диапазоном от 0 до 100. Группы делились по стажу: те, кто работал более 5 лет, и те, кто работал менее 5 лет. Данные приведены ниже. При α=0,10, проверьте заявление о том, что между удовлетворенностью работой двух групп нет разницы.

Слайд 56Задачи
14-10. Как работают одинокие? Инспекторам было поручено оценить продуктивность работы служащих.

Исследователь хочет узнать, у кого она выше: у людей, живущих в браке, или у одиноких? Диапазон шкалы оценки продуктивности составляет от 1 до 50. Данные приведены ниже. При α=0,01 достаточно ли у нас оснований, чтобы подтвердить это заявление?

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика