Слайд 1ПРОВЕРКА ГИПОТЕЗ и ДА
Cтат. методы в психологии
(Радчикова Н.П.)
Слайд 2Цели
Что делать, если независимая переменная имеет больше двух уровней?
Что делать,
если в эксперименте более одной независимой переменной?
Что делать, если в эксперименте более одной зависимой переменной?
Слайд 3Независимая переменная имеет больше двух уровней
Действительно ли холерики и сангвиники более
агрессивны, чем флегматики и меланхолики?
Слайд 4Независимая переменная имеет больше двух уровней
Нашей задачей является избегание ошибки I
рода.
Если мы примем уровень статистической значимости равным 0,05, мы согласимся принять риск ошибиться в 5 случаях из 100. Когда происходит много сравнений, этот риск увеличивается.
Слайд 5Независимая переменная имеет больше двух уровней
6 сравнений:
Вероятность сделать ошибку при каждом
сравнении примем за 0,05.
Тогда вероятность не сделать ошибку
1-0,05=0,95.
Слайд 6Независимая переменная имеет больше двух уровней
Вероятность не сделать ошибку во всех
6 сравнениях
(0,95)6=0,74.
А вероятность допустить ошибку хотя бы в одном сравнении равна
1-0,74=0,26 !
Слайд 7Независимая переменная имеет больше двух уровней
Для 10 сравнений вероятность сделать по
крайней мере одну ошибку равна 0,40,
для 20 сравнений – уже 0,64!!!
Слайд 8Независимая переменная имеет больше двух уровней
Что делать?
Применять специальные критерии!
Слайд 9Основы дисперсионного анализа
В качестве такого критерия для параметрических данных используется
ДИСПЕРСИОННЫЙ
АНАЛИЗ
Слайд 10Основы дисперсионного анализа
Дисперсионный анализ – это процедура, которая позволяет сравнивать средние
значения нескольких групп, предоставляя единственное решение на определенном уровне статистической значимости.
Дисперсионный анализ позволяет ответить на вопрос: «Значимо ли различаются средние значения зависимой переменной при разных уровнях независимой переменной?»
Слайд 11Основы дисперсионного анализа
Дисперсионный анализ иногда в литературе называется ANOVA (от английского
ANalysis Of VAriance). Несмотря на такое название в дисперсионном анализе сравниваются не дисперсии, а средние значения.
Слайд 12Основы дисперсионного анализа
Рассмотрим идеи однофакторного дисперсионного анализа на примере для несвязных
выборок.
В этом случае группы, которые мы сравниваем, представляют различные уровни (значения) одной независимой переменной (или фактора).
Фактор и независимая переменная являются в данном случае синонимами.
Слайд 13Понятие о сумме квадратов
Предположим, что мы провели исследование, где две группы
испытуемых, различающихся по доминантной руке (левши и правши), оценивали, насколько удобно им пользоваться компьютером.
Высокий набранный балл свидетельствует о большем удобстве.
Проверим гипотезу о том, что нет зависимости оценки удобства работы на компьютере от доминантной руки.
Слайд 15Понятие о сумме квадратов
Теперь, если мы вычтем общее среднее из каждого
показателя и возведем эту разность в квадрат, то получим общую сумму квадратов
SSобщ (SS – sum of squares)
SSОБЩ = (1-6)2+(2-6)2+(5-6)2+(8-6)2+
+(6-6)2+(7-6)2+(8-6)2+(10-6)2=72
Слайд 16Понятие о сумме квадратов
Внутригрупповая сумма квадратов – это сумма сумм квадратов,
полученных для каждой группы. Внутригрупповая сумма квадратов является мерой изменчивости внутри групп.
Слайд 17Понятие о сумме квадратов
ЛЕВШИ ПРАВШИ
Источником внутригрупповой изменчивости являются
все переменные, влияющие на зависимую переменную, кроме нашей независимой переменной
Слайд 18Понятие о сумме квадратов
Внутригрупповая сумма квадратов = сумма квадратов группы 1
плюс сумма квадратов группы 2.
SSВ/Г=SSЛЕВ+SSПРАВ
Слайд 19Понятие о сумме квадратов
Межгрупповая сумма квадратов – это сумма квадратов отклонений
между группами. Она отражает влияние независимой переменной и может быть получена как сумма квадратов разностей общего среднего и среднего значения, умноженного на число испытуемых в каждой группе:
Слайд 20Понятие о сумме квадратов
Общая сумма квадратов равна внутригрупповой сумме квадратов плюс
межгрупповой сумме квадратов:
Внутригрупповая сумма квадратов - мера дисперсии данных внутри каждой группы, и, следовательно, не может объясняться независимой переменной
Межгрупповая сумма квадратов – мера дисперсии данных между группами, представляет собой дисперсию, которую вносит независимая переменная
Слайд 21Получение оценок дисперсий
Значимость разницы между этими двумя оценками дисперсии (суммами квадратов)
определяется с помощью F-распределения Фишера.
Слайд 22Получение оценок дисперсий
Если межгрупповая дисперсия (т.е. разница между средними групп) велика
относительно внутригрупповой дисперсии, число F достаточно велико.
Если межгрупповая дисперсия мала относительно внутригрупповой дисперсии, число F достаточно мало.
Слайд 23Получение оценок дисперсий
Таким образом, проверка нуль-гипотезы требует вычисления отношения межгрупповой и
внутригрупповой сумм квадратов.
Но! Оба значения растут с ростом размера выборки. Поэтому следует делить обе суммы квадратов на соответствующие степени свободы.
Слайд 24Получение оценок дисперсий
Степени свободы для межгрупповой суммы квадратов – что число
групп минус 1:
dfМ/Г=k-1
В нашем случае k=2, dfМ/Г =2-1=1
Следовательно, средняя сумма квадратов MSМ/Г (mean square):
Слайд 25Получение оценок дисперсий
Степени свободы для внутригрупповой суммы квадратов – это общее
число испытуемых минус число групп (уровней независимой переменной)
DfВ/Г=N-k=8-2=6
Слайд 28Основы дисперсионного анализа
Fэмп
компьютером для левшей и правшей: и те, и другие чувствуют себя за клавиатурой одинаково
Слайд 29Основы дисперсионного анализа
Межгрупповая сумма квадратов
Внутригрупповая сумма квадратов
Слайд 30Основы дисперсионного анализа
Ограничения и предположения ДА
дисперсии в сравниваемых группах должны быть
приблизительно равны
выборки должны быть случайны и независимы
зависимая переменная должна быть, по крайней мере, интервальной, и нормально распределена в каждой группе.
Слайд 31Основы дисперсионного анализа
Действительно ли холерики и сангвиники более агрессивны, чем флегматики
и меланхолики?
F(3,342)=12,87; p<0,001
Слайд 32Апостериорные критерии
Пример для трех групп
Слайд 36Апостериорные критерии
H0: μ1= μ2
H0: μ1= μ3
H0: μ3= μ2
Слайд 37Апостериорные критерии
Критерий Тьюки (Tukey) – HSD (honestly significant difference)
N – число
человек в группе
qα - значение из специальной таблицы для уровня значимости α, числа сравнений k и dfв/г
Слайд 38Апостериорные критерии
Считаем таблицу разниц между средними групп
Слайд 39Апостериорные критерии
qα для α=0,05
Слайд 40Апостериорные критерии
Критерий Тьюки (Tukey) – HSD (honestly significant difference)
N =9
qα =3,53
Слайд 44Правда и неправда о ДА
Дисперсионный анализ
НЕ
показывает причину!
И никаким образом
не помогает выяснить, что является причиной, а что – следствием!
Слайд 46Самостоятельная работа
К следующему занятию прочитать:
Радчикова Н.П. Объем памяти и размер алфавита…//
ПЖ, том 29, № 4, 2008. – с. 105-112
(есть в электронном виде)
Слайд 47Исследование с несколькими НП
Эффект одной независимой переменной в сложном (факторном) эксперименте
называется главным эффектом (main effect).
Он показывает, имеется ли эффект от воздействия данного отдельно взятого фактора.
Слайд 48Исследование с несколькими НП
Взаимодействие − это количественный результат, обусловленный соотношением между
действием двух или нескольких независимых переменных, выделенный в факторном эксперименте. Вычисляется как разность между различиями значений зависимой переменной, полученных при действии разных условий первой, второй и т. д. переменных, и иллюстрируется графически.
Слайд 49Исследование с несколькими НП
Взаимодействие показывает, зависит ли величина воздействия фактора от
значений других факторов (переменных).
Слайд 50Исследование с несколькими НП
Нельзя интерпретировать результаты исследования, не принимая во внимание
взаимодействие!
Слайд 51Исследование с несколькими НП
Пример.
Психолог провел тренинг развития эмпатии для группы студентов,
состоявшей из юношей и девушек. Эмпатия измерялась до и после тренинга, и психологу интересно узнать, как повлиял тренинг на развитие этого качества.
Слайд 52Исследование с несколькими НП
В этом исследовании были выбраны две независимые переменные:
пол испытуемых (имеет два уровня − юноши и девушки) и
условия измерения эмпатии (имеет два уровня − до тренинга и после тренинга).
Зависимой переменной являлся уровень эмпатии (чем больше балл, набранный по некоторому тесту, тем больше уровень эмпатии).
Слайд 53Исследование с несколькими НП
Главные эффекты
Слайд 54Исследование с несколькими НП
Взаимодействие
Слайд 55Исследование с несколькими НП
Главные эффекты статистически независимы от эффектов взаимодействия, поэтому
нельзя предсказать, какое будет взаимодействие, зная только главные эффекты.
Слайд 56Исследование с несколькими НП
Для оценки значимости главных эффектор и значимости взаимодействия
служит многофакторный дисперсионный анализ.
Этот метод не имеет непараметрических аналогов – его нельзя заменить другими статистическими методами.
Слайд 58 Стой, Подумай, Примени
Исследователь провел эксперимент, чтобы определить
влияние марихуаны на реакцию человека. У группы испытуемых сначала измерялась базовая скорость реакции, затем измерялась скорость реакции после того, как они выкурили сигарету с марихуаной, а для того, чтобы проверить, как долго длится действие наркотика, скорость реакции была измерена еще раз на следующий день
Слайд 59 Стой, Подумай, Примени
Исследователь собрал следующие данные о
восприятии сцен ужаса (чем больше балл, тем сильнее неприятные ощущения) в двух группах испытуемых. Одна группа смотрела только сцены ужаса, а другой сначала демонстрировали юмористические сцены.
Слайд 60 Стой, Подумай, Примени
Студент-психолог измерил тревожность в двух
классах – спортивном и обычном (чем больше балл, тем больше тревожность). Проверьте с помощью подходящего критерия гипотезу студента о том, что спортивный класс обладает меньшей тревожностью.
Слайд 61 Стой, Подумай, Примени
Студент для курсового проекта проверяет,
есть ли разница между «совами», «жаворонками» и «дроздами» во времени реакции рано утром.
Слайд 62 Стой, Подумай, Примени
Школьный психолог проверяет гипотезу о
том, что девочки с высоким социальным статусом проявляют более высокую личностную тревожность, чем их сверстницы, а у мальчиков такой зависимости не наблюдается.
Слайд 63 Стой, Подумай, Примени
Студент-дипломник решил посмотреть, как изменяется
агрессивность учеников с возрастом. Для этого он измерил агрессивность в 1-х, 4-х, 7-х и 11-х классах. Но руководитель проекта забраковал такой диплом, указав, что агрессивность может существенно отличаться у девочек и мальчиков. К счастью на каждой анкете был указан пол ученика. Какой статистический критерий следует применить нашему студенту и почему?
Слайд 64 Стой, Подумай, Примени
Исследователь интересуется, зависит ли креативность
ребенка от условий, в которых он воспитывается. В частности, он решил проверить, как влияет состав семьи на креативность. Было обследовано 150 детей из разного типа семей (полная, неполная, детский дом).
Слайд 65 Стой, Подумай, Примени
Студент Недотепкин для курсового проекта
выдвинул гипотезу о том, что школьная тревожность зависит от статуса ученика в классе. Он провел в одном классе 2 теста - один для определения статуса и другой для определения школьной тревожности.
Слайд 66 Стой, Подумай, Примени
В некотором эксперименте одной группе
испытуемых надо было прочитать список слов, а другой - назвать рисунки, которые были подобраны так, чтобы названия совпадали со словами из списка. Исследователь измерил время (сек), которое понадобилось испытуемым для выполнения заданий.
Слайд 67 Стой, Подумай, Примени
Изучались способности к различным математическим
вычислениям у детей младшего школьного возраста из семей со средним и низким достатком. Было обнаружено, что дети из семей со средним достатком лучше выполняли задания, если их формулировали устно, при этом обе группы одинаково успешно справлялись с невербальными заданиями.
Слайд 68 Стой, Подумай, Примени
Три группы дошкольников участвуют в
исследовании, посвященном изучению настойчивости при выполнении заданий, в котором варьируется время до получения вознаграждения. Детям во всех трех группах раздали трудные головоломки и попросили собирать их, пока не надоест. Одной группе сказали, что по окончании работы все получат по 5 долларов. Вторая группа получит 5 долларов через 2 дня после окончания эксперимента, третья – через 4 дня.
Слайд 69Самостоятельная работа
К практическому занятию по ДА надо прочитать:
Высоков И.Е. Базовые
и стратегические процессы распознавания семантических отношений // ПЖ, 2004, т.25, № 5, с. 96-103
Слайд 71Многомерный ДА
Используется тогда, когда мы хотим проанализировать влияние НП сразу на
несколько ЗП
Часто называется MANOVA
Multivariate Analysis of Variance