Описательная статистика презентация

Содержание

План лекции: Показатели центральной тенденции. Среднее арифметическое, его свойства. Мода, медиана. Квартили. Соотношение между показателями центральной тенденции. Показатели изменчивости: размах, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Свойства дисперсии.

Слайд 1Лекция 2
Тема: «Описательная статистика»


Слайд 2План лекции:
Показатели центральной тенденции. Среднее арифметическое, его свойства.

Мода, медиана. Квартили. Соотношение

между показателями центральной тенденции.

Показатели изменчивости: размах, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Свойства дисперсии.

Показатели ассиметрии и эксцесса.
 

Слайд 3
Показатели центральной тенденции.
Среднее арифметическое, его свойства.


Слайд 4

Средняя арифметическая ( х ) – одна из основных характеристик вариационного

ряда, являющаяся центром распределения, вокруг которого группируются все варианты статистической совокупности.


Слайд 5
Для негруппированных данных эта величина определяется как сумма всех членов совокупности

деленная на их общее число n.

где:
- значения вариант

- знак суммирования вариант в пределах от первой до n- й варианты

- общее число вариант


Слайд 6Для данных, группируемых с учетом повторяемости или веса (pi) отдельных вариант

средняя арифметическая, называемая взвешенной определяется по формуле:

Слайд 7Свойства среднего арифметического:
1. Если каждую варианту совокупности уменьшить или увеличить на

какое-то произвольное положительное число А, то и средняя уменьшиться увеличиться на столько же.
















Слайд 82. Если каждую варианту совокупности разделить или умножить на одно и

то же число А, то и средняя арифметическая изменится во столько же раз.


Слайд 93. Сумма произведений отклонений вариант от их средней арифметической на соответствующие

им частоты равна нулю.







Слайд 10

4. Сумма квадратов отклонений вариант от их средней арифметической меньше суммы

квадратов отклонений тех же вариант от любой другой величины А не равной х:



Слайд 11Мода, медиана. Квартили. Соотношение между показателями центральной тенденции.


Слайд 12Медиана эмпирического распределения (Me) (от лат. Mediana – средняя) – средняя,

относительно которой ряд распределения делится на две половины: в обе стороны от медианы располагается одинаковое число членов ряда (вариант).

Если число членов ранжированного ряда нечетное, то центральная варианта и будет Me.

При четном числе членов ряда медиана определяется по полусумме двух соседних вариант, расположенных в центре ряда.



Слайд 13Если выборка распределена в вариационный ряд, медиана определяется как:

нижняя

граница интервала, в котором находится медиана или полусумма соседних классов;
частота медианного класса;
число накопленных частот, стоящих перед медианным классом;
i величина классового интервала;
n общее число наблюдений.

Слайд 14Мода (Mo) – величина, которая встречается в данной совокупности наиболее часто.


Класс с наибольшей частотой называется модальным.




где:
- нижняя граница модального класса, т.е. класса с
наибольшей частотой ( )
- частота класса, предшествующего модальному,
- частота класса, следующего за модальным,
- ширина классового промежутка.


Слайд 15Квантили - структурные средние характеристики вариационного ряда, отсекающие в пределах вариационного

ряда определенную часть его членов, вариант.



Слайд 16Квартиль – величина, отсекающая 1/4

членов ряда.
(3 квартиля делят весь вариационный ряд на четыре равночисленные части (кварты)).
Дециль – величина, отделяющая 1/10 часть всех членов вариационного ряда.
(9 децилей делят весь вариационный ряд на десять равных частей).
Перцентиль (процентиль) отсекает сотые доли вариант.
(99 децилей делят совокупность на 100 равных частей).


Слайд 17

Показатели изменчивости


Слайд 18Лимиты (от лат limes - предел) – значения максимальной и минимальной

вариант, между которыми распределяются все члены данной совокупности.



Слайд 19
Размах вариации – показатель, характеризующий варьирование признаков.


Слайд 20Дисперсия (от лат. Dispersion - рассеяние) или варианса (англ. Variance -

изменение, вариация) – важнейшая характеристика вариационного ряда.

Дисперсия генеральной совокупности - σ², дисперсия выборки - S² .



Слайд 21Знак суммирования произведений отклонений вариант xi от их средней

Частоты
Объем

выборки

Число степеней свободы

Число степеней свободы - число свободно варьирующих единиц или элементов в составе данной ограниченной совокупности.


Слайд 22Свойства дисперсии:
1. Если каждую варианту совокупности увеличить или уменьшить на одно

и то же постоянное число А, то дисперсия не изменится.
Т.о. дисперсию можно вычислить не только по значениям признака, но и по их отклонениям от какой-нибудь постоянной величины А.




Слайд 232. Если каждую варианту разделить или умножить на одно и то

же постоянное число А, то дисперсия уменьшится или увеличится в А2 раз.




Слайд 24Среднее квадратическое отклонение (Sx)

Характеризует величину и специфику варьирования признака.

Среднее квадратическое отклонение

=
Cтандартное отклонение (standard deviation – англ.)









Чем сильнее варьирует признак, тем больше среднее квадратическое отклонение.

Дисперсия и среднее квадратическое отклонение выражаются в тех же единицах, что и характеризуемый признак.

Слайд 25Показатель, предложенный К. Пирсеном –обозначаемый буквой V (или CV) называется коэффициентом

вариации.


Слайд 26В качестве констант, характеризующих случайную величину, можно использовать математические ожидания целых

степеней случайной величины.

Начальные моменты k-й степени



Слайд 27Проверка нормальности распределения с помощью показателей асимметрии и эксцесса
Выборочные характеристики

— средняя величина и показатели вариации — не содержат информации о законе распределения генеральной совокупности, из которой выборка взята. Трудно судить о законе распределения и по эмпирической вариационной кривой, поскольку на ней сказывается влияние многочисленных случайных причин. Между тем знание закона распределения важно: оно гарантирует от возможных ошибок в оценке генеральных параметров на основании выборочных показателей.

Многие биологические признаки распределяются нормально. Нередко, однако, эмпирические ряды распределения отклоняются более или менее заметно от нормальной кривой. Эти отклонения могут быть различными, обнаруживая в одних случаях асимметрию, в других — эксцесс, а иногда и то и другое одновременно.

Слайд 28Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

мерой несимметричности распределения.









Где:
μ3  -   равно   ∑(xi- среднееx)3
σ3  -  стандартное отклонение (сигма), возведенное в
третью степень;
n   - число наблюдений.


Слайд 29Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является

мерой несимметричности распределения.








Где:
μ3  -   равно   ∑(xi- среднееx)3
σ3  -  стандартное отклонение (сигма), возведенное в
третью степень;
n   - число наблюдений.


Слайд 31Асимметрия ряда выражается графически в виде скошенной вариационной кривой, вершина которой

может быть сдвинута от центра распределения либо влево, либо вправо.







Плотность нормального распределения симметрична относительно среднего.


Слайд 32Коэффициент ассиметрии – величина безразмерная, может принимать значения от -∞ до

+∞.
При симметричном распределении μ(3)=0 и α=0.


Слайд 33Асимметрию называют правосторонней или положительной, если вершина кривой сдвинута влево от

центра распределения; она более пологая, сильно растянутая по оси абсцисс.


При левосторонней, или отрицательной, асимметрии, наоборот, вершина кривой сдвинута вправо от центра распределения, а ее пологая часть находится на левой стороне.



Слайд 34Эксцесс
Термин был впервые введен Пирсоном, 1905.
Коэффициент эксцесса измеряет "пикообразность" распределения.


Оценка эксцесса (выборочный эксцесс) вычисляется по формуле:  






Где
Mj    равен (xi-Meanx)j
 n      - число наблюдений
    
- стандартное отклонение (сигма), возведенное в четвертую степень.


Слайд 35Эксцесс
Термин был впервые введен Пирсоном, 1905.
Коэффициент эксцесса измеряет "пикообразность" распределения.


Если эксцесс значимо отличен от 0, то функция плотности либо имеет более закругленный, либо более острый пик, чем пик плотности нормального распределения.
Функция плотности нормального распределения имеет эксцесс равный 0.
Оценка эксцесса (выборочный эксцесс) вычисляется по формуле:  




Где
Mj    равен (xi-Meanx)j
 n      - число наблюдений
    
- стандартное отклонение (сигма), возведенное в четвертую степень.


Слайд 37Если эксцесс значимо отличен от 0, то функция плотности либо имеет

более закругленный, либо более острый пик, чем пик плотности нормального распределения.
Функция плотности нормального распределения имеет эксцесс равный 0.

Слайд 39Благодарю за внимание!


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика