Первинний статистичний аналіз програмного забеспечення. (Лекція 10) презентация

Содержание

Застосування статистики при аналізі результатів вимірювань ПЗ. Первинний статистичний аналіз. Закон розподілу. Статистичні перевірки.

Слайд 1Лекція 10
Первинний статистичний аналіз


Слайд 2
Застосування статистики при аналізі результатів вимірювань ПЗ.
Первинний статистичний аналіз.
Закон розподілу.
Статистичні перевірки.


Слайд 3Проблема аналізу вимірювань
На основі вимірювання простих властивостей програмного забезпечення потрібно робити

висновки про загальні його властивості

Слайд 4Застосування статистичного аналізу для ПЗ
Ідентифікація розподілу
Пошук та відображення залежностей між даними
прогнозування


Слайд 5Вибірка
Це деякий набір значень величини із загальної кількості її значень (генеральної

сукупності).

Достатність вибірки – представлення вибіркою генеральної сукупності (при збільшенні об’єму даних середні статистичні характеристики змінюються несуттєво)

Слайд 6Гістограми
Побудова варіаційного ряду (гістограми) вимагає ранжування результатів спостережень та обчислення відповідних

їм частот і випадковостей:
х1, х2, ..., хr
n1, n2, ..., nr
f1, f2, ..., fr,
де r – кількість варіант;
хі – і-те значення х метрики;
ni – частота хі, ;
- випадковість хі.

Слайд 7Гістограми
Для побудови гістограми проводиться розбиття варіаційного ряду на класи. Для цього

фіксується рівномірне розбиття осі спостережень ∆h на класи, де h — крок розбиття. Крок розбиття визначається із співвідношення:
 

а — початок спостережень (окремий випадок х1 = а);
b — кінець спостережень (окремий випадок хг = b );
т — кількість елементів розбиття ∆h (кількість класів).


Слайд 8Гістограми
Кількість класів — величина довільна.
Краще вибирати т непарним і таким,

щоб гістограма, по можливості, не мала осциляції випадковостей і була більш-менш "гладкою".
Iснує оптимальна кількість класів, яка залежить від обсягу даних вибірки n та від типу їх закону розподілу (мається на увазі врахування асиметрії та ексцесу). При n < 100 можна використати формулу


Слайд 9Гістограми


Слайд 10Аналіз неперервних та дискретних даних
Неперервні дані представляються у вигляді функцій
При аналізі

дискретні дані краще представляти у неперервній формі


Слайд 11Математичне сподівання
Середнє арифметичне, яке є оцінкою математичного сподівання випадкової величини


Слайд 12Дисперсія та середнє квадратичне відхилення
Вибіркова дисперсія та середньоквадратичне відхилення характеризує розсіювання

вибіркових даних відносно середнього

Слайд 13Коефіцієнти асиметрії та ексцесу
Коефіцієнт асиметрії, що характеризує асиметричність функції щільності (гістограми)

відносно середнього


Коефіцієнт ексцесу характеризує гостровершинність функції розподілу (гістограми) відносно нормального розподілу

Слайд 14Довірчі інтервали
Використовується для оцінювання точності оцінок параметрів

tα/2,ν – квантиль t-розподілу Стьюдента.

За величину беруть відповіді точкову оцінку, а значення а визначають із співвідношень:

Слайд 15Вилучення аномальних значень
Обчислені значення статистики


Порівнюється з критичним значенням ta/2,v (квантиль розподілу

Стьюдента)
При хгр підлягає видаленню

Слайд 16Вилучення аномальних значень
Підсумком аналізу варіаційного ряду або гістограми може бути попередній

висновок про наявність аномальних ("грубих") значень хгр .
Візуально такі значення можна ідентифікувати з аналізу гістограм, коли значення варіаційного ряду досить суттєво віднесене від загальної сукупності даних та має порівняно малу випадковість.
Варіанта xі за своїм значенням може різко відхилятися від загальні сукупності варіант у двох випадках:
якщо вона належить до генеральної сукупності, як і основна група, проте є малоймовірною подією
або якщо має місце випадкове порушення умов експерименту.

Слайд 17Види розподілів
Однопараметричні
Експоненційний
Релея
Максвела
Пірсона
Т-розподіл Стьюдента
Двопараметричні
Рівномірний
Паретто
Нормальний
Логарифмічно-нормальний
Лапласа
Гамма-розподіл
Екстремальний
Розподіл Вейбула


Слайд 18Закон розподілу
Використовується для дискретної випадкової величини
Показує множину можливих подій з ймовірностями

їх настання

Слайд 19Ідентифікація розподілів (крок 1)
На практиці при первинному статистичному аналізі тип розподілу

невідомий
Попередньо проводять ідентифікацію, аналізуючи гістограму (крок 1)

Слайд 20Ідентифікація розподілів


Слайд 21Ідентифікація розподілів
Унімодальна гістограма:
Експоненційний
Вейбула з параметром β

з параметром β > 1
Гамма-розподіл
Екстремальний
Ерланга
Максвелла
Пірсона




Слайд 22Ідентифікація розподілів (крок 2)
Вибір конкретного типу розподілу за емпіричною функцією розподілу

(крок 2)
2 підходи:
Перетворення функції розподілу для надання лінійного вигляду (переважно – перетворення Джонсона)
Моментна ідентифікація – за допомогою коефіцієнтів асиметрії та ексцесу

Слайд 23Ідентифікація розподілів – моментні характеристики
Вибір розподілу базується на перевірці гіпотези відхилення

емпіричних значень від заданих в таблиці
Уточнення розподілу здійснюється на основі критеріїв згоди

Слайд 24Відтворення розподілів
Метою відтворення розподілів є побудова функції розподілу за вибірковими даними


Слайд 25Схема відтворення розподілів
Основні кроки
1. Первинний статистичний аналіз
2. Знаходження оцінок параметрів
3. Оцінювання

точності оцінок параметрів шляхом обчислення дисперсії та довірчих інтервалів
4. Обчислення значень статистичної функції розподілу у точках варіаційного ряду
5. Визначення одного або кількох критеріїв згоди
6. Довірче оцінювання теоретичної функції розподілу ймовірностей

Слайд 26Схема відтворення розподілів
Первинний статистичний аналіз
Формування варіаційних рядів
Розбиття варіаційних рядів на класи
Вилучення

аномальних значень
Обчислення емпіричної функції розподілу ймовірностей
Знаходження статистичних характеристик вибірки з довірчим оцінюванням
Ідентифікація типу розподілу

Слайд 27Методи оцінки параметрів розподілу
Метод максимальної правдоподібності – відбувається порівняння емпіричних та

теоретичних статистичних характеристик
Метод моментів – базується на порівнянні теоретичних та статистичних початкових або центральних моментів
Метод найменших квадратів – використовується при ефективному перетворенні функції розподілу до лінійного вигляду

Слайд 28Висновки
Статистичний аналіз найбільш використовується при аналізі деяких вибірок даних


Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика