Критерій згоди Пірсона 2 (Хі-квадрат). Критерії згоди, які застосовуються для перевірки статистичних гіпотез

Теоретичні та емпіричні частоти. Перевірка на нормальність розподілу

При аналізі варіаційних рядів розподілу велике значення має, наскільки емпіричний розподілознаки відповідає нормальному. Для цього частоти фактичного розподілу слід порівняти з теоретичними, які характерні для нормального розподілу. Отже, необхідно за фактичними даними обчислити теоретичні частоти кривої нормального розподілу, які є функцією нормованих відхилень.

Інакше висловлюючись, емпіричну криву розподілу необхідно вирівняти кривою нормального розподілу.

Об'єктивна характеристика відповідності теоретичнихі емпіричних частотможе бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.

Критерієм згодиназивають критерій, який дозволяє встановити, чи є розбіжність емпіричногоі теоретичногорозподілів випадковим чи значимим, т. е. чи узгоджуються дані спостережень з висунутої статистичної гіпотезою чи погоджуються. Розподіл генеральної сукупності, що вона має з висунутої гіпотези, називають теоретичним.

Виникає потреба встановити критерій(правило), яке дозволяло б судити, чи є розбіжність між емпіричним та теоретичним розподілами випадковим чи значущим. Якщо розбіжність виявиться випадковим, то вважають, що дані спостережень (вибірки) узгоджуються з висунутою гіпотезою про закон розподілу генеральної сукупності і, отже, приймають гіпотезу; якщо ж розбіжність виявиться значущимдані спостережень не узгоджуються з гіпотезою і її відкидають.

Зазвичай емпіричні та теоретичні частоти різняться через те, що:

розбіжність випадково пов'язане з обмеженою кількістю спостережень;

розбіжність невипадково і тим, що статистична гіпотеза у тому, що генеральна сукупність розподілена нормально - хибна.

Таким чином, критерії згодидозволяють відкинути чи підтвердити правильність висунутої при вирівнюванні низки гіпотези про характері розподілу в емпіричному ряду.

Емпіричні частотиодержують у результаті спостереження. Теоретичні частотирозраховують за формулами.

Для закону нормального розподілуїх можна знайти таким чином:

Σƒ i- сума накопичених (кумулятивних) емпіричних частот

h - різниця між двома сусідніми варіантами

σ - вибіркове середньоквадратичне відхилення

t-нормоване (стандартизоване) відхилення

φ(t) – функція щільності ймовірності нормального розподілу (знаходять за таблицею значень локальної функції Лапласа для відповідного значення t)

Є кілька критеріїв згоди, найпоширенішими у тому числі є: критерій хи-квадрат (Пірсона), критерій Колмогорова, критерій Романовського.

Критерій згоди Пірсона 2 – один з основних, який можна представити як суму відносин квадратів розбіжностей між теоретичними (f Т) та емпіричними (f) частотами до теоретичних частот:

k–число груп, куди розбито емпіричне розподіл,

f i -спостерігається частота ознаки в i-й групі,

f T – теоретична частота.

Для розподілу 2 складено таблиці, де вказано критичне значення критерію згоди 2 для обраного рівня значущості α і ступенів свободи df (або ν). Рівень значимості α – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. Р - статистична достовірністьприйняття правильної гіпотези. У статистиці найчастіше користуються трьома рівнями значимості:

α=0,10, тоді Р=0,90 (у 10 випадках із 100)

α=0,05, тоді Р=0,95 (у 5 випадках із 100)

α=0,01, тоді Р=0,99 (у 1 випадку зі 100) може бути відкинута правильна гіпотеза

Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти. Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки. Тому при вирівнюванні по кривою нормального розподілучисло ступенів свободи визначається як df = k-3. Для оцінки суттєвості розрахункове значення порівнюється з табличним χ 2 табл.

При повному збігу теоретичного та емпіричного розподілів χ 2 =0, інакше χ 2 >0. Якщо χ 2 розрахунків > χ 2 табл, то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляємо. У разі, якщо χ 2 розрах.< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсянормальному розподілу. Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий (N>50), причому частота кожної групи повинна бути не менше 5.

Критерій згоди Колмогоровазаснований на визначенні максимальної розбіжності між накопиченими емпіричними та теоретичними частотами:

де D і d – відповідно, максимальна різниця між накопиченими частотами та накопиченими частотами емпіричного та теоретичного розподілів. По таблиці розподілу статистики Колмогорова визначають ймовірність, що може змінюватися від 0 до 1. При Р(λ)=1- відбувається повний збіг частот, Р(λ)=0 – повне розбіжність. Якщо величина ймовірності Р значна стосовно знайденої величини λ, можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві, т. е. носять випадковий характер. Основна умова використання критерію Колмогорова досить велика кількість спостережень.

Критерій згоди Колмогорова

Розглянемо як критерій Колмогорова (λ) застосовується при перевірці гіпотези про нормальний розподілгенеральної сукупності. Вирівнювання фактичного розподілу по кривій нормального розподілу складається з кількох етапів:

Порівнюють фактичні та теоретичні частоти.

За фактичними даними, визначають теоретичні частоти кривої нормального розподілу, яка є функцією нормованого відхилення.

Перевіряють, наскільки розподіл ознаки відповідає нормальному.

Для IV колонки таблиці:

У MS Excel нормований відхилення (t) розраховується за допомогою функції НОРМАЛІЗАЦІЯ. Необхідно виділити діапазон вільних осередків за кількістю варіантів (рядок електронної таблиці). Не знімаючи виділення, викликати функцію НОРМАЛІЗАЦІЯ. У діалоговому вікні, що з'явилося, вказати наступні осередки, в яких розміщені, відповідно, спостерігаються значення (X i), середня (X) і середньоквадратичне відхилення Ϭ. Операцію обов'язково завершити одночаснимнатисканням клавіш Ctrl+Shift+Enter

Для V колонки таблиці:

Функцію густини ймовірності нормального розподілу φ(t) знаходимо за таблицею значень локальної функції Лапласа для відповідного значення нормованого відхилення (t)

Для VI колонки таблиці:

Критерій згоди Колмогорова (λ)визначається шляхом поділу модуля max різниціміж емпіричними та теоретичними кумулятивними частотами на корінь квадратний з числа спостережень:

За спеціальною таблицею ймовірності для критерію згоди λ визначаємо, що значення λ=0,59 відповідає ймовірність 0,88 (λ

Розподіл емпіричних та теоретичних частот, щільності ймовірності теоретичного розподілу

Застосовуючи критерії згоди для перевірки відповідності емпіричного розподілу теоретичному, слід розрізняти перевірку простих і складних гіпотез.

Одновибірковий критерій нормальності Колмогорова-Смирнова заснований на максимумі різниціміж кумулятивним емпіричним розподілом вибірки та передбачуваним (теоретичним) кумулятивним розподілом. Якщо D статистика Колмогорова-Смирнова значуща, то гіпотеза у тому, що відповідний розподіл нормально, має бути відкинуто.

Для перевірки гіпотези про відповідність емпіричного розподілу теоретичному закону розподілу використовуються спеціальні статистичні показники - критерії згоди (або критерії відповідності). До них належать критерії Пірсона, Колмогорова, Романовського, Ястремського та ін. Більшість критеріїв згоди базуються на використанні відхилень емпіричних частот від теоретичних. Очевидно, що чим менше ці відхилення, тим краще теоретичний розподіл відповідає емпіричному (або описує його).

Критерії згоди- це критерії перевірки гіпотез щодо відповідності емпіричного розподілу теоретичному розподілу ймовірностей. Такі критерії поділяються на два класи: загальні та спеціальні. Загальні критерії згоди застосовні до найзагальнішого формулювання гіпотези, а саме, до гіпотези про згоду результатів, що спостерігаються, з будь-яким апріорно передбачуваним розподілом ймовірностей. Спеціальні критерії згоди передбачають спеціальні нульові гіпотези, що формулюють згоду з певною формою розподілу ймовірностей.

Критерії згоди, спираючись на встановлений закон розподілу, дають можливість встановити, коли розбіжності між теоретичними та емпіричними частотами слід визнати несуттєвими (випадковими), а коли – суттєвими (невипадковими). З цього випливає, що критерії згоди дозволяють відкинути або підтвердити правильність висунутої при вирівнюванні низки гіпотези про характер розподілу в емпіричному ряду і дати відповідь, чи можна прийняти для даного емпіричного розподілу модель, виражену деяким теоретичним законом розподілу.

Критерій згоди Пірсона c 2 (хі-квадрат) – один із основних критеріїв згоди. Запропоновано англійським математиком Карлом Пірсоном (1857-1936) для оцінки випадковості (суттєвості) розбіжностей між частотами емпіричного та теоретичного розподілів:

Схема застосування критерію з 2 до оцінки узгодженості теоретичного та емпіричного розподілів зводиться до наступного:

1. Визначається розрахункова міра розбіжності.

2. Визначається кількість ступенів свободи.

3. За кількістю ступенів свободи n за допомогою спеціальної таблиці визначається.

4. Якщо , то при заданому рівні значущості α та кількості ступенів свободи n гіпотезу про несуттєвість (випадковість) розбіжностей відхиляють. В іншому випадку гіпотезу можна визнати такою, що не суперечить отриманим експериментальним даним і з ймовірністю (1 – α) можна стверджувати, що розбіжності між теоретичними та емпіричними частотами випадкові.

Рівень значущості- це можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. У статистичних дослідженнях залежно від важливості та відповідальності розв'язуваних завдань користуються такими трьома рівнями значимості:

1) a = 0,1, тоді Р = 0,9;

2) a = 0,05, тоді Р = 0,95;

3) a = 0,01, тоді Р = 0,99.

Використовуючи критерій згоди з 2, необхідно дотримуватися таких умов:

1. Обсяг досліджуваної сукупності має бути досить великим ( N≥ 50), при цьому частота або чисельність групи повинна бути не менше 5. Якщо ця умова порушується, необхідно попередньо об'єднати невеликі частоти (менше 5).

2. Емпіричний розподіл має складатися з даних, отриманих у результаті випадкового відбору, тобто. вони мають бути незалежними.

Недоліком критерію згоди Пірсона є втрата частини первинної інформації, пов'язана з необхідністю угруповання результатів спостережень в інтервали та об'єднання окремих інтервалів з малою кількістю спостережень. У зв'язку з цим рекомендується доповнювати перевірку відповідності розподілів за критерієм з іншими критеріями. Особливо це необхідно за порівняно малого обсягу вибірки ( n ≈ 100).

У статистиці критерій згоди Колмогорова(також відомий, як критерій згоди Колмогорова - Смирнова) використовується для того, щоб визначити, чи підпорядковуються два емпіричні розподіли одному закону, або визначити, чи підпорядковується отриманий розподіл передбачуваної моделі. Критерій Колмогорова заснований на визначенні максимальної розбіжності між накопиченими частотами чи частотами емпіричних чи теоретичних розподілів. Критерій Колмогорова обчислюється за такими формулами:

де Dі d- відповідно максимальна різниця між накопиченими частотами ( f – f¢) та між накопиченими частостями ( p – p¢) емпіричного та теоретичного рядів розподілів; N- Число одиниць у сукупності.

Розрахувавши значення λ, за спеціальною таблицею визначається ймовірність, з якою можна стверджувати, що відхилення емпіричних частот від теоретичних є випадковими. Якщо ознака набуває значення до 0,3, це означає, що відбувається повний збіг частот. При великому числі спостережень умов Колмогорова здатний виявити будь-який відступ гіпотези. Це означає, що будь-яка відмінність розподілу вибірки від теоретичного буде з його допомогою виявлено, якщо спостережень буде багато. Практична значущість цієї властивості не суттєва, тому що в більшості випадків важко розраховувати на отримання великої кількості спостережень у незмінних умовах, теоретичне уявлення про закон розподілу, якому має підкорятися вибірка, завжди наближене, а точність статистичних перевірок не повинна перевищувати точність обраної моделі.

Критерій згоди Романовськогозаснований використання критерію Пірсона, тобто. вже знайдених значень c 2 і числа ступенів свободи:

де n – число ступенів свободи варіації.

Критерій Романовського зручний за відсутності таблиць для . Якщо< 3, то расхождения распределений случайны, если же >3, то не випадкові і теоретичний розподіл не може служити моделлю для емпіричного розподілу, що вивчається.

Б. С. Ястремський використовував у критерії згоди не число ступенів свободи, а кількість груп ( k), особливу величину q, що залежить від числа груп, та величину хі-квадрат. Критерій згоди Ястремськогомає той самий сенс, як і критерій Романовського, і виражається формулою

де c 2 – критерій згоди Пірсона; - Число груп; q - коефіцієнт, число груп менше 20 рівний 0,6.

Якщо Lфакт > 3, розходження між теоретичними і емпіричними розподілами невипадкові, тобто. емпіричний розподіл не відповідає вимогам нормального розподілу. Якщо Lфакт< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

При аналізі варіаційних рядів розподілу велике значення має, наскільки емпіричний розподілознаки відповідає нормальному. Для цього частоти фактичного розподілу слід порівняти з теоретичними, які характерні для нормального розподілу. Отже, необхідно за фактичними даними обчислити теоретичні частоти кривої нормального розподілу , що є функцією нормованих відхилень.

Інакше висловлюючись, емпіричну криву розподілу необхідно вирівняти кривою нормального розподілу.

Зазвичай емпіричні та теоретичні частоти різняться через те, що:

розбіжність випадково пов'язане з обмеженою кількістю спостережень;
розбіжність невипадкова і пояснюється тим, що статистична гіпотеза про те, що генеральна сукупність розподілена нормально помилкова.

Емпіричні частотиодержують у результаті спостереження. Теоретичні частотирозраховують за формулами.

Для закону нормального розподілуїх можна знайти таким чином:

Σƒ i - сума накопичених (кумулятивних) емпіричних частот
h — різниця між двома сусідніми варіантами
σ - вибіркове середньоквадратичне відхилення
t-нормоване (стандартизоване) відхилення
φ(t)–функція щільності ймовірності нормального розподілу (знаходять для відповідного значення t)

Критерій згоди Пірсона χ 2– один з основних, який можна представити як суму відносин квадратів розбіжностей між теоретичними (f Т ) та емпіричними (f) частотами до теоретичних частот:

k–число груп, куди розбито емпіричне розподіл,
f i -Спостерігається частота ознаки в i-й групі,
f T -Теоретична частота.

Для розподілу 2 складено таблиці, де вказано критичне значення критерію згоди 2 для обраного рівня значущості α і ступенів свободи df (або ν).
Рівень значимості α – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. Р - статистична достовірністьприйняття правильної гіпотези. У статистиці найчастіше користуються трьома рівнями значимості:

α=0,10, тоді Р=0,90 (у 10 випадках із 100)

α=0,05, тоді Р=0,95 (у 5 випадках із 100)

α=0,01, тоді Р=0,99 (у 1 випадку зі 100) може бути відкинута правильна гіпотеза

Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти.Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки.Тому при вирівнюванні покривою нормального розподілучисло ступенів свободи визначається як df = k-3.Для оцінки суттєвості розрахункове значення порівнюється з табличним χ 2 табл

При повному збігу теоретичного та емпіричного розподілів χ 2 =0, інакше χ 2 >0. Якщо χ 2 розрах. > χ 2 табл. , то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляємо.У разі, якщо χ 2 розрах.< χ 2 табл то гіпотезу приймаємо і з ймовірністю Р=(1-α) можна стверджувати, що розбіжність між теоретичними та емпіричними частотами є випадковою. Отже, є підстави стверджувати, що емпіричний розподіл підпорядковується нормальному розподілу. Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий (N>50), причому частота кожної групи повинна бути не менше 5.

Заснований на визначенні максимальної розбіжності між накопиченими емпіричними та теоретичними частотами:

де D і d – відповідно, максимальна різниця між накопиченими частотами та накопиченими частостями емпіричного та теоретичного розподілів.
По таблиці розподілу статистики Колмогорова визначають ймовірність, що може змінюватися від 0 до 1. При Р(λ)=1- відбувається повний збіг частот, Р(λ)=0 – повне розбіжність. Якщо величина ймовірності Р значна стосовно знайденої величини λ, можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві, т. е. носять випадковий характер.
Основна умова використання критерію Колмогорова досить велика кількість спостережень.

Критерій згоди Колмогорова

Розглянемо як критерій Колмогорова (λ) застосовується при перевірці гіпотези про нормальний розподілгенеральної сукупності.Вирівнювання фактичного розподілу по кривій нормального розподілу складається з кількох етапів:

Порівнюють фактичні та теоретичні частоти.
За фактичними даними визначають теоретичні частоти кривої нормального розподілу, що є функцією нормованого відхилення.
Перевіряють, наскільки розподіл ознаки відповідає нормальному.

ДляIVколонки таблиці:

ДляVколонки таблиці:

ДляVIколонки таблиці:

Критерій згоди Колмогорова (λ)визначається шляхом поділу модуляmax різниціміж емпіричними та теоретичними кумулятивними частотами на корінь квадратний з числа спостережень:

Розподіл емпіричних та теоретичних частот, щільності ймовірності теоретичного розподілу

Дивись також

Критерії для перевірки випадковості та оцінки різко виділяються спостережень Література Введення У практиці статистичного аналізу експериментальних даних основний інтерес представляє не саме по собі обчислення тих чи інших статистик, а відповіді на питання такого типу. Відповідно розроблено і безліч критеріїв для перевірки висунутих статистичних гіпотез. Усі критерії для перевірки статистичних гіпотез поділяються на дві великі групи: параметричні та непараметричні.

Поділіться роботою у соціальних мережах

Якщо ця робота Вам не підійшла внизу сторінки, є список схожих робіт. Також Ви можете скористатися кнопкою пошук

Контрольна робота

Використання критеріїв згоди

Вступ

Література

Вступ

У практиці статистичного аналізу експериментальних даних основний інтерес представляє саме собою обчислення тих чи інших статистик, а відповіді питання такого типу. Чи справді середня генеральна сукупність дорівнює деякому числу? Чи значно відрізняється від нуля коефіцієнт кореляції? Чи рівні дисперсії двох вибірок? І таких питань, залежно від конкретного дослідницького завдання, може виникати багато. Відповідно розроблено і безліч критеріїв для перевірки висунутих статистичних гіпотез. Деякі найуживаніші з них ми й розглянемо. В основному вони відноситимуться до середніх, дисперсій, коефіцієнтів кореляції та розподілів чисельностей.

Усі критерії для перевірки статистичних гіпотез поділяються на дві великі групи: параметричні та непараметричні. Параметричні критерії засновані на припущенні, що вибіркові дані взяті з генеральної сукупності з відомим розподілом, і основне завдання полягає в оцінці параметрів цього розподілу. Для непараметричних критеріїв не потрібно ніяких припущень про характер розподілу, за винятком припущення, що він безперервний.

Першими розглянемо параметричні критерії. Послідовність перевірки буде включати формулювання нуль-гіпотези та альтернативної гіпотези, формулювання допущень, визначення вибіркової статистики, що використовується при перевірці і, утворення вибіркового розподілу статистики, визначення критичних областей для обраного критерію і побудова довірчого інтервалу для вибіркової статистики.

1 Критерії згоди для середніх

Нехай перевірена гіпотеза у тому, що параметр генеральної сукупності. Необхідність такої перевірки може виникнути, наприклад, у такій ситуації. Припустимо, що на підставі великих досліджень встановлений діаметр раковини викопного молюска у відкладеннях з фіксованого місця. Нехай також у нашому розпорядженні виявилася деяка кількість раковин, знайдених в іншому місці, а ми робимо припущення, що конкретне місце не впливає на діаметр раковини, тобто. що середнє значення діаметра раковини для всієї популяції молюсків, що колись жили в новому місці, дорівнює відомому значенню, отриманому раніше при вивченні даного виду молюсків у першому місці проживання.

Якщо це відоме значення одно, то нуль-гіпотеза і альтернативна гіпотеза записуються наступним чином: Приймемо, що змінна x у сукупності має нормальний розподіл, а величина дисперсії генеральної сукупності невідома.

Будемо перевіряти гіпотезу за допомогою статистики:

, (1)
де – вибіркове стандартне відхилення.

Було показано, що якщо справедлива, то у виразі (1) має t-розподіл Стьюдента з n-1 ступенями свободи. Якщо вибрати рівень значущості (імовірність відкинути правильну гіпотезу) рівним, то відповідно до того, про що йшлося в попередньому розділі, можна визначити критичні значення для перевірки =0.

В даному випадку, так як розподіл Стьюдента симетрично, то (1-) частина площі під кривою цього розподілу з n-1 ступенями свободи буде укладена між точками і які рівні один одному за абсолютною величиною. Отже, всі значення менше від'ємного і більше позитивного для t-розподілу із заданим числом ступенів свободи при вибраному рівні значущості становитимуть критичну область. Попадання вибіркового значення t у цю сферу призводить до прийняття альтернативної гіпотези.

Довірчий інтервал для будується за описаною раніше методикою і визначається з наступного виразу

(2)

Отже, нехай у нашому випадку відомо, що діаметр раковини викопного молюска дорівнює 182 мм. У нашому розпорядженні виявилася вибірка з 50 новознайдених раковин, для яких мм, а = 2,18 мм. Перевіримо: =18,2 проти Маємо

Якщо рівень значущості вибрати =0,05, то критичне значення. Звідси випливає, що можна відхилити на користь лише на рівні значимості =0,05 . Таким чином, для нашого гіпотетичного прикладу можна стверджувати (природно, з деякою ймовірністю), що діаметр раковини викопних молюсків певного виду залежить від місць, де вони жили.

У зв'язку з тим, що t-розподіл симетрично, наводяться лише позитивні значення t цього розподілу при вибраних рівнях значущості та кількості ступенів волі. Причому враховується як частка площі під кривою розподілу праворуч від значення t, а й водночас ліворуч від значення -t. Це з тим, що у більшості випадків під час перевірки гіпотез нас цікавить суттєвість відхилень як така, незалежно від цього, у більшу чи меншу бік ці відхилення, тобто. ми перевіряємо проти, а не проти: >a чи:

Повернемося тепер до нашого прикладу. Довірчий 100(1-)% інтервал для дорівнює

18,92,01

Розглянемо тепер випадок, коли необхідно порівняти між собою середні дві генеральні сукупності. Перевірена гіпотеза виглядає так: : =0, : 0. Передбачається також, що має нормальний розподіл із середнім та дисперсією, а - нормальний розподіл із середнім і тією ж дисперсією. Крім того, приймаємо, що вибірки, за якими оцінюються генеральні сукупності, витягуються незалежно один від одного і мають обсяг відповідно і. некорельовано.

Перевірка нульової гіпотези проводиться з використанням статистики

(3)

де і - оцінки дисперсії для першої та другої вибірок відповідно. Неважко бачити, що (3) є узагальнення (1).

Було показано, що статистика (3) має t-розподіл Стьюдента зі ступенями свободи. За рівності і, тобто. = = формула (3) спрощується і має вигляд

(4)

Розглянемо приклад. Нехай при вимірі стеблового листя однієї і тієї ж популяції рослин протягом двох сезонів отримані наступні результати: Вважатимемо, що умови для використання критерію Стьюдента, тобто. нормальність генеральних сукупностей, у тому числі взяті вибірки, існування невідомої, але однієї й тієї дисперсії цих сукупностей і незалежність вибірок виконані. Оцінимо лише на рівні значимості =0,01. Маємо

Табличне значення t = 2,58. Тому гіпотеза про рівність середніх значень довжин стеблового листя для популяції рослин протягом двох сезонів має відкинути на обраному рівні значущості.

Увага! Як нульова гіпотеза в математичній статистиці вибирається гіпотеза про відсутність значних відмінностей між порівнюваними показниками, причому незалежно від того, чи йдеться про середні, дисперсія або інші статистики. І в усіх цих випадках, якщо емпіричне (обчислене за формулою) значення критерію більше за теоретичне (обраного з таблиць), то відкидається. Якщо ж емпіричне значення менше табличного, то приймається.

Для того, щоб побудувати довірчий інтервал для різниці середніх цих двох генеральних сукупностей, звернемо увагу на те, що критерій Стьюдента, як видно з формули (3), оцінює значимість різниці між середніми щодо стандартної помилки цієї різниці. У тому, що знаменник (3) представляє саме цю стандартну помилку, неважко переконатися, використовуючи вже розглянуті раніше співвідношення і зроблені припущення. Насправді нам відомо, що в загальному випадку

Якщо x та y незалежні, то і

Взявши замість x і y вибіркові значення та пригадавши зроблене припущення про те, що обидві генеральні сукупності мають одну й ту саму дисперсію, отримаємо

(5)

Оцінка дисперсії може бути отримана з наступного співвідношення

(6)

(Ми ділимо на, тому що за вибірками оцінюються дві величини і, отже, кількість ступенів свободи має бути зменшена на два.)

Якщо тепер підставити (6) (5) і витягти квадратний корінь, то вийде знаменник у виразі (3).

Після цього відступу повернемося до побудови довірчого інтервалу через -.

Маємо

Зробимо деякі зауваження, пов'язані з припущеннями, які використовуються при побудові t-критерію. Насамперед було показано, що порушення припущення про нормальність мають незначний вплив на рівень значущості та потужність критерію для 30. Несуттєво також і порушення припущення про однорідність дисперсій обох генеральних сукупностей, з яких беруться вибірки, але тільки в тому випадку, коли обсяги вибірок рівні. Якщо ж дисперсії обох сукупностей відрізняються один від одного, то ймовірності помилок першого і другого роду будуть істотно відрізнятися від очікуваних.

У цьому випадку для перевірки слід скористатися критерієм

(7)

з числом ступенів свободи

. (8)

Як правило, виходить дробовим числом, тому при користуванні таблицями t-розподілу необхідно брати табличні значення для найближчих цілих значень та проводити інтерполяцію для знаходження t, що відповідає отриманому.

Розглянемо приклад. Під час вивчення двох підвидів озерної жаби розраховувалося відношення довжини тіла до довжини гомілки. Було взято дві вибірки з обсягами =49 і =27. Середні та дисперсії цікавого для нас відносини виявилися рівними відповідно =2,34; =2,08; =0,21; =0,35. Якщо тепер перевіряти гіпотезу з використанням формули (2), то отримаємо, що

При рівні значущості =0,05 ми повинні відкинути нульову гіпотезу (табличне значення t=1,995) і вважати, що є статистично достовірні на обраному рівні значущості відмінності між середніми показниками вимірювань для двох підвидів жаби.

При використанні формул (6) і (7) маємо

В даному випадку для того ж рівня значущості = 0,05 табличне значення t = 2,015 і нульова гіпотеза приймається.

На цьому прикладі досить ясно видно, що зневага умовами, що приймаються при виведенні того чи іншого критерію, може призвести до результатів, прямо протилежних тим, що мають місце насправді. Звичайно ж, у даному випадку, маючи вибірки різного обсягу без заздалегідь встановленого факту про те, що дисперсії вимірюваного показника в обох популяціях статистично рівні, слід користуватися формулами (7) і (8), які і показали відсутність статистично значущих відмінностей.

Тому хочеться повторити ще раз, що перевірка дотримання всіх припущень, зроблених при виведенні того чи іншого критерію, є необхідною умовою для його коректного використання.

Незмінною вимогою в обох наведених модифікаціях t-критерію була вимога про незалежність між собою вибірок. Однак на практиці досить часто зустрічаються ситуації, коли ця вимога не може бути виконана з об'єктивних причин. Наприклад, вимірюються деякі показники на тому самому тваринному чи ділянці території до і після дії зовнішнього чинника тощо. І у цих випадках нас може цікавити перевірка гіпотези проти. Будемо, як і раніше, припускати, що обидві вибірки взяті з нормальних генеральних сукупностей з однаковою дисперсією.

У цьому випадку можна скористатися тим фактом, що різниці між нормально розподіленими величинами також мають нормальний розподіл, і тому можна скористатися критерієм Стьюдента у формі (1). Таким чином, перевірятиметься гіпотеза про те, що n різниць є вибірка з нормально розподіленої генеральної сукупності із середнім, рівним нулю.

Позначивши i-ю різницю через, маємо

, (9)
де

Розглянемо приклад. Нехай у нашому розпорядженні є дані про кількість імпульсів окремої нервової клітини за певний інтервал часу до () та після () дії подразника:

Звідси Маючи на увазі, що (9) має t-розподіл, і вибравши рівень значущості = 0,01, з відповідної таблиці Додатка знайдемо, що критичне значення t для n-1 = 10-1 = 9 ступенів волі дорівнює 3,25. Порівняння теоретичного та емпіричного значень t-статистики показує, що нульова гіпотеза про відсутність статистично значущих відмінностей між частотою імпульсації до та після подачі стимулу має бути відкинута. Можна дійти невтішного висновку у тому, сто використовуваний подразник статистично значимо змінює частоту імпульсації.

В експериментальних дослідженнях, як згадувалося, залежні вибірки з'являються досить часто. Тим не менш, цей факт іноді ігнорується і t-критерій некоректно використовується у формі (3).

У неправомірності цього можна переконатися, розглядаючи стандартні помилки різниці між некорельованими та корельованими середніми. У першому випадку

А в другому

Стандартна помилка різниці d дорівнює

З урахуванням цього знаменник у (9) матиме вигляд

Тепер звернемо увагу на те, що чисельники виразів (4) та (9) збігаються:

отже, відмінність у величині t у яких залежить від знаменників.

Таким чином, якщо в задачі із залежними вибірками буде використана формула (3), і при цьому вибірки матимуть позитивну кореляцію, то одержувані значення t будуть меншими, ніж вони мали б бути при використанні формули (9), і може виникнути ситуація, що буде прийнято нульову гіпотезу, тоді як вона невірна. Зворотна ситуація може виникнути, коли між вибірками буде негативна кореляція, тобто. в цьому випадку значущими будуть визнаватись такі відмінності, які насправді такими не є.

Повернемося знову наприклад з імпульсною активністю і обчислимо для наведених даних значення t за формулою (3), не звертаючи уваги те що, що вибірки пов'язані. Маємо: Для числа ступенів свободи, що дорівнює 18, і рівня значущості =0,01 табличне значення t=2,88 і, на перший погляд, здається, що нічого не сталося, навіть при використанні непридатної для цих умов формули. І цьому випадку обчислене значення t призводить до відкидання нульової гіпотези, тобто. до того ж висновку, який був зроблений з використанням правильної в даній ситуації формулою (9).

Однак давайте переформуємо наявні дані та представимо їх у наступному вигляді (2):

Це ті самі значення, і вони цілком могли б бути отримані в якомусь із дослідів. Так як всі значення в обох вибірках збережені, то використання критерію Стьюдента у формулі (3) дає вже отримане значення =3,32 і призводить до того ж самого висновку, який вже був зроблений.

А тепер розрахуємо значення t за формулою (9), яка повинна використовуватися в даному випадку. Маємо: Критичне значення t при вибраному рівні значущості та дев'яти ступенях свободи дорівнює 3,25. Отже, підстав відкинути нульову гіпотезу ми не маємо, ми її приймаємо, і виявляється, що цей висновок прямо протилежний тому, який був зроблений при використанні формули (3).

На цьому прикладі ми знову переконалися в тому, наскільки важливо для отримання правильних висновків при аналізі експериментальних даних суворо дотримуватися всіх вимог, які були покладені в основу визначення того чи іншого критерію.

Розглянуті модифікації критерію Стьюдента призначаються перевірки гіпотез щодо середніх двох вибірок. Проте виникають ситуації, коли виникає необхідність зробити висновки щодо рівності одночасно k середніх. Для цього випадку також розроблено певну статистичну процедуру, яка буде розглянута в подальшому при обговоренні питань, пов'язаних з дисперсійним аналізом.

2 Критерії згоди для дисперсій

Перевірка статистичних гіпотез щодо дисперсій генеральних сукупностей проводиться у тій самій послідовності, що й середніх. Нагадаємо коротко цю послідовність.

1. Формулюється нульова гіпотеза (про відсутність статистично значимих відмінностей між порівнюваними дисперсіями).

2. Робляться деякі припущення щодо вибіркового розподілу статистики, за допомогою якої планується оцінювати параметр, який входить до гіпотези.

3. Вибирається рівень значущості для перевірки гіпотези.

4. Розраховується значення цікавої для нас статистики і приймається рішення щодо істинності нульової гіпотези.

Нині ж почнемо з перевірки гіпотези у тому, що дисперсія генеральної сукупності =a, тобто. проти. Якщо припустити, що змінна x має нормальне розподілення, і що вибірка обсягу n вилучається з генеральної сукупності випадково, то для перевірки нульової гіпотези використовується статистика

(10)

Згадавши формулу для розрахунку дисперсії, перепишемо (10) так:

. (11)

З цього виразу видно, що чисельник є сумою квадратів відхилень нормально розподілених величин від їх середнього. Кожне із цих відхилень також розподілено нормально. Тому відповідно до відомого нам розподілу суми квадратів нормально розподілених величин статистики (10) і (11) мають -розподіл з n-1 ступенем свободи.

За аналогією з використанням t-розподілу при перевірці для обраного рівня значущості за таблицею розподілу встановлюють критичні точки, що відповідають ймовірностям прийняття нульової гіпотези. Довірчий інтервал для вибраного будується наступним чином:

. (12)

Розглянемо приклад. Нехай на підставі великих експериментальних досліджень встановлено, що дисперсія вмісту алкалоїдів одного виду рослин із певного району дорівнює 4,37 умовних одиниць. У розпорядження фахівця потрапляє вибірка обсягом n = 28 таких рослин, ймовірно, з того ж району. Проведений аналіз показав, що з цієї вибірки =5,01 і необхідно переконатися у цьому, що й відома раніше дисперсії статистично невиразні лише на рівні значимості =0,1.

За формулою (10) маємо

Отриману величину необхідно порівняти з критичними значеннями /2=0,05 та 1-/2=0,95. З таблиці Додатки з 27 ступенями свободи маємо відповідно 40,1 і 16,2, звідки випливає, що нульова гіпотеза може бути прийнята. Відповідний довірчий інтервал для дорівнює 3,37<<8,35.

На відміну від перевірки гіпотез щодо вибіркових середніх з використанням критерію Стьюдента, коли помилки першого та другого роду несуттєво змінювалися при порушенні припущення про нормальний розподіл генеральних сукупностей, у разі гіпотез про дисперсії при невиконанні умов нормальності помилки змінюються суттєво.

Розглянута вище завдання про рівність дисперсії деякому фіксованому значенню становить обмежений інтерес, оскільки досить рідко трапляються ситуації, коли відома дисперсія генеральної сукупності. Значно більший інтерес представляє випадок, коли потрібно перевірити, чи дисперсії рівні двох сукупностей, тобто. перевірка гіпотези проти альтернативи При цьому передбачається, що вибірки обсягом і випадково витягуються з генеральних сукупностей дисперсій і.

Для перевірки нульової гіпотези використовується критерій відношення дисперсій Фішера

(13)

Так як суми квадратів відхилень нормально розподілених випадкових величин від їх середніх значень мають розподіл, то і чисельник і знаменник (13) являють собою величини з розподілом, поділені відповідно на і, отже, їх відношення має F-розподіл з -1 і -1 ступенями свободи.

Загальноприйнято - і так побудовані таблиці F-розподілу, - що як числитель (13) береться велика з дисперсій, і тому визначається тільки одна критична точка, що відповідає обраному рівню значимості.

Нехай у нашому розпорядженні виявилися дві вибірки обсягом =11 і =28 з популяцій звичайних та овальних ставків, котрим відношення висоти до ширини мають дисперсії =0,59 і =0,38. Необхідно перевірити гіпотезу про рівність цих дисперсій цих показників для популяцій, що вивчаються, при рівні значущості =0,05. Маємо

У літературі іноді можна зустріти твердження, що перевірці гіпотези про рівність середніх за критерієм Стьюдента має передувати перевірка гіпотези про рівність дисперсій. Це неправильна рекомендація. Більше того, вона може призвести до помилок, яких можна уникнути, якщо не слідувати їй.

Насправді результати перевірки гіпотези про рівність дисперсій з використанням критерію Фішера значною мірою залежать від припущення про те, що вибірки взяті із сукупностей з нормальним розподілом. У той же час критерій Стьюдента малочутливий до порушень нормальності, і якщо вдається отримати вибірки рівного обсягу, то припущення про рівність дисперсій також не є суттєвим. У разі нерівних n слід користуватися для перевірки формулами (7) та (8).

При перевірці гіпотез про рівність дисперсій виникають деякі особливості у розрахунках, пов'язаних із залежними вибірками. І тут для перевірки гіпотези проти альтернативи використовується статистика

(14)

Якщо нульова гіпотеза справедлива, статистика (14) має t-розподіл Стьюдента з n-2 ступенями свободи.

При вимірюванні блиску 35 зразків покриттів отримано дисперсія =134,5. Повторні виміри за два тижні показали =199,1. У цьому коефіцієнт кореляції між парними вимірами виявився рівним =0,876. Якщо не звертати увагу на те, що вибірки залежать і скористатися критерієм Фішера для перевірки гіпотези, то отримаємо F=1,48. Якщо вибрати рівень значущості = 0,05, то нульова гіпотеза буде прийнята, так як критичне значення F-розподілу для = 35-1 = 34 і = 35-1 = 34 ступенів волі дорівнює 1,79.

У той самий час, якщо використовувати відповідну для цього випадку формулу (14), то отримаємо t=2,35, тоді як критичне значення t для 33 ступенів свободи та обраного рівня значущості =0,05 і 2,03. Отже, нульова гіпотеза про рівність дисперсій у цих двох вибірках має бути відхилена. Таким чином, з цього прикладу видно, що, як і у разі перевірки гіпотези про рівність середніх, використання критерію, що не враховує специфіки експериментальних даних, призводить до помилки.

У рекомендованій літературі можна знайти критерій Бартлетта, що використовується під час перевірки гіпотез про одночасну рівність дисперсій. Крім того, що обчислення статистики цього критерію досить трудомісткі, основний недолік цього критерію в тому, що він надзвичайно чутливий до відхилень від припущення про нормальність розподілів сукупностей, з яких вибираються вибірки. Таким чином, при його використанні ніколи не можна бути впевненим у тому, що нульова гіпотеза відхилена насправді через те, що статистично значуще різняться дисперсії, а не через те, що вибірки не мають нормального розподілу. Тому у разі виникнення проблеми порівняння кількох дисперсій необхідно шукати таку постановку завдання, коли можна буде використовувати критерій Фішера або його модифікації.

3 Критерії згоди щодо часток

Досить часто доводиться аналізувати сукупності, у яких об'єкти можна віднести до однієї з двох категорій. Наприклад, за приналежністю до підлоги в деякій популяції, за наявності деякого мікроелемента в грунті, темного або світлого забарвлення яєць у деяких видів птахів і т.д.

Частку елементів, що володіють певною якістю, позначимо через P, де P являє собою відношення об'єктів з цікавим для нас якістю до всіх об'єктів в сукупності.

Нехай перевіряється гіпотеза у тому, що у деякій досить великий сукупності частка P дорівнює деякому числу a (0

Для дихотомічних (мають дві градації) змінних, як у нашому випадку, P відіграє ту ж роль, що і середня генеральна сукупність змінних, що вимірюються кількісно. З іншого боку, раніше було зазначено, що стандартна помилка частки P може бути подана у вигляді

Тоді, якщо вірна гіпотеза, статистика

, (19)
де p - вибіркове значення P, має одиничний нормальний розподіл. Відразу слід зазначити, що така апроксимація справедлива, якщо менше із творів np або (1-p)n більше 5.

Нехай із літературних даних відомо, що у популяції озерної жаби частка особин, мають поздовжню смугу на спині становить 62% чи 0,62. У нашому розпорядженні виявилася вибірка зі 125 (n) особин, 93 (f) з яких мають поздовжню смугу на спині. Необхідно з'ясувати, чи відповідає частка особин з цікавою для нас ознакою в популяції, з якої вилучено вибірку, відомим даним. Маємо: p=f/n=93/125=0,744, a=0,62, n(1-p)=125(1-0,744)=32>5 та

Отже, і рівня значимості = 0,05 і = 0,01 нульова гіпотеза має бути відкинута, оскільки критичне значення для = 0,05 дорівнює 1,96, а = 0,01 - 2,58 .

Якщо є дві великі сукупності, у яких частки об'єктів з цікавими нас властивістю становлять відповідно і, то інтерес представляє перевірка гіпотези: = проти альтернативної:. Для перевірки вилучаються випадково та незалежно дві вибірки обсягами та. За цими вибірками оцінюються і визначається статистика

(20)

де і - число об'єктів, що мають дану ознаку, відповідно в першій і другій вибірках.

З формули (20) можна зрозуміти, що при її виведенні використовувався той самий принцип, з яким ми стикалися і раніше. А саме, для перевірки статистичних гіпотез визначається кількість стандартних відхилень, що становлять різницю між показниками, що цікавлять нас, дійсно величина (+)/(+) являє собою частку об'єктів із заданою ознакою в обох вибірках одночасно. Якщо позначить її через, то вираз у другій дужці знаменника (20) є (1-) і стає очевидним, що вираз (20) еквівалентно формулі для перевірки нульової гіпотези:

Тому що.

З іншого боку, є стандартною помилкою. Таким чином, (20) може бути записано у вигляді

. (21)

Єдина відмінність між цією статистикою та статистикою, що використовується при перевірці гіпотез про середніх полягає в тому, що z має не t-, а одиничний нормальний розподіл.

Нехай вивчення групи людей (=82) показало, частка осіб, які мають в електроенцефалограмі виявляється -ритм, становить 0,84 чи 84%. Дослідження групи людей іншій місцевості (=51) показало, що ця частка становить 0,78. Для рівня значущості =0,05 необхідно перевірити, що частки осіб, які мають мозкову альфа-активність в генеральних сукупностях, з яких взяті вибірки, однакові.

Насамперед переконаємося у цьому, що наявні експериментальні дані дозволяють скористатися статистикою (20). Маємо:

і оскільки z має нормальний розподіл, для якого критичною точкою при 0,05 є 1,96, то нульова гіпотеза приймається.

Розглянутий критерій справедливий, якщо вибірки, котрим порівнювалися частки об'єктів, які мають цікавим для нас ознакою, є незалежними. Якщо ця вимога не виконується, наприклад, коли сукупність розглядається в послідовні інтервали часу, то один і той же об'єкт може в цих інтервалах мати або не мати дану ознаку.

Позначимо наявність у об'єкта деякої цікавої для нас ознаки через 1, яке відсутність - через 0. Тоді ми приходимо до таблиці 3, де (a+c) - число об'єктів у першій вибірці, які мають деякою ознакою, (a+c) - число об'єктів з цією ознакою у другій вибірці, а n – загальна кількість обстежених об'єктів. Очевидно, що це вже відома чотирипільна таблиця, взаємозв'язок у якій оцінюється за допомогою коефіцієнта

Для такої таблиці та малих (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
яка у разі, якщо нульова гіпотеза вірна, має розподіл хі-квадрату з одним ступенем свободи.

Розглянемо приклад. Нехай протягом двох років перевірялася ефективність щеплень від малярії, зроблених у різні пори року. Перевіряється гіпотеза про те, що ефективність щеплень не залежить від пори року, коли вони робляться. Маємо

Табличне значення для =0,05 дорівнює 3,84, а =0,01 - 6,64. Отже, на будь-якому з цих рівнів значимості нульова гіпотеза має бути відкинута, і в цьому гіпотетичному прикладі (втім, що має відношення до дійсності) може бути зроблено висновок про те, що пивки, зроблені в другій половині року, значно ефективніші.

Природним узагальненням коефіцієнта зв'язку для четырехпольной таблиці є, як згадувалося раніше, коефіцієнт взаємної спряженості Чупрова. Для цього коефіцієнта невідомий точний розподіл, тому про справедливість гіпотези судять на підставі порівняння обчисленого значення та обраного рівня значущості з критичними точками для цього розподілу. Число ступенів свободи визначається виразом (r-1)(c-1), де r і c - число градацій за кожною з ознак.

Нагадаємо розрахункові формули

Наведено дані, отримані щодо дальності зору правим і лівим оком в людей, які мають аномалій зору. Умовно ця дальність розбита на чотири категорії, і нас цікавить достовірність зв'язку між дальністю зору лівим та правим оком. Спочатку знайдемо всі складові у подвійній сумі. Для цього квадрат кожного значення, що наводиться в таблиці, поділяється на суму рядка та стовпця, до яких належить вибране число. Маємо

Використовуючи це значення, отримаємо =3303,6 та T=0,714.

4 Критерії для порівняння розподілів чисельностей

У класичних експериментах з селекції гороху, що знаменували початок генетики, Г.Мендель спостерігав частоти різних видів насіння, одержуваних при схрещуванні рослин з круглим жовтим насінням і з зморшкуватим зеленим насінням.

У цьому й аналогічно випадках інтерес представляє перевірка нульової гіпотези про рівність функцій розподілу генеральних сукупностей, у тому числі вибираються вибірки, тобто. Теоретичні викладки показали, що при вирішенні такого завдання може бути використана статистика

= (23)

Критерій, який використовує цю статистику, був запропонований К.Пірсоном і носить його ім'я. p align="justify"> Критерій Пірсона застосовується для групованих даних незалежно від того, чи мають вони безперервний або дискретний розподіл. У (23) k- число інтервалів групування, - емпіричні чисельності, а - очікувані чи теоретичні чисельності (=n). У разі справедливості нульової гіпотези статистика (23) має - розподіл із k-1 ступенями свободи.

Для наведених у таблиці даних

Критичні точки -розподілу з 3 ступенями свободи для =0,05 і =0,01 рівні відповідно 7,81 та 11,3. Отже, нульова гіпотеза приймається і робиться висновок, що розщеплення в потомстві досить добре відповідає теоретичним закономірностям.

Розглянемо ще один приклад. У колонії морських свинок отримані протягом року такі чисельності народження самців по місяцях, починаючи з січня: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. Чи можна вважати, що отримані дані відповідають рівномірному розподілу, тобто. розподілу, у якому чисельність самців, що народжуються в окремі місяці, в середньому однакова? Якщо прийняти таку гіпотезу, то очікуване середнє число самців, що народжуються, буде одно. Тоді

Критичне значення розподілу з 11 ступенями свободи і = 0,01 дорівнює 24,7 тому на обраному рівні значимості нульова гіпотеза відкидається. Подальший аналіз експериментальних даних показує, що ймовірність народження самців морських свинок у другій половині року зростає.

У разі, коли теоретичний розподіл передбачається рівномірним, проблем із обчисленням теоретичних чисельностей немає. У разі інших розподілів розрахунки ускладнюються. Розглянемо на прикладах, як розраховуються теоретичні чисельності для нормального та пуассонівського розподілу, які досить часто зустрічаються у дослідницькій практиці.

Почнемо із визначення теоретичних чисельностей для нормального розподілу. Ідея полягає в тому, щоб перетворити наш емпіричний розподіл на розподіл з нульовим середнім та одиничною дисперсією. Природно, що при цьому межі клас-інтервалів виражаються в одиницях стандартного відхилення, і тоді, пам'ятаючи про те, що площа під ділянкою кривої, обмеженою верхнім та нижнім значенням кожного інтервалу, дорівнює ймовірності попадання в цей інтервал, множенням цієї ймовірності на загальну чисельність вибірки ми отримаємо шукану теоретичну чисельність.

Нехай у нас є емпіричний розподіл для довжини листя дуба і необхідно перевірити, чи можна рахувати з рівнем значущості =0,05, що цей розподіл незначно відрізняється від нормального.

Пояснимо, як розраховувалися значення, наведені у таблиці. По-перше, за стандартною методикою для групованих даних було обчислено середнє та стандартне відхилення, які виявилися рівними =10,3 та =2,67. За цими значеннями було знайдено межі інтервалів у одиницях стандартного відхилення, тобто. знайдені стандартизовані величини Наприклад, меж інтервалу (46) маємо: (4-10,3)/2,67=-2,36; (6-10,3) / 2,67 = -1,61. Потім для кожного інтервалу було обчислено ймовірність попадання до нього. Наприклад, для інтервалу (-0,110,64) з таблиці нормального розподілу маємо, що ліворуч від точки (-0,11) лежить 0,444 площі одиничного нормального розподілу, а ліворуч від точки (0,64) - 0,739 цієї площі. Таким чином, ймовірність попадання в цей інтервал дорівнює 0739-0444 = 0295. Інші обчислення очевидні. Слід пояснити різницю між n та. Вона виникає за рахунок того, що теоретичний нормальний розподіл можна вважати для практичних цілей зосередженим на інтервалі. В експерименті ж значень, що відхиляються більше, ніж від середнього не буває. Тому площа під кривою емпіричного розподілу не дорівнює одиниці, за рахунок чого виникає похибка. Однак ця похибка не вносить істотних змін до остаточних результатів.

При порівнянні емпіричного і теоретичного розподілів число ступенів свободи для розподілу знаходиться зі сотні f=m-1-l, де m - число клас-інтервалів, а l - число незалежних параметрів розподілу, що оцінюються за вибіркою. Для нормального розподілу l=2, оскільки залежить від двох параметрів: и.

Число ступенів свободи зменшується також на 1, тому що для будь-якого розподілу існує умова, що =1, і отже, число незалежно визначених ймовірностей дорівнює k-1, а не k.

Для наведеного прикладу f = 8-2-1 = 5 і критичне значення при =0,05 для розподілу з 5 ступенями свободи дорівнює 11,07. Отже, нульова гіпотеза приймається.

Техніку порівняння емпіричного розподілу з розподілом Пуассона розглянемо на класичному прикладі про кількість смертей драгун за місяць у прусській армії від удару кінським копитом. Дані відносяться до XIX століття, а чисельності смертей 0, 1, 2 тощо. характеризують ці сумні, але, на щастя події, що відбувалися порівняно рідко, в прусській кавалерії майже за 20 років спостережень.

Як відомо, розподіл Пуассона має такий вигляд:

де - параметр розподілу, що дорівнює середньому,

K =0,1,2,...,n.

Так як розподіл дискретний, то ймовірності, що цікавлять нас, знаходяться безпосередньо за формулою.

Покажемо, наприклад, як визначається теоретична чисельність k=3. Звичайним способом знаходимо, що середнє у цьому розподілі дорівнює 0,652. Маючи це значення, знайдемо

Звідси

Якщо вибрати =0,05, то критичне значення для -розподілу з двома ступенями свободи дорівнює 5,99, і, отже, гіпотеза про те, що емпіричний розподіл на вибраному рівні значущості не відрізняється від пуассонівського, приймається. Число ступенів свободи в даному випадку дорівнює двом, тому що розподіл Пуассон залежить від одного параметра, і значить, у співвідношенні f = m-1-l число параметрів, що оцінюються за вибіркою l = 1, і f = 4-1-1 = 2.

Іноді практично виявляється важливим знати, чи різняться між собою два розподіли, навіть якщо важко вирішити, яким теоретичним розподілом вони можуть бути апроксимовані. Це особливо важливо в тих випадках, коли, наприклад, їх середні та дисперсії між собою статистично значуще не різняться. Виявлення суттєвих відмінностей у характері розподілу може допомогти досліднику зробити припущення щодо можливих факторів, що призводять до цих відмінностей.

У цьому випадку може бути використана статистика (23), причому як емпіричні чисельності використовуються значення одного розподілу, а як теоретичний - іншого. Природно, що в цьому випадку розбиття на клас інтервали має бути єдиним для обох розподілів. Це означає, що для всіх даних з обох вибірок вибираються мінімальне та максимальне значення, незалежно до якої вибірки вони відносяться, а потім відповідно до обраного числа клас-інтервалів визначається їх ширина та підраховується кількість об'єктів, що потрапили в окремі інтервали, для кожної вибірки окремо .

При цьому може виявитися, що деякі класи не потрапляє або потрапляє мало (35) значень. Використання критерію Пірсона дає задовільні результати, якщо кожен інтервал потрапляє щонайменше 35 значень. Тому якщо ця вимога не виконується, необхідно об'єднувати сусідні інтервали. Звичайно, це робиться для обох розподілів.

І, нарешті, ще одне зауваження щодо порівняння обчисленого значення і критичних точок для нього за обраним рівнем значущості. Нам відомо, що якщо >, то нульова гіпотеза відкидається. Однак і значення, близькі до критичної точки 1 справа, повинні викликати у нас підозри, тому що такий надто хороший збіг емпіричного і теоретичного розподілів або двох емпіричних розподілів (адже в цьому випадку чисельності будуть відрізнятися між собою дуже незначно) навряд чи може зустрітися для випадкових розподілів. У цьому випадку можливі дві альтернативні пояснення: або ми маємо справу із законом, і тоді результат, що отримується, не дивний, або експериментальні дані в силу якихось причин “підігнані” один до одного, що вимагає їх повторної перевірки.

До речі, у прикладі з горохом маємо якраз перший випадок, тобто. Поява насіння різної гладкості та забарвлення у потомстві визначається законом, і тому не дивно, що обчислене значення вийшло таким малим.

Тепер повернемося до перевірки статистичної гіпотези про ідентичність двох емпіричних розподілів. Наведено дані про розподіл числа пелюсток квіток анемону, взятих з різних місцеперебування.

З табличних даних видно, що два перших і два останні інтервали повинні бути об'єднані, оскільки число значень, що потрапляють в них, недостатньо для коректного використання критерію Пірсона. З цього прикладу видно також, що якби аналізувалося лише розподіл із місцеперебування А, то клас-інтервалу, що містить 4 пелюстки, взагалі б не було. Він з'явився внаслідок того, що розглядаються два розподіли одночасно, а у другому розподілі такий клас є.

Отже, перевіримо гіпотезу, що ці два розподілу не відрізняються один від одного. Маємо

Для числа ступенів свободи 4 рівня значимості навіть рівного 0,001, нульова гіпотеза відкидається.

Для порівняння двох вибіркових розподілів можна використовувати і непараметричний критерій, запропонований Н.В. (Ось чому цей критерій іноді називають критерієм Колмогорова-Смирнова.) Цей критерій ґрунтується на порівнянні рядів накопичених частот. Статистика цього критерію знаходиться як

max, (24)
де - криві розподілу накопичених частот.

Критичні точки для статистики (24) знаходяться зі співвідношення

, (25)
де і -обсяги першої та другої вибірок.

Критичні значення =0,1;=0,05; і =0,01 рівні відповідно 1,22; 1,36; 1,63. Проілюструємо використання критерію Смирнова на групованих даних, що становлять зростання школярів однакового віку з двох різних районів.

Максимальна різниця між кривими накопичених частот дорівнює 0,124. Якщо вибрати рівень значущості =0,05, то з формули (25) маємо

0,098.

Таким чином, максимальна емпірична різниця більше теоретично очікуваної, тому на прийнятому рівні значимості нульова гіпотеза про ідентичність двох розподілів, що розглядаються, відкидається.

Критерій Смирнова може бути використаний і не для групованих даних, єдина вимога полягає в тому, що ці дані мають бути вилучені з генеральних сукупностей із безперервним розподілом. Бажано також, щоб число значень у кожній із вибірок було не менше 40-50.

Для перевірки нульової гіпотези, згідно з якою двом незалежним вибіркам обсягом n і m відповідають однакові функції розподілу, Ф.Вілкоксон був запропонований непараметричний критерій, який отримав обґрунтування в роботах Г.Манна і Ф.Уітні. Тому в літературі цей критерій називається то критерієм Вілкоксона, то критерієм Манна-Уітні. Цей критерій доцільно використовувати, коли обсяги одержуваних вибірок малі, використання інших критеріїв неправомірно.

Нижче викладки ілюструють підхід до побудови критеріїв, що використовують статистики, пов'язані не з самими вибірковими значеннями, а з їх рангами.

Нехай у нашому розпорядженні опинилися дві вибірки обсягу n та m значень. Побудуємо їх загальний варіаційний ряд, і кожному з цих значень зіставимо його ранг (), тобто. порядковий номер, який займає в ранжированном ряду. Якщо справедлива нульова гіпотеза, то будь-який розподіл рангів рівноймовірний, а загальна кількість всіляких комбінацій рангів при заданих n і m дорівнює кількості поєднань з N=n+m елементів по m.

Критерій Вілкоксону ґрунтується на статистиці

. (26)

Формально для перевірки нульової гіпотези необхідно підрахувати всі можливі комбінації рангів, при яких статистика W приймає значення рівні або менші тому, яке отримано для конкретного ранжованого ряду, і знайти відношення цього числа до загального числа можливих комбінацій рангів за обома вибірками. Порівняння отриманого значення з вибраним рівнем значущості дозволить прийняти або відкинути нульову гіпотезу. Розумність такого підходу у тому, що й одне розподіл зміщено щодо іншого, це проявиться у цьому, що маленькі ранги повинні відповідати, переважно, одній вибірці, а великі - інший. Залежно від цього, відповідні суми рангів повинні бути маленькими або більшими залежно від того, яка альтернатива має місце.

Необхідно перевірити гіпотезу про однакову функцію розподілу, що характеризують обидва методи вимірювання, з рівнем значущості =0,05.

У цьому прикладі n = 3, m = 2, N = 2+3 = 5, а сума рангів, що відповідають вимірам за методом, дорівнює 1+3 = 4.

Випишемо всі = 10 можливих розподілів рангів та їх суми:

Ранги: 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Суми: 3 4 5 6 5 6 7 7 8 9

Відношення числа комбінацій рангів, сума яких не перевищує отриманого значення 4 для методу, до загального числа можливих комбінацій рангів дорівнює 2/10=0,2>0,05, так що для цього прикладу нульова гіпотеза приймається.

При малих значеннях n і m перевірку нульової гіпотези можна здійснювати безпосереднім підрахунком комбінацій відповідних сум рангів. Однак для вибірок великого обсягу це стає практично неможливим, тому було отримано апроксимацію для статистики W, яка, як виявилося, асимптотично прагне нормального розподілу з відповідними параметрами. Ми проведемо розрахунок цих параметрів, щоб проілюструвати підхід до синтезу статистичних критеріїв на основі рангів. У цьому ми скористаємося результатами, наведеними у розділі 37.

Нехай W сума рангів, відповідних однієї з вибірок, наприклад, тієї, що має обсяг m. Нехай - середнє арифметичне цих рангів. Математичне очікування величини дорівнює

так як при нульовій гіпотезі ранги елементів вибірки обсягом m є вибіркою з кінцевої сукупності 1, 2,...,N (N=n+m). Відомо, що

Тож.

При обчисленні дисперсії скористаємося тим, що сума квадратів рангів загального ранжованого ряду, складеного з значень обох вибірок, дорівнює

З урахуванням отриманих раніше співвідношень для оцінки дисперсій генеральних сукупностей та вибірок маємо

Звідси випливає, що

Було показано, що статистика

(27)

для великих n та m має асимптотично одиничний нормальний розподіл.

Розглянемо приклад. Нехай для двох вікових груп одержано дані про полярографічну активність фільтрату сироватки крові. Необхідно з рівнем значущості =0,05 перевірити гіпотезу у тому, що вибірки взяті з генеральних сукупностей, мають однакові функції розподілу. Сума рангів першої вибірки дорівнює 30, другий - 90. Перевіркою правильності підрахунку сум рангів є виконання умови. У нашому випадку 30+90=(7+8)(7+8+1):

:2=120. За формулою (27), використовуючи суму рангів другої вибірки, маємо

Якщо використовувати суму рангів першої вибірки, то отримаємо значення =-3,01. Так як обчислена статистика має одиничний нормальний розподіл, то, природно, що і в першому, і в другому випадку нульова гіпотеза відкидається, оскільки критичне значення для 5% рівня значущості дорівнює модулю 1,96.

При використанні критерію Вилкоксона певні труднощі виникають, коли в обох вибірках зустрічаються однакові значення, так як при цьому використання наведеної формули призводить до зменшення потужності критерію, іноді дуже суттєвому.

Щоб для таких випадків звести помилки до мінімуму, доцільно користуватися наступним емпіричним правилом. Перший раз, коли трапляються однакові значення, що належать різним вибіркам, те, яке з них у варіаційному ряду поставити першим, визначається випадково, наприклад, підкиданням монети. Якщо таких значень кілька, то, визначивши випадково перше, інші рівні значення обох вибірок чергують через одне. У тих випадках, коли зустрічаються й інші рівні значення, надходять так. Якщо першій групі рівних значень першим випадково вибрали значення з однієї якийсь вибірки, то наступній групі рівних значень першим вибирається значення з іншої вибірки тощо.

5. Критерії для перевірки випадковості та оцінки спостережень, що різко виділяються

Досить часто дані отримують серіями у часі чи просторі. Наприклад, у процесі проведення психофізіологічних експериментів, які можуть тривати кілька годин, кілька десятків або сотень разів, вимірюється латентний (прихований період) реакції на зоровий стимул, що пред'являється, або в географічних обстеженнях, коли на майданчиках, розташованих у певних місцях, наприклад, уздовж узлісся ліси, підраховується кількість рослин деякого виду і т.д. З іншого боку, при обчисленні різних статистик передбачається, що вихідні дані є незалежними та однаково розподіленими. Тому інтерес представляє перевірка цього припущення.

Спочатку розглянемо критерій перевірки нульової гіпотези про незалежність однаково нормально розподілених величин. Таким чином, цей критерій є параметричним. Він заснований на розрахунку середнього квадратів послідовних різниць

. (28)

Якщо запровадити нову статистику, то, як відомо з теорії, за справедливості нульової гіпотези статистика

(29)
для n>10 розподілена асимптотично за стандартним нормальним розподілом.

Розглянемо приклад. Наведено час реакції () випробуваного в одному з психофізіологічних експериментів.

Маємо: звідки

Оскільки для =0,05 критичне значення дорівнює 1,96, нульова гіпотеза про незалежність отриманого ряду приймається з вибраним рівнем значущості.

Інше питання, яке часто виникає при аналізі експериментальних даних, полягає в тому, що робити з деякими спостереженнями, які різко відрізняються від основної маси спостережень. Такі спостереження, що різко виділяються, можу виникнути при методичних помилках, помилках обчислень і т.д. У всіх випадках, коли експериментатору відомо, що у спостереження вкралася помилка, він повинен виключати це значення незалежно від його величини. В інших випадках існує лише підозра на помилку, і тоді необхідно використовувати відповідні критерії, щоб прийняти те чи інше рішення, тобто. виключити або залишити спостереження, що різко виділяються.

У загальному випадку питання ставиться так: чи зроблені спостереження над однією і тією ж генеральною сукупністю або деяка частина або окремі значення належать до іншої генеральної сукупності?

Звісно, єдиним надійним способом виключення окремих спостережень є ретельне вивчення умов, у яких ці спостереження отримані. Якщо з якихось причин умови відрізнялися від стандартних, спостереження повинні бути виключені з подальшого аналізу. Але у певних випадках наявні критерії, хоч і недосконалі, можуть мати істотну користь.

Ми наведемо тут без доказу кілька співвідношень, які можуть бути використані для перевірки гіпотези про те, що спостереження проводяться випадково над однією і тією самою генеральною сукупністю. Маємо

(30)

(31)

(32)

де - підозрюване на "викид" спостереження. Якщо всі значення ряду проранжувати, то в ньому різко виділяється спостереження займатиме n-е місце.

Для статистики (30) протабульовано функцію розподілу. Наведено критичні точки цього розподілу деяких n.

Критичними значеннями для статистики (31) в залежності від n є

4,0; 6

4,5; 100

5,0; n>1000.

У формулі (31) передбачається, що й обчислюються без урахування підозрюваного спостереження.

Зі статистикою (32) справа складніша. Для неї показано, що у випадку, якщо розподілені рівномірно, то математичне очікування та дисперсія мають вигляд:

Критичну область утворюють малі значення, які відповідають більшим значенням. Якщо цікавить перевірка на “викид” найменшого значення, спочатку перетворюють дані, щоб вони мали рівномірний розподіл на інтервалі, а потім беруть доповнення цих рівномірних величин до 1 і перевіряють за формулою (32).

Розглянемо використання наведених критеріїв для наступного проранжованого ряду спостережень: 3,4,5,5,6,7,8,9,9,10,11,17. Необхідно вирішити, чи відкинути найбільше значення 17.

Маємо: За формулою (30) = (17-11) / 3,81 = 1,57, і нульова гіпотеза має бути прийнята при = 0,01. За формулою (31) = (17-7,0)/2,61 = 3,83, і нульова гіпотеза також має бути прийнята. Для використання третього критерію знайдемо =5,53, тоді

Статистика w розподілена нормально з нульовим середнім та одиничною дисперсією, і, отже, нульова гіпотеза при =0,05 приймається.

Складність використання статистики (32) полягає у необхідності мати апріорну інформацію про закон розподілу вибіркових значень, а потім аналітично перетворити цей розподіл на рівномірний на інтервалі.

Література

1. Єлісєєва І.І. Загальна теорія статистики: підручник для вузів/І.І. Єлісєєва, М.М. Юзбашев; за ред. І.І. Єлісєєвої. М.: Фінанси та статистика, 2009. 656 с.

2. Єфімова М.Р. Практикум із загальної теорії статистики: навчальний посібник для вузів/М.Р. Єфімова та ін. М.: Фінанси та статистика, 2007. 368 с.

3. Мелкумов Я.С. Соціально-економічна статистика: навчально-методичний посібник. М.: ІМПЕ-ПАБЛІШ, 2007. 200 с.

4. Загальна теорія статистики: Статистична методологія до вивчення комерційної діяльності: підручник для вузів / О.Э. Башина та ін; за ред. О.Е. Башин, А.А. Спірина. - М.: Фінанси та статистика, 2008. 440 с.

5. Салін В.М. Курс теорії статистики для підготовки фахівців фінансово-економічного профілю: підручник/В.М. Салін, Е.Ю. Чурилова. М.: Фінанси та статистика, 2007. 480 с.

6. Соціально-економічна статистика: практикум: навчальний посібник/В.М. Салін та ін; за ред. В.М. Саліна, Є.П. Шпаківській. М.: Фінанси та статистика, 2009. 192 с.

7. Статистика: навчальний посібник/О.В. Багат та ін; за ред. В.М. Сімчери. М.: Фінанси та статистика, 2007. 368 с.

8. Статистика: підручник/І.І. Єлісєєва та ін; за ред. І.І. Єлісєєвої. М.: Вища освіта, 2008. – 566 с.

9. Теорія статистики: підручник для вузів/Р.А. Шмойлова та ін; за ред. Р.А. Шмойловий. - М.: Фінанси та статистика, 2007. 656 с.

10. Шмойлова Р.А. Практикум з теорії статистики: навчальний посібник для вузів/Р.А. Шмойлова та ін; за ред. Р.А. Шмойловий. - М.: Фінанси та статистика, 2007. 416 с.

PAGE \* MERGEFORMAT 1

Інші схожі роботи, які можуть вас зацікавити.
17926.		Аналіз критеріїв компактності промислової робототехніки	1.77 MB
	Програмні рішення для оцінки компактності робота. Мініатюрні роботи можуть проникати у вузькі утворення щілини отвору і рухатися в них, що дозволяє застосовувати їх для виконання різних завдань в обмежених просторах, наприклад, трубах малого діаметра, що мають розмір порядку декількох міліметрів. Практично у всіх галузях промисловості питання мініатюризації виконавчих пристроїв та механізмів є одним із пріоритетних завдань; найважливіше значення мають для малоресурсних технологічних процесів...
1884.		Розробка критеріїв ефективного управління персоналом у ВАТ «Казань-Оргсинтез» для СУЯ	204.77 KB
	Основні теоретичні аспекти системи керування персоналом. Персонал як об'єкт керування. Методи дослідження системи управління персоналом для СУЯ. Методи підвищення ефективності управління персоналом.
16316.		а ця теорія дозволяє цю дилему; б вирішення цієї дилеми потребує наявності критеріїв цієї теорії.	12.12 KB
	Автор стверджує, що фундаментальна причина дилеми макроекономічної політики в умовах фіксованого валютного курсу полягає не в порушенні правила Тінбергена, що є насправді наслідком, а не причиною, а у відсутності необхідних економічних передумов для фіксації валютного курсу, представлених у теорії оптимальних валютних зон. Причиною виникнення цієї дилеми зазвичай вважають порушення правила Тінбергена, згідно з яким для досягнення певної кількості економічних цілей у руках у держави має бути...
18273.		Аналіз правового статусу Президента Республіки Казахстан з позицій загальноприйнятих критеріїв правової держави та принципу поділу влади	73.64 KB
	Суть підходу Президента полягала в тому, що країна повинна розвиватися природним чином еволюційно. Президентське правління - передбачене Конституцією держави - це припинення діяльності інститутів самоврядування певної регіональної адміністративної освіти та здійснення управління останнім за допомогою уповноважених призначених главою держави - президентом та підзвітними йому особами; передбачене Конституцією наділення глави держави - президента надзвичайними повноваженнями в масштабі всього...
5713.		Використання DotNetNuke	1.87 MB
	У цій роботі ми вивчатимемо DotNetNuke. DotNetNuke (скорочена назва DNN) - система управління вмістом веб-сайтами (Web Content Management System, скорочення WCMS), яка увібрала в себе всі найкращі досягнення в галузі технологій побудови веб-проектів.
7073.		ВИКОРИСТАННЯ ІНТЕРФЕЙСІВ	56.59 KB
	Слово інтерфейс - багатозначне, й у різних контекстах воно має різне значення. Існує поняття програмного чи апаратного інтерфейсу, але здебільшого слово інтерфейс асоціюється з деякою зв'язком між об'єктами чи процесами.
6471.		Структура та використання регістрів	193.04 KB
	Структура та використання регістрів Регістри призначені для зберігання та перетворення багаторозрядних двійкових чисел. Регістри побудовано як упорядковану послідовність тригерів. У мікропроцесорах регістри є основним засобом для швидкого запам'ятовування та зберігання цифрової інформації. Елементи з яких будують регістри - це D RS JKтригери з динамічним по зрізу імпульсу або статичним управлінням.
6472.		Структура та використання лічильників	318.58 KB
	Класифікація і принцип побудови асинхронних лічильників Лічильником називається пристрій на виходах якого формується двійковий код, що виражає кількість імпульсів лічильника, що надійшли на вхід. Кількість можливих станів лічильника називають його модулем або коефіцієнтом рахунку та позначають. Основні часові характеристики лічильників: максимальна частота надходження лічильних імпульсів; час переходу з одного стану в інший; Розрізняють власне мікросхеми лічильника та схеми побудованої на основі однієї або кількох...
7066.		ВИКОРИСТАННЯ МЕНЮ У ДОДАТКУ	240.2 KB
	Меню програми Меню програми має відповідати основним режимам роботи програми, тому до вибору пунктів меню та команд окремих пунктів необхідно ставитися з особливою ретельністю. Для кращого розуміння технології використання меню у програмах розглянемо послідовність дій під час вирішення наступної навчальної програми. Усі дії оформити за допомогою меню.
7067.		ВИКОРИСТАННЯ ДІАЛОГОВА МЕНЮ	73.13 KB
	Продовжуючи розробку програми з меню та інструментальною панеллю, нам необхідно написати код обробників повідомлень для команд створення матриці 6*6 та виведення (друк) матриці у клієнтську область нашої програми. Створення матриці необхідно закінчувати виведенням на екран повідомлення про успішне закінчення роботи обробника, наприклад, "Матриця створена".

Перевірювану гіпотезу зазвичай називають нульовою H 0, правило, яким гіпотеза приймається чи відкидається називається статистичним критерієм.. Статистичні критерії, службовці перевірки гіпотез про вигляді законів розподілу називаються критеріями згоди. Тобто. критерії згоди встановлюють, коли отримані насправді розбіжності між передбачуваними теоретичним та досвідченим розподілом: несуттєво – випадкові і коли суттєво – невипадкові.

Розглянемо випадкову величину, яка характеризує вид або функцію розбіжності між передбачуваним теоретичним та дослідним розподілом ознаки, тоді за наявним дослідним розподілом, можна визначити значення a, яке прийняла випадкова величина, якщо відомий її закон розподілу, то не важко знайти ймовірність того, що випадкова величина набуде значення не менше a. Якщо величина aотримано як результат спостереження випадкової величини x, тобто. при розподілі аналізованої ознаки, за передбачуваним теоретичним законом, ймовірність має бути малої. Якщо ж ймовірність виявилася малою, це пояснюється лише тим, що фактично отриманому значення не випадкової величини x, а якийсь інший із іншим законом розподілу, тобто. ознака, що вивчається, розподілена не за передбачуваним законом. Отже, у разі, коли мала -розбіжності між емпіричними і теоретичними розподілами слід визнати не істотним- випадковим, а досвідчений і теоретичний розподіл не суперечать, тобто. узгоджуються один з одним.

Якщо ймовірність мала, то розбіжності між досвідченим і теоретичним розподілами суттєві, пояснити їх випадковістю не можна, а гіпотезу про розподіл ознаки за передбачуваним теоретичним законом слід вважати не підтвердженим, вона не узгоджується з досвідченими даними. Необхідно ретельно вивчивши дослідні дані спробувати знайти новий закон про якість гаданої ознаки, який краще, повніше відбивав би особливості досвідченого розподілу, такі ймовірності вважаються малими та їх беруть не перевищують 0,1.

Критерії згоди Пірсона чи критеріїз 2 .

Нехай аналіз дослідних даних привів до вибору деякого закону розподілу, як передбачуваного для аналізованої ознаки, а за досвідченими даними в результаті n-спостережень, знайдені параметри (якщо вони не були відомі раніше). Позначимо через n i- емпіричні частоти випадкової величини x.

n×P i-теоретичні частоти, що становлять твір числа спостережень nна ймовірності P i- розраховані за передбачуваним теоретичним розподілом. Критерії згоди з 2за міру розбіжності теоретичного та емпіричного рядів частот приймають величину

;

з 2-величина, яку називають з 2розподіл чи розподіл Пірсона. Вона дорівнює 0 тільки при збігу всіх емпіричних і теоретичних частот, в інших випадках відмінна від 0 і тим більше, чим більша розбіжність між зазначеними частотами. Доведено, що обрана характеристика з 2або статистика при n®¥ має розподіл Пірсона зі ступенями свободи

k=m-s- 1.

де m-Кількість інтервалів емпіричного розподілу варіаційного ряду або число груп.

s-число параметрів теоретичного розподілу, що визначаються за досвідченими даними, (наприклад у разі нормального розподілу число параметрів, що оцінюються за вибіркою, дорівнює 2).

Схема застосування критерію зводиться до такого:

1. За досвідченими даними вибирають як передбачуваний закон розподілу ознаки та знаходять його параметри.

2. За допомогою одержаного розподілу визначають теоретичні частоти, що відповідають дослідним частотам.

3. Нечисленні дослідні частоти, якщо вони є, поєднують із сусідніми, потім за формулою визначають величину з 2 .

4. Визначають кількість ступенів свободи k .

5. З таблиць програми для обраного рівня значимості aзнаходять критичне значення при числі ступенів свободи рівним k .

6. Формулюємо висновок, керуючись загальним принципом застосування критеріїв згоди, а саме якщо ймовірність >0,01, то розбіжності між теоретичними і досвідченими частотами визнаються не суттєвими.

Якщо фактично спостерігається значення більше критичного, то H 0відкидається, якщо гіпотеза не суперечить досвідченим даним. Критерій з 2дає задовільні результати, якщо у кожному групувальному інтервалі достатня кількість спостережень n i .

Примітка: Якщо в якомусь інтервалі кількість спостережень<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n iбуло не менше 5. При цьому при обчисленні числа ступенів свободи kяк m-береться відповідно зменшена кількість інтервалів.

Отримано наступний розподіл 100 робітників цеху з вироблення у звітному році

(У %-тах до попереднього року).