Теоретичні та емпіричні частоти. Перевірка на нормальність розподілу
При аналізі варіаційних рядів розподілу велике значення має, наскільки емпіричний розподілознаки відповідає нормальному. Для цього частоти фактичного розподілу слід порівняти з теоретичними, які характерні для нормального розподілу. Отже, необхідно за фактичними даними обчислити теоретичні частоти кривої нормального розподілу, які є функцією нормованих відхилень.
Інакше висловлюючись, емпіричну криву розподілу необхідно вирівняти кривою нормального розподілу.
Об'єктивна характеристика відповідності теоретичнихі емпіричних частотможе бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.
Критерієм згодиназивають критерій, який дозволяє встановити, чи є розбіжність емпіричногоі теоретичногорозподілів випадковим чи значимим, т. е. чи узгоджуються дані спостережень з висунутої статистичної гіпотезою чи погоджуються. Розподіл генеральної сукупності, що вона має з висунутої гіпотези, називають теоретичним.
Виникає потреба встановити критерій(правило), яке дозволяло б судити, чи є розбіжність між емпіричним та теоретичним розподілами випадковим чи значущим. Якщо розбіжність виявиться випадковим, то вважають, що дані спостережень (вибірки) узгоджуються з висунутою гіпотезою про закон розподілу генеральної сукупності і, отже, приймають гіпотезу; якщо ж розбіжність виявиться значущимдані спостережень не узгоджуються з гіпотезою і її відкидають.
Зазвичай емпіричні та теоретичні частоти різняться через те, що:
розбіжність випадково пов'язане з обмеженою кількістю спостережень;
розбіжність невипадково і тим, що статистична гіпотеза у тому, що генеральна сукупність розподілена нормально - хибна.
Таким чином, критерії згодидозволяють відкинути чи підтвердити правильність висунутої при вирівнюванні низки гіпотези про характері розподілу в емпіричному ряду.
Емпіричні частотиодержують у результаті спостереження. Теоретичні частотирозраховують за формулами.
Для закону нормального розподілуїх можна знайти таким чином:
Σƒ i- сума накопичених (кумулятивних) емпіричних частот
h - різниця між двома сусідніми варіантами
σ - вибіркове середньоквадратичне відхилення
t-нормоване (стандартизоване) відхилення
φ(t) – функція щільності ймовірності нормального розподілу (знаходять за таблицею значень локальної функції Лапласа для відповідного значення t)
Є кілька критеріїв згоди, найпоширенішими у тому числі є: критерій хи-квадрат (Пірсона), критерій Колмогорова, критерій Романовського.
Критерій згоди Пірсона 2 – один з основних, який можна представити як суму відносин квадратів розбіжностей між теоретичними (f Т) та емпіричними (f) частотами до теоретичних частот:
k–число груп, куди розбито емпіричне розподіл,
f i -спостерігається частота ознаки в i-й групі,
f T – теоретична частота.
Для розподілу 2 складено таблиці, де вказано критичне значення критерію згоди 2 для обраного рівня значущості α і ступенів свободи df (або ν). Рівень значимості α – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. Р - статистична достовірністьприйняття правильної гіпотези. У статистиці найчастіше користуються трьома рівнями значимості:
α=0,10, тоді Р=0,90 (у 10 випадках із 100)
α=0,05, тоді Р=0,95 (у 5 випадках із 100)
α=0,01, тоді Р=0,99 (у 1 випадку зі 100) може бути відкинута правильна гіпотеза
Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти. Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки. Тому при вирівнюванні по кривою нормального розподілучисло ступенів свободи визначається як df = k-3. Для оцінки суттєвості розрахункове значення порівнюється з табличним χ 2 табл.
При повному збігу теоретичного та емпіричного розподілів χ 2 =0, інакше χ 2 >0. Якщо χ 2 розрахунків > χ 2 табл, то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляємо. У разі, якщо χ 2 розрах.< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсянормальному розподілу. Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий (N>50), причому частота кожної групи повинна бути не менше 5.
Критерій згоди Колмогоровазаснований на визначенні максимальної розбіжності між накопиченими емпіричними та теоретичними частотами:
де D і d – відповідно, максимальна різниця між накопиченими частотами та накопиченими частотами емпіричного та теоретичного розподілів. По таблиці розподілу статистики Колмогорова визначають ймовірність, що може змінюватися від 0 до 1. При Р(λ)=1- відбувається повний збіг частот, Р(λ)=0 – повне розбіжність. Якщо величина ймовірності Р значна стосовно знайденої величини λ, можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві, т. е. носять випадковий характер. Основна умова використання критерію Колмогорова досить велика кількість спостережень.
Критерій згоди Колмогорова
Розглянемо як критерій Колмогорова (λ) застосовується при перевірці гіпотези про нормальний розподілгенеральної сукупності. Вирівнювання фактичного розподілу по кривій нормального розподілу складається з кількох етапів:
Порівнюють фактичні та теоретичні частоти.
За фактичними даними, визначають теоретичні частоти кривої нормального розподілу, яка є функцією нормованого відхилення.
Перевіряють, наскільки розподіл ознаки відповідає нормальному.
Для IV колонки таблиці:
У MS Excel нормований відхилення (t) розраховується за допомогою функції НОРМАЛІЗАЦІЯ. Необхідно виділити діапазон вільних осередків за кількістю варіантів (рядок електронної таблиці). Не знімаючи виділення, викликати функцію НОРМАЛІЗАЦІЯ. У діалоговому вікні, що з'явилося, вказати наступні осередки, в яких розміщені, відповідно, спостерігаються значення (X i), середня (X) і середньоквадратичне відхилення Ϭ. Операцію обов'язково завершити одночаснимнатисканням клавіш Ctrl+Shift+Enter
Для V колонки таблиці:
Функцію густини ймовірності нормального розподілу φ(t) знаходимо за таблицею значень локальної функції Лапласа для відповідного значення нормованого відхилення (t)
Для VI колонки таблиці:
Критерій згоди Колмогорова (λ)визначається шляхом поділу модуля max різниціміж емпіричними та теоретичними кумулятивними частотами на корінь квадратний з числа спостережень:
За спеціальною таблицею ймовірності для критерію згоди λ визначаємо, що значення λ=0,59 відповідає ймовірність 0,88 (λ
Розподіл емпіричних та теоретичних частот, щільності ймовірності теоретичного розподілу
Застосовуючи критерії згоди для перевірки відповідності емпіричного розподілу теоретичному, слід розрізняти перевірку простих і складних гіпотез.
Одновибірковий критерій нормальності Колмогорова-Смирнова заснований на максимумі різниціміж кумулятивним емпіричним розподілом вибірки та передбачуваним (теоретичним) кумулятивним розподілом. Якщо D статистика Колмогорова-Смирнова значуща, то гіпотеза у тому, що відповідний розподіл нормально, має бути відкинуто.
Для перевірки гіпотези про відповідність емпіричного розподілу теоретичному закону розподілу використовуються спеціальні статистичні показники - критерії згоди (або критерії відповідності). До них належать критерії Пірсона, Колмогорова, Романовського, Ястремського та ін. Більшість критеріїв згоди базуються на використанні відхилень емпіричних частот від теоретичних. Очевидно, що чим менше ці відхилення, тим краще теоретичний розподіл відповідає емпіричному (або описує його).
Критерії згоди- це критерії перевірки гіпотез щодо відповідності емпіричного розподілу теоретичному розподілу ймовірностей. Такі критерії поділяються на два класи: загальні та спеціальні. Загальні критерії згоди застосовні до найзагальнішого формулювання гіпотези, а саме, до гіпотези про згоду результатів, що спостерігаються, з будь-яким апріорно передбачуваним розподілом ймовірностей. Спеціальні критерії згоди передбачають спеціальні нульові гіпотези, що формулюють згоду з певною формою розподілу ймовірностей.
Критерії згоди, спираючись на встановлений закон розподілу, дають можливість встановити, коли розбіжності між теоретичними та емпіричними частотами слід визнати несуттєвими (випадковими), а коли – суттєвими (невипадковими). З цього випливає, що критерії згоди дозволяють відкинути або підтвердити правильність висунутої при вирівнюванні низки гіпотези про характер розподілу в емпіричному ряду і дати відповідь, чи можна прийняти для даного емпіричного розподілу модель, виражену деяким теоретичним законом розподілу.
Критерій згоди Пірсона c 2 (хі-квадрат) – один із основних критеріїв згоди. Запропоновано англійським математиком Карлом Пірсоном (1857-1936) для оцінки випадковості (суттєвості) розбіжностей між частотами емпіричного та теоретичного розподілів:
Схема застосування критерію з 2 до оцінки узгодженості теоретичного та емпіричного розподілів зводиться до наступного:
1. Визначається розрахункова міра розбіжності.
2. Визначається кількість ступенів свободи.
3. За кількістю ступенів свободи n за допомогою спеціальної таблиці визначається.
4. Якщо , то при заданому рівні значущості α та кількості ступенів свободи n гіпотезу про несуттєвість (випадковість) розбіжностей відхиляють. В іншому випадку гіпотезу можна визнати такою, що не суперечить отриманим експериментальним даним і з ймовірністю (1 – α) можна стверджувати, що розбіжності між теоретичними та емпіричними частотами випадкові.
Рівень значущості- це можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. У статистичних дослідженнях залежно від важливості та відповідальності розв'язуваних завдань користуються такими трьома рівнями значимості:
1) a = 0,1, тоді Р = 0,9;
2) a = 0,05, тоді Р = 0,95;
3) a = 0,01, тоді Р = 0,99.
Використовуючи критерій згоди з 2, необхідно дотримуватися таких умов:
1. Обсяг досліджуваної сукупності має бути досить великим ( N≥ 50), при цьому частота або чисельність групи повинна бути не менше 5. Якщо ця умова порушується, необхідно попередньо об'єднати невеликі частоти (менше 5).
2. Емпіричний розподіл має складатися з даних, отриманих у результаті випадкового відбору, тобто. вони мають бути незалежними.
Недоліком критерію згоди Пірсона є втрата частини первинної інформації, пов'язана з необхідністю угруповання результатів спостережень в інтервали та об'єднання окремих інтервалів з малою кількістю спостережень. У зв'язку з цим рекомендується доповнювати перевірку відповідності розподілів за критерієм з іншими критеріями. Особливо це необхідно за порівняно малого обсягу вибірки ( n ≈ 100).
У статистиці критерій згоди Колмогорова(також відомий, як критерій згоди Колмогорова - Смирнова) використовується для того, щоб визначити, чи підпорядковуються два емпіричні розподіли одному закону, або визначити, чи підпорядковується отриманий розподіл передбачуваної моделі. Критерій Колмогорова заснований на визначенні максимальної розбіжності між накопиченими частотами чи частотами емпіричних чи теоретичних розподілів. Критерій Колмогорова обчислюється за такими формулами:
де Dі d- відповідно максимальна різниця між накопиченими частотами ( f – f¢) та між накопиченими частостями ( p – p¢) емпіричного та теоретичного рядів розподілів; N- Число одиниць у сукупності.
Розрахувавши значення λ, за спеціальною таблицею визначається ймовірність, з якою можна стверджувати, що відхилення емпіричних частот від теоретичних є випадковими. Якщо ознака набуває значення до 0,3, це означає, що відбувається повний збіг частот. При великому числі спостережень умов Колмогорова здатний виявити будь-який відступ гіпотези. Це означає, що будь-яка відмінність розподілу вибірки від теоретичного буде з його допомогою виявлено, якщо спостережень буде багато. Практична значущість цієї властивості не суттєва, тому що в більшості випадків важко розраховувати на отримання великої кількості спостережень у незмінних умовах, теоретичне уявлення про закон розподілу, якому має підкорятися вибірка, завжди наближене, а точність статистичних перевірок не повинна перевищувати точність обраної моделі.
Критерій згоди Романовськогозаснований використання критерію Пірсона, тобто. вже знайдених значень c 2 і числа ступенів свободи:
де n – число ступенів свободи варіації.
Критерій Романовського зручний за відсутності таблиць для . Якщо< 3, то расхождения распределений случайны, если же >3, то не випадкові і теоретичний розподіл не може служити моделлю для емпіричного розподілу, що вивчається.
Б. С. Ястремський використовував у критерії згоди не число ступенів свободи, а кількість груп ( k), особливу величину q, що залежить від числа груп, та величину хі-квадрат. Критерій згоди Ястремськогомає той самий сенс, як і критерій Романовського, і виражається формулою
де c 2 – критерій згоди Пірсона; - Число груп; q - коефіцієнт, число груп менше 20 рівний 0,6.
Якщо Lфакт > 3, розходження між теоретичними і емпіричними розподілами невипадкові, тобто. емпіричний розподіл не відповідає вимогам нормального розподілу. Якщо Lфакт< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.
При аналізі варіаційних рядів розподілу велике значення має, наскільки емпіричний розподілознаки відповідає нормальному. Для цього частоти фактичного розподілу слід порівняти з теоретичними, які характерні для нормального розподілу. Отже, необхідно за фактичними даними обчислити теоретичні частоти кривої нормального розподілу , що є функцією нормованих відхилень.
Інакше висловлюючись, емпіричну криву розподілу необхідно вирівняти кривою нормального розподілу.
Об'єктивна характеристика відповідності теоретичнихі емпіричних частотможе бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди.
Критерієм згодиназивають критерій, який дозволяє встановити, чи є розбіжність емпіричногоі теоретичногорозподілів випадковим чи значимим, т. е. чи узгоджуються дані спостережень з висунутої статистичної гіпотезою чи погоджуються. Розподіл генеральної сукупності, що вона має з висунутої гіпотези, називають теоретичним.
Виникає потреба встановити критерій(правило), яке дозволяло б судити, чи є розбіжність між емпіричним та теоретичним розподілами випадковим чи значущим. Якщо розбіжність виявиться випадковим, то вважають, що дані спостережень (вибірки) узгоджуються з висунутою гіпотезою про закон розподілу генеральної сукупності і, отже, приймають гіпотезу; якщо ж розбіжність виявиться значущимдані спостережень не узгоджуються з гіпотезою і її відкидають.
Зазвичай емпіричні та теоретичні частоти різняться через те, що:
- розбіжність випадково пов'язане з обмеженою кількістю спостережень;
- розбіжність невипадкова і пояснюється тим, що статистична гіпотеза про те, що генеральна сукупність розподілена нормально помилкова.
Таким чином, критерії згодидозволяють відкинути чи підтвердити правильність висунутої при вирівнюванні низки гіпотези про характері розподілу в емпіричному ряду.
Емпіричні частотиодержують у результаті спостереження. Теоретичні частотирозраховують за формулами.
Для закону нормального розподілуїх можна знайти таким чином:
- Σƒ i - сума накопичених (кумулятивних) емпіричних частот
- h — різниця між двома сусідніми варіантами
- σ - вибіркове середньоквадратичне відхилення
- t-нормоване (стандартизоване) відхилення
- φ(t)–функція щільності ймовірності нормального розподілу (знаходять для відповідного значення t)
Є кілька критеріїв згоди, найпоширенішими у тому числі є: критерій хи-квадрат (Пірсона), критерій Колмогорова, критерій Романовського.
Критерій згоди Пірсона χ 2– один з основних, який можна представити як суму відносин квадратів розбіжностей між теоретичними (f Т ) та емпіричними (f) частотами до теоретичних частот:
- k–число груп, куди розбито емпіричне розподіл,
- f i -Спостерігається частота ознаки в i-й групі,
- f T -Теоретична частота.
Для розподілу 2 складено таблиці, де вказано критичне значення критерію згоди 2 для обраного рівня значущості α і ступенів свободи df (або ν).
Рівень значимості α – можливість помилкового відхилення висунутої гіпотези, тобто. ймовірність того, що буде відкинуто правильну гіпотезу. Р - статистична достовірністьприйняття правильної гіпотези. У статистиці найчастіше користуються трьома рівнями значимості:
α=0,10, тоді Р=0,90 (у 10 випадках із 100)
α=0,05, тоді Р=0,95 (у 5 випадках із 100)
α=0,01, тоді Р=0,99 (у 1 випадку зі 100) може бути відкинута правильна гіпотеза
Число ступенів свободи df визначається як число груп у ряді розподілу мінус число зв'язків: df = k -z. Під числом зв'язків розуміється число показників емпіричного низки, використаних під час обчислення теоретичних частот, тобто. показників, що пов'язують емпіричні та теоретичні частоти.Наприклад, при вирівнюванні по кривій нормального розподілу є три зв'язки.Тому при вирівнюванні покривою нормального розподілучисло ступенів свободи визначається як df = k-3.Для оцінки суттєвості розрахункове значення порівнюється з табличним χ 2 табл
При повному збігу теоретичного та емпіричного розподілів χ 2 =0, інакше χ 2 >0. Якщо χ 2 розрах. > χ 2 табл. , то при заданому рівні значущості та числі ступенів свободи гіпотезу про несуттєвість (випадковості) розбіжностей відхиляємо.У разі, якщо χ 2 розрах.< χ 2 табл то гіпотезу приймаємо і з ймовірністю Р=(1-α) можна стверджувати, що розбіжність між теоретичними та емпіричними частотами є випадковою. Отже, є підстави стверджувати, що емпіричний розподіл підпорядковується нормальному розподілу. Критерій згоди Пірсона використовується, якщо обсяг сукупності досить великий (N>50), причому частота кожної групи повинна бути не менше 5.
Заснований на визначенні максимальної розбіжності між накопиченими емпіричними та теоретичними частотами:
де D і d – відповідно, максимальна різниця між накопиченими частотами та накопиченими частостями емпіричного та теоретичного розподілів.
По таблиці розподілу статистики Колмогорова визначають ймовірність, що може змінюватися від 0 до 1. При Р(λ)=1- відбувається повний збіг частот, Р(λ)=0 – повне розбіжність. Якщо величина ймовірності Р значна стосовно знайденої величини λ, можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві, т. е. носять випадковий характер.
Основна умова використання критерію Колмогорова досить велика кількість спостережень.
Критерій згоди Колмогорова
Розглянемо як критерій Колмогорова (λ) застосовується при перевірці гіпотези про нормальний розподілгенеральної сукупності.Вирівнювання фактичного розподілу по кривій нормального розподілу складається з кількох етапів:
- Порівнюють фактичні та теоретичні частоти.
- За фактичними даними визначають теоретичні частоти кривої нормального розподілу, що є функцією нормованого відхилення.
- Перевіряють, наскільки розподіл ознаки відповідає нормальному.
ДляIVколонки таблиці:
У MS Excel нормований відхилення (t) розраховується за допомогою функції НОРМАЛІЗАЦІЯ. Необхідно виділити діапазон вільних осередків за кількістю варіантів (рядок електронної таблиці). Не знімаючи виділення, викликати функцію НОРМАЛІЗАЦІЯ. У діалоговому вікні, що з'явилося, вказати наступні осередки, в яких розміщені, відповідно, спостерігаються значення (X i), середня (X) і середньоквадратичне відхилення Ϭ. Операцію обов'язково завершити одночаснимнатисканням клавіш Ctrl+Shift+Enter
ДляVколонки таблиці:
Функцію густини ймовірності нормального розподілу φ(t) знаходимо за таблицею значень локальної функції Лапласа для відповідного значення нормованого відхилення (t)
ДляVIколонки таблиці:
Критерій згоди Колмогорова (λ)визначається шляхом поділу модуляmax різниціміж емпіричними та теоретичними кумулятивними частотами на корінь квадратний з числа спостережень:
За спеціальною таблицею ймовірності для критерію згоди λ визначаємо, що значення λ=0,59 відповідає ймовірність 0,88 (λ
Розподіл емпіричних та теоретичних частот, щільності ймовірності теоретичного розподілу
Застосовуючи критерії згоди для перевірки відповідності емпіричного розподілу теоретичному, слід розрізняти перевірку простих і складних гіпотез.
Одновибірковий критерій нормальності Колмогорова-Смирнова заснований на максимумі різниціміж кумулятивним емпіричним розподілом вибірки та передбачуваним (теоретичним) кумулятивним розподілом. Якщо D статистика Колмогорова-Смирнова значуща, то гіпотеза у тому, що відповідний розподіл нормально, має бути відкинуто.
Дивись також
Критерії для перевірки випадковості та оцінки різко виділяються спостережень Література Введення У практиці статистичного аналізу експериментальних даних основний інтерес представляє не саме по собі обчислення тих чи інших статистик, а відповіді на питання такого типу. Відповідно розроблено і безліч критеріїв для перевірки висунутих статистичних гіпотез. Усі критерії для перевірки статистичних гіпотез поділяються на дві великі групи: параметричні та непараметричні.
Поділіться роботою у соціальних мережах
Якщо ця робота Вам не підійшла внизу сторінки, є список схожих робіт. Також Ви можете скористатися кнопкою пошук
Контрольна робота
Використання критеріїв згоди
Вступ
Література
Вступ
У практиці статистичного аналізу експериментальних даних основний інтерес представляє саме собою обчислення тих чи інших статистик, а відповіді питання такого типу. Чи справді середня генеральна сукупність дорівнює деякому числу? Чи значно відрізняється від нуля коефіцієнт кореляції? Чи рівні дисперсії двох вибірок? І таких питань, залежно від конкретного дослідницького завдання, може виникати багато. Відповідно розроблено і безліч критеріїв для перевірки висунутих статистичних гіпотез. Деякі найуживаніші з них ми й розглянемо. В основному вони відноситимуться до середніх, дисперсій, коефіцієнтів кореляції та розподілів чисельностей.
Усі критерії для перевірки статистичних гіпотез поділяються на дві великі групи: параметричні та непараметричні. Параметричні критерії засновані на припущенні, що вибіркові дані взяті з генеральної сукупності з відомим розподілом, і основне завдання полягає в оцінці параметрів цього розподілу. Для непараметричних критеріїв не потрібно ніяких припущень про характер розподілу, за винятком припущення, що він безперервний.
Першими розглянемо параметричні критерії. Послідовність перевірки буде включати формулювання нуль-гіпотези та альтернативної гіпотези, формулювання допущень, визначення вибіркової статистики, що використовується при перевірці і, утворення вибіркового розподілу статистики, визначення критичних областей для обраного критерію і побудова довірчого інтервалу для вибіркової статистики.
1 Критерії згоди для середніх
Нехай перевірена гіпотеза у тому, що параметр генеральної сукупності. Необхідність такої перевірки може виникнути, наприклад, у такій ситуації. Припустимо, що на підставі великих досліджень встановлений діаметр раковини викопного молюска у відкладеннях з фіксованого місця. Нехай також у нашому розпорядженні виявилася деяка кількість раковин, знайдених в іншому місці, а ми робимо припущення, що конкретне місце не впливає на діаметр раковини, тобто. що середнє значення діаметра раковини для всієї популяції молюсків, що колись жили в новому місці, дорівнює відомому значенню, отриманому раніше при вивченні даного виду молюсків у першому місці проживання.
Якщо це відоме значення одно, то нуль-гіпотеза і альтернативна гіпотеза записуються наступним чином: Приймемо, що змінна x у сукупності має нормальний розподіл, а величина дисперсії генеральної сукупності невідома.
Будемо перевіряти гіпотезу за допомогою статистики:
, (1)
де – вибіркове стандартне відхилення.
Було показано, що якщо справедлива, то у виразі (1) має t-розподіл Стьюдента з n-1 ступенями свободи. Якщо вибрати рівень значущості (імовірність відкинути правильну гіпотезу) рівним, то відповідно до того, про що йшлося в попередньому розділі, можна визначити критичні значення для перевірки =0.
В даному випадку, так як розподіл Стьюдента симетрично, то (1-) частина площі під кривою цього розподілу з n-1 ступенями свободи буде укладена між точками і які рівні один одному за абсолютною величиною. Отже, всі значення менше від'ємного і більше позитивного для t-розподілу із заданим числом ступенів свободи при вибраному рівні значущості становитимуть критичну область. Попадання вибіркового значення t у цю сферу призводить до прийняття альтернативної гіпотези.
Довірчий інтервал для будується за описаною раніше методикою і визначається з наступного виразу
(2)
Отже, нехай у нашому випадку відомо, що діаметр раковини викопного молюска дорівнює 182 мм. У нашому розпорядженні виявилася вибірка з 50 новознайдених раковин, для яких мм, а = 2,18 мм. Перевіримо: =18,2 проти Маємо
Якщо рівень значущості вибрати =0,05, то критичне значення. Звідси випливає, що можна відхилити на користь лише на рівні значимості =0,05 . Таким чином, для нашого гіпотетичного прикладу можна стверджувати (природно, з деякою ймовірністю), що діаметр раковини викопних молюсків певного виду залежить від місць, де вони жили.
У зв'язку з тим, що t-розподіл симетрично, наводяться лише позитивні значення t цього розподілу при вибраних рівнях значущості та кількості ступенів волі. Причому враховується як частка площі під кривою розподілу праворуч від значення t, а й водночас ліворуч від значення -t. Це з тим, що у більшості випадків під час перевірки гіпотез нас цікавить суттєвість відхилень як така, незалежно від цього, у більшу чи меншу бік ці відхилення, тобто. ми перевіряємо проти, а не проти: >a чи: Повернемося тепер до нашого прикладу. Довірчий 100(1-)% інтервал для дорівнює 18,92,01
Розглянемо тепер випадок, коли необхідно порівняти між собою середні дві генеральні сукупності. Перевірена гіпотеза виглядає так: : =0, : 0. Передбачається також, що має нормальний розподіл із середнім та дисперсією, а - нормальний розподіл із середнім і тією ж дисперсією. Крім того, приймаємо, що вибірки, за якими оцінюються генеральні сукупності, витягуються незалежно один від одного і мають обсяг відповідно і. некорельовано. Перевірка нульової гіпотези проводиться з використанням статистики (3)
де і - оцінки дисперсії для першої та другої вибірок відповідно. Неважко бачити, що (3) є узагальнення (1). Було показано, що статистика (3) має t-розподіл Стьюдента зі ступенями свободи. За рівності і, тобто. = = формула (3) спрощується і має вигляд (4)
Розглянемо приклад. Нехай при вимірі стеблового листя однієї і тієї ж популяції рослин протягом двох сезонів отримані наступні результати: Вважатимемо, що умови для використання критерію Стьюдента, тобто. нормальність генеральних сукупностей, у тому числі взяті вибірки, існування невідомої, але однієї й тієї дисперсії цих сукупностей і незалежність вибірок виконані. Оцінимо лише на рівні значимості =0,01. Маємо Табличне значення t = 2,58. Тому гіпотеза про рівність середніх значень довжин стеблового листя для популяції рослин протягом двох сезонів має відкинути на обраному рівні значущості. Увага! Як нульова гіпотеза в математичній статистиці вибирається гіпотеза про відсутність значних відмінностей між порівнюваними показниками, причому незалежно від того, чи йдеться про середні, дисперсія або інші статистики. І в усіх цих випадках, якщо емпіричне (обчислене за формулою) значення критерію більше за теоретичне (обраного з таблиць), то відкидається. Якщо ж емпіричне значення менше табличного, то приймається. Для того, щоб побудувати довірчий інтервал для різниці середніх цих двох генеральних сукупностей, звернемо увагу на те, що критерій Стьюдента, як видно з формули (3), оцінює значимість різниці між середніми щодо стандартної помилки цієї різниці. У тому, що знаменник (3) представляє саме цю стандартну помилку, неважко переконатися, використовуючи вже розглянуті раніше співвідношення і зроблені припущення. Насправді нам відомо, що в загальному випадку Якщо x та y незалежні, то і Взявши замість x і y вибіркові значення та пригадавши зроблене припущення про те, що обидві генеральні сукупності мають одну й ту саму дисперсію, отримаємо (5)
Оцінка дисперсії може бути отримана з наступного співвідношення (6)
(Ми ділимо на, тому що за вибірками оцінюються дві величини і, отже, кількість ступенів свободи має бути зменшена на два.) Якщо тепер підставити (6) (5) і витягти квадратний корінь, то вийде знаменник у виразі (3). Після цього відступу повернемося до побудови довірчого інтервалу через -. Маємо Зробимо деякі зауваження, пов'язані з припущеннями, які використовуються при побудові t-критерію. Насамперед було показано, що порушення припущення про нормальність мають незначний вплив на рівень значущості та потужність критерію для 30. Несуттєво також і порушення припущення про однорідність дисперсій обох генеральних сукупностей, з яких беруться вибірки, але тільки в тому випадку, коли обсяги вибірок рівні. Якщо ж дисперсії обох сукупностей відрізняються один від одного, то ймовірності помилок першого і другого роду будуть істотно відрізнятися від очікуваних. У цьому випадку для перевірки слід скористатися критерієм (7)
з числом ступенів свободи . (8)
Як правило, виходить дробовим числом, тому при користуванні таблицями t-розподілу необхідно брати табличні значення для найближчих цілих значень та проводити інтерполяцію для знаходження t, що відповідає отриманому. Розглянемо приклад. Під час вивчення двох підвидів озерної жаби розраховувалося відношення довжини тіла до довжини гомілки. Було взято дві вибірки з обсягами =49 і =27. Середні та дисперсії цікавого для нас відносини виявилися рівними відповідно =2,34; =2,08; =0,21; =0,35. Якщо тепер перевіряти гіпотезу з використанням формули (2), то отримаємо, що При рівні значущості =0,05 ми повинні відкинути нульову гіпотезу (табличне значення t=1,995) і вважати, що є статистично достовірні на обраному рівні значущості відмінності між середніми показниками вимірювань для двох підвидів жаби. При використанні формул (6) і (7) маємо В даному випадку для того ж рівня значущості = 0,05 табличне значення t = 2,015 і нульова гіпотеза приймається. На цьому прикладі досить ясно видно, що зневага умовами, що приймаються при виведенні того чи іншого критерію, може призвести до результатів, прямо протилежних тим, що мають місце насправді. Звичайно ж, у даному випадку, маючи вибірки різного обсягу без заздалегідь встановленого факту про те, що дисперсії вимірюваного показника в обох популяціях статистично рівні, слід користуватися формулами (7) і (8), які і показали відсутність статистично значущих відмінностей. Тому хочеться повторити ще раз, що перевірка дотримання всіх припущень, зроблених при виведенні того чи іншого критерію, є необхідною умовою для його коректного використання. Незмінною вимогою в обох наведених модифікаціях t-критерію була вимога про незалежність між собою вибірок. Однак на практиці досить часто зустрічаються ситуації, коли ця вимога не може бути виконана з об'єктивних причин. Наприклад, вимірюються деякі показники на тому самому тваринному чи ділянці території до і після дії зовнішнього чинника тощо. І у цих випадках нас може цікавити перевірка гіпотези проти. Будемо, як і раніше, припускати, що обидві вибірки взяті з нормальних генеральних сукупностей з однаковою дисперсією. У цьому випадку можна скористатися тим фактом, що різниці між нормально розподіленими величинами також мають нормальний розподіл, і тому можна скористатися критерієм Стьюдента у формі (1). Таким чином, перевірятиметься гіпотеза про те, що n різниць є вибірка з нормально розподіленої генеральної сукупності із середнім, рівним нулю. Позначивши i-ю різницю через, маємо , (9) Розглянемо приклад. Нехай у нашому розпорядженні є дані про кількість імпульсів окремої нервової клітини за певний інтервал часу до () та після () дії подразника: Звідси Маючи на увазі, що (9) має t-розподіл, і вибравши рівень значущості = 0,01, з відповідної таблиці Додатка знайдемо, що критичне значення t для n-1 = 10-1 = 9 ступенів волі дорівнює 3,25. Порівняння теоретичного та емпіричного значень t-статистики показує, що нульова гіпотеза про відсутність статистично значущих відмінностей між частотою імпульсації до та після подачі стимулу має бути відкинута. Можна дійти невтішного висновку у тому, сто використовуваний подразник статистично значимо змінює частоту імпульсації. В експериментальних дослідженнях, як згадувалося, залежні вибірки з'являються досить часто. Тим не менш, цей факт іноді ігнорується і t-критерій некоректно використовується у формі (3). У неправомірності цього можна переконатися, розглядаючи стандартні помилки різниці між некорельованими та корельованими середніми. У першому випадку А в другому Стандартна помилка різниці d дорівнює З урахуванням цього знаменник у (9) матиме вигляд Тепер звернемо увагу на те, що чисельники виразів (4) та (9) збігаються: отже, відмінність у величині t у яких залежить від знаменників. Таким чином, якщо в задачі із залежними вибірками буде використана формула (3), і при цьому вибірки матимуть позитивну кореляцію, то одержувані значення t будуть меншими, ніж вони мали б бути при використанні формули (9), і може виникнути ситуація, що буде прийнято нульову гіпотезу, тоді як вона невірна. Зворотна ситуація може виникнути, коли між вибірками буде негативна кореляція, тобто. в цьому випадку значущими будуть визнаватись такі відмінності, які насправді такими не є. Повернемося знову наприклад з імпульсною активністю і обчислимо для наведених даних значення t за формулою (3), не звертаючи уваги те що, що вибірки пов'язані. Маємо: Для числа ступенів свободи, що дорівнює 18, і рівня значущості =0,01 табличне значення t=2,88 і, на перший погляд, здається, що нічого не сталося, навіть при використанні непридатної для цих умов формули. І цьому випадку обчислене значення t призводить до відкидання нульової гіпотези, тобто. до того ж висновку, який був зроблений з використанням правильної в даній ситуації формулою (9). Однак давайте переформуємо наявні дані та представимо їх у наступному вигляді (2): Це ті самі значення, і вони цілком могли б бути отримані в якомусь із дослідів. Так як всі значення в обох вибірках збережені, то використання критерію Стьюдента у формулі (3) дає вже отримане значення =3,32 і призводить до того ж самого висновку, який вже був зроблений. А тепер розрахуємо значення t за формулою (9), яка повинна використовуватися в даному випадку. Маємо: Критичне значення t при вибраному рівні значущості та дев'яти ступенях свободи дорівнює 3,25. Отже, підстав відкинути нульову гіпотезу ми не маємо, ми її приймаємо, і виявляється, що цей висновок прямо протилежний тому, який був зроблений при використанні формули (3). На цьому прикладі ми знову переконалися в тому, наскільки важливо для отримання правильних висновків при аналізі експериментальних даних суворо дотримуватися всіх вимог, які були покладені в основу визначення того чи іншого критерію. Розглянуті модифікації критерію Стьюдента призначаються перевірки гіпотез щодо середніх двох вибірок. Проте виникають ситуації, коли виникає необхідність зробити висновки щодо рівності одночасно k середніх. Для цього випадку також розроблено певну статистичну процедуру, яка буде розглянута в подальшому при обговоренні питань, пов'язаних з дисперсійним аналізом. 2 Критерії згоди для дисперсій Перевірка статистичних гіпотез щодо дисперсій генеральних сукупностей проводиться у тій самій послідовності, що й середніх. Нагадаємо коротко цю послідовність. 1. Формулюється нульова гіпотеза (про відсутність статистично значимих відмінностей між порівнюваними дисперсіями). 2. Робляться деякі припущення щодо вибіркового розподілу статистики, за допомогою якої планується оцінювати параметр, який входить до гіпотези. 3. Вибирається рівень значущості для перевірки гіпотези. 4. Розраховується значення цікавої для нас статистики і приймається рішення щодо істинності нульової гіпотези. Нині ж почнемо з перевірки гіпотези у тому, що дисперсія генеральної сукупності =a, тобто. проти. Якщо припустити, що змінна x має нормальне розподілення, і що вибірка обсягу n вилучається з генеральної сукупності випадково, то для перевірки нульової гіпотези використовується статистика (10)
Згадавши формулу для розрахунку дисперсії, перепишемо (10) так: . (11)
З цього виразу видно, що чисельник є сумою квадратів відхилень нормально розподілених величин від їх середнього. Кожне із цих відхилень також розподілено нормально. Тому відповідно до відомого нам розподілу суми квадратів нормально розподілених величин статистики (10) і (11) мають -розподіл з n-1 ступенем свободи. За аналогією з використанням t-розподілу при перевірці для обраного рівня значущості за таблицею розподілу встановлюють критичні точки, що відповідають ймовірностям прийняття нульової гіпотези. Довірчий інтервал для вибраного будується наступним чином: . (12)
Розглянемо приклад. Нехай на підставі великих експериментальних досліджень встановлено, що дисперсія вмісту алкалоїдів одного виду рослин із певного району дорівнює 4,37 умовних одиниць. У розпорядження фахівця потрапляє вибірка обсягом n = 28 таких рослин, ймовірно, з того ж району. Проведений аналіз показав, що з цієї вибірки =5,01 і необхідно переконатися у цьому, що й відома раніше дисперсії статистично невиразні лише на рівні значимості =0,1. За формулою (10) маємо Отриману величину необхідно порівняти з критичними значеннями /2=0,05 та 1-/2=0,95. З таблиці Додатки з 27 ступенями свободи маємо відповідно 40,1 і 16,2, звідки випливає, що нульова гіпотеза може бути прийнята. Відповідний довірчий інтервал для дорівнює 3,37<<8,35.
На відміну від перевірки гіпотез щодо вибіркових середніх з використанням критерію Стьюдента, коли помилки першого та другого роду несуттєво змінювалися при порушенні припущення про нормальний розподіл генеральних сукупностей, у разі гіпотез про дисперсії при невиконанні умов нормальності помилки змінюються суттєво. Розглянута вище завдання про рівність дисперсії деякому фіксованому значенню становить обмежений інтерес, оскільки досить рідко трапляються ситуації, коли відома дисперсія генеральної сукупності. Значно більший інтерес представляє випадок, коли потрібно перевірити, чи дисперсії рівні двох сукупностей, тобто. перевірка гіпотези проти альтернативи При цьому передбачається, що вибірки обсягом і випадково витягуються з генеральних сукупностей дисперсій і. Для перевірки нульової гіпотези використовується критерій відношення дисперсій Фішера (13)
Так як суми квадратів відхилень нормально розподілених випадкових величин від їх середніх значень мають розподіл, то і чисельник і знаменник (13) являють собою величини з розподілом, поділені відповідно на і, отже, їх відношення має F-розподіл з -1 і -1 ступенями свободи. Загальноприйнято - і так побудовані таблиці F-розподілу, - що як числитель (13) береться велика з дисперсій, і тому визначається тільки одна критична точка, що відповідає обраному рівню значимості. Нехай у нашому розпорядженні виявилися дві вибірки обсягом =11 і =28 з популяцій звичайних та овальних ставків, котрим відношення висоти до ширини мають дисперсії =0,59 і =0,38. Необхідно перевірити гіпотезу про рівність цих дисперсій цих показників для популяцій, що вивчаються, при рівні значущості =0,05. Маємо У літературі іноді можна зустріти твердження, що перевірці гіпотези про рівність середніх за критерієм Стьюдента має передувати перевірка гіпотези про рівність дисперсій. Це неправильна рекомендація. Більше того, вона може призвести до помилок, яких можна уникнути, якщо не слідувати їй. Насправді результати перевірки гіпотези про рівність дисперсій з використанням критерію Фішера значною мірою залежать від припущення про те, що вибірки взяті із сукупностей з нормальним розподілом. У той же час критерій Стьюдента малочутливий до порушень нормальності, і якщо вдається отримати вибірки рівного обсягу, то припущення про рівність дисперсій також не є суттєвим. У разі нерівних n слід користуватися для перевірки формулами (7) та (8). При перевірці гіпотез про рівність дисперсій виникають деякі особливості у розрахунках, пов'язаних із залежними вибірками. І тут для перевірки гіпотези проти альтернативи використовується статистика (14)
Якщо нульова гіпотеза справедлива, статистика (14) має t-розподіл Стьюдента з n-2 ступенями свободи. При вимірюванні блиску 35 зразків покриттів отримано дисперсія =134,5. Повторні виміри за два тижні показали =199,1. У цьому коефіцієнт кореляції між парними вимірами виявився рівним =0,876. Якщо не звертати увагу на те, що вибірки залежать і скористатися критерієм Фішера для перевірки гіпотези, то отримаємо F=1,48. Якщо вибрати рівень значущості = 0,05, то нульова гіпотеза буде прийнята, так як критичне значення F-розподілу для = 35-1 = 34 і = 35-1 = 34 ступенів волі дорівнює 1,79. У той самий час, якщо використовувати відповідну для цього випадку формулу (14), то отримаємо t=2,35, тоді як критичне значення t для 33 ступенів свободи та обраного рівня значущості =0,05 і 2,03. Отже, нульова гіпотеза про рівність дисперсій у цих двох вибірках має бути відхилена. Таким чином, з цього прикладу видно, що, як і у разі перевірки гіпотези про рівність середніх, використання критерію, що не враховує специфіки експериментальних даних, призводить до помилки. У рекомендованій літературі можна знайти критерій Бартлетта, що використовується під час перевірки гіпотез про одночасну рівність дисперсій. Крім того, що обчислення статистики цього критерію досить трудомісткі, основний недолік цього критерію в тому, що він надзвичайно чутливий до відхилень від припущення про нормальність розподілів сукупностей, з яких вибираються вибірки. Таким чином, при його використанні ніколи не можна бути впевненим у тому, що нульова гіпотеза відхилена насправді через те, що статистично значуще різняться дисперсії, а не через те, що вибірки не мають нормального розподілу. Тому у разі виникнення проблеми порівняння кількох дисперсій необхідно шукати таку постановку завдання, коли можна буде використовувати критерій Фішера або його модифікації. 3 Критерії згоди щодо часток Досить часто доводиться аналізувати сукупності, у яких об'єкти можна віднести до однієї з двох категорій. Наприклад, за приналежністю до підлоги в деякій популяції, за наявності деякого мікроелемента в грунті, темного або світлого забарвлення яєць у деяких видів птахів і т.д. Частку елементів, що володіють певною якістю, позначимо через P, де P являє собою відношення об'єктів з цікавим для нас якістю до всіх об'єктів в сукупності.
де