Т критерій студента автоматичний розрахунок. Розподіл t-критерію Стьюдента для перевірки гіпотези про середню та розрахунку довірчого інтервалу в MS Excel

Таблиця розподілу Стьюдента

Таблиці інтеграла ймовірностей використовуються для вибірок великого обсягу з нескінченно великої генеральної сукупності. Але вже за (n)< 100 получается Несоответствие между

табличними даними та ймовірністю межі; при (n)< 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

ральної сукупності немає значення, оскільки розподіл відхилень вибіркового показника від генеральної характеристики за великої вибірці завжди виявляється нормаль-

ним. У вибірках невеликого обсягу (n)< 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

разом, що має нормальний розподіл. Теорія малих вибірок розроблена англійським статистиком У. Госсетом (що писав під псевдонімом Стьюдент) початку XX в. У

1908 р. їм побудовано спеціальний розподіл, який дозволяє і при малих вибірках співвідносити (t) і довірчу ймовірність F(t). При (n ) > 100, таблиці розподілу Стьюдента дають самі результати, як і таблиці інтеграла ймовірностей Лапласа, при 30< (n ) <

100 відмінності незначні. Тому практично до малих вибірок відносять вибірки обсягом менше ніж 30 одиниць (безумовно, великою вважається вибірка з обсягом понад 100 одиниць).

Використання малих вибірок часом обумовлено характером обстежуваної сукупності. Так, у селекційній роботі «чистого» досвіду легше досягти на невеликій кількості.

ділянок. Виробничий та економічний експеримент, пов'язаний з економічними витратами, також проводиться на невеликій кількості випробувань. Як зазначалося, у разі малої вибірки лише з нормально розподіленої генеральної сукупності може бути розраховані і довірчі ймовірності, і довірчі межі генеральної середньої.

Щільність ймовірностей розподілу Стьюдента описується функцією.

1 + t2

f (t, n) := Bn

n − 1

t - поточна змінна; n - обсяг вибірки;

B - величина, яка залежить лише від (n).

Розподіл Стьюдента має лише один параметр: (d.f.) - число ступенів свободи (іноді позначається (к)). Цей розподіл - як і нормальний, симетрично щодо точки (t) = 0, але він більш пологий. При збільшенні обсягу вибірки, отже, і числа ступенів свободи розподіл Стьюдента швидко наближається до нормального. Число ступенів свободи дорівнює числу тих індивідуальних значень ознак, якими потрібно роз-

вважати визначення шуканої характеристики. Так, для розрахунку дисперсії має бути відома середня величина. Тому при розрахунку дисперсії застосовують (d.f.) = n-1.

Таблиці розподілу Стьюдента публікуються у двох варіантах:

1. аналогічно таблицям інтеграла ймовірностей наводяться значення ( t) і відповідаю-

щі ймовірності F(t ) при різному числі ступенів свободи;

2. значення (t) наводяться для найбільш уживаних довірчих ймовірностей

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 та 0,99 або для 1 - 0,70 = 0,3; 1 – 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. при різному числі ступенів волі. Така таблиця наведена в додатку

(Таблиця 1 - 20), а також значення (t) - критерій Стьюдента при рівні значущості від 0,7

Перевірка статистичної гіпотези дозволяє зробити суворий висновок про характеристики генеральної сукупності з урахуванням вибіркових даних. Гіпотези бувають різні. Одна з них - це гіпотеза про середню ( математичному очікуванні). Суть її в тому, щоб на основі наявної вибірки зробити коректний висновок про те, де може або не може знаходиться генеральна середня (точну правду ми ніколи не дізнаємося, але можемо звузити коло пошуку).

Загальний підхід у перевірці гіпотез описаний, тому одразу до справи. Припустимо для початку, що вибірку вилучено з нормальної сукупності випадкових величин Xз генеральною середньою μ та дисперсією σ 2(Знаю-знаю, що так не буває, але не треба мене перебивати!). Середня арифметична із цієї вибірки, очевидно, сама є випадковою величиною. Якщо витягти багато таких вибірок і порахувати за ними середні, то вони також матимуть з математичним очікуванням μ і

Тоді випадкова величина

Виникає питання: чи генеральна середня з ймовірністю 95% перебуватиме в межах ±1,96. s x̅. Іншими словами, чи є розподіл випадкових величин

еквівалентними.

Вперше це питання було поставлено (і вирішено) одним хіміком, який працював на пивній фабриці Гіннеса у Дубліні (Ірландія). Хіміка звали Вільям Сілі Госсет і він брав проби пива щодо хімічного аналізу. У якийсь момент, мабуть, Вільяма почали мучити сумніви щодо розподілу середніх. Воно виходило трохи більш розмазаним, ніж має бути у нормального розподілу.

Зібравши математичне обґрунтування та розрахувавши значення функції виявленого ним розподілу, хімік з Дубліна Вільям Госсет написав замітку, яка була опублікована в березневому випуску 1908 журналу «Біометрика» (головний редактор – Карл Пірсон). Т.к. Гіннес суворо заборонив видавати секрети пивоваріння, Держсет підписався псевдонімом Стьюдент.

Незважаючи на те, що К. Пірсон вже винайшов розподіл, все-таки загальне уявлення про нормальність ще домінувало. Ніхто не збирався думати, що розподіл вибіркових оцінок може бути нормальним. Тому стаття У. Держсету залишилася практично не поміченою та забутою. І лише Рональд Фішер гідно оцінив відкриття Держсету. Фішер використав новий розподіл у своїх роботах і дав йому назву t-розподіл Стьюдента. Критерій для перевірки гіпотез, відповідно, став t-критерієм Стьюдента. Так відбулася «революція» в статистиці, яка зробила крок в епоху аналізу вибіркових даних. Це був короткий екскурс до історії.

Подивимося, що міг побачити У. Госсет. Згенеруємо 20 тисяч нормальних вибірок із 6-ти спостережень із середньою ( ) 50 та середньоквадратичним відхиленням ( σ ) 10. Потім нормуємо вибіркові середні, використовуючи генеральну дисперсію:

20 тисяч середніх, що вийшло, згрупуємо в інтервали довжиною 0,1 і підрахуємо частоти. Зобразимо на діаграмі фактичний (Norm) та теоретичний (ENorm) розподіл частот середніх вибіркових.

Крапки (спостерігаються частоти) практично збігаються з лінією (теоретичними частотами). Воно й зрозуміло, адже дані взяті з однієї й тієї ж генеральної сукупності, а відмінності – це лише помилки вибірки.

Проведемо новий експеримент. Нормуємо середні, використовуючи вибіркову дисперсію.

Знову підрахуємо частоти та нанесемо їх на діаграму у вигляді точок, залишивши для порівняння лінію стандартного нормального розподілу. Позначимо емпіричне частоти середніх, скажімо, через букву t.

Видно, що розподіли цього разу не дуже й збігаються. Близькі, так, але не однакові. Хвости стали «важчими».

Держсет-Стьюдент не мав останньої версії MS Excel, але саме цей ефект він і помітив. Чому так виходить? Пояснення у тому, що випадкова величина

залежить не тільки від помилки вибірки (числителя), а й від стандартної середньої помилки (знаменника), яка також є випадковою величиною.

Давайте трохи розберемося, який розподіл має бути такої випадкової величини. Спочатку доведеться щось згадати (або дізнатися) з математичної статистики. Є така теорема Фішера, яка говорить, що у вибірці з нормального розподілу:

1. середня та вибіркова дисперсія s 2є незалежними величинами;

2. співвідношення вибіркової та генеральної дисперсії, помножене на кількість ступенів свободи, має розподіл χ 2(Хі-квадрат) з такою ж кількістю ступенів свободи, тобто.

де k– кількість ступенів свободи (англійською degrees of freedom (d.f.))

На цьому законі ґрунтується безліч інших результатів у статистиці нормальних моделей.

Повернемося до розподілу середньої. Розділимо чисельник та знаменник виразу

на σ X̅. Отримаємо

Чисельник – це стандартна нормальна випадкова величина (позначимо ξ (Ксі)). Знаменник висловимо з теореми Фішера.

Тоді вихідний вираз набуде вигляду

Це і є у загальному вигляді (стюдентове ставлення). Вивести функцію його розподілу можна безпосередньо, т.к. розподіли обох випадкових величин у цьому виразі відомі. Залишимо це задоволення математикам.

Функція t-розподілу Стьюдента має досить складну розуміння формулу, тому немає сенсу її розбирати. Все одно їй не користується, т.к. ймовірності наведені у спеціальних таблицях розподілу Стьюдента (іноді називають таблицями коефіцієнтів Стьюдента), або забиті у формули ПЕОМ.

Отже, озброївшись новими знаннями, ви зможете зрозуміти офіційне визначення розподілу Стьюдента.
Випадковою величиною, що підпорядковується розподілу Стьюдента з kступенями свободи, називається відношення незалежних випадкових величин

де ξ розподілено за стандартним нормальним законом, а χ 2 kпідпорядковується розподілу χ 2 c kступенями свободи.

Таким чином, формула критерію Стьюдента для середньої арифметичної

Є окремий випадок студентового відношення

З формули та визначення випливає, що розподіл т-критерію Стьюдента залежить лише від кількості ступенів свободи.

При k> 30 t-критерій практично відрізняється від стандартного нормального розподілу.

На відміну від хі-квадрат, t-критерій може бути одно- та двостороннім. Зазвичай користуються двостороннім, припускаючи, що відхилення може відбуватися обидві сторони від середньої. Але якщо умова завдання допускає відхилення лише у бік, то розумно застосовувати односторонній критерій. Від цього збільшується потужність, т.к. при фіксованому рівні значущості критичне значення трохи наближається до нуля.

Умови застосування t-критерію Стьюдента

Незважаючи на те, що відкриття Стьюдента свого часу здійснило переворот у статистиці, t-критерій все ж таки досить сильно обмежений у можливостях застосування, т.к. сам собою походить з припущення про нормальному розподілі вихідних даних. Якщо дані є нормальними (що зазвичай і буває), те й t-критерій не матиме розподілу Стьюдента. Однак через дію центральної граничної теореми середня навіть у ненормальних даних швидко набуває дзвоноподібної форми розподілу.

Розглянемо, наприклад, дані, що мають виражений скіс вправо, як у розподілу хі-квадрат з 5-ма ступенями свободи.

Тепер створимо 20 тисяч вибірок і спостерігатиме, як змінюється розподіл середніх залежно від їхнього обсягу.

Відмінність досить помітна в малих вибірках до 15-20 спостережень. Але далі воно стрімко зникає. Отже, ненормальність розподілу – це, звісно, ​​погано, але некритично.

Найбільше t-критерій «боїться» викидів, тобто. аномальних відхилень. Візьмемо 20 тис. нормальних вибірок по 15 спостережень і частину їх додамо по одному випадковому викиду.

Картина виходить невтішна. Фактичні частоти середніх дуже відрізняються від теоретичних. Використання t-розподілу у такій ситуації стає вельми ризикованою витівкою.

Отже, в не дуже малих вибірках (від 15 спостережень) t-критерій щодо стійкий до ненормального розподілу вихідних даних. А ось викиди в даних сильно спотворюють розподіл t-критерію, що, у свою чергу, може призвести до помилок статистичного висновку, тому аномальних спостережень слід позбутися. Часто з вибірки видаляють усі значення, що виходять за межі ±2 стандартних відхилень від середньої.

Приклад перевірки гіпотези про математичне очікування за допомогою t-критерію Стьюдента в MS Excel

У Excel є кілька функцій, пов'язаних із t-розподілом. Розглянемо їх.

Стюдент.Расп - "класичне" лівосторонній t-розподіл Стьюдента. На вхід подається значення t-критерію, кількість ступенів свободи та опція (0 або 1), що визначає, що потрібно розрахувати: густина або значення функції. На виході отримуємо, відповідно, щільність або ймовірність того, що випадкова величина виявиться меншою за вказаний в аргументі t-критерію.

СТЬЮДЕНТ.РАСП.2Х – двосторонній розподіл. Як аргумент подається абсолютне значення (за модулем) t-критерію та кількість ступенів свободи. На виході отримуємо можливість отримати таке чи ще більше значення t-критерію, тобто. фактичний рівень важливості (p-level).

СТЬЮДЕНТ.РАСП.ПХ - правосторонній t-розподіл. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Якщо t-критерій позитивний, то ймовірність – це p-level.

СТЬЮДЕНТ.ОБР – використовується для розрахунку лівостороннього зворотного значення t-розподілу. Як аргумент подається ймовірність та кількість ступенів свободи. На виході отримуємо відповідне цій ймовірності значення t-критерію. Відлік імовірності йде ліворуч. Тому для лівого хвоста потрібен сам рівень значущості α , а для правого α .

СТЬЮДЕНТ.ОБР.2Х – зворотне значення для двостороннього розподілу Стьюдента, тобто. значення t-критерію (за модулем). Також на вхід подається рівень значущості α . Тільки цього разу відлік ведеться з двох сторін одночасно, тому ймовірність розподіляється на два хвости. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функція перевірки гіпотези про рівність математичних очікувань у двох вибірках. Замінює купу розрахунків, т.к. достатньо вказати лише два діапазони з даними та ще пару параметрів. На виході отримаємо p-level.

ДОВЕРИТ.СТЬЮДЕНТ – розрахунок довірчого інтервалу середньої з урахуванням t-розподілу.

Розглянемо такий навчальний приклад. На підприємстві фасують цемент у мішки по 50 кг. Через випадковість в окремо взятому мішку допускається деяке відхилення від очікуваної маси, але генеральна середня повинна залишатися 50кг. У відділі контролю якості випадково зважили 9 мішків і отримали такі результати: середня маса ( ) Склала 50,3кг, середньоквадратичне відхилення ( s) - 0,5 кг.

Чи узгоджується отриманий результат із нульовою гіпотезою у тому, що генеральна середня дорівнює 50кг? Іншими словами, чи можна отримати такий результат з чистого випадку, якщо обладнання працює справно і видає середнє наповнення 50 кг? Якщо гіпотеза не буде відхилена, то отримана відмінність вписується в діапазон випадкових коливань, якщо гіпотеза буде відхилена, то, швидше за все, в налаштуваннях апарата, що заповнює мішки, стався збій. Потрібна його перевірка та налаштування.

Коротка умова у загальноприйнятих позначках виглядає так.

H 0: μ = 50 кг

H 1: μ ≠ 50 кг

Є підстави припустити, що розподіл заповнюваності мішків підкоряються нормальному розподілу (чи не сильно від нього відрізняється). Отже, для перевірки гіпотези про математичне очікування можна використовувати t-критерій Стьюдента. Випадкові відхиленняможуть відбуватися у будь-який бік, отже потрібен двосторонній t-критерій.

Спочатку застосуємо допотопні засоби: ручний розрахунок t-критерію та порівняння його з критичним табличним значенням. Розрахунковий t-критерій:

Тепер визначимо, чи отримується отримане число за критичний рівень при рівні значущості α = 0,05. Скористаємося таблицею t-розподілу Стьюдента (є у будь-якому підручнику зі статистики).

Стовпцями йде ймовірність правої частини розподілу, рядками – число ступенів свободи. Нас цікавить двосторонній t-критерій з рівнем значущості 0,05, що рівнозначно t-значенню половини рівня значимості праворуч: 1 — 0,05/2 = 0,975. Кількість ступенів свободи – обсяг вибірки мінус 1, тобто. 9 - 1 = 8. На перетині знаходимо табличне значення t-критерію - 2,306. Якби ми використовували стандартний нормальний розподіл, то критичною точкоюбуло б значення 1,96, а тут вона більша, т.к. t-розподіл на невеликих вибірках має більш плескатий вигляд.

Порівнюємо фактичне (1,8) та табличне значення (2.306). Розрахунковий критерій виявився меншим за табличний. Отже, наявні дані не суперечать гіпотезі H 0 у тому, що генеральна середня дорівнює 50 кг (але й доводять її). Це все, що ми можемо дізнатися, використовуючи таблиці. Можна, звичайно, ще p-level спробувати знайти, але він буде наближеним. Як правило, саме p-level використовується для перевірки гіпотез. Тому далі переходимо до Excel.

Готовий функції для розрахунку t-критерію в Excel немає. Але це і не страшно, адже формула t-критерію Стьюдента досить проста і її можна легко спорудити прямо в осередку Excel.

Отримали ті ж 1,8. Знайдемо спочатку критичне значення. Альфа беремо 0,05, критерій двосторонній. Потрібна функція зворотного значення t-розподілу для двосторонньої гіпотези СТЬЮДЕНТ.ОБР.2Х.

Отримане значення відсікає критичну область. Спостерігається t-критерій до неї не потрапляє, тому гіпотеза не відхиляється.

Однак це той самий спосіб перевірки гіпотези за допомогою табличного значення. Більш інформативно розрахувати p-level, тобто. ймовірність отримати спостерігається чи ще більше відхилення від середньої 50кг, якщо ця гіпотеза вірна. Потрібна функція розподілу Стьюдента для двосторонньої гіпотези СТЬЮДЕНТ.РАСП.2Х.

P-level дорівнює 0,1096, що більше допустимого рівня значущості 0,05 – гіпотезу не відхиляємо. Але тепер можна судити про міру доказу. P-level виявився досить близьким до того рівня, коли гіпотеза відхиляється, але це наводить різні думки. Наприклад, що вибірка виявилася надто малою для виявлення значущого відхилення.

Нехай через деякий час відділ контролю знову вирішив перевірити, як витримується стандарт заповнення мішків. На цей раз для більшої надійності було відібрано не 9, а 25 мішків. Інтуїтивно зрозуміло, що розкид середньої зменшиться, а отже, і шансів знайти збій у системі стає більше.

Припустимо, були отримані ті ж значення середньої та стандартного відхилення за вибіркою, що і вперше (50,3 та 0,5 відповідно). Розрахуємо t-критерій.


Критичне значення для 24-х ступенів свободи та α = 0,05 становить 2,064. На малюнку нижче видно, що t-критерій потрапляє до області відхилення гіпотези.

Можна дійти невтішного висновку у тому, що з довірчою ймовірністю понад 95% генеральна середня відрізняється від 50кг. Для більшої переконливості подивимося на p-level (останній рядок таблиці). Імовірність отримати середню з таким або ще більшим відхиленням від 50, якщо гіпотеза вірна, становить 0,0062, або 0,62%, що при одноразовому вимірі практично неможливо. Загалом гіпотезу відхиляємо, як малоймовірну.

Розрахунок довірчого інтервалу за допомогою t-розподілу Стьюдента

З перевіркою гіпотез тісно пов'язаний ще один статистичний методрозрахунок довірчих інтервалів. Якщо отриманий інтервал потрапляє значення, відповідне нульової гіпотезі, це рівнозначно тому, що нульова гіпотеза не відхиляється. В іншому випадку гіпотеза відхиляється з відповідною довірчою ймовірністю. У деяких випадках аналітики взагалі не перевіряють гіпотез у класичному вигляді, А розраховують лише довірчі інтервали. Такий підхід дозволяє отримати ще більше корисної інформації.

Розрахуємо довірчі інтервали для середньої при 9 та 25 спостереженнях. Для цього скористаємося функцією ExcelДОВІР.СТЬЮДЕНТ. Тут, хоч як це дивно, все досить просто. У аргументах функції слід зазначити лише рівень значимості α , стандартне відхиленняза вибіркою та розмір вибірки. На виході отримаємо півширину довірчого інтервалу, тобто значення, яке потрібно відкласти по обидва боки від середньої. Провівши розрахунки та намалювавши наочну діаграму, отримаємо наступне.

Як видно, при вибірці 9 спостережень значення 50 потрапляє в довірчий інтервал(гіпотеза не відхиляється), а при 25 спостереженнях не потрапляє (гіпотеза відхиляється). При цьому в експерименті з 25 мішками можна стверджувати, що з ймовірністю 97,5% генеральна середня перевищує 50,1 кг (нижня межа довірчого інтервалу дорівнює 50,094кг). А це є досить цінна інформація.

Таким чином, ми вирішили одне й те саме завдання трьома способами:

1. Стародавнім підходом, порівнюючи розрахункове та табличне значення t-критерію
2. Більш сучасним розрахувавши p-level, додавши ступінь впевненості при відхиленні гіпотези.
3. Ще більш інформативним, розрахувавши довірчий інтервал та отримавши мінімальне значення генеральної середньої.

Важливо пам'ятати, що t-критерій відноситься до параметричним методам, т.к. заснований на нормальному розподілі (у нього два параметри: середнє та дисперсія). Тому для його успішного застосування важлива хоча б приблизна нормальність вихідних даних та відсутність викидів.

Насамкінець пропоную подивитися відеоролик про те, як проводити розрахунки, пов'язані з t-критерієм Стьюдента в Excel.

Під час розгляду прикладу ми будемо використовувати вигадані відомості, щоб читач міг провести необхідні перетворення самостійно.

Так, припустимо, у ході досліджень вивчали вплив препарату А на вміст речовини В (ммоль/г) у тканині С та концентрацію речовини D у крові (ммоль/л) у пацієнтів, розділених за якоюсь ознакою Е на 3 групи рівного обсягу (n=10). Результати такого вигаданого дослідження наведено у таблиці:

Вміст речовини B, ммоль/г

Речовина D, ммоль/л

приріст концентрації


Хочемо вас попередити, що вибірки обсягу 10 розглядаються нами для простоти представлення даних та обчислень, на практиці такого обсягу вибірок зазвичай виявляється недостатньо для формування статистичного висновку.

Як приклад розглянемо дані 1-го стовпця таблиці.

Описові статистики

Вибіркове середнє

Середнє арифметичне, яке часто називають просто «середнє», отримують шляхом складання всіх значень і розподілу цієї суми на число значень у наборі. Це можна показати за допомогою формули алгебри. Набір n спостережень змінної x можна зобразити як x 1 x 2 x 3 ... x n

Формула для визначення середнього арифметичного спостережень (вимовляється «ікс з рисою»):

= (Х 1 + Х 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Вибіркова дисперсія

Один із способів вимірювання розсіювання даних полягає в тому, щоб визначити ступінь відхилення кожного спостереження від середньої арифметичної. Очевидно, що чим більше відхилення, тим більша мінливість, варіабельність спостережень. Однак ми не можемо використовувати середнє цих відхилень як міру розсіювання, тому що позитивні відхилення компенсують негативні відхилення (їх сума дорівнює нулю). Щоб вирішити цю проблему, ми зводимо у квадрат кожне відхилення та знаходимо середнє зведених у квадрат відхилень; ця величина називається варіацією, чи дисперсією. Візьмемо n спостережень x 1, x 2, х 3, ..., x n, середня яких дорівнює. Обчислюємо диспер цю, зазвичай позначається якs 2 ,цих спостережень:

Вибіркова дисперсія цього показника дорівнює s 2 = 3,2.

Середньоквадратичне відхилення

Стандартне (середньоквадратичне) відхилення - це позитивний квадратний коріньіз дисперсії. На прикладі n спостережень це виглядає так:

Ми можемо уявити стандартне відхилення як свого роду середнє відхилення спостережень від середнього. Воно обчислюється у тих самих одиницях (розмірностях), як і вихідні дані.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Коефіцієнт варіації

Якщо розділити стандартне відхилення на середнє арифметичне та виразити результат у відсотках, то вийде коефіцієнт варіації.

CV = (1,79/13,1) * 100% = 13,7

Помилка вибіркового середнього

1,79/sqrt (10) = 0,57;

Коефіцієнт Стьюдента t (одновибірковий t-критерій)

Застосовується для перевірки гіпотези про відмінність середнього значення від певного відомого значення m

Кількість ступенів свободи розраховується як f=n-1.

У цьому випадку довірчий інтервал для середнього укладено між межами 11,87 та 14,39.

Для рівня довірчої ймовірності 95% m=11,87 чи m=14,39, тобто= |13,1-11,82| = | 13,1-14,38 | = 1,28

Відповідно, у разі для числа ступенів свободи f = 10 - 1 = 9 і рівня довірчої ймовірності 95% t=2,26.

Діалог Основні статистики та таблиці

У модулі Основні статистики та таблиціоберемо Описові статистики.

Відкриється діалогове вікно Описові статистики.

В полі Пермінніоберемо Групу 1.

Натиснувши на Ок, Отримаємо таблиці результатів з описовими статистиками вибраних змінних.

Відкриється діалогове вікно Одновибірковий t-критерій.

Припустимо, нам відомо, що середній вміст речовини B у тканині дорівнює 11.

Таблиця результатів з описовими статистиками та t-критерієм Стьюдента виглядає так:

Нам довелося відкинути гіпотезу у тому, що середній вміст речовини У тканини З дорівнює 11.

Оскільки обчислене значення критерію більше табличного (2,26), нульова гіпотеза відкидається на вибраному рівні значимості, і різницю між вибіркою і відомою величиною визнаються статистично значущими. Таким чином, висновок про існування відмінностей, зроблений за допомогою критерію Cтьюдента, підтверджується цим методом.

t-критерій Стьюдента – загальна назва для класу методів статистичної перевіркигіпотез (статистичних критеріїв), заснованих на розподілі Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках.

1. Історія розробки t-критерію

Цей критерій був розроблений Вільямом Держсетомдля оцінки якості пива в компанії Гіннес. У зв'язку з зобов'язаннями перед компанією щодо нерозголошення комерційної таємниці, стаття Держсету вийшла 1908 року в журналі «Біометрика» під псевдонімом «Student» (Студент).

2. Навіщо використовується t-критерій Стьюдента?

t-критерій Стьюдента використовується для визначення статистичної значимостівідмінностей середніх величин. Може застосовуватись як у випадках порівняння незалежних вибірок ( наприклад, групи хворих на цукровий діабет та групи здорових), і при порівнянні пов'язаних сукупностей ( наприклад, середня частота пульсу в тих самих пацієнтів до і після прийому антиаритмічного препарату).

3. У яких випадках можна використовувати t-критерій Стьюдента?

Для застосування t-критерію Стьюдента необхідно, щоб вихідні дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також необхідне дотримання умови рівності (гомоскедастичності) дисперсій.

При недотриманні цих умов при порівнянні середніх вибіркових повинні використовуватися аналогічні методи непараметричної статистики, серед яких найбільш відомими є U-критерій Манна - Вітні(як двовибірковий критерій для незалежних вибірок), а також критерій знаківі критерій Вілкоксону(Використовуються у випадках залежних вибірок).

4. Як розрахувати t-критерій Стьюдента?

Для порівняння середніх величин t-критерій Стьюдента розраховується за такою формулою:

де М 1- середня арифметична першої порівнюваної сукупності (групи), М 2- середня арифметична другої порівнюваної сукупності (групи), m 1 - середня помилкапершої середньої арифметичної, m 2- Середня помилка другої середньої арифметичної.

5. Як інтерпретувати значення t-критерію Стьюдента?

Отримане значення t-критерію Стьюдента необхідно правильно інтерпретувати. Для цього нам необхідно знати кількість досліджуваних у кожній групі (n1 і n2). Знаходимо кількість ступенів свободи fза наступною формулою:

f = (n 1 + n 2) - 2

Після цього визначаємо критичне значення t-критерію Стьюдента для необхідного рівня значущості (наприклад, p=0,05) та при даному числі ступенів свободи fза таблицею ( див. нижче).

Порівнюємо критичне та розраховане значення критерію:

  • Якщо розраховане значення t-критерію Стьюдента одно чи більшекритичного, знайденого за таблицею, робимо висновок про статистичну значущість відмінностей між порівнюваними величинами.
  • Якщо значення розрахованого t-критерію Стьюдента меншетабличного, отже відмінності порівнюваних величин статистично не значущі.

6. Приклад розрахунку t-критерію Стьюдента

Для вивчення ефективності нового препарату заліза було обрано дві групи пацієнтів із анемією. У першій групі пацієнти протягом двох тижнів отримували новий препарат, а у другій групі – отримували плацебо. Після цього було проведено вимірювання рівня гемоглобіну у периферичній крові. У першій групі середній рівень гемоглобіну становив 115,4±1,2 г/л, а у другій – 103,7±2,3 г/л (дані представлені у форматі M±m), порівнювані сукупності мають нормальний розподіл. У цьому чисельність першої групи становила 34, а другий - 40 пацієнтів. Необхідно зробити висновок про статистичну значущість отриманих відмінностей та ефективність нового препарату заліза.

Рішення:Для оцінки значущості відмінностей використовуємо t-критерій Стьюдента, що розраховується як різниця середніх значень, поділена на суму квадратів помилок:

Після виконання розрахунків значення t-критерію виявилося рівним 4,51. Знаходимо число ступенів свободи як (34 + 40) – 2 = 72. Порівнюємо отримане значення t-критерію Стьюдента 4,51 з критичним при р = 0,05 значенням, зазначеним у таблиці: 1,993. Так як розраховане значення критерію більше критичного, робимо висновок про те, що відмінності, що спостерігаються, статистично значущі (рівень значущості р<0,05).

Поділіться з друзями або збережіть для себе:

Завантаження...