Еднопосочен дисперсионен анализ. Еднопосочен дисперсионен анализ на Фишер

Да предположим, че на автоматична линия няколко машини изпълняват една и съща операция паралелно. За правилното планиране на последващата обработка е важно да се знае колко еднакви са средните размери на частите, получени на паралелни машини. Има само един фактор, който влияе върху размера на детайлите и това са машините, на които се изработват. Необходимо е да се установи колко значително е влиянието на този фактор върху размерите на частите. Да приемем, че наборите от размери на частите, направени на всяка машина, имат нормална дистрибуцияи равни отклонения.

Имаме m машини, следователно, m агрегата или нива, на които n 1 , n 2 ,..., n t наблюдения. За по-лесно разсъждение нека приемем, че n 1 \u003d n 2 \u003d ... \u003dи т.н. Размерите на съставните части n iнаблюдения върху аз-то ниво, означете x i 1, x аз 2,..., x в . Тогава всички наблюдения могат да бъдат представени под формата на таблица, която се нарича матрица на наблюденията (Таблица 3.1).

Таблица 3.1

Нива Резултати от наблюдение
1 2 й н
х 11 х 12 x 1 j х 1 бр
х 21 х 22 x 2 j х 2 п
х 31 х 32 x 3 j х 3 бр
аз x i1 x i2 x i j x i n
м x m1 x m2 x mj xmn

Ще приемем, че за аз-то ниво n наблюдения имат средна стойност βi, равно на суматаобщата средна стойност µ и нейната вариация поради аз-то ниво на фактора, т.е. βi = µ + γ i. Тогава едно наблюдение може да бъде представено по следния начин:

x i j = µ + γ i. +ε ij= βi +εij (3.1)

където µ е общата средна стойност; γ i- ефект поради аз-то ниво на фактора; εij- вариация на резултатите в рамките на определено ниво.

Член εijхарактеризира влиянието на всички фактори, които не са взети предвид от модела (3.1). Според общия проблем на дисперсионния анализ е необходимо да се оцени значимостта на влиянието на фактора γ върху размерите на частите. Общата вариация на променлива x i jможе да се разложи на части, едната от които характеризира влиянието на фактора γ, а другата - влиянието на неотчетените фактори. За да направите това, е необходимо да се намери оценка за общата средна стойност µ и оценка за средните за нивата βi. Очевидно е, че оценката β е средноаритметичното от n наблюдения на i-то ниво, т.е.

Звездичка в индекса при x означава, че наблюденията са фиксирани на i-то ниво. Средната аритметична стойност на целия набор от наблюдения е оценка на общата средна стойност µ, т.е.

Намерете сумата на квадратите на отклоненията x i jот , т.е.

Представяме го във формата (3.2)

И =

Но = 0, тъй като това е сумата от отклоненията на променливите на една популация от средноаритметичното на същата популация, т.е. цялата сума е нула. Записваме втория член на сумата (3.2) във формата:



Или

Терминът е сумата от квадратите на разликите между средните нива и средната стойност на целия набор от наблюдения. Тази сума се нарича сума на квадратите на отклоненията между групите и характеризира несъответствието между нивата. Стойността , се нарича още дисперсия по фактори, т.е. дисперсия поради изследвания фактор.

Членът е сумата от квадратите на разликите между индивидуалните наблюдения и средната стойност на i-то ниво. Тази сума се нарича сума на квадратите на отклоненията в рамките на групата и характеризира несъответствието между наблюденията на i-то ниво. Стойността се нарича още остатъчно разсейване, т.е. дисперсия поради неотчетени фактори.

Стойността се нарича обща или обща сума на квадратите на отклоненията на отделните наблюдения от общата средна стойност.

Познавайки сумите на квадратите SS, SS 1 и SS 2, е възможно да се оценят безпристрастните оценки на съответните дисперсии - обща, междугрупова и вътрешногрупова (таблица 3.2).

Ако влиянието на всички нива на фактора γ е еднакво, тогава и са оценки на общата дисперсия.

Тогава, за да се оцени значимостта на влиянието на фактора γ, е достатъчно да се провери нулевата хипотеза H 0: = .

За да направите това, изчислете критерия на Фишер F B = , с броя на степените на свобода k 1 = m - 1 и k 2 = m (n - 1). След това, съгласно таблицата на F-разпределението (виж таблицата на разпределението на критерия на Фишер), за нивото на значимост α се намира критичната стойност на F cr.

Таблица 3.2

Ако F B > F cr, тогава нулевата хипотеза се отхвърля и се прави заключение за значителното влияние на фактора γ.

В F B< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.



Сравнявайки междугруповите и остатъчните дисперсии, величината на тяхното съотношение се използва, за да се прецени колко силно се проявява влиянието на факторите.

Пример 3.1. Има четири партиди платове за работно облекло. От всяка партида бяха избрани пет проби и бяха проведени тестове за определяне на големината на натоварването при скъсване. Резултатите от теста са дадени в табл. 3.3.

Таблица 3.3

Партиден номер, t

Необходимо е да се установи дали влиянието на различните партиди суровини върху величината на натоварването при скъсване е значително.

Решение.

В този случай m = 4, n = 5. Средната аритметична стойност на всеки ред се изчислява по формулата

Имаме: =(200+140+170+145+165)/5=164; =170; =202; = 164.

Намерете средноаритметичната стойност на цялата съвкупност:

Нека изчислим количествата, необходими за съставянето на таблицата. 3.4:

сума на квадратите на отклоненията между групите SS 1 , с k 1 =t –1=

4-1=3 степени на свобода:

сумата на квадратите на отклоненията в групата SS 2 с k 2 = mp - m = =20-4=16 степени на свобода:

общата сума на квадратите SS с k=mn-1=20-1=19 степени на свобода:

Въз основа на намерените стойности оценяваме дисперсията, съгласно формулите (Таблица 3.2), които ще съставим (Таблица 3.4) за разглеждания пример.

Таблица 3.4

Да похарчим Статистически анализспоред критерия на Фишер. Изчислете F B \u003d = (4980 1/3) / (7270 1/16) \u003d 1660 / 454,4 \u003d 3,65.

Според таблицата на F-разпределението (вижте приложенията), намираме стойността на F Kp при k 2 = 16 и к 1= 3 степени на свобода и ниво на значимост α = 0,01. Имаме F Kp = 5,29.

Изчислената стойност на F B е по-малка от стойността на таблицата, така че може да се твърди, че нулевата хипотеза не е отхвърлена, което означава, че разликата между тъканите в партидите не влияе върху натоварването на скъсване.

В пакета за анализ на данни, инструментът за единичен фактор дисперсионен анализизползвани за тестване на хипотеза за сходството на средните стойности на две или повече проби, принадлежащи към една и съща население. Нека разгледаме работата на пакета за еднопосочен дисперсионен анализ.

Нека решим Пример 3.1 с помощта на инструмента Еднопосочна ANOVA.

Всички хора естествено търсят знания. (Аристотел. Метафизика)

Дисперсионен анализ

Уводен преглед

В този раздел ще прегледаме основните методи, допускания и терминология на ANOVA.

Обърнете внимание, че в англоезичната литература дисперсионният анализ обикновено се нарича анализ на вариацията. Ето защо, за краткост, по-долу понякога ще използваме термина ANOVA (Ананализ о f варация) за конвенционална ANOVA и термина МАНОВАза многовариантен дисперсионен анализ. В този раздел ще разгледаме последователно основните идеи на дисперсионния анализ ( ANOVA), анализ на ковариацията ( АНКОВА), многовариантен дисперсионен анализ ( МАНОВА) и многовариантен ковариационен анализ ( МАНКОВА). След кратко обсъждане на достойнствата на контрастния анализ и post hoc тестовете, нека да разгледаме предположенията, на които се основават методите ANOVA. Към края на този раздел се обясняват предимствата на многовариантния подход за анализ на повтарящи се измервания пред традиционния едноизмерен подход.

Ключови идеи

Целта на дисперсионния анализ.Основната цел на дисперсионния анализ е да се изследва значимостта на разликата между средните. Глава (Глава 8) предоставя кратко въведение в тестването на статистическата значимост. Ако просто сравнявате средните стойности на две проби, анализът на дисперсията ще даде същия резултат като нормалния анализ. T- критерий за независими проби (ако се сравняват две независими групи от обекти или наблюдения), или T- критерий за зависими проби (ако две променливи се сравняват върху един и същи набор от обекти или наблюдения). Ако не сте запознати с тези критерии, препоръчваме ви да прегледате уводния преглед на главата (Глава 9).

Откъде идва името Дисперсионен анализ? Може да изглежда странно, че процедурата за сравняване на средните се нарича дисперсионен анализ. Всъщност това се дължи на факта, че когато изследваме статистическата значимост на разликата между средните стойности, ние всъщност анализираме дисперсиите.

Разделяне на сбора на квадрати

За размер на извадката от n дисперсията на извадката се изчислява като сумата от квадратите на отклоненията от средната стойност на извадката, разделена на n-1 (размер на извадката минус едно). По този начин, за фиксиран размер на извадката n, дисперсията е функция на сумата от квадрати (отклонения), означена, за краткост, СС(от английски Sum of Squares - Сума от квадрати). Анализът на дисперсията се основава на разделянето (или разделянето) на дисперсията на части. Разгледайте следния набор от данни:

Средните стойности на двете групи са значително различни (2 и 6, съответно). Сума на квадратите на отклоненията вътреот всяка група е 2. Събирайки ги заедно, получаваме 4. Ако сега повторим тези изчисления като изключимгрупово членство, т.е. ако изчислим ССвъз основа на комбинираната средна стойност от двете проби, получаваме 28. С други думи, дисперсията (сумата на квадратите) на базата на променливостта в рамките на групата води до много по-малки стойности, отколкото когато се изчислява на базата на общата променливост (спрямо общата означава). Причината за това очевидно е значителната разлика между средните стойности и тази разлика между средните стойности обяснява съществуваща разликамежду суми на квадрати. Наистина, ако използваме модула Дисперсионен анализще се получат следните резултати:

Както се вижда от таблицата, обща сумаквадрати СС=28, разделено на сумата от квадратите, поради вътрешногруповипроменливост ( 2+2=4 ; вижте втория ред на таблицата) и сумата от квадратите поради разликата в средните стойности. (28-(2+2)=24; вижте първия ред на таблицата).

СС грешки иСС ефект.Вътрешногрупова променливост ( СС) обикновено се нарича дисперсия грешки.Това означава, че обикновено не може да се предвиди или обясни, когато се провежда експеримент. От друга страна, СС ефект(или междугрупова променливост) може да се обясни с разликата между средните стойности в изследваните групи. С други думи, принадлежност към определена група обяснявамеждугрупова изменчивост, т.к знаем, че тези групи имат различни средства.

Проверка на значимостта.Основните идеи за тестване за статистическа значимост са обсъдени в главата Елементарни понятия на статистиката(Глава 8). Същата глава обяснява причините, поради които много тестове използват съотношението на обяснена и необяснима дисперсия. Пример за това използване е самият анализ на дисперсията. Тестването на значимостта в ANOVA се основава на сравняване на вариацията, дължаща се на вариация между групите (наречена среден квадратичен ефектили ГОСПОЖИЦАЕфект) и дисперсия поради разпространение в рамките на групата (наречено средна квадратична грешкаили ГОСПОЖИЦАгрешка). Ако нулевата хипотеза е вярна (равенство на средните стойности в двете популации), тогава можем да очакваме относително малка разлика в средните стойности на извадката поради случайна променливост. Следователно, при нулевата хипотеза, вътрешногруповата дисперсия практически ще съвпадне с общата дисперсия, изчислена без да се взема предвид членството в групата. Получените дисперсии в рамките на групата могат да бъдат сравнени с помощта на Е- тест, който проверява дали съотношението на дисперсии е значително по-голямо от 1. В горния пример, Е- Тестът показва, че разликата между средните е статистически значима.

Основна логика на ANOVA.Обобщавайки, можем да кажем, че целта на дисперсионния анализ е да се тества статистическата значимост на разликата между средните (за групи или променливи). Тази проверка се извършва с помощта на дисперсионен анализ, т.е. чрез разделяне на общата дисперсия (вариация) на части, едната от които се дължи на случайна грешка (т.е. вътрешногрупова променливост), а втората е свързана с разликата в средните стойности. След това последният компонент на дисперсията се използва за анализиране на статистическата значимост на разликата между средните стойности. Ако тази разлика е значителна, нулевата хипотеза се отхвърля и се приема алтернативната хипотеза, че има разлика между средните стойности.

Зависими и независими променливи.Променливите, чиито стойности се определят чрез измервания по време на експеримент (например резултат, отбелязан на тест), се наричат зависимпроменливи. Променливите, които могат да бъдат манипулирани в експеримент (например методи на обучение или други критерии, които ви позволяват да разделите наблюденията на групи), се наричат факториили независимапроменливи. Тези понятия са описани по-подробно в главата Елементарни понятия на статистиката(Глава 8).

Многовариантен дисперсионен анализ

В горното прост примерможете незабавно да изчислите t-теста за независими проби, като използвате подходящата опция за модул Основни статистики и таблици.Получените резултати, разбира се, съвпадат с резултатите от дисперсионния анализ. Анализът на дисперсията обаче съдържа гъвкави и мощни технически инструменти, които могат да се използват за много по-сложни изследвания.

Много фактори.Светът по своята същност е сложен и многоизмерен. Ситуациите, при които дадено явление е напълно описано от една променлива, са изключително редки. Например, ако се опитваме да се научим как да растем големи домати, трябва да се имат предвид фактори, свързани с генетичната структура на растенията, тип почва, светлина, температура и др. По този начин, когато провеждате типичен експеримент, трябва да се справите с голям брой фактори. Основната причина, поради която използването на ANOVA е за предпочитане пред повторното сравняване на две проби при различни нива на използване на фактори T- критерий е, че дисперсионният анализ е повече ефективени, за малки проби, по-информативен.

Управление на факторите.Да приемем, че в примера за анализ на две проби, обсъден по-горе, добавяме още един фактор, например Етаж- Пол. Нека всяка група се състои от 3 мъже и 3 жени. Дизайнът на този експеримент може да бъде представен под формата на таблица 2 на 2:

Експериментирайте. Група 1 Експериментирайте. Група 2
мъже2 6
3 7
1 5
Средно аритметично2 6
Жени4 8
5 9
3 7
Средно аритметично4 8

Преди да направите изчисленията, можете да видите, че в този пример общата дисперсия има поне три източника:

(1) случайна грешка (в рамките на груповата дисперсия),

(2) променливост, свързана с членството в експерименталната група, и

(3) променливост, дължаща се на пола на наблюдаваните обекти.

(Имайте предвид, че има друг възможен източник на променливост - взаимодействие на факторите, което ще обсъдим по-късно). Какво се случва, ако не включим етажполкато фактор в анализа и изчисляване на обичайното T- критерий? Ако изчислим суми на квадрати, игнорирайки етаж -пол(т.е. комбиниране на обекти от различен пол в една група при изчисляване на дисперсията в рамките на групата, като същевременно се получава сумата от квадрати за всяка група, равна на СС=10 и общата сума на квадратите СС= 10+10 = 20), тогава получаваме по-голяма стойност на вътрешногруповата дисперсия, отколкото при по-точен анализ с допълнително разделяне на подгрупи според полу- пол(в този случай вътрешногруповата средна стойност ще бъде равна на 2, а общата вътрешногрупова сума на квадратите ще бъде равна на СС = 2+2+2+2 = 8). Тази разлика се дължи на факта, че средната стойност за мъже - мъжепо-малко от средното за Жени -женски поли тази разлика в средните стойности увеличава общата променливост в рамките на групата, ако не се вземе предвид полът. Контролирането на дисперсията на грешката увеличава чувствителността (мощността) на теста.

Този пример показва друго предимство на дисперсионния анализ пред конвенционалния анализ. T-критерий за две проби. Анализът на дисперсията ви позволява да изучавате всеки фактор, като контролирате стойностите на други фактори. Това всъщност е основната причина за неговата по-голяма статистическа сила (необходими са по-малки размери на извадката, за да се получат значими резултати). Поради тази причина дисперсионният анализ, дори на малки извадки, дава статистически по-значими резултати от обикновения. T- критерий.

Ефекти на взаимодействие

Има още едно предимство на използването на ANOVA пред конвенционалния анализ. T- критерий: дисперсионният анализ ви позволява да откриете взаимодействиемежду факторите и следователно позволява да се изучават по-сложни модели. За да илюстрираме, разгледайте друг пример.

Основни ефекти, двойни (двуфакторни) взаимодействия.Да приемем, че има две групи ученици, като психологически учениците от първата група са настроени за изпълнение на поставените задачи и са по-целенасочени от учениците от втората група, която се състои от по-мързеливи ученици. Нека разделим произволно всяка група наполовина и предложим на едната половина от всяка група трудна задача, а на другата лесна. След това измерваме колко усърдно работят учениците върху тези задачи. Средните стойности за това (фиктивно) проучване са показани в таблицата:

Какво заключение може да се направи от тези резултати? Може ли да се заключи, че: (1) учениците работят по-усилено върху трудна задача; (2) мотивираните ученици работят ли повече от мързеливите? Нито едно от тези твърдения не отразява същността на систематичния характер на средните стойности, дадени в таблицата. Анализирайки резултатите, би било по-правилно да се каже, че само мотивираните ученици работят по-усилено върху сложни задачи, докато само мързеливите ученици работят по-усилено върху лесни задачи. С други думи, естеството на учениците и сложността на задачата взаимодействащивзаимно влияят на необходимото усилие. Това е пример взаимодействие по двойкимежду характера на учениците и сложността на задачата. Имайте предвид, че твърдения 1 и 2 описват основни ефекти.

Взаимодействия от по-висок порядък.Докато взаимодействията по двойки са относително лесни за обяснение, взаимодействията от по-висок ред са много по-трудни за обяснение. Нека си представим, че в примера, разгледан по-горе, е въведен още един фактор етаж -Поли получихме следната таблица със средни стойности:

Какви изводи могат да се направят сега от получените резултати? Средните графики улесняват тълкуването на сложни ефекти. Модулът за анализ на дисперсията ви позволява да изграждате тези графики с почти едно кликване.

Изображението в графиките по-долу представя изследваното тристранно взаимодействие.

Разглеждайки графиките, можем да кажем, че има взаимодействие между характера и трудността на теста за жените: мотивираните жени работят по-усилено върху трудна задача, отколкото върху лесна. При мъжете същото взаимодействие е обратно. Вижда се, че описанието на взаимодействието между факторите става по-объркващо.

Общ начинописания на взаимодействията. AT общ случайвзаимодействието между факторите се описва като промяна на един ефект под въздействието на друг. В разгледания по-горе пример двуфакторното взаимодействие може да се опише като промяна в основния ефект на фактора, характеризиращ сложността на задачата, под влияние на фактора, описващ характера на ученика. За взаимодействието на трите фактора от предходния параграф можем да кажем, че взаимодействието на два фактора (сложността на задачата и характера на ученика) се променя под влияние на полПол. Ако се изследва взаимодействието на четири фактора, можем да кажем, че взаимодействието на три фактора се променя под влиянието на четвъртия фактор, т.е. има различни видове взаимодействия на различни нива на четвъртия фактор. Оказа се, че в много области взаимодействието на пет или дори Повече ▼фактори не е необичайно.

Комплексни планове

Междугрупови и вътрешногрупови планове (планове за повторно измерване)

Когато сравнявате две различни групичесто използван T- критерий за независими проби (от модул Основни статистики и таблици). Когато две променливи се сравняват върху един и същи набор от обекти (наблюдения), той се използва T-критерий за зависими проби. За анализа на дисперсията също е важно дали извадките са зависими или не. Ако има повтарящи се измервания на едни и същи променливи (при различни условия или в различно време) за същите обекти, тогава казват за присъствието фактор на многократни измервания(също наричан вътрешногрупов фактортъй като вътрегруповата сума от квадрати се изчислява, за да се оцени нейната значимост). Ако се сравняват различни групи обекти (например мъже и жени, три щама бактерии и т.н.), тогава се описва разликата между групите междугрупов фактор.Методите за изчисляване на критериите за значимост за двата описани типа фактори са различни, но общата им логика и интерпретация са еднакви.

Междугрупови и вътрешногрупови планове.В много случаи експериментът изисква включване както на фактор между групи, така и на фактор на повтарящи се измервания в дизайна. Например, измерват се математическите умения на учениците и учениците (където етаж -Пол-междугрупов фактор) в началото и в края на семестъра. Двете измерения на уменията на всеки ученик формират вътрешногруповия фактор (фактор на повтарящи се измервания). Тълкуването на основните ефекти и взаимодействия за фактори между групи и повторни измервания е същото и двата вида фактори очевидно могат да си взаимодействат помежду си (например жените придобиват умения по време на семестъра, а мъжете ги губят).

Непълни (вложени) планове

В много случаи ефектът на взаимодействие може да бъде пренебрегнат. Това се случва или когато е известно, че няма ефект на взаимодействие в популацията, или когато прилагането на пълното факториелпланът е невъзможен. Например, изследва се ефектът на четири горивни добавки върху разхода на гориво. Избрани са четири коли и четирима водачи. Пълна факториелекспериментът изисква всяка комбинация: добавка, шофьор, кола да се появи поне веднъж. Това изисква поне 4 x 4 x 4 = 64 тестови групи, което отнема твърде много време. Освен това почти няма взаимодействие между водача и добавката за гориво. Имайки това предвид, можете да използвате плана латински квадрати,който съдържа само 16 групи тестове (четири добавки са обозначени с буквите A, B, C и D):

Латинските квадрати са описани в повечето книги за експериментален дизайн (напр. Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984; Winer, 1962) и няма да бъдат обсъждани подробно тук. Имайте предвид, че латинските квадрати са ненпъленпланове, които не включват всички комбинации от факторни нива. Например водач 1 кара кола 1 само с добавка А, водач 3 кара кола 1 само с добавка С. Нива на факторите добавки ( A, B, C и D), вложени в клетки на таблица автомобиленх шофьор -като яйца в гнездо. Това мнемонично правило е полезно за разбиране на природата вложени или вложенипланове. Модул Дисперсионен анализосигурява прости начинианализ на планове от този тип.

Ковариационен анализ

Основна идея

В глава Ключови идеиимаше кратка дискусия на идеята за контролиращи фактори и как включването на адитивни фактори може да намали сумата на квадратните грешки и да увеличи статистическата сила на дизайна. Всичко това може да се разшири до променливи с непрекъснат набор от стойности. Когато такива непрекъснати променливи са включени като фактори в дизайна, те се наричат ковариати.

Фиксирани ковариати

Да предположим, че сравняваме математическите умения на две групи ученици, които са били обучавани по два различни учебника. Нека приемем също, че имаме данни за коефициента на интелигентност (IQ) за всеки ученик. Можем да приемем, че IQ е свързано с математическите умения и да използваме тази информация. За всяка от двете групи ученици може да се изчисли коефициентът на корелация между IQ и математическите умения. Използвайки този коефициент на корелация, е възможно да се разграничи делът на дисперсията в групите, обяснен с влиянието на IQ, и необяснимият дял на дисперсията (вижте също Елементарни понятия на статистиката(глава 8) и Основни статистики и таблици(Глава 9)). Останалата част от дисперсията се използва в анализа като дисперсия на грешката. Ако има връзка между коефициента на интелигентност и математическите умения, тогава разликите в грешките могат да бъдат значително намалени. СС/(н-1) .

Ефект на ковариатите върхуФ- критерий. Ф-критерият оценява статистическата значимост на разликата между средните стойности в групите и съотношението се изчислява междугрупова дисперсия (ГОСПОЖИЦАефект) към дисперсията на грешката ( ГОСПОЖИЦАгрешка) . Ако ГОСПОЖИЦАгрешканамалява, например, когато се вземе предвид факторът IQ, стойността Есе увеличава.

Много ковариати.Разсъждението, използвано по-горе за една ковариата (IQ), лесно се разширява до множество ковариати. Например, в допълнение към коефициента на интелигентност, можете да включите измерване на мотивация, пространствено мислене и т.н. Вместо обичайния коефициент на корелация, той използва множествен факторкорелации.

Когато стойносттаЕ -критериите намаляват.Понякога въвеждането на ковариати в дизайна на експеримента намалява стойността Е- критерии . Това обикновено показва, че ковариатите са свързани не само със зависимата променлива (като математически умения), но и с фактори (като различни учебници). Да приемем, че IQ се измерва в края на семестъра, след като две групи студенти са прекарали почти една година в изучаване на два различни учебника. Въпреки че учениците бяха разделени на групи на случаен принцип, може да се окаже, че разликата в учебниците е толкова голяма, че както IQ, така и математическите умения в различните групи ще варират значително. В този случай ковариатите не само намаляват дисперсията на грешката, но също и дисперсията между групите. С други думи, след контролиране на разликата в IQ между групите, разликата в математическите умения вече няма да бъде значителна. Иначе може да се каже. След „елиминиране“ на влиянието на коефициента на интелигентност, неволно се изключва влиянието на учебника върху развитието на математическите умения.

Коригирани средни стойности.Когато ковариата влияе на фактора между групите, трябва да се изчисли коригирани средни стойности, т.е. такива средни стойности, които се получават след премахване на всички оценки на ковариатите.

Взаимодействие между ковариати и фактори.Точно както се изследват взаимодействията между факторите, могат да се изследват взаимодействията между ковариатите и между групите фактори. Да предположим, че един от учебниците е особено подходящ за умни ученици. Вторият учебник е скучен за умните ученици, а същият учебник е труден за по-малко умните ученици. В резултат на това има положителна корелация между коефициента на интелигентност и резултатите от обучението в първата група (по-умни ученици, по-добри резултати) и нулева или малка отрицателна корелация във втората група (колкото по-умен е ученикът, толкова по-малка е вероятността да придобие математически умения от втори учебник). В някои изследвания тази ситуация се обсъжда като пример за нарушаване на допусканията на анализа на ковариацията. Въпреки това, тъй като модулът за анализ на дисперсията използва най-често срещаните методи за анализ на ковариацията, е възможно по-специално да се оцени статистическата значимост на взаимодействието между факторите и ковариатите.

Променливи ковариати

Докато фиксираните ковариати се обсъждат доста често в учебниците, променливите ковариати се споменават много по-рядко. Обикновено, когато провеждаме експерименти с повтарящи се измервания, ние се интересуваме от разликите в измерванията на едни и същи количества в различни моменти от време. А именно, ние се интересуваме от значението на тези различия. Ако измерването на ковариата се извършва едновременно с измерванията на зависимите променливи, може да се изчисли корелацията между ковариатите и зависимите променливи.

Например, можете да изучавате интерес към математиката и математически умения в началото и в края на семестъра. Би било интересно да се провери дали промените в интереса към математиката са свързани с промените в математическите умения.

Модул Дисперсионен анализв СТАТИСТИКАавтоматично оценява статистическата значимост на промените в ковариатите в тези планове, където е възможно.

Многовариантни дизайни: Многовариантен ANOVA и ковариационен анализ

Междугрупови планове

Всички примери, разгледани по-рано, включват само една зависима променлива. Когато има няколко зависими променливи едновременно, само сложността на изчисленията се увеличава, а съдържанието и основните принципи не се променят.

Например, провежда се изследване по два различни учебника. Едновременно с това се изследва и успехът на учениците в изучаването на физика и математика. В този случай има две зависими променливи и трябва да разберете как два различни учебника им влияят едновременно. За да направите това, можете да използвате многовариантен дисперсионен анализ (MANOVA). Вместо едноизмерен Екритерий, многоизмерен Етест (Wilks l-тест), базиран на сравнение на ковариационната матрица на грешката и междугруповата ковариационна матрица.

Ако зависимите променливи са корелирани една с друга, тогава тази корелация трябва да се вземе предвид при изчисляване на теста за значимост. Очевидно, ако едно и също измерване се повтори два пъти, тогава нищо ново не може да се получи в този случай. Ако измерение, което е свързано с него, се добави към съществуващо измерение, тогава се получава някаква нова информация, но новата променлива съдържа излишна информация, която се отразява в ковариацията между променливите.

Тълкуване на резултатите.Ако цялостният многовариантен критерий е значим, можем да заключим, че съответният ефект (напр. вида на учебника) е значим. Възникват обаче следните въпроси. Видът на учебника влияе ли върху подобряването само на математическите умения, само на физическите умения или и на двете. Всъщност, след получаване на смислен многовариантен критерий, за единичен основен ефект или взаимодействие, едноизмерен Екритерий. С други думи, зависимите променливи, които допринасят за значимостта на многовариантния тест, се изследват отделно.

Планове с многократни измервания

Ако математическите и физически умения на студентите се измерват в началото и в края на семестъра, то това са повторни измервания. Изследването на критерия за значимост в такива планове е логическо развитиеедномерен случай. Обърнете внимание, че многовариантните методи на ANOVA също често се използват за изследване на значимостта на едномерни многократни измервания, които имат повече от две нива. Съответните приложения ще бъдат обсъдени по-късно в тази част.

Сумиране на променливи стойности и многовариантен дисперсионен анализ

Дори опитни потребители на едномерна и многомерна ANOVA често се объркват, като получават различни резултати, когато прилагат многомерна ANOVA към, да речем, три променливи, и когато прилагат едномерна ANOVA към сумата от трите променливи като една променлива.

Идея сумиранепроменливи е, че всяка променлива съдържа някаква истинска променлива, която се изследва, както и случайна грешка при измерване. Следователно, когато се осредняват стойностите на променливите, грешката на измерване ще бъде по-близо до 0 за всички измервания и осреднените стойности ще бъдат по-надеждни. Всъщност в този случай прилагането на ANOVA към сумата от променливи е разумна и мощна техника. Въпреки това, ако зависимите променливи са многовариантни по природа, сумирането на стойностите на променливите е неподходящо.

Например, нека зависимите променливи се състоят от четири мерки успех в обществото. Всеки индикатор характеризира напълно независима страна човешка дейност(например професионален успех, бизнес успех, семейно благополучие и др.). Добавянето на тези променливи заедно е като добавяне на ябълка и портокал. Сумата от тези променливи не би била подходяща едномерна мярка. Следователно такива данни трябва да се третират като многоизмерни индикатори многовариантен дисперсионен анализ.

Контрастен анализ и post hoc тестове

Защо се сравняват отделни набори от средства?

Обикновено хипотезите за експерименталните данни се формулират не просто по отношение на основните ефекти или взаимодействия. Пример е следната хипотеза: определен учебник подобрява математическите умения само при мъже, докато друг учебник е приблизително еднакво ефективен и за двата пола, но все още по-малко ефективен за мъжете. Може да се предвиди, че представянето на учебника взаимодейства с пола на ученика. Тази прогноза обаче също е в сила природавзаимодействия. Очаква се значителна разлика между половете за учениците в едната книга и практически независими от пола резултати за учениците в другата книга. Този тип хипотеза обикновено се изследва с помощта на контрастен анализ.

Анализ на контраста

Накратко, анализът на контраста ни позволява да оценим статистическата значимост на някои линейни комбинации от сложни ефекти. Контрастният анализ е основният и незаменим елемент от всеки комплексен ANOVA план. Модул Дисперсионен анализима доста разнообразни възможности за анализ на контраста, които ви позволяват да изберете и анализирате всеки тип сравнение на средни стойности.

a posterioriсравнения

Понякога в резултат на обработка на експеримент се открива неочакван ефект. Въпреки че в повечето случаи един креативен изследовател ще може да обясни всеки резултат, това не предоставя възможности за допълнителен анализ и оценки за прогнозата. Този проблем е един от онези, за които post hoc критерии, тоест критерии, които не използват априорихипотези. За илюстрация разгледайте следния експеримент. Да предположим, че 100 карти съдържат числа от 1 до 10. След като пуснем всички тези карти в заглавката, избираме на случаен принцип 20 пъти по 5 карти и изчисляваме средната стойност за всяка проба (средната стойност на числата, написани на картите). Можем ли да очакваме, че има две проби, чиито средни стойности са значително различни? Това е много правдоподобно! Чрез избиране на две проби с максимална и минимална средна стойност, може да се получи разлика в средните стойности, която е много различна от разликата в средните стойности, например, на първите две проби. Тази разлика може да бъде изследвана, например, с помощта на контрастен анализ. Без да навлизаме в подробности, има няколко т.нар a posterioriкритерии, които се основават точно на първия сценарий (вземане на крайни средни стойности от 20 проби), т.е. тези критерии се основават на избора на най-различни средства за сравняване на всички средства в дизайна. Тези критерии се прилагат, за да не се получи чисто случайно изкуствен ефект, например да се намери съществена разлика между средните, когато няма такава. Модул Дисперсионен анализпредлага широк набор от такива критерии. Когато се появят неочаквани резултати в експеримент, включващ множество групи, a posterioriпроцедури за изследване на статистическата значимост на получените резултати.

Сбор от квадрати тип I, II, III и IV

Многовариантна регресия и дисперсионен анализ

Съществува тясна връзка между метода на многовариантната регресия и дисперсионния анализ (анализ на вариациите). И при двата метода се изучава линеен модел. Накратко, почти всички експериментални проекти могат да бъдат изследвани с помощта на многовариантна регресия. Помислете за следния прост план за кръстосани групи 2 x 2.

DV А б AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Колони A и B съдържат кодове, характеризиращи нивата на фактори A и B, колона AxB съдържа произведението на две колони A и B. Можем да анализираме тези данни с помощта на многовариантна регресия. Променлива DVдефинирана като зависима променлива, променливи от Апреди AxBкато независими променливи. Изследването на значимостта на регресионните коефициенти ще съвпадне с изчисленията при дисперсионния анализ на значимостта на основните ефекти на факторите Аи би ефект на взаимодействие AxB.

Небалансирани и балансирани планове

При изчисляване на корелационната матрица за всички променливи, например за данните, изобразени по-горе, може да се види, че основните ефекти на факторите Аи би ефект на взаимодействие AxBнекорелирани. Това свойство на ефектите се нарича още ортогоналност. Казват, че ефектите Аи б - ортогоналенили независимаедин от друг. Ако всички ефекти в плана са ортогонални един на друг, както в примера по-горе, тогава се казва, че планът е балансиран.

Балансираните планове имат „добро свойство“. Изчисленията при анализа на такива планове са много прости. Всички изчисления се свеждат до изчисляване на корелацията между ефектите и зависимите променливи. Тъй като ефектите са ортогонални, частичните корелации (както при пълните многоизмеренрегресии) не се изчисляват. Въпреки това, в истинския животплановете не винаги са балансирани.

Помислете за реални данни с неравен брой наблюдения в клетките.

Фактор А Фактор Б
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ако кодираме тези данни, както по-горе, и изчислим корелационната матрица за всички променливи, тогава се оказва, че проектните фактори са корелирани един с друг. Факторите в плана вече не са ортогонални и такива планове се наричат неуравновесен.Обърнете внимание, че в този пример корелацията между факторите е изцяло свързана с разликата в честотите на 1 и -1 в колоните на матрицата с данни. С други думи, експерименталните дизайни с неравномерни обеми на клетките (по-точно, непропорционални обеми) ще бъдат небалансирани, което означава, че основните ефекти и взаимодействия ще се смесват. В този случай, за да изчислите статистическата значимост на ефектите, трябва да изчислите напълно многовариантната регресия. Тук има няколко стратегии.

Сбор от квадрати тип I, II, III и IV

Тип сума на квадратитеазиIII. За да се изследва значимостта на всеки фактор в многовариантен модел, може да се изчисли частичната корелация на всеки фактор, при условие че всички други фактори вече са взети предвид в модела. Можете също така да въвеждате фактори в модела стъпка по стъпка, като фиксирате всички фактори, които вече са въведени в модела, и игнорирате всички други фактори. В общи линии това е разликата между Тип IIIи Типазсуми на квадрати (тази терминология е въведена в SAS, вижте например SAS, 1982; подробно обсъждане може да се намери и в Searle, 1987, p. 461; Woodward, Bonett и Brecht, 1990, p. 216; или Milliken и Джонсън, 1984 г., стр. 138).

Тип сума на квадратитеII.Следващата „междинна” стратегия за формиране на модел е: да се контролират всички основни ефекти при изследване на значимостта на единичен основен ефект; при контрола на всички основни ефекти и всички взаимодействия по двойки, когато се изследва значимостта на едно взаимодействие по двойки; в контролирането на всички основни ефекти от всички взаимодействия по двойки и всички взаимодействия на три фактора; при изследване на отделно взаимодействие на три фактора и др. Сумите на квадратите за ефектите, изчислени по този начин, се наричат ТипIIсуми на квадрати. Така, типII sums of squares контролира всички ефекти от същия ред и по-долу, като игнорира всички ефекти от по-висок ред.

Тип сума на квадратитеIV. И накрая, за някои специални планове с липсващи клетки (непълни планове) е възможно да се изчисли т.нар. Тип IVсуми на квадрати. Този метод ще бъде обсъден по-късно във връзка с непълните планове (планове с липсващи клетки).

Тълкуване на хипотезата за сумата на квадратите от типове I, II и III

сбор от квадрати ТипIIIнай-лесно за тълкуване. Припомнете си, че сумите на квадрати ТипIIIизследвайте ефектите след контролиране на всички други ефекти. Например след намиране на статистически значима ТипIIIефект за фактора Ав модула Дисперсионен анализ, можем да кажем, че има единичен значим ефект на фактора А, след въвеждане на всички други ефекти (фактори) и съответно интерпретирайте този ефект. Вероятно в 99% от всички приложения на дисперсионния анализ този тип критерий представлява интерес за изследователя. Този тип сума на квадратите обикновено се изчислява в модула Дисперсионен анализпо подразбиране, независимо дали опцията е избрана Регресионен подходили не (стандартни подходи, възприети в модула Дисперсионен анализобсъдени по-долу).

Значителни ефекти, получени чрез суми от квадрати Типили ТипIIсумите на квадратите не са толкова лесни за тълкуване. Те се интерпретират най-добре в контекста на поетапна многовариантна регресия. Ако се използва сумата от квадрати Типазосновният ефект на фактор B се оказа значителен (след включване на фактор A в модела, но преди добавяне на взаимодействието между A и B), може да се заключи, че има значителен основен ефект на фактор B, при условие че има няма взаимодействие между фактори А и Б. (Ако при използване на критерия ТипIII, фактор B също се оказа значим, тогава можем да заключим, че има значим основен ефект на фактор B, след въвеждане на всички други фактори и техните взаимодействия в модела).

По отношение на пределните средства на хипотезата Типази ТипIIобикновено нямат просто тълкуване. В тези случаи се казва, че не може да се интерпретира значимостта на ефектите, като се вземат предвид само маргиналните средства. по-скоро представени стрсредните стойности са свързани със сложна хипотеза, която комбинира средни стойности и размер на извадката. Например, типIIхипотезите за фактор А в простия пример за дизайн 2 x 2, обсъден по-рано, биха били (вижте Woodward, Bonett и Brecht, 1990, стр. 219):

nij- брой наблюдения в клетка

uij- средна стойност в клетка

н. й- пределно средно

Без да навлизаме в подробности (за повече подробности вижте Milliken and Johnson, 1984, глава 10), е ясно, че това не са прости хипотези и в повечето случаи нито една от тях не представлява особен интерес за изследователя. Има обаче случаи, когато хипотезите Типазможе да представлява интерес.

Изчислителният подход по подразбиране в модула Дисперсионен анализ

По подразбиране, ако опцията не е отметната Регресионен подход, модул Дисперсионен анализизползва клетъчен среден модел. Характерно за този модел е, че сумите на квадратите за различни ефекти се изчисляват за линейни комбинации от средни стойности на клетките. В пълен факторен експеримент това води до суми от квадрати, които са същите като сумите от квадрати, обсъдени по-рано като тип III. Въпреки това, в опцията Планирани сравнения(в прозореца Анализ на дисперсионните резултати), потребителят може да направи хипотеза за всяка линейна комбинация от претеглени или непретеглени средни клетки. Така потребителят може да тества не само хипотези ТипIII, но хипотези от всякакъв вид (вкл типIV). Този общ подход е особено полезен при изследване на дизайни с липсващи клетки (така наречените непълни дизайни).

За пълни факторни дизайни този подход е полезен и когато човек иска да анализира претеглени пределни средни стойности. Да предположим например, че в простия дизайн 2 x 2, разгледан по-рано, искаме да сравним претеглените (от гледна точка на факторни нива) б) пределни средни стойности за фактор А. Това е полезно, когато разпределението на наблюденията върху клетките не е изготвено от експериментатора, а е изградено на случаен принцип и тази случайност се отразява в разпределението на броя наблюдения по нива на фактор В в агрегата .

Например, има фактор - възрастта на вдовиците. Възможна извадка от респонденти е разделена на две групи: под 40 години и над 40 години (фактор Б). Вторият фактор (фактор А) в плана е дали вдовиците са получили или не социална подкрепа от някоя агенция (докато някои вдовици са избрани на случаен принцип, други са служили като контролни). В този случай възрастовото разпределение на вдовиците в извадката отразява действителното възрастово разпределение на вдовиците в населението. Оценка на работата на групата Социална помощвдовици от всички възрастище съответства на среднопретеглената стойност за двете възрастови групи (с тегла, съответстващи на броя наблюдения в групата).

Планирани сравнения

Имайте предвид, че сумата от въведените коефициенти на контраст не е непременно равна на 0 (нула). Вместо това програмата автоматично ще направи корекции, така че съответните хипотези да не се смесват с общата средна стойност.

За да илюстрираме това, нека се върнем към простия план 2 x 2, обсъден по-рано. Спомнете си, че броят на клетките на този небалансиран дизайн е -1, 2, 3 и 1. Да кажем, че искаме да сравним претеглените пределни средни стойности за фактор А (претеглени от честотата на нивата на фактор В). Можете да въведете контрастни съотношения:

Обърнете внимание, че сборът на тези коефициенти не е 0. Програмата ще настрои коефициентите така, че сборът да е 0, като същевременно запази относителните им стойности, т.е.:

1/3 2/3 -3/4 -1/4

Тези контрасти ще сравнят претеглените средни стойности за фактор А.

Хипотези за главното средно.Хипотезата, че непретеглената основна средна стойност е 0, може да се изследва с помощта на коефициенти:

Хипотезата, че претеглената основна средна стойност е 0, се тества с:

В никакъв случай програмата не коригира контрастните съотношения.

Анализ на планове с липсващи клетки (непълни планове)

Факториалните дизайни, съдържащи празни клетки (обработка на комбинации от клетки, в които няма наблюдения), се наричат ​​непълни. В такива проекти някои фактори обикновено не са ортогонални и някои взаимодействия не могат да бъдат изчислени. Като цяло няма по-добър метод за анализ на подобни планове.

Регресионен подход

В някои по-стари програми, които се основават на анализ на ANOVA дизайни с помощта на многовариантна регресия, факторите в непълните дизайни се задават по подразбиране по обичайния начин (сякаш ако планът е пълен). След това се извършва многовариантен регресионен анализ за тези фиктивно кодирани фактори. За съжаление, този метод води до резултати, които са много трудни, ако не и невъзможни, за интерпретиране, тъй като не е ясно как всеки ефект допринася за линейната комбинация от средства. Помислете за следния прост пример.

Фактор А Фактор Б
B1 B2
A1 3 4, 5
A2 6, 6, 7 Пропуснато

Ако многовариантна регресия на формата Зависима променлива = константа + фактор A + фактор B, тогава хипотезата за значимостта на факторите A и B по отношение на линейни комбинации от средни изглежда така:

Фактор A: клетка A1,B1 = клетка A2,B1

Фактор B: клетка A1,B1 = клетка A1,B2

Този случай е прост. При по-сложни планове е невъзможно реално да се определи какво точно ще се изследва.

Средни клетки, дисперсионен анализ , хипотези тип IV

Подход, който се препоръчва в литературата и изглежда за предпочитане, е изследването на значими (по отношение на изследователски задачи) априорихипотези за средствата, наблюдавани в клетките на плана. Подробно обсъждане на този подход може да се намери в Dodge (1985), Heiberger (1989), Milliken and Johnson (1984), Searle (1987) или Woodward, Bonett и Brecht (1990). Сумите на квадратите, свързани с хипотези за линейна комбинация от средства в непълни проекти, изследващи оценки на част от ефектите, също се наричат ​​суми на квадрати. IV.

Автоматично генериране на типови хипотезиIV. Когато многовариантните проекти имат сложен модел на липсващи клетки, е желателно да се дефинират ортогонални (независими) хипотези, чието изследване е еквивалентно на изследването на основните ефекти или взаимодействия. Разработени са алгоритмични (изчислителни) стратегии (базирани на матрицата на псевдо-обратния дизайн) за генериране на подходящи тегла за такива сравнения. За съжаление окончателните хипотези не са еднозначно дефинирани. Разбира се, те зависят от реда, в който са определени ефектите, и рядко са лесни за тълкуване. Поради това се препоръчва внимателно да се проучи естеството на липсващите клетки, след което да се формулират хипотези ТипIV, които са най-подходящи за целите на изследването. След това проучете тези хипотези, като използвате опцията Планирани сравненияв прозореца резултати. Най-лесният начин за уточняване на сравненията в този случай е да се изисква въвеждането на вектор от контрасти за всички фактори заеднов прозореца Планирани сравнения.След извикване на диалоговия прозорец Планирани сравнениявсички групи от текущия план ще бъдат показани, а тези, които са пропуснати, ще бъдат маркирани.

Пропуснати клетки и проверка на специфичен ефект

Има няколко вида планове, в които местоположението на липсващите клетки не е произволно, а внимателно планирано, което позволява прост анализ на основните ефекти, без да се засягат други ефекти. Например, когато необходимият брой клетки в плана не е наличен, често се използват планове. латински квадратчетаза оценка на основните ефекти на няколко фактора с Голям бройнива. Например факторен дизайн 4 x 4 x 4 x 4 изисква 256 клетки. В същото време можете да използвате Гръко-латински площадза оценка на основните ефекти, като има само 16 клетки в плана (гл. Планиране на експеримента, том IV, съдържа подробно описание на такива планове). Непълните дизайни, при които основните ефекти (и някои взаимодействия) могат да бъдат оценени с помощта на прости линейни комбинации от средства, се наричат балансирани непълни планове.

При балансирани дизайни стандартният (по подразбиране) метод за генериране на контрасти (тегла) за основните ефекти и взаимодействия след това ще произведе анализ на таблица с вариации, в който сумите на квадратите за съответните ефекти не се смесват един с друг. опция Специфични ефектипрозорец резултатище генерира липсващи контрасти, като напише нула в липсващите клетки на плана. Веднага след като опцията е заявена Специфични ефектиза потребител, който изучава някаква хипотеза, се появява таблица с резултати с действителните тегла. Имайте предвид, че при балансиран дизайн сумите на квадратите на съответните ефекти се изчисляват само ако тези ефекти са ортогонални (независими) спрямо всички други основни ефекти и взаимодействия. В противен случай използвайте опцията Планирани сравненияза изследване на смислени сравнения между средствата.

Липсващи клетки и комбинирани ефекти/членове на грешки

Ако опция Регресионен подходв стартовия панел на модула Дисперсионен анализне е избрано, моделът на средните стойности на клетките ще се използва при изчисляване на сумата от квадрати за ефектите (настройка по подразбиране). Ако дизайнът не е балансиран, тогава при комбиниране на неортогонални ефекти (вижте по-горе обсъждането на опцията Липсващи клетки и специфичен ефект) може да се получи сума от квадрати, състояща се от неортогонални (или припокриващи се) компоненти. Получените по този начин резултати обикновено не могат да се интерпретират. Следователно, човек трябва да бъде много внимателен при избора и внедряването на сложни непълни експериментални проекти.

Има много книги с подробни обсъждания на различни видове планове. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken and Johnson, 1984; Searle, 1987; Woodward and Bonett, 1990), но този вид информация е извън обхвата на този учебник. По-късно в този раздел обаче ще бъде демонстриран анализ на различни типове планове.

Предположения и последици от нарушаване на предположенията

Отклонение от предположението за нормални разпределения

Да приемем, че зависимата променлива се измерва в цифрова скала. Нека приемем също, че зависимата променлива има нормално разпределение във всяка група. Дисперсионен анализсъдържа широк набор от графики и статистически данни, за да обоснове това предположение.

Ефекти от нарушение.В общи линии Екритерият е много устойчив на отклонение от нормалното ( подробни резултативиж Lindman, 1974). Ако ексцесът е по-голям от 0, тогава стойността на статистиката Еможе да стане много малък. Нулевата хипотеза се приема, въпреки че може да не е вярна. Ситуацията е обратна, когато ексцесът е по-малък от 0. Изкривеността на разпределението обикновено има малък ефект върху Естатистика. Ако броят на наблюденията в една клетка е достатъчно голям, тогава отклонението от нормалното няма голямо значение поради централна гранична теорема, според което разпределението на средната стойност е близко до нормалното, независимо от първоначалното разпределение. Подробно обсъждане на устойчивостта Естатистическите данни могат да бъдат намерени в Box and Anderson (1955) или Lindman (1974).

Хомогенност на дисперсията

Предположения.Предполага се, че отклоненията на различните групи от плана са еднакви. Това предположение се нарича предположение хомогенност на дисперсията.Спомнете си, че в началото на този раздел, когато описваме изчисляването на сумата от квадратни грешки, извършихме сумиране във всяка група. Ако дисперсиите в две групи се различават една от друга, тогава добавянето им не е много естествено и не дава оценка на общата дисперсия в рамките на групата (тъй като в този случай изобщо няма обща дисперсия). Модул Дисперсионен анализ -ANOVA/МАНОВАсъдържа голям набор от статистически критерии за откриване на отклонение от предположенията за хомогенност на дисперсията.

Ефекти от нарушение.Линдман (1974, стр. 33) показва това Екритерият е доста стабилен по отношение на нарушаването на предположенията за хомогенност на дисперсията ( хетерогенностдисперсия, виж също Box, 1954a, 1954b; Hsu, 1938).

Специален случай: корелация на средни стойности и дисперсии.Има моменти, когато Естатистика може заблуждавам.Това се случва, когато средните стойности в клетките на дизайна са свързани с дисперсията. Модул Дисперсионен анализви позволява да изградите дисперсионни диаграми на разсейване или стандартно отклонениепо отношение на средствата за откриване на такава корелация. Причината, поради която такава корелация е опасна, е следната. Нека си представим, че в плана има 8 клетки, 7 от които имат почти еднаква средна стойност, а в една клетка средната е много по-голяма от останалите. Тогава Етестът може да открие статистически значим ефект. Но да предположим, че в клетка с голяма средна стойност и дисперсията е много по-голяма от останалите, т.е. средната стойност и дисперсията в клетките са зависими (колкото по-голяма е средната стойност, толкова по-голяма е дисперсията). В този случай голямата средна стойност е ненадеждна, тъй като може да е причинена от голямо отклонение в данните. въпреки това Естатистика въз основа на обединенивариацията в клетките ще обхване голяма средна стойност, въпреки че критериите, базирани на вариация във всяка клетка, няма да считат всички разлики в средните стойности за значими.

Това естество на данните (голяма средна стойност и голямо отклонение) често се среща, когато има извънредни наблюдения. Едно или две извънредни наблюдения силно изместват средната стойност и значително увеличават дисперсията.

Хомогенност на дисперсията и ковариацията

Предположения.При многовариантни проекти, с многовариантни зависими мерки, хомогенността на предположенията за дисперсия, описани по-рано, също се прилага. Въпреки това, тъй като има многовариантни зависими променливи, също така се изисква техните кръстосани корелации (ковариации) да бъдат еднакви във всички клетки на плана. Модул Дисперсионен анализпредлага различни начини за тестване на тези предположения.

Ефекти от нарушение. Многоизмерен аналог Е- критерий - λ-тест на Wilks. Не се знае много за стабилността (устойчивостта) на λ-теста на Wilks по отношение на нарушаването на горните допускания. Въпреки това, тъй като тълкуването на резултатите от модула Дисперсионен анализобикновено се основава на значимостта на едномерните ефекти (след установяване на значимостта на общия критерий), обсъждането на устойчивостта засяга главно едномерния анализ на дисперсията. Следователно значението на едноизмерните ефекти трябва да бъде внимателно изследвано.

Специален случай: анализ на ковариацията.Особено сериозни нарушения на хомогенността на дисперсията/ковариацията могат да възникнат, когато в дизайна са включени ковариати. По-специално, ако корелацията между ковариатите и зависимите мерки е различна в различните клетки на дизайна, може да последва погрешно тълкуване на резултатите. Трябва да се помни, че при анализа на ковариацията по същество се извършва регресионен анализ във всяка клетка, за да се изолира тази част от дисперсията, която съответства на ковариата. Предположението за хомогенност на дисперсията/ковариацията предполага, че този регресионен анализ се извършва при следното ограничение: всички регресионни уравнения(наклони) са еднакви за всички клетки. Ако това не е предвидено, тогава могат да възникнат големи грешки. Модул Дисперсионен анализима няколко специални критерия за тестване на това предположение. Може да е препоръчително да използвате тези критерии, за да сте сигурни, че регресионните уравнения за различните клетки са приблизително еднакви.

Сферичност и сложна симетрия: причини за използването на многовариантен подход на повтарящи се измервания в анализа на дисперсията

При проекти, съдържащи фактори на повтарящи се измервания с повече от две нива, прилагането на едномерен анализ на дисперсията изисква допълнителни допускания: допускания за сложна симетрия и допускания за сферичност. Тези предположения рядко се изпълняват (вижте по-долу). Следователно, в последните годинимноговариантният анализ на дисперсията придоби популярност в такива планове (и двата подхода са комбинирани в модула Дисперсионен анализ).

Предположение за сложна симетрияПредположението за комплексна симетрия е, че дисперсиите (общо в рамките на групата) и ковариациите (по група) за различни повтарящи се измервания са еднакви (едни и същи). Това е достатъчно условие, за да бъде валиден едномерният F тест за повтарящи се измервания (т.е. докладваните F-стойности са средно в съответствие с F-разпределението). В този случай обаче това условие не е необходимо.

Допускане на сферичност.Предположението за сферичност е необходимо и достатъчно условие, за да бъде оправдан F-критерият. Състои се в това, че в рамките на групите всички наблюдения са независими и равномерно разпределени. Естеството на тези предположения, както и въздействието на техните нарушения, обикновено не са добре описани в книгите за дисперсионен анализ - това ще бъде описано в следващите параграфи. Той също така ще покаже, че резултатите от едновариантния подход може да се различават от резултатите от многовариантния подход и ще обясни какво означава това.

Необходимостта от независимост на хипотезите.Общият начин за анализиране на данни в дисперсионния анализ е пасване на модела. Ако по отношение на модела, съответстващ на данните, има такива априорихипотези, тогава дисперсията се разделя, за да се тестват тези хипотези (критерии за основни ефекти, взаимодействия). От изчислителна гледна точка този подход генерира някакъв набор от контрасти (набор от сравнения на средства в дизайна). Ако обаче контрастите не са независими един от друг, разделянето на вариантите става безсмислено. Например, ако два контраста Аи бса идентични и съответната част се избира от дисперсията, след което същата част се избира два пъти. Например, глупаво и безсмислено е да се отделят две хипотези: „средната стойност в клетка 1 е по-висока от средната стойност в клетка 2“ и „средната стойност в клетка 1 е по-висока от средната стойност в клетка 2“. Така че хипотезите трябва да са независими или ортогонални.

Независими хипотези при повторни измервания.Общ алгоритъм, реализиран в модула Дисперсионен анализ, ще се опита да генерира независими (ортогонални) контрасти за всеки ефект. За фактора повтарящи се измервания тези контрасти пораждат много хипотези за различиямежду нивата на разглеждания фактор. Въпреки това, ако тези различия са свързани в рамките на групите, тогава получените контрасти вече не са независими. Например, при обучение, при което обучаемите се измерват три пъти в един семестър, може да се случи промените между 1-во и 2-ро измерение да са в отрицателна корелация с промяната между 2-ро и 3-то измерение на предметите. Тези, които са усвоили по-голямата част от материала между 1-во и 2-ро измерение, усвояват по-малка част през времето, изминало между 2-ро и 3-то измерение. Всъщност, за повечето случаи, когато анализът на дисперсията се използва при повтарящи се измервания, може да се приеме, че промените в нивата са корелирани между субектите. Когато обаче това се случи, сложните предположения за симетрия и сферичност не са изпълнени и независимите контрасти не могат да бъдат изчислени.

Въздействието на нарушенията и начините за коригирането им.Когато сложните предположения за симетрия или сферичност не са изпълнени, анализът на дисперсията може да доведе до грешни резултати. Преди многовариантните процедури да бъдат достатъчно развити, бяха направени няколко допускания, за да се компенсират нарушенията на тези допускания. (Вижте например Greenhouse & Geisser, 1959 и Huynh & Feldt, 1970). Тези методи се използват широко и днес (затова са представени в модула Дисперсионен анализ).

Многовариантен анализ на дисперсионния подход към повтарящи се измервания.Като цяло, проблемите на сложната симетрия и сферичност се отнасят до факта, че наборите от контрасти, включени в изследването на ефектите от фактори на повтарящи се измервания (с повече от 2 нива), не са независими един от друг. Въпреки това, те не трябва да бъдат независими, ако се използват. многоизмеренкритерий за едновременна проверка статистическа значимостдве или повече повторени измервания факторни контрасти. Това е причината многовариантният анализ на дисперсионните методи да се използва все по-често за тестване на значимостта на едномерни фактори с многократно измерване с повече от 2 нива. Този подход е широко използван, тъй като обикновено не изисква допускането на сложна симетрия и допускането на сферичност.

Случаи, в които не може да се използва подходът на многовариантния анализ на дисперсията.Има примери (планове), когато подходът на многовариантния анализ на дисперсията не може да бъде приложен. Това обикновено са случаи, при които има малък брой субекти в дизайна и много нива във фактора за повтарящи се измервания. Тогава може да има твърде малко наблюдения за извършване на многовариантен анализ. Например, ако има 12 обекта, стр = 4 фактор на многократни измервания и всеки фактор има к = 3 нива. Тогава взаимодействието на 4 фактора ще „разходва“ (к-1)стр = 2 4 = 16 степени на свобода. Въпреки това, има само 12 субекта, следователно многовариантен тест не може да бъде извършен в този пример. Модул Дисперсионен анализнезависимо ще открие тези наблюдения и ще изчисли само едномерни критерии.

Разлики в едновариантните и многовариантните резултати.Ако изследването включва голям брой повтарящи се измервания, може да има случаи, при които едновариантният подход на повторени измервания на ANOVA дава резултати, които са много различни от тези, получени с многовариантния подход. Това означава, че разликите между нивата на съответните повтарящи се измервания са свързани между субектите. Понякога този факт е от някакъв независим интерес.

Многовариантен дисперсионен анализ и структурно моделиране на уравнения

През последните години моделирането на структурни уравнения стана популярно като алтернатива на многовариантния дисперсионен анализ (виж, например, Bagozzi и Yi, 1989; Bagozzi, Yi и Singh, 1991; Cole, Maxwell, Arvey и Salas, 1993). Този подход ви позволява да тествате хипотези не само за средните стойности в различни групи, но и за корелационните матрици на зависимите променливи. Например, можете да намалите предположенията за хомогенността на дисперсията и ковариацията и изрично да включите грешки в модела за всяка група от дисперсия и ковариация. Модул СТАТИСТИКАМоделиране на структурни уравнения (SEPATH) (виж том III) дава възможност за такъв анализ.

Дисперсионният анализ се използва за идентифициране на влиянието върху изследвания показател на някои фактори, които обикновено не могат да бъдат количествено измерими. Същността на метода е да се разложи общата вариация на изследвания показател на части, съответстващи на отделното и съвместно влияние на факторите, и да се изследват статистически тези части, за да се определи приемливостта на хипотезите за липсата на тези влияния. Моделите ANOVA, в зависимост от броя на факторите, се класифицират на еднофакторни, двуфакторени т.н. Според целта на изследването се разграничават следните модели: детерминистичен(Ml) - тук нивата на всички фактори са предварително фиксирани и се проверява влиянието им, случаен(M2) - тук нивата на всеки фактор се получават като произволна извадка от общата съвкупност от факторни нива, и смесен(M3) - тук нивата на някои фактори са предварително фиксирани, а нивата на други са случайна извадка.

Еднопосочен дисперсионен анализ

Еднопосочната ANOVA се основава на следния вероятностен модел:

където е стойността на случайната променлива Y, взета на ниво D (,) , / =

1,2,..., v, множители Лв &-тото наблюдение, k = 1,2, ..., P,;

Около 1 "1 - ефектът от влиянието върху UGниво D®;

e® са независими случайни променливи, отразяващи влиянието на неконтролирани остатъчни фактори върху Y/"* и всички e* 1 ~ Н( 0, или).

Освен това в модела Ml всички 0 (,) са детерминистични количества

и? e ("H \u003d 0; и в модела M2 0 (,) - случайни променливи (стойности на случайни

ефект на чай 0), 0® = 0, където 0 - ;V(0, st in), и всички 0® и e* ’ са независими.

Нека намерим общия вариант S2ефективен знак Y и двата му компонента - S 2 Aи С Ротразяващи съответно влиянието на фактора НОи влиянието на остатъчни фактори:

Лесно е да се провери това S2 = S 2 A +. Разделяне на всички части

това равенство върху i, получаваме:

Това правило гласи така: Обща дисперсиянаблюдения е равна на сумата интергрупадисперсия (това е дисперсията на Su (0 означава група) и вътрешногруповидисперсия (това е средната стойност а 2от групови вариации).

За да разберете дали факторът НОза резултат:

  • ? в модела Ml хипотезата се тества H 0: 0 (|) = 0 (2) = ... = 0 (v) =0 (ако е прието, тогава за всички мастиломатематическо очакване MU / "* \u003d A / Y [виж формула (8.4.1)], което означава, че когато нивото на фактора се промени, общата средна група не се променя, т.е. разглежданите нива на фактора НОне засягат Y;
  • ? в модела М2 хипотезата се тества H 0 = 0 (приемането му означава, че ефектът 0 е постоянна стойност и като се вземе предвид условието M0 = 0, получаваме, че 0 = 0, т.е. факторът НОне засяга U).

Критериите за проверка на тези и други хипотези, както и оценка на параметрите на модела (8.4.1) са дадени в табл. 8.5.

Задача 8.7. Изследователят иска да разбере дали четирите начина за рекламиране на даден продукт се различават по ефекта си върху обема на продажбата му. За да направите това, във всеки от четирите града от същия тип (използвани са различни начиниреклама) събрана информация за обема на продажбите на стоки (в парични единици) в четири произволно избрани магазина и се изчисляват съответните характеристики на извадката:

Решение. Тук е факторът НОе начин за реклама; неговите четири нива са фиксирани и се оказва дали тези нива се различават по своето влияние - това е Ml моделът на еднофакторния анализ.

където e** е независимо?** N(0,g r).

защото МОЯТАи всички 0 (,) са постоянни стойности, тогава когато (8.4.3) е изпълнено, наблюденията са независими и всички

Да приемем, че независимостта на наблюденията е гарантирана от организацията на експеримента; условие (8.4.4) означава, че обемът на продажбите с r "-тия метод на реклама има нормален закон за разпределение с математическото очакване a, \u003d МОЯТ+ 0 (,) и със същата вариация за всички методи. Да приемем, че има нормално разпределение. Използвайки критерия на Бартлет (вижте таблица 8.3), ние се уверяваме, че резултатите от теста ни позволяват да приемем хипотезата N "n: относно? =... = ол.Изчислете


според таблицата Клауза 6.3 с k=v-l=3np=a= 0,05 намерете % 2 а = ха = 7,82; тъй като 1.538 N "0 приемаме.

Сега нека тестваме ключовата хипотеза на дисперсионния анализ H 0: 0 m =... = 0 S 2 A = 220,19, S 2 R\u003d 39.27, S "2 \u003d 259.46; като се уверим, че равенството (8.4.2) е вярно, намираме оценката (8.4.5) (вижте таблица 8.5) s2 = 39,27/12 = 3,27 вариации от 2 до; проверете дали неравенството (8.4.6) е изпълнено (вижте таблица 8.5):

според таблицата P. 6.4 при = 3, до 2 = 12 и p = a = 0,05 намерете F2a = фа= 3,49. Тъй като 22.43 > 3.49, неравенството (8.4.6) е изпълнено. Следователно хипотезата

Условия и критерии за проверка на хипотези на еднопосочен дисперсионен анализ

H 0: 0 (|) = ... = 0 (4) = 0 отхвърляне: вярваме, че фиксираните начини за рекламиране на продукти влияят върху продажбите; докато влияе

= 84,9% вариация в обема на продажбите.

Нека променим условието на задачата. Да приемем, че начините за рекламиране на продукт не са фиксирани предварително, а се избират произволно от целия набор от начини. Тогава установяването на въпроса дали методът на реклама влияе или не се свежда до проверка на хипотезата з 0: Og = 0 модел M2. Критерият за неговата проверка е същият като при модела Ml. Тъй като условието (8.4.6) за отхвърляне на хипотезата H 0: o 2 в = 0 е изпълнено, отхвърляме хипотезата, поне докато не бъдат получени допълнителни данни: смятаме, че начинът на рекламиране на стоките (в цялата съвкупност от тези начини) влияе върху обема на продажбите.

Двупосочен дисперсионен анализ

(със същия номер T> 1 наблюдения за различни комбинации от нива на фактори)

Двупосочният анализ на дисперсията се основава на следния вероятностен модел:

където Y / 1 ' 7) стойността на случайната променлива Y, взета на ниво A(" i = 1,2, ..., v A,фактор а НОи ниво 5®, y = 1,2, ..., v B,фактор а ATв да се-m наблюдение, k = 1,2, ..., / и; 0^, 0 (th y), 0^d y) - ефекти на влияние върху Y / 1 ’, съответно нива НО (" 5® и взаимодействия А (0и B;- независими случайни променливи, отразяващи влиянието върху U/ 1 'y) на неконтролирани остатъчни фактори, и e?' l ~ /V ((), a l).

Нека намерим общия вариант S2знак U и неговите четири компонента - S 2 a, С 2 Б, S2ab, S 2 r , отразяващи влиянието на факторите, респ А, Бтехните взаимодействия и остатъчни фактори:


Лесно е да се провери това S2 = + S 2 B + S 2 iB + S B .

Оценките на параметрите и на трите типа на модела (8.4.9): Ml, M2 и M3, хипотезите за проверка и критериите за тяхната проверка са дадени в табл. 8.6. Моделите M2 и M3 предполагат, че всички случайни ефекти са независими както помежду си, така и с тях e^' J) .

Еднофакторен дисперсионен моделима формата

където Xjj-стойността на изследваната променлива, получена на z-нивофактор (r = 1, 2,..., T) su-ти сериен номер (j- 1,2,..., P);/y - ефект, дължащ се на влиянието на i-то ниво на фактора; д^. - случаен компонент или смущение, причинено от влиянието на неконтролируеми фактори, т.е. вариация на променлива в рамките на едно ниво.

Под факторно нивочаст от нейната мярка или състояние се разбира, например количеството на приложените торове, вида на топенето на метала или партидния брой части и т.н.

Основни предпоставки за дисперсионен анализ.

1. Математическо очакване на смущение ? (/ - е нула за всяко i,тези.

  • 2. Смущенията са взаимно независими.
  • 3. Дисперсията на смущението (или променливата Xu) е постоянна за всеки ij>тези.

4. Смущението e# (или променливата Xu) има нормален закон на разпределение N( 0; а 2).

Влиянието на факторните нива може да бъде като фиксирани, или систематичен(модел I) и случаен(модел II).

Нека, например, е необходимо да се установи дали има значителни разлики между партиди от продукти по отношение на някакъв показател за качество, т.е. проверете влиянието върху качеството на един фактор - партида продукти. Ако всички партиди суровини са включени в изследването, тогава влиянието на нивото на такъв фактор е систематично (модел I) и констатациите са приложими само за онези отделни партиди, които са били включени в изследването; ако е включена само произволно избрана част от партидите, тогава влиянието на фактора е случайно (модел II). В многофакторните комплекси е възможен смесен модел III, при който някои фактори имат произволни нива, а други са фиксирани.

Нека разгледаме този проблем по-подробно. Нека има Tпартиди продукти. От всяка партида, избрана съответно p L, p 2 ,p tпродукти (за простота приемаме, че u = n 2 =... = n t = n).Ние представяме стойностите на индекса за качество на тези продукти под формата на матрица от наблюдения


Необходимо е да се провери значимостта на влиянието на партидите от продукти върху тяхното качество.

Ако приемем, че елементите на редовете на матрицата за наблюдение са числените стойности (реализации) на случайни променливи X t, X 2 ,..., x t,изразяващи качеството на продуктите и имащи нормален закон на разпределение с математически очаквания, респ a v a 2, ..., a tи същите вариации a 2, тогава този проблем се свежда до тестване на нулевата хипотеза # 0: a v = a 2l = ... = а t, извършено при дисперсионния анализ.

Нека обозначим осредняването по някакъв индекс със звездичка (или точка) вместо индекс, тогава средният индекс на качество на продуктите от i-тата партида, или средна групаза i-то ниво на фактора, приема формата

а обща средна стойност -

Помислете за сумата от квадратите на отклоненията на наблюденията от общата средна стойност xn:

или Q= Q+ Q2+ ?>з Последният член

тъй като сумата от отклоненията на стойностите на променливата от нейната средна стойност, т.е. ? 1.g y - x) е равно на нула. ) =x

Първият член може да бъде записан като

В резултат на това получаваме следната идентичност:

t p. _

където Q=Yх [ x ij _ x ", I 2 - общ,или пълен,сума на квадратите на отклоненията; 7=1

Q, -н^)

Споделете с приятели или запазете за себе си:

Зареждане...