Доверителният интервал показва. Доверителен интервал

"Катрен-Стил" продължава публикуването на цикъла на Константин Кравчик за медицинска статистика. В две предишни статии авторът засегна обяснението на такива понятия като и.

Константин Кравчик

Математик-аналитик. Специалист в областта статистически изследванияв медицината и хуманитарните науки

град Москва

Много често в статии за клинични изпитвания можете да намерите мистериозна фраза: "доверителен интервал" (95% CI или 95% CI - доверителен интервал). Например в една статия може да се каже: „Използван е t-тестът на Стюдънт за оценка на значимостта на разликите с изчислен 95% доверителен интервал.“

Каква е стойността на "95% доверителен интервал" и защо да го изчисляваме?

Какво е доверителен интервал? - Това е диапазонът, в който попадат истинските средни стойности в популацията. И какво, има "неверни" средни стойности? В известен смисъл, да, те го правят. В ние обяснихме, че е невъзможно да се измери параметърът от интерес в цялата популация, така че изследователите се задоволяват с ограничена извадка. В тази извадка (например по телесно тегло) има една средна стойност (определено тегло), по която съдим за средната стойност в цялата генерална популация. Малко вероятно е обаче средното тегло в извадката (особено малката) да съвпадне със средното тегло в общата популация. Следователно е по-правилно да се изчисли и използва диапазонът от средни стойности на общата съвкупност.

Да предположим например, че 95% доверителен интервал (95% CI) за хемоглобина е между 110 и 122 g/L. Това означава, че с 95 % вероятност истинската средна стойност на хемоглобина в общата популация ще бъде в диапазона от 110 до 122 g/l. С други думи, ние не знаем средно аритметичнохемоглобин в общата популация, но можем да посочим диапазона от стойности за тази характеристика с 95% вероятност.

Доверителните интервали са особено подходящи за разликата в средните стойности между групите или това, което се нарича размер на ефекта.

Да предположим, че сравним ефективността на два препарата с желязо: един, който е на пазара от дълго време, и един, който току-що е регистриран. След курса на терапията беше оценена концентрацията на хемоглобин в изследваните групи пациенти и статистическата програма изчисли за нас, че разликата между средните стойности на двете групи с вероятност от 95% е в диапазона от 1,72 до 14,36 g/l (Таблица 1).

Раздел. 1. Критерий за независими проби
(групите се сравняват по нивото на хемоглобина)

Това трябва да се тълкува по следния начин: в частта от пациентите в общата популация, която приема ново лекарство, хемоглобинът ще бъде по-висок средно с 1,72-14,36 g / l, отколкото при тези, които са взели вече известно лекарство.

С други думи, в общата популация разликата в средните стойности на хемоглобина в групите с 95% вероятност е в тези граници. Изследователят ще прецени дали това е много или малко. Смисълът на всичко това е, че не работим с една средна стойност, а с диапазон от стойности, следователно по-надеждно оценяваме разликата в параметъра между групите.

В статистическите пакети, по преценка на изследователя, можете независимо да стесните или разширите границите на доверителния интервал. Като намаляваме вероятностите на доверителния интервал, ние стесняваме обхвата на средните стойности. Например, при 90% CI, обхватът на средните (или средните разлики) ще бъде по-тесен, отколкото при 95% CI.

Обратно, увеличаването на вероятността до 99% разширява диапазона от стойности. При сравняване на групи долната граница на CI може да премине нулевата граница. Например, ако разширим границите на доверителния интервал до 99 %, тогава границите на интервала варират от –1 до 16 g/L. Това означава, че в генералната съвкупност има групи, разликата между средните между които за изследвания признак е 0 (М=0).

Доверителните интервали могат да се използват за тестване на статистически хипотези. Ако доверителният интервал премине нулевата стойност, тогава нулевата хипотеза, която предполага, че групите не се различават по изследвания параметър, е вярна. По-горе е описан пример, когато разширихме границите до 99%. Някъде в общата популация открихме групи, които не се различават по никакъв начин.

95% доверителен интервал на разлика в хемоглобина, (g/l)


Фигурата показва 95% доверителен интервал на разликата в средния хемоглобин между двете групи като линия. Линията преминава нулевия знак, следователно има разлика между средните стойности, равна на нула, което потвърждава нулевата хипотеза, че групите не се различават. Разликата между групите варира от -2 до 5 g/l, което означава, че хемоглобинът може да се понижи с 2 g/l или да се повиши с 5 g/l.

Доверителният интервал е много важен показател. Благодарение на него можете да видите дали разликите в групите наистина се дължат на разликата в средните стойности или се дължат на голяма извадка, тъй като при голяма извадка шансовете за откриване на разлики са по-големи, отколкото при малка.

На практика може да изглежда така. Взехме проба от 1000 души, измерихме нивото на хемоглобина и установихме, че доверителният интервал за разликата в средните стойности е от 1,2 до 1,5 g/L. Ниво статистическа значимостдокато p

Виждаме, че концентрацията на хемоглобина се повишава, но почти незабележимо, следователно статистическата значимост се появява именно поради размера на извадката.

Доверителните интервали могат да бъдат изчислени не само за средни стойности, но и за пропорции (и рискови съотношения). Например, ние се интересуваме от доверителния интервал на пропорциите на пациентите, постигнали ремисия, докато приемат разработеното лекарство. Да приемем, че 95% CI за пропорциите, т.е. за дела на такива пациенти, е в диапазона 0,60–0,80. Така можем да кажем, че нашето лекарство има терапевтичен ефект в 60 до 80% от случаите.

Всяка извадка дава само приблизителна представа за генералната съвкупност и всички статистически характеристики на извадката (средна стойност, режим, дисперсия ...) са някакво приближение или да речем оценка на общите параметри, които в повечето случаи не могат да бъдат изчислени поради недостъпността на общото население (Фигура 20) .

Фигура 20. Грешка при вземане на проби

Но можете да посочите интервала, в който с определена степен на вероятност се намира истинската (обща) стойност на статистическата характеристика. Този интервал се нарича д доверителен интервал (CI).

Така че общата средна стойност с вероятност от 95% е в рамките

от до, (20)

където T - таблична стойност на критерия на Стюдънт за α =0,05 и f= н-1

Може да се намери и 99% CI, в този случай T избран за α =0,01.

Какво е практическото значение на доверителния интервал?

    Широкият доверителен интервал показва, че средната стойност на извадката не отразява точно средната стойност на популацията. Това обикновено се дължи на недостатъчен размер на извадката или на нейната хетерогенност, т.е. голяма дисперсия. И двете дават голяма грешка в средната стойност и съответно по-широк CI. И това е причината да се върнем към етапа на планиране на изследването.

    Горните и долните граници на CI оценяват дали резултатите ще бъдат клинично значими

Нека се спрем по-подробно на въпроса за статистическата и клиничната значимост на резултатите от изследването на груповите свойства. Спомнете си, че задачата на статистиката е да открие поне някои разлики в общите съвкупности въз основа на извадкови данни. Задачата на лекаря е да намери такива (не каквито и да е) разлики, които ще помогнат за диагностицирането или лечението. И не винаги статистическите заключения са основа за клинични заключения. По този начин, статистически значимо понижение на хемоглобина с 3 g/l не е причина за безпокойство. И обратно, ако някакъв проблем в човешкото тяло няма масов характер на ниво цялото население, това не е причина да не се занимаваме с този проблем.

Ще разгледаме тази позиция в пример.

Изследователите се чудеха дали момчетата, които са имали някакъв вид инфекциозно заболяване, изостават от връстниците си в растеж. За целта е проведено селективно изследване, в което са участвали 10 момчета с това заболяване. Резултатите са представени в таблица 23.

Таблица 23. Статистически резултати

долна граница

горен лимит

Спецификации (cm)

средата

От тези изчисления следва, че селективният среден ръст на 10-годишните момчета, прекарали някакво инфекциозно заболяване, е близък до нормалния (132,5 cm). Въпреки това, долната граница на доверителния интервал (126,6 cm) показва, че има 95% вероятност истинският среден ръст на тези деца да съответства на понятието "нисък ръст", т.е. тези деца са закърнели.

В този пример резултатите от изчисленията на доверителния интервал са клинично значими.

И други Всички те са оценки на техните теоретични двойници, които биха могли да се получат, ако нямаше извадка, а население. Но уви, общото население е много скъпо и често недостъпно.

Концепцията за интервална оценка

Всяка примерна оценка има известно разсейване, защото е случайна променлива в зависимост от стойностите в конкретна проба. Следователно, за по-надеждни статистически заключения, трябва да се знае не само точкова оценка, но и интервал, който с голяма вероятност γ (гама) обхваща прогнозния показател θ (тета).

Формално това са две такива стойности (статистика) T1(X)и T2(X), Какво T1< T 2 , за които при дадено ниво на вероятност γ условието е изпълнено:

Накратко, вероятно е γ или повече истинската стойност е между точките T1(X)и T2(X), които се наричат ​​долна и горна граница доверителен интервал.

Едно от условията за конструиране на доверителни интервали е неговата максимална стеснимост, т.е. трябва да е възможно най-кратък. Желанието е съвсем естествено, т.к. изследователят се опитва да локализира по-точно находката на желания параметър.

От това следва, че доверителният интервал трябва да покрива максималните вероятности на разпределението. и самата партитура да е в центъра.

Тоест вероятността за отклонение (на истинския показател от оценката) нагоре е равна на вероятността за отклонение надолу. Трябва също да се отбележи, че за изкривените разпределения интервалът отдясно не е равен на интервала отляво.

Фигурата по-горе ясно показва, че колкото по-високо е нивото на доверие, толкова по-широк е интервалът - пряка връзка.

Това беше малко въведение в теорията за интервално оценяване на неизвестни параметри. Нека да преминем към намирането на граници на доверие за математическо очакване.

Доверителен интервал за математическо очакване

Ако оригиналните данни са разпределени върху , тогава средната стойност ще бъде нормална стойност. Това следва от правилото, че линейна комбинация от нормални стойности също има нормално разпределение. Следователно, за да изчислим вероятностите, бихме могли да използваме математическия апарат на нормалния закон за разпределение.

Това обаче ще изисква познаването на два параметъра - очакваната стойност и дисперсията, които обикновено не са известни. Можете, разбира се, да използвате оценки вместо параметри (средно аритметично и ), но тогава разпределението на средната стойност няма да е съвсем нормално, то ще бъде леко изравнено. Гражданинът Уилям Госет от Ирландия умело отбеляза този факт, когато публикува откритието си в броя на Biometrica от март 1908 г. За целите на секретността Госет подписа със Студент. Така се появи t-разпределението на Стюдънт.

Но нормалното разпределение на данните, използвано от К. Гаус при анализа на грешките в астрономическите наблюдения, е изключително рядко в земния живот и е доста трудно да се установи това (за висока точност са необходими около 2 хиляди наблюдения). Следователно най-добре е да се откажете от предположението за нормалност и да използвате методи, които не зависят от разпределението на оригиналните данни.

Възниква въпросът: какво е разпределението на средноаритметичното, ако се изчислява от данните на неизвестно разпределение? Отговорът дава добре познатата в теорията на вероятностите Централна гранична теорема(CPT). В математиката има няколко негови версии (формулировките са усъвършенствани през годините), но всички те, грубо казано, се свеждат до твърдението, че сумата от голям брой независими случайни променливи се подчинява на нормален законразпространение.

При изчисляване на средноаритметичното се използва сумата от случайни променливи. От това се оказва, че средноаритметичното има нормално разпределение, при което очакваната стойност е очакваната стойност на изходните данни, а дисперсията е .

Умни хоразнаем как да докажем CLT, но ние ще проверим това с помощта на експеримент, проведен в Excel. Нека симулираме извадка от 50 равномерно разпределени случайни променливи (използвайки Функции на ExcelСЛУЧАЙНО МЕЖДУ). След това ще направим 1000 такива проби и ще изчислим средноаритметичната стойност за всяка. Нека разгледаме тяхното разпространение.

Вижда се, че разпределението на средната е близко до нормалния закон. Ако обемът на пробите и техният брой се увеличат още повече, тогава сходството ще бъде още по-добро.

Сега, след като сами се убедихме във валидността на CLT, можем, като използваме , да изчислим доверителните интервали за средната аритметична стойност, която с дадена вероятностпокриват истинската средна или очаквана стойност.

За да зададете горната и долната граница, трябва да знаете параметрите нормална дистрибуция. По правило те не са, следователно се използват оценки: средноаритметичнои дисперсия на извадката. Отново този метод дава добро приближение само за големи проби. Когато извадките са малки, често се препоръчва да се използва разпределението на Student. Не вярвайте! Разпределението на Стюдънт за средната стойност възниква само когато оригиналните данни имат нормално разпределение, тоест почти никога. Ето защо е по-добре незабавно да зададете минималната лента за количеството необходими данни и да използвате асимптотично правилни методи. Казват, че 30 наблюдения са достатъчни. Вземете 50 - няма да сбъркате.

T 1.2са долната и горната граница на доверителния интервал

– средноаритметично извадково

s0– извадково стандартно отклонение (безпристрастно)

н – размер на извадката

γ – ниво на достоверност (обикновено равно на 0,9, 0,95 или 0,99)

c γ =Φ -1 ((1+γ)/2)е реципрочната на стандартната функция на нормалното разпределение. С прости думи, това е броят на стандартните грешки от средната аритметична стойност до долната или горната граница (посочените три вероятности съответстват на стойностите от 1,64, 1,96 и 2,58).

Същността на формулата е, че се взема средноаритметичното и след това от него се отделя определена сума ( с γ) стандартни грешки ( s 0 /√n). Всичко се знае, вземете и пребройте.

Преди масовото използване на компютри, за получаване на стойностите на функцията на нормалното разпределение и нейната обратна функция, те използваха . Те все още се използват, но е по-ефективно да се обърнете към готовите Формули на Excel. Всички елементи от горната формула ( , и ) могат лесно да бъдат изчислени в Excel. Но има и готова формула за изчисляване на доверителния интервал - НОРМА ЗА ДОВЕРИЕ. Синтаксисът му е следният.

CONFIDENCE NORM(alpha, standard_dev, size)

алфа– ниво на значимост или ниво на достоверност, което в горната нотация е равно на 1-γ, т.е. вероятността математическитеочакването ще бъде извън доверителния интервал. При ниво на увереност 0,95, алфа е 0,05 и т.н.

standard_offе стандартното отклонение на данните от извадката. Не е необходимо да изчислявате стандартната грешка, Excel ще раздели на корен от n.

размерът– размер на извадката (n).

Резултатът от функцията CONFIDENCE.NORM е вторият член от формулата за изчисляване на доверителния интервал, т.е. полуинтервал. Съответно долната и горната точка са средната ± получената стойност.

По този начин е възможно да се изгради универсален алгоритъм за изчисляване на доверителните интервали за средноаритметичното, което не зависи от разпределението на изходните данни. Цената за универсалността е нейната асимптотична природа, т.е. необходимостта от използване на относително големи проби. Въпреки това през века модерни технологиисъбирането на точното количество данни обикновено не е трудно.

Тестване на статистически хипотези с помощта на доверителен интервал

(модул 111)

Един от основните проблеми, решавани в статистиката, е. Накратко същността му е следната. Прави се например предположение, че очакванията на общата съвкупност са равни на някаква стойност. След това се конструира разпределението на извадковите средни, които могат да се наблюдават с дадено очакване. След това разглеждаме къде в това условно разпределение се намира реалната средна стойност. Ако надхвърли допустимите граници, тогава появата на такава средна е много малко вероятна, а при еднократно повторение на експеримента е почти невъзможна, което противоречи на изложената хипотеза, която е успешно отхвърлена. Ако средното не надхвърли критичното ниво, тогава хипотезата не се отхвърля (но и не се доказва!).

И така, с помощта на доверителни интервали, в нашия случай за очакванията, можете също да тествате някои хипотези. Много лесно се прави. Да предположим, че средноаритметичната стойност за някаква извадка е 100. Тества се хипотезата, че очакваната стойност е, да речем, 90. Тоест, ако поставим въпроса примитивно, той звучи така: възможно ли е с истинската стойност на средно равно на 90, наблюдаваното средно е 100?

За да се отговори на този въпрос, ще е необходима допълнителна информация за стандартното отклонение и размера на извадката. Да кажем, че стандартното отклонение е 30, а броят на наблюденията е 64 (за лесно извличане на корена). Тогава стандартната грешка на средната стойност е 30/8 или 3,75. За да изчислите 95% доверителен интервал, ще трябва да отделите две стандартни грешки от двете страни на средната стойност (по-точно 1,96). Доверителният интервал ще бъде приблизително 100 ± 7,5 или от 92,5 до 107,5.

По-нататъшното разсъждение е следното. Ако тестваната стойност попада в доверителния интервал, това не противоречи на хипотезата, тъй като се вписва в границите на случайни флуктуации (с вероятност от 95%). Ако тестваната точка е извън доверителния интервал, тогава вероятността за такова събитие е много малка, във всеки случай под приемливото ниво. Следователно хипотезата се отхвърля като противоречаща на наблюдаваните данни. В нашия случай хипотезата за очакване е извън доверителния интервал (тестваната стойност от 90 не е включена в интервала от 100±7,5), така че трябва да бъде отхвърлена. Отговаряйки на примитивния въпрос по-горе, човек трябва да каже: не, не може, във всеки случай това се случва изключително рядко. Често това показва конкретна вероятност за погрешно отхвърляне на хипотезата (p-ниво), а не дадено ниво, според което е изграден доверителният интервал, но повече за това друг път.

Както можете да видите, не е трудно да се изгради доверителен интервал за средната стойност (или математическото очакване). Основното нещо е да хванете същността и тогава нещата ще тръгнат. На практика повечето използват 95% доверителен интервал, който е с ширина около две стандартни грешки от двете страни на средната стойност.

Това е всичко за сега. Всичко най-хубаво!

Доверителен интервал(CI; на английски, доверителен интервал - CI), получен в изследването на пробата, дава мярка за точността (или несигурността) на резултатите от изследването, за да се направят заключения относно популацията на всички такива пациенти (обща популация ). Правилното определение на 95% CI може да се формулира по следния начин: 95% от тези интервали ще съдържат истинската стойност в популацията. Тази интерпретация е малко по-малко точна: CI е диапазонът от стойности, в рамките на който можете да сте 95% сигурни, че съдържа истинската стойност. При използване на CI акцентът е върху определянето на количествения ефект, за разлика от P стойността, която се получава в резултат на тестване за статистическа значимост. P стойността не оценява никаква сума, а по-скоро служи като мярка за силата на доказателствата срещу нулевата хипотеза за „без ефект“. Стойността на P сама по себе си не ни казва нищо за големината на разликата или дори за нейната посока. Следователно независимите стойности на P са абсолютно неинформативни в статии или резюмета. За разлика от това, CI показва както количеството на ефекта от непосредствен интерес, като полезността на лечението, така и силата на доказателствата. Следователно DI е пряко свързан с практиката на DM.

Подход за оценка към Статистически анализ, илюстриран от CI, има за цел да измери размера на ефекта от интерес (чувствителност на диагностичния тест, процент на прогнозираните случаи, намаляване на относителния риск с лечение и т.н.), както и да измери несигурността в този ефект. Най-често CI е диапазонът от стойности от двете страни на оценката, в които е вероятно да се крие истинската стойност, и можете да сте 95% сигурни в това. Конвенцията за използване на 95% вероятност е произволна, както и стойността на P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI се основава на идеята, че едно и също проучване, проведено върху различни групи пациенти, няма да доведе до идентични резултати, но че техните резултати ще бъдат разпределени около истинската, но неизвестна стойност. С други думи, CI описва това като „зависима от пробата променливост“. CI не отразява допълнителна несигурност поради други причини; по-специално, не включва ефектите от селективна загуба на пациенти върху проследяването, лошо съответствие или неточно измерване на резултатите, липса на заслепяване и др. По този начин CI винаги подценява общото количество несигурност.

Изчисляване на доверителния интервал

Таблица A1.1. Стандартни грешки и доверителни интервали за някои клинични измервания

Обикновено CI се изчислява от наблюдавана оценка на количествена мярка, като разликата (d) между две пропорции и стандартната грешка (SE) в оценката на тази разлика. Така полученият приблизително 95% CI е d ± 1,96 SE. Формулата се променя според естеството на мярката за резултат и обхвата на CI. Например, в рандомизирано, плацебо-контролирано проучване на ацелуларна ваксина срещу коклюш, магарешка кашлица се е развила при 72 от 1670 (4,3%) бебета, които са получили ваксината, и 240 от 1665 (14,4%) в контролната група. Процентната разлика, известна като намаляване на абсолютния риск, е 10,1%. SE на тази разлика е 0,99%. Съответно 95% CI е 10,1% + 1,96 x 0,99%, т.е. от 8.2 до 12.0.

Въпреки различните философски подходи, CI и тестовете за статистическа значимост са тясно свързани математически.

По този начин стойността на P е „значима“, т.е. Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Несигурността (неточността) на оценката, изразена в CI, до голяма степен е свързана с корен квадратен от размера на извадката. Малките проби предоставят по-малко информация от големите проби и CI съответно са по-широки в по-малките проби. Например, статия, сравняваща ефективността на три теста, използвани за диагностициране на инфекция с Helicobacter pylori, съобщава за чувствителност на дихателния тест с урея от 95,8% (95% CI 75-100). Въпреки че цифрата от 95,8% изглежда впечатляваща, малкият размер на извадката от 24 възрастни пациенти с H. pylori означава, че има значителна несигурност в тази оценка, както се вижда от широкия CI. Наистина долната граница от 75% е много по-ниска от оценката от 95,8%. Ако същата чувствителност се наблюдава в извадка от 240 души, тогава 95% CI ще бъде 92,5-98,0, което дава повече сигурност, че тестът е силно чувствителен.

В рандомизирани контролирани проучвания (RCT) незначимите резултати (т.е. тези с P > 0,05) са особено податливи на погрешно тълкуване. CI е особено полезен тук, тъй като показва колко съвместими са резултатите с клинично полезния истински ефект. Например, в RCT, сравняващ шев спрямо анастомоза със скоби в дебелото черво, инфекция на раната се е развила съответно при 10,9% и 13,5% от пациентите (P = 0,30). 95% CI за тази разлика е 2,6% (-2 до +8). Дори в това проучване, което включва 652 пациенти, остава вероятно да има скромна разлика в честотата на инфекциите в резултат на двете процедури. Колкото по-малко е изследването, толкова по-голяма е несигурността. Sung и др. извърши RCT, сравняващ инфузия на октреотид с спешна склеротерапия за остро варикозно кървене при 100 пациенти. В групата на октреотид процентът на спиране на кървенето е 84%; в групата на склеротерапията - 90%, което дава Р = 0,56. Имайте предвид, че честотата на продължаващо кървене е подобна на тази при инфекция на раната в споменатото проучване. В този случай обаче 95% CI за разлика в интервенциите е 6% (-7 до +19). Този диапазон е доста широк в сравнение с 5% разлика, която би представлявала клиничен интерес. Ясно е, че проучването не изключва значителна разлика в ефикасността. Следователно заключението на авторите "инфузията на октреотид и склеротерапията са еднакво ефективни при лечението на кървене от варици" определено не е валидно. В случаи като този, когато 95% CI за абсолютно намаляване на риска (ARR) включва нула, както тук, CI за NNT (брой, необходим за лечение) е доста труден за тълкуване. NLP и неговият CI се получават от реципрочните стойности на ACP (умножавайки ги по 100, ако тези стойности са дадени като проценти). Тук получаваме NPP = 100: 6 = 16,6 с 95% CI от -14,3 до 5,3. Както се вижда от бележката под линия „г“ в табл. A1.1, този CI включва стойности за NTPP от 5.3 до безкрайност и NTLP от 14.3 до безкрайност.

CI могат да бъдат конструирани за най-често използваните статистически оценки или сравнения. За RCT включва разликата между средните пропорции, относителните рискове, съотношенията на шансовете и NRR. По същия начин CI могат да бъдат получени за всички основни оценки, направени в проучвания на точността на диагностичните тестове - чувствителност, специфичност, положителна прогнозна стойност (всички от които са прости пропорции) и съотношения на вероятността - оценки, получени в мета-анализи и сравнение с контрола проучвания. Програма за персонален компютър, която обхваща много от тези употреби на DI, е достъпна с второто издание на Statistics with Confidence. Макросите за изчисляване на CI за пропорции са свободно достъпни за Excel и статистическите програми SPSS и Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Множество оценки на ефекта от лечението

Въпреки че изграждането на CI е желателно за първичните резултати от проучването, те не са необходими за всички резултати. CI се отнася до клинично важни сравнения. Например, когато сравнявате две групи, правилният CI е този, който е изграден за разликата между групите, както е показано в примерите по-горе, а не CI, който може да бъде изграден за оценката във всяка група. Не само, че е безполезно да се дават отделни CI за резултатите във всяка група, това представяне може да бъде подвеждащо. По подобен начин, правилният подход при сравняване на ефикасността на лечението в различни подгрупи е директното сравняване на две (или повече) подгрупи. Неправилно е да се приеме, че лечението е ефективно само в една подгрупа, ако нейният CI изключва стойността, съответстваща на липса на ефект, докато други не. CI също са полезни при сравняване на резултати в множество подгрупи. На фиг. A1.1 показва относителния риск от еклампсия при жени с прееклампсия в подгрупи жени от плацебо-контролирано RCT на магнезиев сулфат.

Ориз. A1.2. Forest Graph показва резултатите от 11 рандомизирани клинични изпитвания на ваксина срещу ротавирус по говеда за превенция на диария спрямо плацебо. 95% доверителен интервал е използван за оценка на относителния риск от диария. Размерът на черния квадрат е пропорционален на количеството информация. Освен това са показани обобщена оценка на ефикасността на лечението и 95% доверителен интервал (обозначен с ромб). Метаанализът използва модел на произволни ефекти, който надхвърля някои предварително установени; например това може да е размерът, използван при изчисляване на размера на извадката. Съгласно по-строг критерий, цялата гама от CI трябва да показва полза, която надвишава предварително определен минимум.

Вече обсъдихме грешката да се приема липсата на статистическа значимост като индикация, че две лечения са еднакво ефективни. Също толкова важно е да не се приравнява статистическата значимост с клиничната значимост. Клинично значение може да се приеме, когато резултатът е статистически значим и степента на отговора на лечението

Проучванията могат да покажат дали резултатите са статистически значими и кои са клинично важни и кои не. На фиг. A1.2 показва резултатите от четири опита, за които целият CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Доверителен интервалса граничните стойности на статистическа величина, която с дадена доверителна вероятност γ ще бъде в този интервал с по-голям размер на извадката. Означава се като P(θ - ε . На практика вероятността за доверие γ се избира от стойностите γ = 0.9 , γ = 0.95 , γ = 0.99, достатъчно близки до единица.

Сервизно задание. Тази услуга определя:

  • доверителен интервал за общата средна стойност, доверителен интервал за дисперсията;
  • доверителен интервал за стандартното отклонение, доверителен интервал за общата фракция;
Полученото решение се записва във файл на Word (вижте примера). По-долу има видео инструкция за попълване на първоначалните данни.

Пример #1. В колективна ферма от общо стадо от 1000 овце 100 овце са подложени на селективно контролно стригане. В резултат на това е установен среден настриг на вълна от 4,2 кг на овца. Определете с вероятност от 0,99 стандартната грешка на пробата при определяне на средното срязване на вълна на овца и границите, в които се намира стойността на срязване, ако дисперсията е 2,5. Пробата не се повтаря.
Пример #2. От партидата внесени продукти на поста на Московската северна митница са взети 20 проби от продукт "А" по реда на случайно повторно вземане на проби. В резултат на проверката е установено средно съдържание на влага на продукт "А" в пробата, което се оказва 6% със стандартно отклонение от 1%.
Определете с вероятност от 0,683 границите на средното съдържание на влага в продукта в цялата партида внесени продукти.
Пример #3. Проучване на 36 студенти показа, че средният брой прочетени от тях учебници за учебна година се оказва 6. Ако приемем, че броят учебници, прочетени от студент за семестър, има нормален закон на разпределение със стандартно отклонение, равно на 6, намерете : A) с надеждност от 0,99 интервална оценка за математическото очакване на тази случайна променлива; Б) с каква вероятност може да се твърди, че средният брой учебници, прочетени от студент за семестър, изчислен за тази извадка, се отклонява от математическото очакване по абсолютна стойност с не повече от 2.

Класификация на доверителните интервали

По вида на параметъра, който се оценява:

По тип проба:

  1. Доверителен интервал за безкрайно вземане на проби;
  2. Доверителен интервал за крайната проба;
Вземането на проби се нарича повторно вземане на проби, ако избраният обект се върне към общата популация, преди да се избере следващият. Пробата се нарича неповтаряща се.ако избраният обект не бъде върнат в общата съвкупност. На практика обикновено се работи с неповтарящи се проби.

Изчисляване на средната извадкова грешка за случаен подбор

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на генералната съвкупност се нарича грешка в представителността.
Обозначения на основните параметри на генералната и извадковата съвкупност.
Примерни формули за средна грешка
преизбираненеповтаряща се селекция
за средатаза споделянеза средатаза споделяне
Съотношението между границата на извадкова грешка (Δ), гарантирана с известна вероятност P(t),и средната грешка на извадката има формата: или Δ = t μ, където T– коефициент на доверителност, определен в зависимост от степента на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката с подходящ метод на случаен подбор

Споделете с приятели или запазете за себе си:

Зареждане...