فاصله اطمینان را نشان می دهد. فاصله اطمینان

"Katren-Style" انتشار چرخه کنستانتین کراوچیک را ادامه می دهد آمار پزشکی. در دو مقاله قبلی، نویسنده به توضیح مفاهیمی مانند و.

کنستانتین کراوچیک

ریاضیدان - تحلیلگر. متخصص در این زمینه مطالعات آماریدر پزشکی و علوم انسانی

شهر مسکو

اغلب در مقالات مربوط به آزمایشات بالینی می توانید یک عبارت مرموز را پیدا کنید: "فاصله اطمینان" (95٪ CI یا 95٪ CI - فاصله اطمینان). به عنوان مثال، یک مقاله ممکن است بگوید: "آزمون t-Student برای ارزیابی اهمیت تفاوت ها با فاصله اطمینان 95٪ محاسبه شده استفاده شد."

ارزش «فاصله اطمینان 95 درصد» چیست و چرا محاسبه می شود؟

فاصله اطمینان چیست؟ - این محدوده ای است که مقادیر میانگین واقعی در جمعیت در آن قرار می گیرند. و چه، میانگین های "غیر واقعی" وجود دارد؟ به یک معنا، بله، آنها انجام می دهند. در توضیح دادیم که اندازه‌گیری پارامتر مورد علاقه در کل جمعیت غیرممکن است، بنابراین محققان به نمونه محدودی بسنده می‌کنند. در این نمونه (مثلاً بر اساس وزن بدن) یک مقدار متوسط ​​(وزن معین) وجود دارد که بر اساس آن مقدار میانگین را در کل جمعیت عمومی قضاوت می کنیم. با این حال، بعید است که میانگین وزن در نمونه (به ویژه نمونه کوچک) با میانگین وزن در جمعیت عمومی مطابقت داشته باشد. بنابراین، محاسبه و استفاده از دامنه مقادیر متوسط ​​​​جمعیت عمومی صحیح تر است.

برای مثال، فرض کنید فاصله اطمینان 95% (95% CI) برای هموگلوبین بین 110 تا 122 گرم در لیتر باشد. این بدان معنی است که با احتمال 95٪، مقدار میانگین واقعی هموگلوبین در جمعیت عمومی در محدوده 110 تا 122 گرم در لیتر خواهد بود. به عبارت دیگر ما نمی دانیم میانگینهموگلوبین در جمعیت عمومی است، اما می توانیم محدوده مقادیر این ویژگی را با احتمال 95٪ نشان دهیم.

فواصل اطمینان به ویژه به تفاوت میانگین بین گروه ها یا آنچه اندازه اثر نامیده می شود مربوط می شود.

فرض کنید اثربخشی دو فرآورده آهن را با هم مقایسه کردیم: یکی که مدت زیادی در بازار بوده و دیگری که به تازگی ثبت شده است. پس از طی دوره درمان، غلظت هموگلوبین در گروه های مورد مطالعه از بیماران مورد بررسی قرار گرفت و برنامه آماری برای ما محاسبه کرد که تفاوت بین مقادیر متوسط ​​دو گروه با احتمال 95 درصد در محدوده ای از 1.72 تا 14.36 گرم در لیتر (جدول 1).

Tab. 1. معیار برای نمونه های مستقل
(گروه ها بر اساس سطح هموگلوبین مقایسه می شوند)

این باید به شرح زیر تفسیر شود: در بخشی از بیماران در جمعیت عمومی که مصرف می کند داروی جدیدهموگلوبین به طور متوسط ​​1.72-14.36 گرم در لیتر نسبت به افرادی که داروی شناخته شده مصرف کرده اند بالاتر خواهد بود.

به عبارت دیگر، در جمعیت عمومی، تفاوت میانگین مقادیر هموگلوبین در گروه‌های با احتمال 95 درصد در این حدود است. این بر عهده محقق خواهد بود که قضاوت کند که آیا این مقدار زیاد است یا کم. نکته همه اینها این است که ما با یک مقدار متوسط ​​کار نمی کنیم، بلکه با طیفی از مقادیر کار می کنیم، بنابراین، ما با اطمینان بیشتری تفاوت یک پارامتر را بین گروه ها تخمین می زنیم.

در بسته های آماری به صلاحدید محقق می توان به طور مستقل مرزهای فاصله اطمینان را محدود یا گسترش داد. با کاهش احتمالات فاصله اطمینان، دامنه میانگین ها را محدود می کنیم. برای مثال، در 90% CI، دامنه میانگین ها (یا تفاوت های میانگین) باریک تر از 95% CI خواهد بود.

برعکس، افزایش احتمال به 99٪ دامنه مقادیر را گسترش می دهد. هنگام مقایسه گروه ها، حد پایین CI ممکن است از علامت صفر عبور کند. به عنوان مثال، اگر مرزهای فاصله اطمینان را تا 99 % افزایش دهیم، مرزهای بازه از 1- تا 16 گرم در لیتر متغیر است. به این معنی که در جمعیت عمومی گروه هایی وجود دارد که اختلاف میانگین بین آنها برای صفت مورد مطالعه 0 (M=0) است.

برای آزمون فرضیه های آماری می توان از فواصل اطمینان استفاده کرد. اگر فاصله اطمینان از مقدار صفر عبور کند، فرضیه صفر، که فرض می کند گروه ها در پارامتر مورد مطالعه تفاوتی ندارند، درست است. یک مثال در بالا توضیح داده شده است، زمانی که ما مرزها را تا 99٪ گسترش دادیم. در جایی از جمعیت عمومی، گروه هایی را یافتیم که به هیچ وجه با هم تفاوت نداشتند.

95% فاصله اطمینان اختلاف در هموگلوبین، (g/l)


شکل، فاصله اطمینان 95% اختلاف میانگین هموگلوبین بین دو گروه را به صورت خطی نشان می دهد. خط از علامت صفر عبور می کند، بنابراین بین میانگین ها برابر با صفر تفاوت وجود دارد که فرضیه صفر مبنی بر عدم تفاوت گروه ها را تأیید می کند. تفاوت بین گروه ها بین 2- تا 5 گرم در لیتر است، به این معنی که هموگلوبین می تواند 2 گرم در لیتر کاهش یا 5 گرم در لیتر افزایش یابد.

فاصله اطمینان یک شاخص بسیار مهم است. با تشکر از آن، می توانید ببینید که آیا تفاوت در گروه ها واقعا به دلیل تفاوت در میانگین بوده است یا به دلیل یک نمونه بزرگ، زیرا با یک نمونه بزرگ، شانس پیدا کردن تفاوت بیشتر از نمونه کوچک است.

در عمل، ممکن است به این شکل باشد. ما از 1000 نفر نمونه گرفتیم، سطح هموگلوبین را اندازه گیری کردیم و دریافتیم که فاصله اطمینان برای تفاوت میانگین ها از 1.2 تا 1.5 گرم در لیتر است. مرحله اهمیت آماریدر حالی که ص

می بینیم که غلظت هموگلوبین افزایش یافته است، اما تقریباً به طور نامحسوس، بنابراین، اهمیت آماری دقیقاً به دلیل حجم نمونه ظاهر شد.

فواصل اطمینان را می توان نه تنها برای میانگین ها، بلکه برای نسبت ها (و نسبت های ریسک) نیز محاسبه کرد. به عنوان مثال، ما علاقه مند به فاصله اطمینان نسبت بیمارانی هستیم که در حین مصرف داروی توسعه یافته بهبود یافته اند. فرض کنید که 95% CI برای نسبت‌ها، یعنی نسبت چنین بیمارانی، در محدوده 0.60-0.80 است. بنابراین می توان گفت که داروی ما در 60 تا 80 درصد موارد اثر درمانی دارد.

هر نمونه فقط یک تصور تقریبی از جامعه عمومی را ارائه می دهد و تمام ویژگی های آماری نمونه (میانگین، حالت، واریانس ...) تقریبی یا می گویند تخمینی از پارامترهای کلی است که در اکثر موارد نمی توان آن را محاسبه کرد. عدم دسترسی عموم مردم (شکل 20).

شکل 20. خطای نمونه گیری

اما می توانید بازه ای را مشخص کنید که با درجه ای از احتمال، مقدار واقعی (عمومی) مشخصه آماری در آن قرار دارد. این فاصله نامیده می شود د فاصله اطمینان (CI).

بنابراین میانگین کلی با احتمال 95٪ در داخل قرار دارد

از تا، (20)

جایی که تی - مقدار جدولی معیار دانشجویی برای α =0.05 و f= n-1

را می توان یافت و 99٪ CI، در این مورد تی انتخاب شده برای α =0,01.

اهمیت عملی فاصله اطمینان چیست؟

    فاصله اطمینان گسترده نشان می دهد که میانگین نمونه به طور دقیق میانگین جامعه را منعکس نمی کند. این معمولاً به دلیل حجم نمونه ناکافی یا ناهمگونی آن است. پراکندگی بزرگ هر دو یک خطای بزرگ در میانگین و بر این اساس، یک CI گسترده تر می دهند. و این دلیلی است برای بازگشت به مرحله برنامه ریزی تحقیق.

    حد بالا و پایین CI ارزیابی می کند که آیا نتایج از نظر بالینی قابل توجه هستند یا خیر

اجازه دهید با جزئیات بیشتری در مورد اهمیت آماری و بالینی نتایج مطالعه خواص گروه صحبت کنیم. به یاد بیاورید که وظیفه آمار تشخیص حداقل برخی از تفاوت ها در جمعیت های عمومی بر اساس داده های نمونه است. این وظیفه پزشک است که چنین تفاوت هایی (نه هیچ کدام) را پیدا کند که به تشخیص یا درمان کمک کند. و همیشه نتیجه گیری های آماری مبنای نتایج بالینی نیستند. بنابراین، کاهش معنی دار آماری هموگلوبین به میزان 3 گرم در لیتر، جای نگرانی نیست. و برعکس، اگر مشکلی در بدن انسان دارای ویژگی توده ای در سطح کل جمعیت نباشد، دلیلی بر عدم رسیدگی به این مشکل نیست.

ما این موقعیت را در نظر خواهیم گرفت مثال.

محققین تعجب کردند که آیا پسرانی که به نوعی بیماری عفونی مبتلا هستند از نظر رشد از همسالان خود عقب مانده اند یا خیر. برای این منظور یک مطالعه انتخابی انجام شد که در آن 10 پسر مبتلا به این بیماری شرکت کردند. نتایج در جدول 23 ارائه شده است.

جدول 23. نتایج آماری

حد پایین

حد بالا

مشخصات (سانتی متر)

وسط

از این محاسبات چنین استنباط می شود که میانگین قد انتخابی پسران 10 ساله ای که به نوعی بیماری عفونی مبتلا بوده اند نزدیک به نرمال (132.5 سانتی متر) است. با این حال، حد پایین فاصله اطمینان (126.6 سانتی متر) نشان می دهد که به احتمال 95٪ میانگین قد واقعی این کودکان با مفهوم "کوتاه قد" مطابقت دارد. این بچه ها کوتاه قدی هستند

در این مثال، نتایج محاسبات فاصله اطمینان از نظر بالینی قابل توجه است.

و دیگران همه آنها تخمینی از همتایان نظری خود هستند که در صورت نبود نمونه می توان آنها را به دست آورد. جمعیت. اما افسوس، جمعیت عمومی بسیار گران است و اغلب در دسترس نیست.

مفهوم تخمین فاصله

هر تخمین نمونه مقداری پراکندگی دارد، زیرا یک متغیر تصادفی بسته به مقادیر در یک نمونه خاص است. بنابراین، برای نتیجه گیری های آماری قابل اعتمادتر، نه تنها باید دانست تخمین نقطه ای، بلکه یک فاصله است که با احتمال زیاد γ (گاما) نشانگر تخمینی را پوشش می دهد θ (تتا).

به طور رسمی، این دو مقدار هستند (آمار) T1 (X)و T2 (X)، چی T1< T 2 ، که در سطح معینی از احتمال γ شرط برقرار است:

به طور خلاصه، احتمال دارد γ یا بیشتر مقدار واقعی بین نقاط است T1 (X)و T2 (X)، که به آنها کران پایین و بالایی می گویند فاصله اطمینان.

یکی از شرایط ساخت فواصل اطمینان حداکثر باریک بودن آن است، یعنی. باید تا حد امکان کوتاه باشد. میل کاملاً طبیعی است، زیرا. محقق تلاش می کند تا یافته های پارامتر مورد نظر را با دقت بیشتری بومی سازی کند.

نتیجه این است که فاصله اطمینان باید حداکثر احتمالات توزیع را پوشش دهد. و خود امتیاز در مرکز باشد.

یعنی احتمال انحراف (شاخص واقعی از برآورد) به سمت بالا برابر با احتمال انحراف به سمت پایین است. همچنین باید توجه داشت که برای توزیع های اریب، فاصله سمت راست با فاصله سمت چپ برابر نیست.

شکل بالا به وضوح نشان می دهد که هر چه سطح اطمینان بیشتر باشد، بازه زمانی بیشتر است - یک رابطه مستقیم.

این مقدمه کوچکی برای تئوری تخمین بازه ای پارامترهای ناشناخته بود. بیایید به سراغ یافتن محدودیت های اعتماد به نفس برویم انتظارات ریاضی.

فاصله اطمینان برای انتظارات ریاضی

اگر داده های اصلی بر روی توزیع شوند، میانگین یک مقدار عادی خواهد بود. این از این قانون نتیجه می گیرد که ترکیب خطی مقادیر نرمال نیز دارای توزیع نرمال است. بنابراین برای محاسبه احتمالات می توان از دستگاه ریاضی قانون توزیع نرمال استفاده کرد.

با این حال، این نیاز به دانش دو پارامتر دارد - مقدار مورد انتظار و واریانس، که معمولاً شناخته شده نیستند. البته می توانید از تخمین ها به جای پارامترها (میانگین حسابی و ) استفاده کنید، اما پس از آن توزیع میانگین کاملاً نرمال نخواهد بود، کمی مسطح می شود. شهروند ویلیام گوست از ایرلند زمانی که کشف خود را در شماره مارس 1908 بیومتریکا منتشر کرد، به این واقعیت اشاره کرد. برای اهداف محرمانه، گوست با دانشجو امضا کرد. اینگونه بود که توزیع t Student ظاهر شد.

با این حال، توزیع نرمال داده ها، که توسط K. Gauss در تجزیه و تحلیل اشتباهات در مشاهدات نجومی استفاده می شود، در زندگی زمینی بسیار نادر است و ایجاد آن بسیار دشوار است (برای دقت بالا، حدود 2000 مشاهده مورد نیاز است). بنابراین، بهتر است فرض نرمال بودن را کنار بگذارید و از روش هایی استفاده کنید که به توزیع داده های اصلی بستگی ندارند.

این سؤال مطرح می شود: اگر میانگین حسابی از داده های یک توزیع مجهول محاسبه شود، چه توزیعی دارد؟ پاسخ توسط نظریه احتمالات شناخته شده است تئوری حد مرکزی(CPT). در ریاضیات، نسخه‌های مختلفی از آن وجود دارد (فرمول‌بندی‌ها در طول سال‌ها اصلاح شده‌اند)، اما همه آنها، به طور کلی، به این ادعا خلاصه می‌شوند که مجموع تعداد زیادی از متغیرهای تصادفی مستقل مطابقت دارد. قانون عادیتوزیع

هنگام محاسبه میانگین حسابی از مجموع متغیرهای تصادفی استفاده می شود. از اینجا معلوم می شود که میانگین حسابی دارای یک توزیع نرمال است که در آن مقدار مورد انتظار مقدار مورد انتظار داده های اولیه است و واریانس برابر است.

افراد باهوشمی‌دانیم چگونه CLT را اثبات کنیم، اما ما این را با کمک آزمایشی که در اکسل انجام شده است، تأیید می‌کنیم. بیایید نمونه ای از 50 متغیر تصادفی توزیع شده یکنواخت (با استفاده از توابع اکسل RANDOMBETWEEN). سپس 1000 نمونه از این دست می سازیم و میانگین حسابی هر کدام را محاسبه می کنیم. بیایید به توزیع آنها نگاه کنیم.

مشاهده می شود که توزیع میانگین نزدیک به قانون نرمال است. اگر حجم نمونه ها و تعداد آنها حتی بیشتر شود، شباهت حتی بهتر خواهد بود.

اکنون که خودمان اعتبار CLT را دیدیم، می توانیم با استفاده از , فاصله اطمینان میانگین حسابی را محاسبه کنیم که با احتمال داده شدهمیانگین واقعی یا مقدار مورد انتظار را پوشش دهد.

برای تنظیم کران های بالا و پایین، باید پارامترها را بدانید توزیع نرمال. به عنوان یک قاعده، آنها نیستند، بنابراین از برآوردها استفاده می شود: میانگین حسابیو واریانس نمونه. باز هم، این روش تقریب خوبی را فقط برای نمونه های بزرگ به دست می دهد. هنگامی که نمونه ها کوچک هستند، اغلب توصیه می شود از توزیع دانش آموز استفاده شود. باور نکن! توزیع دانش آموز برای میانگین تنها زمانی اتفاق می افتد که داده اصلی دارای توزیع نرمال باشد، یعنی تقریبا هرگز. بنابراین، بهتر است بلافاصله حداقل نوار را برای مقدار داده های مورد نیاز تعیین کنید و از روش های مجانبی صحیح استفاده کنید. آنها می گویند 30 مشاهده کافی است. 50 بگیرید - نمی توانید اشتباه کنید.

T 1.2مرزهای پایین و بالایی فاصله اطمینان هستند

- میانگین حسابی نمونه

s0- انحراف استاندارد نمونه (بی طرفانه)

n - اندازهی نمونه

γ - سطح اطمینان (معمولاً برابر با 0.9، 0.95 یا 0.99)

c γ =Φ -1 ((1+γ)/2)متقابل تابع توزیع نرمال استاندارد است. به عبارت ساده، این تعداد خطاهای استاندارد از میانگین حسابی تا کران پایین یا بالا است (سه احتمال نشان داده شده با مقادیر 1.64، 1.96 و 2.58 مطابقت دارد).

ماهیت فرمول این است که میانگین حسابی گرفته می شود و سپس مقدار مشخصی از آن کنار می رود ( با γ) خطاهای استاندارد ( s 0 /√n). همه چیز معلوم است، بگیر و بشمار.

قبل از استفاده انبوه از رایانه های شخصی، برای به دست آوردن مقادیر تابع توزیع نرمال و معکوس آن، از . آنها هنوز در حال استفاده هستند، اما استفاده از آنها کارآمدتر است فرمول های اکسل. تمام عناصر فرمول بالا ( و ) را می توان به راحتی در اکسل محاسبه کرد. اما یک فرمول آماده برای محاسبه فاصله اطمینان نیز وجود دارد - هنجار اعتماد. نحو آن به شرح زیر است.

NORM اطمینان (آلفا، استاندارد_dev، اندازه)

آلفا- سطح معناداری یا سطح اطمینان که در نماد بالا برابر با 1-γ است، یعنی. احتمال اینکه ریاضیانتظار خارج از فاصله اطمینان خواهد بود. در سطح اطمینان 0.95، آلفا 0.05 است و غیره.

standard_offانحراف معیار داده های نمونه است. شما نیازی به محاسبه خطای استاندارد ندارید، اکسل بر ریشه n تقسیم می کند.

اندازه– حجم نمونه (n).

نتیجه تابع CONFIDENCE.NORM عبارت دوم از فرمول محاسبه فاصله اطمینان است، یعنی. نیم فاصله بر این اساس، نقاط پایین و بالایی میانگین ± مقدار به دست آمده است.

بنابراین، می توان یک الگوریتم جهانی برای محاسبه فواصل اطمینان برای میانگین حسابی ساخت، که به توزیع داده های اولیه بستگی ندارد. بهای جهانی بودن ماهیت مجانبی آن است، یعنی. نیاز به استفاده از نمونه های نسبتا بزرگ. با این حال، در قرن فن آوری های مدرنجمع آوری مقدار مناسب داده معمولاً دشوار نیست.

آزمون فرضیه های آماری با استفاده از فاصله اطمینان

(ماژول 111)

یکی از مشکلات اصلی حل شده در آمار است. به طور خلاصه، ماهیت آن این است. برای مثال، فرضی وجود دارد که انتظارات عموم مردم با مقداری برابر است. سپس توزیع میانگین های نمونه ساخته می شود که می توان با یک انتظار معین مشاهده کرد. در مرحله بعد، به این می پردازیم که در کجای این توزیع شرطی میانگین واقعی قرار دارد. اگر از حد مجاز فراتر رود ، ظاهر چنین میانگینی بسیار بعید است و با یک بار تکرار آزمایش تقریباً غیرممکن است ، که با فرضیه مطرح شده که با موفقیت رد شده است در تناقض است. اگر میانگین از سطح بحرانی فراتر نرود، فرضیه رد نمی شود (اما اثبات هم نمی شود!).

بنابراین، با کمک فواصل اطمینان، در مورد ما برای انتظار، می توانید برخی از فرضیه ها را نیز آزمایش کنید. انجام آن بسیار آسان است. فرض کنید میانگین حسابی برای برخی از نمونه ها 100 باشد. این فرضیه در حال آزمایش است که مقدار مورد انتظار مثلاً 90 است. یعنی اگر سؤال را به صورت ابتدایی مطرح کنیم، به نظر می رسد: آیا با مقدار واقعی میانگین برابر با 90، میانگین مشاهده شده 100 بود؟

برای پاسخ به این سوال، اطلاعات بیشتری در مورد انحراف معیار و اندازه نمونه مورد نیاز است. فرض کنید انحراف معیار 30 و تعداد مشاهدات 64 است (برای استخراج آسان ریشه). سپس خطای استاندارد میانگین 30/8 یا 3.75 است. برای محاسبه فاصله اطمینان 95 درصد، باید دو خطای استاندارد را در دو طرف میانگین (به طور دقیق تر، 1.96) کنار بگذارید. فاصله اطمینان تقریباً 100 ± 7.5 یا از 92.5 تا 107.5 خواهد بود.

استدلال بیشتر به شرح زیر است. اگر مقدار آزمایش شده در بازه اطمینان قرار گیرد، با فرضیه مغایرتی ندارد، زیرا در محدوده نوسانات تصادفی (با احتمال 95٪) قرار می گیرد. اگر نقطه آزمایش خارج از فاصله اطمینان باشد، احتمال وقوع چنین رویدادی بسیار ناچیز و در هر صورت زیر سطح قابل قبول است. بنابراین، این فرضیه به عنوان مغایر با داده های مشاهده شده رد می شود. در مورد ما، فرضیه انتظار خارج از فاصله اطمینان است (مقدار آزمایش شده 90 در بازه 100±7.5 لحاظ نمی شود)، بنابراین باید رد شود. در پاسخ به سوال ابتدایی بالا، باید گفت: نه، نمی تواند، در هر صورت، این اتفاق بسیار نادر است. اغلب، این نشان دهنده یک احتمال خاص از رد اشتباه فرضیه (سطح p) است و نه سطح معینی که بر اساس آن فاصله اطمینان ایجاد شده است، بلکه بیشتر در زمان دیگری است.

همانطور که می بینید، ایجاد فاصله اطمینان برای میانگین (یا انتظارات ریاضی) دشوار نیست. نکته اصلی این است که ذات را بگیریم و سپس همه چیز پیش خواهد رفت. در عمل، اکثراً از فاصله اطمینان 95% استفاده می کنند، که حدود دو خطای استاندارد در دو طرف میانگین است.

فعلاً همین است. بهترین ها!

فاصله اطمینان(CI؛ به زبان انگلیسی، فاصله اطمینان - CI) به دست آمده در مطالعه در نمونه، میزان دقت (یا عدم قطعیت) نتایج مطالعه را به منظور نتیجه‌گیری در مورد جمعیت همه این بیماران (جمعیت عمومی) نشان می‌دهد. ). تعریف صحیح 95% CI را می توان به صورت زیر فرموله کرد: 95% از چنین بازه هایی حاوی مقدار واقعی در جامعه خواهند بود. این تفسیر تا حدودی دقیق تر است: CI محدوده ای از مقادیر است که در آن می توانید 95٪ مطمئن باشید که حاوی مقدار واقعی است. هنگام استفاده از CI، تأکید بر تعیین اثر کمی است، در مقابل مقدار P، که در نتیجه آزمایش اهمیت آماری به دست می‌آید. مقدار P هیچ مقداری را ارزیابی نمی کند، بلکه به عنوان معیاری برای سنجش قدرت شواهد در برابر فرضیه صفر "بدون اثر" عمل می کند. مقدار P به خودی خود چیزی در مورد بزرگی تفاوت یا حتی در مورد جهت آن به ما نمی گوید. بنابراین، مقادیر مستقل P در مقالات یا چکیده ها کاملاً بی اطلاع هستند. در مقابل، CI هم میزان تأثیر مورد علاقه فوری، مانند سودمندی یک درمان و هم قدرت شواهد را نشان می دهد. بنابراین، DI ارتباط مستقیمی با تمرین DM دارد.

رویکرد ارزیابی به تحلیل آماری، که توسط CI نشان داده شده است، با هدف اندازه گیری میزان تأثیر علاقه (حساسیت آزمایش تشخیصی، میزان موارد پیش بینی شده، کاهش خطر نسبی با درمان و غیره) و همچنین اندازه گیری عدم قطعیت در این اثر است. اغلب، CI محدوده مقادیری است که در دو طرف تخمین وجود دارد که احتمالاً مقدار واقعی در آن قرار دارد، و شما می توانید 95٪ از آن مطمئن باشید. قرارداد استفاده از احتمال 95% دلخواه است و همچنین مقدار P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI مبتنی بر این ایده است که مطالعه مشابهی که روی مجموعه‌های مختلف بیماران انجام می‌شود نتایج یکسانی ایجاد نمی‌کند، اما نتایج آن‌ها حول ارزش واقعی اما ناشناخته توزیع می‌شود. به عبارت دیگر، CI این را به عنوان "تغییرات وابسته به نمونه" توصیف می کند. CI منعکس کننده عدم اطمینان اضافی به دلایل دیگر نیست. به طور خاص، اثرات از دست دادن انتخابی بیماران در ردیابی، انطباق ضعیف یا اندازه‌گیری نادرست نتیجه، عدم کور کردن و غیره را شامل نمی‌شود. بنابراین CI همیشه مقدار کل عدم قطعیت را دست کم می گیرد.

محاسبه فاصله اطمینان

جدول A1.1. خطاهای استاندارد و فواصل اطمینان برای برخی از اندازه گیری های بالینی

به طور معمول، CI از یک برآورد مشاهده شده از یک اندازه گیری کمی، مانند تفاوت (d) بین دو نسبت، و خطای استاندارد (SE) در برآورد آن تفاوت محاسبه می شود. CI تقریبی 95٪ به دست آمده در نتیجه d ± 1.96 SE است. فرمول با توجه به ماهیت اندازه گیری نتیجه و پوشش CI تغییر می کند. به عنوان مثال، در یک کارآزمایی تصادفی شده و کنترل شده با دارونما در مورد واکسن سیاه سرفه بدون سلول، سیاه سرفه در 72 نوزاد از 1670 (4.3٪) نوزادی که واکسن دریافت کرده بودند و 240 از 1665 (14.4٪) در گروه کنترل ایجاد شد. درصد اختلاف، که به عنوان کاهش ریسک مطلق شناخته می شود، 10.1٪ است. SE این تفاوت 0.99٪ است. بر این اساس، CI 95% 10.1% + 1.96 x 0.99% است. از 8.2 تا 12.0

علی‌رغم رویکردهای فلسفی مختلف، CI و آزمون‌های معنی‌داری آماری از نظر ریاضی با هم مرتبط هستند.

بنابراین، مقدار P "قابل توجه" است، یعنی. آر<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

عدم قطعیت (عدم دقت) برآورد، بیان شده در CI، تا حد زیادی با جذر حجم نمونه مرتبط است. نمونه‌های کوچک اطلاعات کمتری نسبت به نمونه‌های بزرگ ارائه می‌کنند، و CI به نسبت در نمونه‌های کوچک‌تر گسترده‌تر است. به عنوان مثال، مقاله ای که عملکرد سه آزمایش مورد استفاده برای تشخیص عفونت هلیکوباکتر پیلوری را مقایسه می کند، حساسیت تست تنفسی اوره را 95.8٪ (95٪ CI 75-100) گزارش کرده است. در حالی که رقم 95.8٪ چشمگیر به نظر می رسد، اندازه نمونه کوچک 24 بیمار بالغ هلیکوباکتر پیلوری به این معنی است که عدم قطعیت قابل توجهی در این برآورد وجود دارد، همانطور که توسط CI گسترده نشان داده شده است. در واقع، حد پایین 75 درصد بسیار کمتر از برآورد 95.8 درصد است. اگر همین حساسیت در نمونه 240 نفری مشاهده شود، 95% فاصله اطمینان (CI) 92.5-98.0 خواهد بود، که اطمینان بیشتری از حساس بودن آزمون می دهد.

در کارآزمایی‌های تصادفی‌سازی و کنترل‌شده (RCT)، نتایج غیرمعنی‌دار (یعنی آن‌هایی که P> 0.05 دارند) به‌ویژه در معرض سوءتعبیر قرار دارند. CI به ویژه در اینجا مفید است زیرا نشان می دهد که نتایج چقدر با اثر واقعی مفید بالینی سازگار است. به عنوان مثال، در یک RCT با مقایسه بخیه و آناستوموز اصلی در روده بزرگ، عفونت زخم به ترتیب در 10.9٪ و 13.5٪ از بیماران ایجاد شد (0.30 = P). 95% CI برای این تفاوت 2.6% (2- تا 8+) است. حتی در این مطالعه که شامل 652 بیمار بود، به احتمال زیاد تفاوت کمی در بروز عفونت های ناشی از این دو روش وجود دارد. هر چه مطالعه کوچکتر باشد، عدم قطعیت بیشتر است. سونگ و همکاران یک RCT برای مقایسه انفوزیون اکتروتید با اسکلروتراپی اورژانسی برای خونریزی حاد واریس در 100 بیمار انجام داد. در گروه octreotide، میزان توقف خونریزی 84٪ بود. در گروه اسکلروتراپی - 90٪، که P = 0.56 را می دهد. توجه داشته باشید که میزان ادامه خونریزی مشابه با عفونت زخم در مطالعه ذکر شده است. اما در این مورد 95% فاصله اطمینان (CI) برای تفاوت در مداخلات 6% (7- تا 19+) است. این محدوده در مقایسه با اختلاف 5 درصدی که مورد توجه بالینی است، بسیار گسترده است. واضح است که مطالعه تفاوت معنی داری را در اثربخشی رد نمی کند. بنابراین، نتیجه گیری نویسندگان "انفوزیون اکتروتید و اسکلروتراپی به یک اندازه در درمان خونریزی از واریس موثر هستند" قطعا معتبر نیست. در مواردی مانند این که 95٪ CI برای کاهش ریسک مطلق (ARR) شامل صفر است، همانطور که در اینجا، CI برای NNT (تعداد مورد نیاز برای درمان) تفسیر نسبتاً دشوار است. NLP و CI آن از حرکات متقابل ACP به دست می آید (اگر این مقادیر به صورت درصد داده شوند، آنها را در 100 ضرب می کنیم). در اینجا ما NPP = 100 را دریافت می کنیم: 6 = 16.6 با CI 95٪ از -14.3 تا 5.3. همانطور که از پاورقی «د» در جدول پیداست. A1.1، این CI شامل مقادیر NTPP از 5.3 تا بی نهایت و NTLP از 14.3 تا بی نهایت است.

CI ها را می توان برای برآوردها یا مقایسه های آماری متداول ساخت. برای RCTها، شامل تفاوت بین نسبت‌های متوسط، ریسک‌های نسبی، نسبت‌های شانس و NRR است. به طور مشابه، CI ها را می توان برای تمام تخمین های اصلی انجام شده در مطالعات مربوط به دقت تست تشخیصی به دست آورد - حساسیت، ویژگی، ارزش اخباری مثبت (که همه نسبت های ساده هستند) و نسبت های احتمال - تخمین های به دست آمده در متاآنالیز و مقایسه با کنترل مطالعات. یک برنامه رایانه شخصی که بسیاری از این کاربردهای DI را پوشش می دهد با ویرایش دوم آمار با اطمینان موجود است. ماکروها برای محاسبه CI برای نسبت‌ها به صورت رایگان برای Excel و برنامه‌های آماری SPSS و Minitab در http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions، htm در دسترس هستند.

ارزیابی های متعدد از اثر درمان

در حالی که ساخت CI برای نتایج اولیه یک مطالعه مطلوب است، آنها برای همه نتایج مورد نیاز نیستند. CI مربوط به مقایسه های بالینی مهم است. به عنوان مثال، هنگام مقایسه دو گروه، CI صحیح همان CI است که برای تفاوت بین گروه ها ساخته شده است، همانطور که در مثال های بالا نشان داده شده است، و نه CI که می توان برای تخمین در هر گروه ایجاد کرد. نه تنها ارائه CI جداگانه برای نمرات در هر گروه بی فایده است، این ارائه می تواند گمراه کننده باشد. به طور مشابه، رویکرد صحیح هنگام مقایسه اثربخشی درمان در زیر گروه‌های مختلف، مقایسه مستقیم دو (یا چند) زیر گروه است. این نادرست است که فرض کنیم درمان فقط در یک زیرگروه مؤثر است اگر CI آن مقدار مربوط به هیچ تأثیری را حذف کند، در حالی که دیگران این کار را نمی کنند. CI ها همچنین هنگام مقایسه نتایج در چندین زیرگروه مفید هستند. روی انجیر A1.1 خطر نسبی اکلامپسی را در زنان مبتلا به پره اکلامپسی در زیرگروه های زنان از RCT سولفات منیزیم کنترل شده با دارونما نشان می دهد.

برنج. A1.2. نمودار جنگل نتایج 11 کارآزمایی بالینی تصادفی شده واکسن روتاویروس گاوی را برای پیشگیری از اسهال در مقابل دارونما نشان می دهد. برای برآورد خطر نسبی اسهال از فاصله اطمینان 95 درصد استفاده شد. اندازه مربع سیاه متناسب با مقدار اطلاعات است. علاوه بر این، یک برآورد خلاصه از اثربخشی درمان و یک فاصله اطمینان 95٪ (که با الماس نشان داده شده است) نشان داده شده است. متاآنالیز از یک مدل اثرات تصادفی استفاده کرد که از برخی موارد از پیش تعیین شده فراتر رفت. به عنوان مثال، می تواند اندازه مورد استفاده در محاسبه حجم نمونه باشد. تحت یک معیار دقیق تر، کل محدوده CI ها باید مزایایی را نشان دهند که از حداقل از پیش تعیین شده بیشتر باشد.

ما قبلاً در مورد اشتباه در نظر گرفتن عدم وجود معنی دار آماری به عنوان نشانه ای مبنی بر اینکه دو درمان به یک اندازه مؤثر هستند بحث کرده ایم. به همان اندازه مهم است که معنی‌داری آماری را با اهمیت بالینی یکسان نکنیم. اهمیت بالینی را می توان زمانی فرض کرد که نتیجه از نظر آماری معنی دار باشد و بزرگی پاسخ درمانی باشد.

مطالعات می توانند نشان دهند که آیا نتایج از نظر آماری معنی دار هستند و کدام یک از نظر بالینی مهم هستند و کدام نه. روی انجیر A1.2 نتایج چهار کارآزمایی را نشان می دهد که کل CI برای آن ها انجام شده است<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

فاصله اطمینانمقادیر محدود کننده کمیت آماری هستند که با احتمال اطمینان داده شده γ، در این بازه با حجم نمونه بزرگتر خواهند بود. به عنوان P (θ - ε . در عمل، احتمال اطمینان γ از مقادیر γ = 0.9، γ = 0.95، γ = 0.99 به اندازه کافی نزدیک به وحدت انتخاب می شود.

واگذاری خدمات. این سرویس تعریف می کند:

  • فاصله اطمینان برای میانگین کلی، فاصله اطمینان برای واریانس.
  • فاصله اطمینان برای انحراف استاندارد، فاصله اطمینان برای کسر عمومی.
راه حل به دست آمده در یک فایل Word ذخیره می شود (به مثال مراجعه کنید). در زیر یک دستورالعمل ویدیویی در مورد نحوه پر کردن داده های اولیه وجود دارد.

مثال شماره 1. در یک مزرعه جمعی، از کل گله 1000 گوسفند، 100 گوسفند تحت برش کنترل انتخابی قرار گرفتند. در نتیجه، میانگین برشی پشم 4.2 کیلوگرم برای هر گوسفند ایجاد شد. با احتمال 0.99 خطای استاندارد نمونه در تعیین میانگین برش پشم در هر گوسفند و حدودی که مقدار برشی در آن قرار دارد در صورتی که واریانس 2.5 باشد را تعیین کنید. نمونه غیر تکراری است
مثال شماره 2. از دسته محصولات وارداتی در پست گمرک شمالی مسکو، 20 نمونه از محصول "A" به ترتیب نمونه گیری مجدد تصادفی گرفته شد. در نتیجه بررسی، میانگین رطوبت محصول "A" در نمونه مشخص شد که 6٪ با انحراف معیار 1٪ بود.
با احتمال 0.683 حدود میانگین رطوبت محصول در کل دسته محصولات وارداتی را تعیین کنید.
مثال شماره 3. نظرسنجی از 36 دانش آموز نشان داد که میانگین تعداد کتاب های درسی خوانده شده توسط آنها در هر سال تحصیلی 6 کتاب بوده است. با فرض اینکه تعداد کتاب های درسی خوانده شده توسط دانش آموز در هر ترم دارای قانون توزیع نرمال با انحراف معیار برابر با 6 باشد. : الف) با پایایی 0.99 برآورد فاصله ای برای انتظارات ریاضی این متغیر تصادفی. ب) با چه احتمالی می توان استدلال کرد که میانگین تعداد کتاب های درسی خوانده شده توسط دانش آموز در هر ترم که برای این نمونه محاسبه می شود، بیش از 2 از انتظارات ریاضی در مقدار مطلق انحراف داشته باشد.

طبقه بندی فواصل اطمینان

بر اساس نوع پارامتر مورد ارزیابی:

بر اساس نوع نمونه:

  1. فاصله اطمینان برای نمونه برداری بی نهایت.
  2. فاصله اطمینان برای نمونه نهایی؛
نمونه برداری را نمونه گیری مجدد می نامند، اگر شی انتخاب شده قبل از انتخاب مورد بعدی به جمعیت عمومی برگردانده شود. نمونه غیر تکراری نامیده می شود.اگر شی انتخاب شده به جمعیت عمومی بازگردانده نشود. در عمل معمولاً با نمونه های تکرار نشدنی سروکار داریم.

محاسبه میانگین خطای نمونه گیری برای انتخاب تصادفی

اختلاف بین مقادیر شاخص های به دست آمده از نمونه و پارامترهای مربوط به جامعه عمومی نامیده می شود. خطای نمایندگی.
تعیین پارامترهای اصلی جامعه عمومی و نمونه.
نمونه فرمول های میانگین خطا
انتخاب مجددانتخاب غیر تکراری
برای وسطبرای اشتراک گذاریبرای وسطبرای اشتراک گذاری
نسبت بین حد خطای نمونه گیری (Δ) با برخی احتمالات تضمین شده است P(t)،و میانگین خطای نمونه گیری به شکل: یا Δ = t μ است که در آن تی- ضریب اطمینان، بسته به سطح احتمال P(t) مطابق جدول تابع انتگرال لاپلاس تعیین می شود.

فرمول های محاسبه حجم نمونه با روش انتخاب تصادفی مناسب

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...