تجزیه و تحلیل واریانس به طور خلاصه. تحلیل واریانس

همه مردم به طور طبیعی به دنبال دانش هستند. (ارسطو. متافیزیک)

تحلیل واریانس

مروری مقدماتی

در این بخش، روش‌ها، مفروضات و اصطلاحات پایه ANOVA را بررسی می‌کنیم.

توجه داشته باشید که در ادبیات انگلیسی تحلیل واریانس معمولاً آنالیز تنوع نامیده می شود. بنابراین، برای اختصار، در زیر گاهی اوقات از این اصطلاح استفاده خواهیم کرد ANOVA (یکتجزیه و تحلیل o f واریشن) برای ANOVA معمولی و اصطلاح مانوابرای تحلیل واریانس چند متغیره در این بخش، به ترتیب ایده های اصلی تحلیل واریانس ( ANOVAتجزیه و تحلیل کوواریانس ( ANCOVAتجزیه و تحلیل واریانس چند متغیره ( مانوا) و تحلیل کوواریانس چند متغیره ( مانکووا). پس از یک بحث مختصر در مورد محاسن آنالیز کنتراست و آزمون های تعقیبی، بیایید به مفروضاتی که روش های ANOVA بر اساس آن ها استوار است نگاه کنیم. در پایان این بخش، مزایای رویکرد چند متغیره برای تحلیل اندازه‌گیری‌های مکرر در مقایسه با رویکرد تک بعدی سنتی توضیح داده شده است.

ایده های کلیدی

هدف از تحلیل واریانس.هدف اصلی از تحلیل واریانس، بررسی اهمیت تفاوت بین میانگین ها است. فصل (فصل 8) مقدمه ای کوتاه برای آزمون معناداری آماری ارائه می کند. اگر فقط میانگین دو نمونه را با هم مقایسه می کنید، آنالیز واریانس همان نتیجه تجزیه و تحلیل معمولی را به دست می دهد. تی- معیار برای نمونه های مستقل (اگر دو گروه مستقل از اشیا یا مشاهدات مقایسه شوند)، یا تی- معیار برای نمونه های وابسته (اگر دو متغیر بر روی یک مجموعه از اشیاء یا مشاهدات مقایسه شوند). اگر با این معیارها آشنا نیستید، توصیه می کنیم به بررسی مقدماتی فصل مراجعه کنید (فصل 9).

نام از کجا آمده است تحلیل واریانس? شاید عجیب به نظر برسد که روش مقایسه میانگین ها را تحلیل واریانس می نامند. در واقع، این به این دلیل است که وقتی اهمیت آماری تفاوت میانگین ها را بررسی می کنیم، در واقع در حال تجزیه و تحلیل واریانس ها هستیم.

تقسیم مجموع مربع ها

برای اندازه نمونه n، واریانس نمونه به صورت مجذور انحرافات از میانگین نمونه تقسیم بر n-1 (اندازه نمونه منهای یک) محاسبه می شود. بنابراین، برای اندازه نمونه ثابت n، واریانس تابعی از مجموع مربع ها (انحرافات) است که برای اختصار نشان داده می شود. اس اس(از انگلیسی Sum of Squares - Sum of Squares). تجزیه و تحلیل واریانس بر اساس تقسیم (یا تقسیم) واریانس به قطعات است. مجموعه داده زیر را در نظر بگیرید:

میانگین دو گروه تفاوت معنی داری دارند (به ترتیب 2 و 6). مجموع انحرافات مجذور داخلاز هر گروه 2 می شود. با جمع کردن آنها به 4 می رسیم. اگر اکنون این محاسبات را تکرار کنیم مستثنی کردنعضویت گروه، یعنی اگر محاسبه کنیم اس اسبر اساس میانگین ترکیبی دو نمونه، 28 به دست می‌آید. به عبارت دیگر، واریانس (مجموع مربعات) بر اساس تنوع درون گروهی مقادیر بسیار کمتری نسبت به زمانی که بر اساس تنوع کل محاسبه می‌شود (نسبت به کل) به دست می‌آورد. منظور داشتن). دلیل این امر بدیهی است که تفاوت معنادار بین میانگین هاست و این تفاوت بین میانگین ها را توضیح می دهد تفاوت موجودبین مجموع مربع ها در واقع، اگر از ماژول استفاده کنیم تحلیل واریانس، نتایج زیر بدست خواهد آمد:

همانطور که از جدول مشخص است، مجموع مجموع مربع ها اس اس= 28 به مجموع مربع های به دلیل تقسیم می شود درون گروهیتنوع ( 2+2=4 ; ردیف دوم جدول را ببینید) و مجموع مربع ها به دلیل تفاوت در مقادیر میانگین. (28-(2+2)=24؛ خط اول جدول را ببینید).

اس اس اشتباهات واس اس اثرتنوع درون گروهی ( اس اس) معمولاً واریانس نامیده می شود خطاهااین بدان معنی است که معمولاً وقتی آزمایشی انجام می شود، نمی توان آن را پیش بینی یا توضیح داد. از سوی دیگر، اس اس اثر(یا تنوع بین گروهی) را می توان با تفاوت بین میانگین ها در گروه های مورد مطالعه توضیح داد. به عبارت دیگر تعلق به یک گروه خاص توضیح می دهدتنوع بین گروهی، زیرا می دانیم که این گروه ها ابزارهای مختلفی دارند.

بررسی اهمیتایده های اصلی آزمون برای اهمیت آماری در فصل مورد بحث قرار می گیرد مفاهیم اولیه آمار(فصل 8). همین فصل دلایلی را توضیح می دهد که چرا بسیاری از آزمون ها از نسبت واریانس توضیح داده شده و غیرقابل توضیح استفاده می کنند. نمونه ای از این استفاده، خود آنالیز واریانس است. آزمون اهمیت در ANOVA مبتنی بر مقایسه واریانس ناشی از تغییرات بین گروهی است (به نام میانگین اثر مربعیا ام‌اساثر) و پراکندگی ناشی از گسترش درون گروهی (نامیده می شود میانگین مربعات خطایا ام‌اسخطا). اگر فرضیه صفر درست باشد (برابری میانگین ها در دو جامعه)، به دلیل تنوع تصادفی می توان انتظار تفاوت نسبتاً کمی در میانگین های نمونه داشت. بنابراین، تحت فرض صفر، واریانس درون گروهی عملاً منطبق خواهد بود واریانس کل، بدون در نظر گرفتن گروه عضویت محاسبه می شود. واریانس های درون گروهی حاصل را می توان با استفاده از آن مقایسه کرد اف- تستی که بررسی می کند آیا نسبت واریانس به طور قابل توجهی بیشتر از 1 است یا خیر. در مثال بالا، اف- آزمون نشان می دهد که تفاوت بین میانگین ها از نظر آماری معنی دار است.

منطق پایه ANOVA.به طور خلاصه می توان گفت که هدف از تحلیل واریانس، آزمون معناداری آماری تفاوت میانگین ها (برای گروه ها یا متغیرها) است. این بررسی با استفاده از تحلیل واریانس انجام می شود، یعنی. با تقسیم واریانس کل (تغییر) به بخش هایی که یکی از آنها به دلیل خطای تصادفی (یعنی تغییرپذیری درون گروهی) است و دومی با تفاوت در مقادیر میانگین همراه است. سپس آخرین مؤلفه واریانس برای تحلیل اهمیت آماری تفاوت بین میانگین ها استفاده می شود. اگر این تفاوت معنی دار باشد، فرض صفر رد می شود و فرض جایگزین که بین میانگین ها تفاوت وجود دارد پذیرفته می شود.

متغیرهای وابسته و مستقلمتغیرهایی که مقادیر آنها با اندازه گیری در طول آزمایش تعیین می شود (به عنوان مثال، امتیاز در یک آزمون) نامیده می شوند. وابستهمتغیرها متغیرهایی که می توانند در یک آزمایش دستکاری شوند (به عنوان مثال، روش های آموزشی یا معیارهای دیگری که به شما امکان می دهد مشاهدات را به گروه ها تقسیم کنید) نامیده می شوند. عواملیا مستقلمتغیرها این مفاهیم با جزئیات بیشتری در فصل توضیح داده شده است مفاهیم اولیه آمار(فصل 8).

تحلیل واریانس چند متغیره

در مثال ساده بالا، می توانید بلافاصله آزمون t-test مستقل را با استفاده از گزینه ماژول مناسب محاسبه کنید آمار و جداول پایهنتایج به دست آمده البته با نتایج تحلیل واریانس منطبق است. با این حال، تجزیه و تحلیل واریانس شامل ابزارهای فنی انعطاف پذیر و قدرتمندی است که می تواند برای مطالعات بسیار پیچیده تر مورد استفاده قرار گیرد.

عوامل زیادیجهان ذاتاً پیچیده و چند بعدی است. موقعیت هایی که برخی از پدیده ها به طور کامل توسط یک متغیر توصیف می شود بسیار نادر هستند. به عنوان مثال، اگر سعی می کنیم یاد بگیریم چگونه رشد کنیم گوجه فرنگی بزرگ، عوامل مربوط به ساختار ژنتیکی گیاهان، نوع خاک، نور، دما و ... را باید در نظر گرفت. بنابراین، هنگام انجام یک آزمایش معمولی، باید با تعداد زیادی از عوامل دست و پنجه نرم کنید. دلیل اصلی اینکه چرا استفاده از تحلیل واریانس به مقایسه مکرر دو نمونه ارجحیت دارد سطوح مختلفعوامل از طریق تی- معیار این است که تحلیل واریانس بیشتر باشد تاثير گذارو برای نمونه های کوچک، آموزنده تر.

مدیریت عاملیبیایید فرض کنیم که در مثال تجزیه و تحلیل دو نمونه ای که در بالا بحث شد، یک عامل دیگر را اضافه می کنیم، به عنوان مثال، کف- جنسیت. بگذارید هر گروه از 3 مرد و 3 زن تشکیل شود. طرح این آزمایش را می توان در قالب جدول 2 در 2 ارائه کرد:

آزمایش کنید. گروه 1 آزمایش کنید. گروه 2
مردان2 6
3 7
1 5
میانگین2 6
زنان4 8
5 9
3 7
میانگین4 8

قبل از انجام محاسبات، می بینید که در این مثال واریانس کل، توسط حداقل، سه منبع:

(1) خطای تصادفی (در واریانس گروه)،

(2) تنوع مرتبط با عضویت در گروه آزمایشی، و

(3) تنوع به دلیل جنسیت اشیاء مشاهده شده.

(توجه داشته باشید که منبع احتمالی دیگری برای تغییر وجود دارد - تعامل عواملکه در ادامه به آن خواهیم پرداخت). اگر درج نکنیم چه اتفاقی می افتد کفجنسیتبه عنوان عاملی در تجزیه و تحلیل و محاسبه معمول تی-معیار؟ اگر مجموع مربع ها را محاسبه کنیم، نادیده گرفته می شود کف -جنسیت(به عنوان مثال، ترکیب اشیاء با جنس های مختلف در یک گروه در هنگام محاسبه واریانس درون گروهی، در حالی که مجموع مربع های هر گروه برابر با اس اس=10، و مجموع مجموع مربع ها اس اس= 10 + 10 = 20)، سپس مقدار بیشتری از پراکندگی درون گروهی را نسبت به تجزیه و تحلیل دقیق تر با تقسیم اضافی به زیر گروه ها بر اساس نیمه جنسیت(در این حالت میانگین درون گروهی برابر با 2 و مجموع مجموع مجذورهای درون گروهی برابر با اس اس = 2+2+2+2 = 8). این تفاوت به این دلیل است که مقدار میانگین برای مردان - نرهاکمتر از میانگین برای زنان -زنو اگر جنسیت در نظر گرفته نشود، این تفاوت در میانگین ها، تنوع کل درون گروهی را افزایش می دهد. کنترل واریانس خطا باعث افزایش حساسیت (قدرت) آزمون می شود.

این مثال یکی دیگر از مزیت های آنالیز واریانس را نسبت به تحلیل معمولی نشان می دهد. تی-معیار برای دو نمونه تجزیه و تحلیل واریانس به شما امکان می دهد تا با کنترل مقادیر سایر عوامل، هر عامل را مطالعه کنید. این در واقع دلیل اصلی قدرت آماری بیشتر آن است (برای به دست آوردن نتایج معنی دار به حجم نمونه کوچکتر نیاز است). به همین دلیل، آنالیز واریانس، حتی در نمونه های کوچک، نتایج آماری معنی داری نسبت به یک نمونه ساده به دست می دهد. تی- معیار

اثرات متقابل

استفاده از ANOVA مزیت دیگری نسبت به آنالیز معمولی دارد. تی- معیار: تجزیه و تحلیل واریانس به شما امکان می دهد تشخیص دهید اثر متقابلبین عوامل و بنابراین اجازه می دهد تا مدل های پیچیده تر مورد مطالعه قرار گیرد. برای توضیح، مثال دیگری را در نظر بگیرید.

اثرات اصلی، تعاملات زوجی (دو عاملی).فرض کنیم دانش‌آموزان دو گروه هستند و از نظر روان‌شناسی دانش‌آموزان گروه اول در انجام وظایف محوله هماهنگ هستند و نسبت به دانش‌آموزان گروه دوم که شامل دانش‌آموزان تنبل‌تر هستند، هدفمندتر هستند. بیایید هر گروه را به طور تصادفی به نصف تقسیم کنیم و به نیمی از هر گروه یک کار دشوار و به دیگری یک کار آسان ارائه دهیم. پس از آن، میزان سختی کار دانش‌آموزان روی این وظایف را اندازه می‌گیریم. میانگین های این مطالعه (ساختی) در جدول نشان داده شده است:

از این نتایج چه نتیجه ای می توان گرفت؟ آیا می توان نتیجه گرفت که: (1) دانش آموزان در یک کار دشوار سخت تر کار می کنند. (2) آیا دانش آموزان با انگیزه بیشتر از افراد تنبل کار می کنند؟ هیچ یک از این عبارات ماهیت سیستماتیک میانگین های ارائه شده در جدول را منعکس نمی کند. با تجزیه و تحلیل نتایج، صحیح تر است که بگوییم فقط دانش آموزان با انگیزه روی کارهای پیچیده سخت تر کار می کنند، در حالی که در کارهای آسانفقط افراد تنبل بیشتر کار می کنند. به عبارت دیگر، ماهیت دانش آموزان و پیچیدگی کار در حال تعاملیکدیگر بر میزان تلاش مورد نیاز تأثیر می گذارند. این یک مثال است تعامل جفتبین ماهیت دانش آموزان و پیچیدگی کار. توجه داشته باشید که عبارات 1 و 2 توضیح می دهند اثرات اصلی.

تعاملات مرتبه های بالاتردر حالی که توضیح تعاملات زوجی نسبتاً آسان است، توضیح تعاملات مرتبه بالاتر بسیار دشوارتر است. بیایید تصور کنیم که در مثال بالا، یک عامل دیگر معرفی شده است کف -جنسیتو جدول میانگین های زیر را بدست آوردیم:

اکنون از نتایج به دست آمده چه نتیجه ای می توان گرفت؟ نمودارهای متوسط ​​تفسیر جلوه های پیچیده را آسان می کند. ماژول تحلیل واریانس به شما امکان می دهد این نمودارها را تقریباً با یک کلیک بسازید.

تصویر در نمودارهای زیر نشان دهنده تعامل سه طرفه مورد مطالعه است.

با نگاهی به نمودارها، می توانیم بگوییم که بین ماهیت و دشواری آزمون برای زنان تعامل وجود دارد: زنان با انگیزه در یک کار دشوار بیشتر از یک کار آسان کار می کنند. در مردان نیز همین تعامل معکوس است. مشاهده می شود که توصیف تعامل بین عوامل گیج کننده تر می شود.

روش کلی برای توصیف تعاملات.در حالت کلی، تعامل بین عوامل به عنوان تغییر در یک اثر تحت تأثیر اثر دیگر توصیف می شود. در مثالی که در بالا مورد بحث قرار گرفت، تعامل دو عاملی را می توان به عنوان تغییر در تأثیر اصلی عامل مشخص کننده پیچیدگی کار، تحت تأثیر عاملی که شخصیت دانش آموز را توصیف می کند، توصیف کرد. برای تأثیر متقابل سه عامل پاراگراف قبل می توان گفت که تأثیر متقابل دو عامل (پیچیدگی تکلیف و شخصیت دانش آموز) تحت تأثیر جنسیتجنسیت. اگر تأثیر متقابل چهار عامل بررسی شود، می توان گفت که تأثیر متقابل سه عامل تحت تأثیر عامل چهارم تغییر می کند. انواع مختلفی از تعاملات در سطوح مختلف عامل چهارم وجود دارد. مشخص شد که در بسیاری از زمینه ها تعامل پنج یا حتی بیشتر از عوامل غیرعادی نیست.

طرح های پیچیده

طرح های بین گروهی و درون گروهی (طرح های اندازه گیری مجدد)

هنگام مقایسه دو گروه های مختلفمعمولا استفاده می شود تی- معیار برای نمونه های مستقل (از ماژول آمار و جداول پایه). هنگامی که دو متغیر بر روی یک مجموعه از اشیاء (مشاهدات) مقایسه می شوند، از آن استفاده می شود تی-معیار نمونه های وابسته برای تجزیه و تحلیل واریانس، وابسته بودن یا نبودن نمونه ها نیز مهم است. اگر اندازه گیری های مکرر از متغیرهای یکسان (در شرایط مختلف یا در زمان های مختلف) وجود داشته باشد. برای همان اشیاء، سپس از حضور می گویند فاکتور اندازه گیری های مکرر(همچنین به نام یک عامل درون گروهیاز آنجایی که مجموع مربع های درون گروهی برای ارزیابی اهمیت آن محاسبه می شود). اگر گروه های مختلف اشیاء با هم مقایسه شوند (به عنوان مثال، مردان و زنان، سه سویه باکتری و غیره)، تفاوت بین گروه ها شرح داده می شود. عامل بین گروهیروش های محاسبه معیارهای اهمیت برای دو نوع عامل توصیف شده متفاوت است، اما منطق کلی و تفسیر آنها یکسان است.

طرح های بین گروهی و درون گروهیدر بسیاری از موارد، آزمایش مستلزم گنجاندن یک عامل بین گروهی و یک عامل اندازه گیری مکرر در طراحی است. به عنوان مثال، مهارت های ریاضی دانش آموزان دختر و پسر اندازه گیری می شود کف -جنسیت-فاکتور بین گروهی) در ابتدا و در پایان ترم. دو بعد مهارت های هر دانش آموز عامل درون گروهی (عامل اندازه گیری های مکرر) را تشکیل می دهد. تفسیر تأثیرات و تعاملات اصلی برای عوامل بین گروهی و اقدامات مکرر یکسان است و هر دو نوع عامل به وضوح می توانند با یکدیگر تعامل داشته باشند (مثلاً زنان در طول ترم مهارت کسب می کنند و مردان آن را از دست می دهند).

طرح های ناقص (تودرتو).

در بسیاری از موارد، اثر متقابل را می توان نادیده گرفت. این اتفاق می افتد یا زمانی که مشخص است که هیچ اثر متقابل در جمعیت وجود دارد، و یا زمانی که اجرای کامل فاکتوریلطرح غیر ممکن است به عنوان مثال، تأثیر چهار افزودنی سوخت بر مصرف سوخت در حال بررسی است. چهار خودرو و چهار راننده انتخاب می شوند. پر شده فاکتوریلآزمایش مستلزم آن است که هر ترکیب: مکمل، راننده، ماشین حداقل یک بار ظاهر شود. این امر به حداقل 4 x 4 x 4 = 64 گروه آزمایشی نیاز دارد که بسیار وقت گیر است. علاوه بر این، به سختی هیچ تعاملی بین راننده و افزودنی سوخت وجود دارد. با در نظر گرفتن این موضوع می توانید از طرح استفاده کنید مربع های لاتین،که فقط شامل 16 گروه آزمایش است (چهار ماده افزودنی با حروف A، B، C و D مشخص می شوند):

مربع‌های لاتین در اکثر کتاب‌های طراحی تجربی توصیف شده‌اند (مانند Hays, 1988؛ Lindman, 1974؛ Milliken and Johnson, 1984؛ Winer, 1962) و در اینجا به تفصیل مورد بحث قرار نخواهد گرفت. توجه داشته باشید که مربع های لاتین هستند نهnپر شدهطرح هایی که شامل تمام ترکیبات سطوح عاملی نمی شود. برای مثال، راننده 1 ماشین 1 را فقط با افزودنی A رانندگی می کند، راننده 3 ماشین 1 را فقط با افزودنی C رانندگی می کند. سطوح عامل مواد افزودنی ( A، B، C و D) تو در تو سلول های جدول خودروایکس راننده -مثل تخم مرغ در لانه این قانون یادگاری برای درک طبیعت مفید است تو در تو یا تو در توبرنامه ها مدول تحلیل واریانسراه های آسانی برای تجزیه و تحلیل طرح هایی از این نوع ارائه می دهد.

تحلیل کوواریانس

ایده اصلی

در فصل ایده های کلیدیبه طور خلاصه ایده عوامل کنترلی و اینکه چگونه گنجاندن عوامل افزایشی می تواند مجموع مربعات خطاها را کاهش داده و قدرت آماری طرح را افزایش دهد، مورد بحث قرار گرفت. همه اینها را می توان به متغیرهایی با مجموعه ای پیوسته از مقادیر گسترش داد. هنگامی که چنین متغیرهای پیوسته ای به عنوان عوامل در طراحی گنجانده شوند، نامیده می شوند متغیرهای کمکی.

متغیرهای کمکی ثابت

فرض کنید در حال مقایسه مهارت های ریاضی دو گروه از دانش آموزان هستیم که از دو کتاب درسی متفاوت آموزش داده شده اند. بیایید همچنین فرض کنیم که برای هر دانش آموز داده های بهره هوشی (IQ) داریم. می توانیم فرض کنیم که IQ مربوط به مهارت های ریاضی است و از این اطلاعات استفاده کنیم. برای هر یک از دو گروه از دانش آموزان، ضریب همبستگی بین IQ و مهارت های ریاضی قابل محاسبه است. با استفاده از این ضریب همبستگی، می توان بین سهم واریانس در گروه هایی که با تأثیر IQ توضیح داده شده و سهم واریانس غیر قابل توضیح تمایز قائل شد (همچنین رجوع کنید به مفاهیم اولیه آمار(فصل 8) و آمار و جداول پایه(فصل 9)). کسر باقی مانده از واریانس در تحلیل به عنوان واریانس خطا استفاده می شود. اگر بین IQ و مهارت های ریاضی همبستگی وجود داشته باشد، واریانس خطا را می توان به طور قابل توجهی کاهش داد. اس اس/(n-1) .

تأثیر متغیرهای کمکی برF- معیار F-این معیار اهمیت آماری تفاوت بین مقادیر میانگین را در گروه ها ارزیابی می کند، در حالی که نسبت واریانس بین گروهی محاسبه می شود ( ام‌اساثر) به واریانس خطا ( ام‌اسخطا) . اگر یک ام‌اسخطابه عنوان مثال، با در نظر گرفتن فاکتور IQ، مقدار کاهش می یابد افافزایش.

تعداد زیادی متغیر.استدلال استفاده شده در بالا برای یک متغیر کمکی منفرد (IQ) به راحتی به چندین متغیر کمکی گسترش می یابد. به عنوان مثال، علاوه بر ضریب هوشی، می توانید اندازه گیری انگیزه، تفکر فضایی و غیره را نیز در نظر بگیرید. به جای ضریب همبستگی معمول، از آن استفاده می کند چند عاملیهمبستگی ها

زمانی که ارزشاف - معیارها کاهش می یابد.گاهی اوقات معرفی متغیرهای کمکی در طراحی آزمایش باعث کاهش ارزش می شود اف-شاخص . این معمولاً نشان می دهد که متغیرهای کمکی نه تنها با متغیر وابسته (مانند مهارت های ریاضی)، بلکه با عوامل (مانند کتاب های درسی مختلف) همبستگی دارند. فرض کنید ضریب هوشی در پایان ترم اندازه گیری می شود، پس از اینکه دو گروه از دانش آموزان تقریبا یک سال را صرف مطالعه دو کتاب درسی مختلف کرده اند. اگرچه دانش‌آموزان به‌طور تصادفی به گروه‌هایی تقسیم شدند، اما ممکن است معلوم شود که تفاوت در کتاب‌های درسی آنقدر زیاد است که هم مهارت‌های هوشی و هم مهارت‌های ریاضی در گروه‌های مختلف بسیار متفاوت است. در این حالت، متغیرهای کمکی نه تنها واریانس خطا را کاهش می دهند، بلکه واریانس بین گروهی را نیز کاهش می دهند. به عبارت دیگر، پس از کنترل تفاوت ضریب هوشی بین گروه ها، دیگر تفاوت در مهارت های ریاضی معنی دار نخواهد بود. غیر از این هم میشه گفت. پس از "از بین بردن" تأثیر ضریب هوشی، تأثیر کتاب درسی بر رشد مهارت های ریاضی به طور ناخواسته حذف می شود.

میانگین های تعدیل شدههنگامی که متغیر کمکی بر عامل بین گروهی تأثیر می گذارد، باید محاسبه کرد میانگین های تعدیل شده، یعنی چنین میانگین هایی که پس از حذف کلیه برآوردهای متغیرهای کمکی به دست می آیند.

تعامل بین متغیرهای کمکی و عوامل.همانطور که تعاملات بین عوامل بررسی می شود، تعاملات بین متغیرهای کمکی و بین گروهی از عوامل نیز قابل بررسی است. فرض کنید یکی از کتاب های درسی مخصوصاً برای دانش آموزان باهوش مناسب است. کتاب دوم برای دانش آموزان باهوش خسته کننده است و همین کتاب برای دانش آموزان کم باهوش دشوار است. در نتیجه، بین IQ و نتایج یادگیری در گروه اول (دانش آموزان باهوش تر، نتایج بهتر) همبستگی مثبت و در گروه دوم همبستگی منفی صفر یا کمی وجود دارد (هر چه دانش آموز باهوش تر باشد، احتمال کسب مهارت های ریاضی کمتر می شود. از کتاب درسی دوم). در برخی مطالعات، این وضعیت به عنوان نمونه ای از نقض مفروضات تحلیل کوواریانس مورد بحث قرار گرفته است. با این حال، از آنجایی که ماژول تحلیل واریانس از متداول‌ترین روش‌های تحلیل کوواریانس استفاده می‌کند، به‌ویژه امکان ارزیابی اهمیت آماری تعامل بین عوامل و متغیرهای کمکی وجود دارد.

متغیرهای کمکی متغیر

در حالی که متغیرهای کمکی ثابت اغلب در کتاب‌های درسی مورد بحث قرار می‌گیرند، متغیرهای کمکی متغیر بسیار کمتر ذکر شده‌اند. معمولاً هنگام انجام آزمایش‌هایی با اندازه‌گیری‌های مکرر، ما به تفاوت در اندازه‌گیری مقادیر یکسان در مقاطع زمانی مختلف علاقه مندیم. یعنی ما به اهمیت این تفاوت ها علاقه مندیم. اگر همزمان با اندازه گیری های متغیر وابسته، اندازه گیری کمکی انجام شود، می توان همبستگی بین متغیر کمکی و متغیر وابسته را محاسبه کرد.

به عنوان مثال، شما می توانید علاقه به ریاضیات و مهارت های ریاضی را در ابتدا و در پایان ترم مطالعه کنید. بررسی اینکه آیا تغییرات در علاقه به ریاضیات با تغییرات در مهارت های ریاضی مرتبط است یا خیر، جالب است.

مدول تحلیل واریانسکه در آماربه طور خودکار اهمیت آماری تغییرات در متغیرهای کمکی در آن طرح ها را، در صورت امکان، ارزیابی می کند.

طرح های چند متغیره: ANOVA چند متغیره و تحلیل کوواریانس

برنامه های بین گروهی

تمام مثال‌هایی که قبلاً در نظر گرفته شد فقط یک متغیر وابسته را شامل می‌شد. وقتی چندین متغیر وابسته به طور همزمان وجود داشته باشد، فقط پیچیدگی محاسبات افزایش می یابد و محتوا و اصول اولیه تغییر نمی کند.

به عنوان مثال، مطالعه ای روی دو کتاب درسی مختلف در حال انجام است. در عین حال موفقیت دانش آموزان در مطالعه فیزیک و ریاضی مورد بررسی قرار می گیرد. در این مورد، دو متغیر وابسته وجود دارد و باید دریابید که چگونه دو کتاب درسی مختلف به طور همزمان روی آنها تأثیر می گذارد. برای این کار می توانید از تحلیل واریانس چند متغیره (MANOVA) استفاده کنید. به جای یک بعدی افمعیار، چند بعدی افآزمون (آزمون ال ویلکس) بر اساس مقایسه ماتریس کوواریانس خطا و ماتریس کوواریانس بین گروهی.

اگر متغیرهای وابسته با یکدیگر همبستگی داشته باشند، در محاسبه آزمون معناداری باید این همبستگی در نظر گرفته شود. بدیهی است که اگر همان اندازه گیری دو بار تکرار شود، در این صورت چیز جدیدی نمی توان به دست آورد. اگر یک بعد مرتبط با آن به بعد موجود اضافه شود، اطلاعات جدیدی به دست می آید، اما متغیر جدید حاوی اطلاعات اضافی است که در کوواریانس بین متغیرها منعکس می شود.

تفسیر نتایج.اگر معیار کلی چند متغیره معنادار باشد، می‌توان نتیجه گرفت که اثر متناظر (مثلاً نوع کتاب درسی) معنی‌دار است. با این حال، سوالات زیر مطرح می شود. آیا نوع کتاب درسی فقط در بهبود مهارت های ریاضی، فقط مهارت های بدنی یا هر دو تأثیر دارد؟ در واقع، پس از به دست آوردن یک معیار چند متغیره معنادار، برای یک اثر اصلی یا تعامل، تک بعدی افمعیار به عبارت دیگر، متغیرهای وابسته ای که به معنی دار بودن آزمون چند متغیره کمک می کنند، به طور جداگانه بررسی می شوند.

طرح هایی با اندازه گیری های مکرر

اگر مهارت‌های ریاضی و فیزیکی دانش‌آموزان در ابتدای ترم و در پایان ترم اندازه‌گیری شود، این اندازه‌گیری‌های تکراری است. بررسی معیار اهمیت در این گونه طرح ها، توسعه منطقی مورد تک بعدی است. توجه داشته باشید که روش های ANOVA چند متغیره نیز معمولاً برای بررسی اهمیت عوامل اندازه گیری مکرر تک متغیره که بیش از دو سطح دارند استفاده می شود. کاربردهای مربوطه بعداً در این بخش مورد بحث قرار خواهند گرفت.

مجموع مقادیر متغیر و تحلیل واریانس چند متغیره

حتی کاربران باتجربه ANOVA تک متغیره و چند متغیره اغلب زمانی که نتایج متفاوتی را هنگام اعمال ANOVA چند متغیره برای مثلاً سه متغیر و هنگام اعمال ANOVA تک متغیره برای مجموع این سه متغیر به عنوان یک متغیر منفرد به دست می‌آورند، گیج می‌شوند.

اندیشه جمع بندیمتغیرها این است که هر متغیر حاوی مقداری متغیر واقعی است که بررسی می شود و همچنین یک خطای اندازه گیری تصادفی. بنابراین، هنگام میانگین‌گیری مقادیر متغیرها، خطای اندازه‌گیری برای همه اندازه‌گیری‌ها نزدیک‌تر به صفر خواهد بود و مقادیر میانگین قابل اعتمادتر خواهند بود. در واقع، در این مورد، اعمال ANOVA برای مجموع متغیرها یک تکنیک منطقی و قدرتمند است. اما اگر ماهیت متغیرهای وابسته چند متغیره باشد، جمع کردن مقادیر متغیرها نامناسب است.

برای مثال، اجازه دهید متغیرهای وابسته از چهار معیار تشکیل شده باشند موفقیت در جامعه. هر شاخص یک جنبه کاملاً مستقل از فعالیت انسانی را مشخص می کند (به عنوان مثال، موفقیت حرفه ای، موفقیت تجاری، رفاه خانواده و غیره). جمع کردن این متغیرها با هم مانند اضافه کردن یک سیب و یک پرتقال است. مجموع این متغیرها معیار تک متغیره مناسبی نخواهد بود. بنابراین، چنین داده هایی باید به عنوان شاخص های چند بعدی در نظر گرفته شوند تحلیل واریانس چند متغیره.

تجزیه و تحلیل کنتراست و آزمون های تعقیبی

چرا مجموعه های فردی از ابزارها با هم مقایسه می شوند؟

معمولاً فرضیه‌های مربوط به داده‌های تجربی صرفاً از نظر تأثیرات یا تعاملات اصلی فرمول‌بندی نمی‌شوند. یک مثال فرضیه زیر است: یک کتاب درسی خاص مهارت های ریاضی را فقط در دانش آموزان پسر بهبود می بخشد، در حالی که کتاب درسی دیگر تقریباً برای هر دو جنس به یک اندازه مؤثر است، اما هنوز برای مردان کمتر مؤثر است. می توان پیش بینی کرد که عملکرد کتاب درسی با جنسیت دانش آموز در تعامل است. با این حال، این پیش بینی نیز صدق می کند طبیعتفعل و انفعالات. در یک کتاب برای دانش‌آموزان تفاوت معناداری بین جنسیت‌ها و در کتاب دیگر برای دانش‌آموزان نتایج عملاً مستقل از جنسیت انتظار می‌رود. این نوع فرضیه معمولاً با استفاده از تحلیل کنتراست بررسی می شود.

تجزیه و تحلیل کنتراست

به طور خلاصه، تجزیه و تحلیل کنتراست به ما امکان می دهد تا اهمیت آماری برخی از ترکیبات خطی اثرات پیچیده را ارزیابی کنیم. تجزیه و تحلیل کنتراست عنصر اصلی و ضروری هر طرح ANOVA پیچیده است. مدول تحلیل واریانسدارای قابلیت های بسیار متنوعی از تجزیه و تحلیل کنتراست است که به شما امکان می دهد هر نوع مقایسه میانگین ها را انتخاب و تجزیه و تحلیل کنید.

پسینیمقایسه ها

گاهی اوقات، در نتیجه پردازش یک آزمایش، یک اثر غیر منتظره پیدا می شود. اگرچه در بیشتر موارد یک محقق خلاق می تواند هر نتیجه ای را توضیح دهد، این فرصتی برای تحلیل و تخمین بیشتر برای پیش بینی فراهم نمی کند. این مشکل یکی از مواردی است که برای آن معیارهای post hoc، یعنی معیارهایی که استفاده نمی کنند پیشینفرضیه ها برای نشان دادن، آزمایش زیر را در نظر بگیرید. فرض کنید 100 کارت شامل اعداد 1 تا 10 است. با انداختن همه این کارت ها در هدر، به طور تصادفی 20 برابر 5 کارت را انتخاب می کنیم و میانگین مقدار هر نمونه (میانگین اعداد نوشته شده روی کارت ها) را محاسبه می کنیم. آیا می توانیم انتظار داشته باشیم که دو نمونه وجود داشته باشد که میانگین آنها به طور قابل توجهی متفاوت است؟ بسیار قابل قبول است! با انتخاب دو نمونه با میانگین حداکثر و حداقل می توان تفاوتی در میانگین بدست آورد که با تفاوت میانگین ها مثلاً دو نمونه اول بسیار متفاوت است. این تفاوت را می توان برای مثال با استفاده از تحلیل کنتراست بررسی کرد. بدون پرداختن به جزئیات، چندین به اصطلاح وجود دارد پسینیمعیارهایی که دقیقاً بر اساس سناریوی اول (گرفتن میانگین های افراطی از 20 نمونه) است، یعنی این معیارها بر اساس انتخاب متفاوت ترین ابزارها برای مقایسه همه ابزارها در طراحی است. این معیارها به منظور عدم دستیابی به یک اثر مصنوعی صرفاً تصادفی به کار می روند، به عنوان مثال، برای یافتن تفاوت قابل توجهی بین میانگین ها در حالی که هیچ کدام وجود ندارد. مدول تحلیل واریانسطیف گسترده ای از این معیارها را ارائه می دهد. هنگامی که نتایج غیرمنتظره ای در یک آزمایش شامل چندین گروه مشاهده می شود، پسینیروش‌هایی برای بررسی اهمیت آماری نتایج به‌دست‌آمده.

مجموع مربع های نوع I، II، III و IV

رگرسیون چند متغیره و تحلیل واریانس

بین روش رگرسیون چند متغیره و تحلیل واریانس (تحلیل تغییرات) رابطه تنگاتنگی وجود دارد. در هر دو روش، یک مدل خطی مورد مطالعه قرار گرفته است. به طور خلاصه، تقریباً تمام طرح های تجربی را می توان با استفاده از رگرسیون چند متغیره بررسی کرد. طرح متقابل گروهی ساده 2×2 زیر را در نظر بگیرید.

DV آ ب AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

ستون های A و B حاوی کدهایی هستند که سطوح عوامل A و B را مشخص می کنند، ستون AxB حاوی حاصل ضرب دو ستون A و B است. ما می توانیم این داده ها را با استفاده از رگرسیون چند متغیره تجزیه و تحلیل کنیم. متغیر DVبه عنوان یک متغیر وابسته تعریف می شود، متغیرها از آقبل از AxBبه عنوان متغیرهای مستقل بررسی معنی داری برای ضرایب رگرسیون با محاسبات در تحلیل واریانس اهمیت اثرات اصلی عوامل همزمان خواهد بود. آو بو اثر متقابل AxB.

برنامه های نامتعادل و متوازن

هنگام محاسبه ماتریس همبستگی برای همه متغیرها، به عنوان مثال، برای داده های نشان داده شده در بالا، می توان مشاهده کرد که اثرات اصلی عوامل آو بو اثر متقابل AxBنامرتبط به این خاصیت افکت ها متعامد بودن نیز می گویند. آنها می گویند که اثرات آو ب - متعامدیا مستقلاز یکدیگر. اگر تمام اثرات در پلان متعامد با یکدیگر باشند، مانند مثال بالا، آنگاه پلان گفته می شود که متعادل.

طرح‌های متوازن دارای "ویژگی خوب" هستند. محاسبات در تجزیه و تحلیل چنین طرح هایی بسیار ساده است. تمام محاسبات به محاسبه همبستگی بین اثرات و متغیرهای وابسته کاهش می یابد. از آنجایی که اثرات متعامد هستند، همبستگی های جزئی (مانند کامل چند بعدیرگرسیون ها) محاسبه نمی شوند. با این حال، در زندگی واقعیبرنامه ها همیشه متعادل نیستند

داده های واقعی را با تعداد نابرابر مشاهدات در سلول ها در نظر بگیرید.

عامل A عامل B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

اگر این داده ها را مانند بالا رمزگذاری کنیم و ماتریس همبستگی را برای همه متغیرها محاسبه کنیم، معلوم می شود که عوامل طراحی با یکدیگر همبستگی دارند. عوامل موجود در طرح اکنون متعامد نیستند و چنین طرح هایی نامیده می شوند نامتعادلتوجه داشته باشید که در این مثال، همبستگی بین فاکتورها کاملاً به تفاوت فرکانس های 1 و -1 در ستون های ماتریس داده مربوط می شود. به عبارت دیگر، طرح‌های آزمایشی با حجم‌های سلولی نابرابر (به طور دقیق‌تر، حجم‌های نامتناسب) نامتعادل خواهند بود، به این معنی که تأثیرات و تعاملات اصلی با هم مخلوط می‌شوند. در این مورد، برای محاسبه معناداری آماری اثرات، باید رگرسیون چند متغیره را به طور کامل محاسبه کنید. در اینجا چندین استراتژی وجود دارد.

مجموع مربع های نوع I، II، III و IV

مجموع مربع ها نوعمنوIII. برای مطالعه اهمیت هر یک از عوامل در یک مدل چند متغیره، می توان همبستگی جزئی هر عامل را محاسبه کرد، مشروط بر اینکه سایر عوامل از قبل در مدل لحاظ شده باشند. همچنین می توانید فاکتورها را به صورت گام به گام وارد مدل کنید و تمام فاکتورهایی که قبلاً وارد مدل شده اند را ثابت کنید و همه عوامل دیگر را نادیده بگیرید. به طور کلی، این تفاوت است نوع IIIو نوعمنمجموع مربعات (این اصطلاح در SAS معرفی شد، برای مثال به SAS، 1982 مراجعه کنید؛ بحث مفصلی را نیز می توان در Searle، 1987، p. 461؛ Woodward, Bonett, and Brecht, 1990, p. 216؛ یا Milliken و جانسون، 1984، ص 138).

مجموع مربع ها نوعII.استراتژی شکل‌گیری مدل «واسطه» بعدی این است: کنترل تمام اثرات اصلی در مطالعه اهمیت یک اثر اصلی واحد. در کنترل همه اثرات اصلی و همه تعاملات زوجی، زمانی که اهمیت یک تعامل زوجی مورد بررسی قرار می گیرد. در کنترل تمام اثرات اصلی همه تعاملات زوجی و همه تعاملات سه عامل. در مطالعه تعامل جداگانه سه عامل و غیره. مجموع مربعات برای اثرات محاسبه شده به این روش نامیده می شود نوعIIمجموع مربع ها بنابراین، نوعی ازIIمجموع مربع ها همه جلوه های یک مرتبه و پایین تر را کنترل می کند و تمام اثرات مرتبه بالاتر را نادیده می گیرد.

مجموع مربع ها نوعIV. در نهایت، برای برخی از طرح های خاص با سلول های مفقود (طرح های ناقص) می توان به اصطلاح محاسبه کرد. نوع IVمجموع مربع ها این روش بعداً در رابطه با طرح های ناقص (طرح هایی با سلول های گمشده) مورد بحث قرار خواهد گرفت.

تفسیر حدس مجموع مربعات انواع I، II و III

مجموع مربعات نوعIIIساده ترین تفسیر به یاد بیاورید که مجموع مربع ها نوعIIIپس از کنترل سایر اثرات، اثرات را بررسی کنید. به عنوان مثال، پس از یافتن یک معنی دار آماری نوعIIIاثر برای عامل آدر ماژول تحلیل واریانس، می توان گفت که یک اثر معنی دار واحد وجود دارد آ، پس از معرفی سایر اثرات (عوامل) و تفسیر این اثر بر اساس آن. احتمالاً در 99 درصد تمام کاربردهای تحلیل واریانس، این نوع معیار مورد توجه محقق است. این نوع مجموع مربع ها معمولاً در ماژول محاسبه می شود تحلیل واریانسبه طور پیش فرض، صرف نظر از اینکه گزینه انتخاب شده باشد یا خیر رویکرد رگرسیونیا نه (رویکردهای استاندارد اتخاذ شده در ماژول تحلیل واریانسدر زیر بحث شده است).

اثرات قابل توجهی با استفاده از مجموع مربع ها به دست می آید نوعیا نوعIIتفسیر مجموع مربع ها چندان آسان نیست. آنها به بهترین وجه در زمینه رگرسیون چند متغیره گام به گام تفسیر می شوند. اگر از مجموع مربع ها استفاده کنید نوعمناثر اصلی عامل B معنی دار بود (پس از گنجاندن عامل A در مدل، اما قبل از افزودن اثر متقابل بین A و B)، می توان نتیجه گرفت که اثر اصلی معنی داری از عامل B وجود دارد، مشروط بر اینکه برهمکنش بین A و B وجود نداشته باشد. عوامل A و B. (در صورت استفاده از معیار نوعIIIفاکتور B نیز معنی دار بود، پس از وارد کردن سایر عوامل و تأثیر متقابل آنها در مدل، می توان نتیجه گرفت که تأثیر اصلی فاکتور B معنی دار است.

از نظر میانگین های حاشیه ای فرضیه نوعمنو نوعIIمعمولاً تفسیر ساده ای ندارند. در این موارد گفته می شود که صرفاً با در نظر گرفتن وسایل حاشیه ای نمی توان اهمیت آثار را تفسیر کرد. بلکه ارائه شده است پمقادیر میانگین مربوط به یک فرضیه پیچیده است که میانگین و حجم نمونه را ترکیب می کند. مثلا، نوعی ازIIفرضیه‌های عامل A در مثال طراحی ساده 2×2 که قبلاً مورد بحث قرار گرفت این خواهد بود (رجوع کنید به Woodward, Bonett, and Brecht, 1990, p. 219):

nij- تعداد مشاهدات در یک سلول

uij- مقدار متوسط ​​در یک سلول

n. j- میانگین حاشیه ای

بدون پرداختن به جزئیات (برای جزئیات بیشتر رجوع کنید به Milliken and Johnson، 1984، فصل 10)، واضح است که اینها فرضیه های ساده ای نیستند و در بیشتر موارد هیچ یک از آنها برای محقق مورد توجه خاص قرار نمی گیرند. با این حال، مواردی وجود دارد که فرضیه ها نوعمنممکن است مورد توجه باشد.

رویکرد محاسباتی پیش فرض در ماژول تحلیل واریانس

در صورتی که گزینه علامت نخورده باشد، پیش‌فرض است رویکرد رگرسیون، مدول تحلیل واریانساستفاده می کند مدل میانگین سلولی. مشخصه این مدل این است که مجموع مربع ها برای اثرات مختلف برای ترکیب های خطی میانگین سلول ها محاسبه می شود. در یک آزمایش فاکتوریل کامل، این نتیجه به مجموع مربع‌هایی می‌رسد که با مجموع مربع‌هایی که قبلاً بحث شد، یکسان است. نوعی از III. با این حال، در گزینه مقایسه های برنامه ریزی شده(در پنجره تجزیه و تحلیل نتایج واریانسکاربر می تواند فرضیه ای را در مورد هر ترکیب خطی از میانگین سلولی وزن دار یا بدون وزن آزمایش کند. بنابراین، کاربر می تواند نه تنها فرضیه ها را آزمایش کند نوعIII، اما فرضیه هایی از هر نوع (از جمله نوعی ازIV). این رویکرد کلی به ویژه هنگام بررسی طرح هایی با سلول های گمشده (به اصطلاح طرح های ناقص) مفید است.

برای طرح‌های فاکتوریل کامل، این رویکرد زمانی مفید است که بخواهیم میانگین‌های حاشیه وزنی را تحلیل کنیم. به عنوان مثال، فرض کنید که در طرح ساده 2×2 که قبلاً در نظر گرفته شد، می‌خواهیم وزن‌ها را (از نظر سطوح عاملی) مقایسه کنیم. بمیانگین‌های حاشیه‌ای برای فاکتور A. این زمانی مفید است که توزیع مشاهدات توسط سلول‌ها توسط آزمایش‌کننده تهیه نشده باشد، بلکه به‌طور تصادفی ساخته شده است، و این تصادفی در توزیع تعداد مشاهدات بر اساس سطوح فاکتور B در مجموع منعکس می‌شود. .

به عنوان مثال، یک عامل وجود دارد - سن بیوه ها. یک نمونه ممکن از پاسخ دهندگان به دو گروه کوچکتر از 40 سال و مسن تر از 40 سال (عامل B) تقسیم می شود. دومین عامل (عامل الف) در این طرح این است که آیا زنان بیوه از برخی آژانس ها حمایت اجتماعی دریافت کرده اند یا خیر (در حالی که برخی از بیوه ها به طور تصادفی انتخاب شده اند، برخی دیگر به عنوان کنترل عمل می کنند). در این مورد، توزیع سنی زنان بیوه در نمونه نشان دهنده توزیع سنی واقعی زنان بیوه در جامعه است. بررسی اثربخشی گروه حمایت اجتماعی از زنان بیوه تمام سنینبا میانگین وزنی برای دو گروه سنی (با وزن های مربوط به تعداد مشاهدات در گروه) مطابقت دارد.

مقایسه های برنامه ریزی شده

توجه داشته باشید که مجموع نسبت های کنتراست وارد شده لزوماً برابر با 0 (صفر) نیست. در عوض، برنامه به طور خودکار تنظیمات را انجام می دهد تا فرضیه های مربوطه با میانگین کلی ترکیب نشود.

برای نشان دادن این موضوع، اجازه دهید به طرح ساده 2×2 که قبلاً بحث شد، برگردیم. به یاد بیاورید که تعداد سلول‌های این طرح نامتعادل 1-، 2، 3 و 1 است. فرض کنید می‌خواهیم میانگین‌های وزنی حاشیه‌ای را برای عامل A (وزن‌دهی شده با فراوانی سطوح عامل B) مقایسه کنیم. می توانید نسبت کنتراست را وارد کنید:

توجه داشته باشید که این ضرایب تا 0 جمع نمی شوند. برنامه ضرایب را به گونه ای تنظیم می کند که آنها تا 0 جمع شوند، در حالی که مقادیر نسبی خود را حفظ می کنند، یعنی:

1/3 2/3 -3/4 -1/4

این تضادها میانگین وزنی عامل A را با هم مقایسه می کند.

فرضیات در مورد میانگین اصلی.این فرضیه که میانگین اصلی وزن‌نشده 0 است را می‌توان با استفاده از ضرایب بررسی کرد:

این فرضیه که میانگین وزنی اصلی 0 است با استفاده از:

برنامه در هیچ موردی نسبت کنتراست را اصلاح نمی کند.

تجزیه و تحلیل طرح های دارای سلول های گمشده (طرح های ناقص)

طرح های فاکتوری حاوی سلول های خالی (پردازش ترکیب سلول هایی که در آن هیچ مشاهده ای وجود ندارد) ناقص نامیده می شوند. در این گونه طرح ها، برخی عوامل معمولاً متعامد نیستند و نمی توان برخی از فعل و انفعالات را محاسبه کرد. به طور کلی روش بهتری برای تحلیل چنین طرح هایی وجود ندارد.

رویکرد رگرسیون

در برخی از برنامه‌های قدیمی‌تر که مبتنی بر تجزیه و تحلیل طرح‌های ANOVA با استفاده از رگرسیون چند متغیره هستند، عوامل در طرح‌های ناقص به‌طور پیش‌فرض به روش معمول تنظیم می‌شوند (انگار طرح کامل شده است). سپس یک تحلیل رگرسیون چند متغیره برای این عوامل رمزگذاری شده ساختگی انجام می شود. متأسفانه، این روش به نتایجی منتهی می شود که تفسیر آنها اگر غیرممکن نباشد، بسیار دشوار است، زیرا مشخص نیست که هر اثر چگونه به ترکیب خطی ابزارها کمک می کند. مثال ساده زیر را در نظر بگیرید.

عامل A عامل B
B1 B2
A1 3 4, 5
A2 6, 6, 7 از دست رفته

اگر رگرسیون چند متغیره فرم متغیر وابسته = ثابت + عامل A + عامل B، سپس فرضیه اهمیت عوامل A و B از نظر ترکیب خطی میانگین ها به صورت زیر است:

فاکتور A: سلول A1,B1 = سلول A2,B1

فاکتور B: سلول A1,B1 = سلول A1,B2

این مورد ساده است. در طرح های پیچیده تر، تعیین اینکه دقیقاً چه چیزی مورد بررسی قرار می گیرد، غیرممکن است.

سلول های میانگین، رویکرد تحلیل واریانس , فرضیه های نوع چهارم

رویکردی که در ادبیات توصیه می شود و به نظر ارجح است، مطالعه معنادار (از نظر وظایف پژوهشی) است. پیشینفرضیه هایی در مورد ابزارهای مشاهده شده در سلول های طرح. بحث مفصلی از این رویکرد را می توان در دوج (1985)، هایبرگر (1989)، میلیکن و جانسون (1984)، سرل (1987)، یا وودوارد، بونت و برشت (1990) یافت. مجموع مربع‌های مرتبط با فرضیه‌های مربوط به ترکیب خطی میانگین‌ها در طرح‌های ناقص، بررسی تخمین بخشی از اثرات، نیز مجموع مربع نامیده می‌شوند. IV.

تولید خودکار فرضیه های نوعIV. هنگامی که طرح های چند متغیره دارای یک الگوی سلول گمشده پیچیده هستند، مطلوب است که فرضیه های متعامد (مستقل) تعریف شوند که بررسی آنها معادل بررسی اثرات یا تعاملات اصلی باشد. استراتژی‌های الگوریتمی (محاسباتی) (بر اساس ماتریس طراحی شبه معکوس) برای تولید وزن‌های مناسب برای چنین مقایسه‌هایی توسعه یافته‌اند. متأسفانه، فرضیه های نهایی به طور منحصر به فرد تعریف نشده اند. البته، آنها به ترتیب تعریف اثرات بستگی دارند و به ندرت قابل تفسیر هستند. بنابراین توصیه می‌شود ماهیت سلول‌های از دست رفته را با دقت مطالعه کرده و سپس فرضیه‌ها را تدوین کنید نوعIV, که بیشترین ارتباط را با اهداف مطالعه دارند. سپس این فرضیه ها را با استفاده از گزینه بررسی کنید مقایسه های برنامه ریزی شدهدر پنجره نتایج. ساده ترین راه برای مشخص کردن مقایسه ها در این مورد، نیاز به معرفی یک بردار کنتراست برای همه عوامل است. با یکدیگردر پنجره مقایسه های برنامه ریزی شدهپس از فراخوانی کادر محاوره ای مقایسه های برنامه ریزی شدهتمام گروه های طرح فعلی نشان داده شده و آنهایی که حذف شده اند علامت گذاری خواهند شد.

سلول های پرش شده و بررسی اثر خاص

انواع مختلفی از پلان ها وجود دارد که در آنها مکان سلول های از دست رفته تصادفی نیست، بلکه با دقت برنامه ریزی شده است، که امکان تجزیه و تحلیل ساده از اثرات اصلی را بدون تأثیرگذاری بر سایر اثرات فراهم می کند. به عنوان مثال، زمانی که تعداد سلول های مورد نیاز در یک پلان در دسترس نباشد، اغلب از پلان ها استفاده می شود. مربع های لاتینبرای برآورد اثرات اصلی چندین عامل با تعداد سطوح زیاد. به عنوان مثال، یک طرح فاکتوریل 4 x 4 x 4 x 4 به 256 سلول نیاز دارد. در عین حال می توانید استفاده کنید مربع یونانی-لاتینبرای تخمین اثرات اصلی با داشتن تنها 16 سلول در طرح (فصل برنامه ریزی آزمایشی، جلد چهارم، شرح مفصلی از این گونه طرح ها را شامل می شود). طرح های ناقصی که در آنها اثرات اصلی (و برخی از فعل و انفعالات) را می توان با استفاده از ترکیب خطی ساده ابزارها تخمین زد، نامیده می شوند. برنامه های ناقص متعادل.

در طرح‌های متعادل، روش استاندارد (پیش‌فرض) ایجاد کنتراست (وزن) برای جلوه‌های اصلی و برهمکنش‌ها، تجزیه و تحلیل جدول واریانسی را ایجاد می‌کند که در آن مجموع مربع‌ها برای جلوه‌های مربوطه با یکدیگر مخلوط نمی‌شوند. گزینه جلوه های خاصپنجره نتایجبا نوشتن صفر در سلول های طرح از دست رفته، کنتراست های از دست رفته را ایجاد می کند. بلافاصله پس از درخواست گزینه جلوه های خاصبرای کاربری که برخی از فرضیه ها را مطالعه می کند، جدولی از نتایج با وزن های واقعی ظاهر می شود. توجه داشته باشید که در یک طراحی متوازن، مجموع مجذورات اثرات مربوطه فقط در صورتی محاسبه می‌شود که آن اثرات متعامد (مستقل) نسبت به سایر اثرات و برهمکنش‌های اصلی باشند. در غیر این صورت از گزینه استفاده کنید مقایسه های برنامه ریزی شدهبرای بررسی مقایسه های معنادار بین میانگین ها.

سلول‌های گمشده و اثرات/اعضای خطای ترکیبی

اگر گزینه رویکرد رگرسیوندر پانل راه اندازی ماژول تحلیل واریانسانتخاب نشده است، مدل میانگین سلول ها هنگام محاسبه مجموع مربع ها برای جلوه ها استفاده می شود (تنظیم پیش فرض). اگر طراحی متعادل نباشد، هنگام ترکیب جلوه های غیر متعامد (به بحث بالا در مورد گزینه مراجعه کنید سلول های از دست رفته و اثر خاص) می توان مجموع مربع های متشکل از اجزای غیر متعامد (یا همپوشانی) را بدست آورد. نتایج به دست آمده از این طریق معمولاً قابل تفسیر نیستند. بنابراین در انتخاب و اجرای طرح های آزمایشی پیچیده و ناقص باید بسیار دقت کرد.

کتاب های زیادی وجود دارد که در مورد طرح ها به تفصیل بحث می کند. نوع مختلف. (دوج، 1985؛ هایبرگر، 1989؛ لیندمن، 1974؛ میلیکن و جانسون، 1984؛ سرل، 1987؛ وودوارد و بونت، 1990)، اما این نوع اطلاعات خارج از محدوده این کتاب درسی است. با این حال، تجزیه و تحلیل انواع مختلف طرح ها بعداً در این بخش نشان داده خواهد شد.

مفروضات و آثار نقض مفروضات

انحراف از فرض توزیع نرمال

فرض کنید که متغیر وابسته در مقیاس عددی اندازه گیری می شود. همچنین فرض کنید که متغیر وابسته دارای توزیع نرمال در هر گروه است. تحلیل واریانسشامل طیف گسترده ای از نمودارها و آمار برای اثبات این فرض است.

اثرات نقضبطور کلی افاین معیار در برابر انحراف از نرمال بودن بسیار مقاوم است (برای نتایج دقیق به لیندمن، 1974 مراجعه کنید). اگر کشش بزرگتر از 0 باشد، مقدار آماره است افممکن است بسیار کوچک شود فرضیه صفر پذیرفته شده است، اگرچه ممکن است درست نباشد. هنگامی که کشش کمتر از 0 باشد، وضعیت معکوس می شود. چولگی توزیع معمولاً تأثیر کمی بر روی آن دارد. افآمار. اگر تعداد مشاهدات در یک سلول به اندازه کافی زیاد باشد، انحراف از حالت عادی اهمیت چندانی ندارد. تئوری حد مرکزیکه بر اساس آن، توزیع مقدار میانگین بدون توجه به توزیع اولیه، نزدیک به نرمال است. بحث مفصل در مورد پایداری افآمار را می توان در باکس و اندرسون (1955) یا لیندمن (1974) یافت.

همگنی پراکندگی

مفروضاتفرض بر این است که واریانس های گروه های مختلف طرح یکسان است. این فرض را فرض می نامند همگنی پراکندگیبه یاد بیاورید که در ابتدای این بخش، هنگام تشریح محاسبه مجموع مربعات خطاها، جمع بندی را در هر گروه انجام دادیم. اگر واریانس ها در دو گروه با یکدیگر متفاوت باشند، پس جمع کردن آنها خیلی طبیعی نیست و تخمینی از کل واریانس درون گروهی ارائه نمی دهد (زیرا در این مورد اصلا واریانس کلی وجود ندارد). مدول تحلیل واریانس -ANOVA/MANOVAشامل مجموعه بزرگی از معیارهای آماری برای تشخیص انحراف از مفروضات همگنی واریانس است.

اثرات نقضلیندمن (1974، ص 33) نشان می دهد که افاین معیار با توجه به نقض مفروضات همگنی واریانس کاملاً پایدار است ( ناهمگونیپراکندگی، همچنین نگاه کنید به Box, 1954a, 1954b; هسو، 1938).

مورد خاص: همبستگی میانگین ها و واریانس ها.مواقعی هست که افآمار می تواند گمراه کردناین زمانی اتفاق می افتد که مقادیر میانگین در سلول های طراحی با واریانس همبستگی داشته باشند. مدول تحلیل واریانسبه شما اجازه می دهد تا نمودارهای پراکندگی پراکندگی یا انحراف معیارنسبت به ابزار تشخیص چنین همبستگی. دلیل خطرناک بودن چنین همبستگی به شرح زیر است. بیایید تصور کنیم که 8 خانه در پلان وجود دارد که 7 تای آنها تقریباً میانگین یکسانی دارند و در یک سلول میانگین بسیار بزرگتر از بقیه است. سپس افآزمایش می تواند یک اثر آماری معنی دار را تشخیص دهد. اما فرض کنید که در یک سلول با مقدار میانگین بزرگ و واریانس بسیار بزرگتر از سایرین باشد، یعنی. میانگین و واریانس در سلول ها وابسته است (هرچه میانگین بزرگتر باشد، واریانس بیشتر است). در این مورد، میانگین بزرگ غیرقابل اعتماد است، زیرا ممکن است ناشی از واریانس زیاد در داده ها باشد. با این حال افآمار بر اساس متحدواریانس درون سلولی میانگین زیادی را به دست می‌آورد، اگرچه معیارهای مبتنی بر واریانس در هر سلول، همه تفاوت‌ها در میانگین‌ها را معنادار در نظر نمی‌گیرند.

این ماهیت داده ها (میانگین بزرگ و واریانس بزرگ) اغلب زمانی که مشاهدات پرت وجود دارد، با آن مواجه می شود. یک یا دو مشاهدات پرت به شدت میانگین را تغییر داده و واریانس را به شدت افزایش می دهد.

همگنی واریانس و کوواریانس

مفروضاتدر طرح‌های چند متغیره، با معیارهای وابسته به چند متغیره، مفروضات همگنی واریانس که قبلاً توضیح داده شد نیز اعمال می‌شود. با این حال، از آنجایی که متغیرهای وابسته چند متغیره وجود دارد، همچنین لازم است که همبستگی متقاطع (کوواریانس) آنها در تمام سلول های طرح یکنواخت باشد. مدول تحلیل واریانسارائه می دهد روش های مختلفآزمایش این مفروضات

اثرات نقض. آنالوگ چند بعدی اف- معیار - λ-آزمون Wilks. اطلاعات زیادی در مورد پایداری (استحکام) آزمون λ Wilks با توجه به نقض مفروضات فوق وجود ندارد. با این حال، از تفسیر نتایج ماژول تحلیل واریانسمعمولاً بر اساس اهمیت تأثیرات تک متغیره است (پس از تعیین اهمیت معیار مشترک)، بحث استحکام عمدتاً به تحلیل واریانس تک متغیره مربوط می شود. بنابراین، اهمیت اثرات یک بعدی باید به دقت بررسی شود.

مورد ویژه: تحلیل کوواریانس.هنگامی که متغیرهای کمکی در طرح گنجانده شوند، به ویژه نقض شدید همگنی واریانس/کوواریانس ممکن است رخ دهد. به طور خاص، اگر همبستگی بین متغیرهای کمکی و معیارهای وابسته در سلول های مختلف طرح متفاوت باشد، ممکن است تفسیر نادرست نتایج به دنبال داشته باشد. باید به خاطر داشت که در تجزیه و تحلیل کوواریانس، در اصل، یک تحلیل رگرسیون در هر سلول انجام می شود تا آن قسمت از واریانس را که با متغیر کمکی مطابقت دارد جدا شود. فرض همگنی واریانس/کوواریانس فرض می‌کند که این تحلیل رگرسیون تحت محدودیت زیر انجام می‌شود: معادلات رگرسیون(شیب ها) برای همه سلول ها یکسان است. اگر این در نظر گرفته نشده باشد، ممکن است خطاهای بزرگی رخ دهد. مدول تحلیل واریانسچندین معیار ویژه برای آزمایش این فرض دارد. ممکن است توصیه شود از این معیارها برای اطمینان از اینکه معادلات رگرسیون برای سلول های مختلف تقریباً یکسان است استفاده کنید.

کرویت و تقارن پیچیده: دلایل استفاده از رویکرد اندازه گیری های مکرر چند متغیره در تحلیل واریانس

در طرح‌های حاوی عوامل اندازه‌گیری مکرر با بیش از دو سطح، استفاده از تحلیل واریانس تک متغیره به مفروضات اضافی نیاز دارد: مفروضات تقارن پیچیده و مفروضات کروی. این فرضیات به ندرت برآورده می شوند (به زیر مراجعه کنید). بنابراین، در سال‌های اخیر، تحلیل واریانس چند متغیره در چنین طرح‌هایی محبوبیت پیدا کرده است (هر دو رویکرد در ماژول ترکیب شده‌اند. تحلیل واریانس).

فرض تقارن مختلطفرض تقارن مختلط این است که واریانس‌ها (کل درون گروهی) و کوواریانس‌ها (بر اساس گروه) برای اندازه‌گیری‌های تکراری مختلف یکنواخت هستند (یکسان). این یک شرط کافی برای معتبر بودن آزمون اندازه گیری مکرر F تک متغیره است (یعنی مقادیر F گزارش شده به طور متوسط ​​با توزیع F مطابقت دارند). اما در این حالت این شرط ضروری نیست.

فرض کروی بودن.فرض کروی بودن لازم است و شرایط کافیبرای اینکه آزمون F توجیه شود. این شامل این واقعیت است که در درون گروه ها همه مشاهدات مستقل و به طور مساوی توزیع شده اند. ماهیت این مفروضات، و همچنین تأثیر نقض آنها، معمولاً در کتابهای تجزیه و تحلیل واریانس به خوبی توضیح داده نمی شود - این یکی در پاراگراف های بعدی توضیح داده خواهد شد. همچنین نشان خواهد داد که نتایج رویکرد تک متغیره ممکن است با نتایج رویکرد چند متغیره متفاوت باشد و توضیح دهد که این به چه معناست.

لزوم استقلال فرضیه ها.روش کلی برای تجزیه و تحلیل داده ها در تحلیل واریانس است مناسب مدل. اگر با توجه به مدل مربوط به داده ها، برخی از آنها وجود دارد پیشینفرضیه ها، سپس واریانس برای آزمایش این فرضیه ها تقسیم می شود (معیارهای اثرات اصلی، تعاملات). از نقطه نظر محاسباتی، این رویکرد مجموعه ای از تضادها (مجموعه مقایسه میانگین ها در طراحی) را ایجاد می کند. با این حال، اگر تضادها مستقل از یکدیگر نباشند، تقسیم بندی واریانس ها بی معنی می شود. به عنوان مثال، اگر دو تضاد آو بیکسان هستند و قسمت مربوطه از واریانس انتخاب می شود، سپس همان قسمت دو بار انتخاب می شود. برای مثال، احمقانه و بیهوده است که دو فرضیه را مشخص کنیم: "میانگین در سلول 1 بیشتر از میانگین سلول 2 است" و "میانگین در خانه 1 از میانگین سلول 2 بیشتر است". پس فرضیه ها باید مستقل یا متعامد باشند.

فرضیه های مستقل در اندازه گیری های مکرر.الگوریتم عمومی پیاده سازی شده در ماژول تحلیل واریانس، سعی خواهد کرد تضادهای مستقل (متعامد) برای هر اثر ایجاد کند. برای عامل اندازه‌گیری‌های مکرر، این تضادها فرضیه‌های زیادی در مورد ایجاد می‌کند تفاوتبین سطوح عامل در نظر گرفته شده است. با این حال، اگر این تفاوت ها در گروه ها همبستگی داشته باشند، تضادهای حاصل دیگر مستقل نیستند. به عنوان مثال، در آموزش هایی که فراگیران در یک ترم سه بار اندازه گیری می شوند، ممکن است این اتفاق بیفتد که تغییرات بین بعد 1 و 2 با تغییر بین ابعاد 2 و 3 موضوعات مرتبط باشد. کسانی که بیشتر مطالب را بین بعد 1 و 2 تسلط دارند، در مدت زمانی که بین بعد 2 و 3 سپری شده است، به قسمت کوچکتری تسلط دارند. در واقع، برای اکثر مواردی که از آنالیز واریانس در اندازه‌گیری‌های مکرر استفاده می‌شود، می‌توان فرض کرد که تغییرات در سطوح بین آزمودنی‌ها همبستگی دارد. با این حال، هنگامی که این اتفاق می افتد، مفروضات تقارن پیچیده و کروی برآورده نمی شوند و تضادهای مستقل را نمی توان محاسبه کرد.

تاثیر تخلفات و راه های اصلاح آن.هنگامی که مفروضات تقارن پیچیده یا کروی برآورده نمی شوند، تجزیه و تحلیل واریانس می تواند نتایج اشتباهی ایجاد کند. قبل از اینکه رویه‌های چند متغیره به اندازه کافی توسعه یابند، چندین فرض برای جبران نقض این مفروضات مطرح شد. (به عنوان مثال به Greenhouse & Geisser، 1959 و Huynh & Feldt، 1970 مراجعه کنید). این روش ها هنوز هم امروزه به طور گسترده مورد استفاده قرار می گیرند (به همین دلیل است که در ماژول ارائه می شوند تحلیل واریانس).

رویکرد تحلیل واریانس چند متغیره برای اندازه گیری های مکرر.به طور کلی، مسائل مربوط به تقارن و کروییت مختلط به این موضوع اشاره دارد که مجموعه تضادهای موجود در بررسی تأثیر عوامل اندازه گیری های مکرر (با بیش از 2 سطح) مستقل از یکدیگر نیستند. با این حال، در صورت استفاده از آنها لازم نیست مستقل باشند. چند بعدیمعیار تایید همزمان اهمیت آماریکنتراست عامل دو یا چند اندازه گیری مکرر به همین دلیل است که روش‌های ANOVA چند متغیره برای آزمایش اهمیت فاکتورهای اندازه‌گیری مکرر تک متغیره با بیش از ۲ سطح رایج‌تر شده‌اند. این رویکرد به طور گسترده مورد استفاده قرار می گیرد زیرا معمولاً به فرض تقارن پیچیده و فرض کروی بودن نیاز ندارد.

مواردی که نمی توان از روش تحلیل واریانس چند متغیره استفاده کرد.نمونه‌هایی (طرح‌هایی) وجود دارد که رویکرد تحلیل واریانس چند متغیره را نمی‌توان اعمال کرد. اینها معمولاً مواردی هستند که تعداد کمی از موضوعات در طراحی و سطوح زیادی در فاکتور اندازه گیری های مکرر وجود دارد. سپس ممکن است مشاهدات بسیار کمی برای انجام یک تحلیل چند متغیره وجود داشته باشد. برای مثال، اگر 12 موجودیت وجود داشته باشد، پ = 4 ضریب اندازه گیری های مکرر و هر عامل دارای ک = 3 سطوح سپس تعامل 4 عامل "هزینه" می شود (ک-1) ص = 2 4 = 16 درجه آزادی. با این حال، تنها 12 موضوع وجود دارد، از این رو نمی توان یک آزمون چند متغیره را در این مثال انجام داد. مدول تحلیل واریانسبه طور مستقل این مشاهدات را تشخیص داده و تنها معیارهای یک بعدی را محاسبه می کند.

تفاوت در نتایج تک متغیره و چند متغیره.اگر مطالعه شامل تعداد زیادی اندازه‌گیری مکرر باشد، ممکن است مواردی وجود داشته باشد که رویکرد اندازه‌گیری‌های مکرر تک متغیره ANOVA نتایجی به‌دست آورد که بسیار متفاوت از نتایج به‌دست‌آمده با رویکرد چند متغیره است. این به این معنی است که تفاوت بین سطوح اندازه‌گیری‌های مکرر مربوطه بین افراد مرتبط است. گاهی اوقات این واقعیت مورد توجه مستقل است.

تحلیل واریانس چند متغیره و مدلسازی ساختاری معادلات

در سال‌های اخیر، مدل‌سازی معادلات ساختاری به‌عنوان جایگزینی برای تحلیل پراکندگی چند متغیره رایج شده است (برای مثال، باگوزی و یی، 1989؛ باگوزی، یی، و سینگ، 1991؛ کول، ماکسول، آروی، و سالاس، 1993 را ببینید). این رویکرد به شما امکان می دهد تا فرضیه ها را نه تنها در مورد میانگین در گروه های مختلف، بلکه در مورد ماتریس های همبستگی متغیرهای وابسته نیز آزمایش کنید. به عنوان مثال، می توانید فرضیات مربوط به همگنی واریانس و کوواریانس را کاهش دهید و به صراحت در مدل برای هر گروه از واریانس و کوواریانس خطاها را وارد کنید. مدول آمارمدل سازی معادلات ساختاری (SEPATH) (رجوع کنید به جلد سوم) چنین تحلیلی را امکان پذیر می کند.

تجزیه و تحلیل پراکندگی

در آمار ریاضی - روش آماری، برای شناسایی تأثیر عوامل فردی بر نتیجه آزمایش و همچنین برای برنامه ریزی بعدی آزمایش های مشابه طراحی شده است. در ابتدا D. و. توسط R. Fisher برای پردازش نتایج زراعی پیشنهاد شد. آزمایش هایی برای شناسایی شرایطی که در آن رقم آزمایش شده محصول حداکثر عملکرد را می دهد. کاربردهای مدرن D. و. طیف وسیعی از مسائل اقتصاد، جامعه شناسی، زیست شناسی و فناوری را پوشش می دهد و معمولاً از نظر آماری تفسیر می شود. نظریه های تشخیص سیستماتیک تفاوت بین نتایج اندازه گیری های مستقیم انجام شده در این شرایط یا سایر شرایط متغیر.

اگر مقادیر ثابت مجهول 1، ...، aIمی توان با استفاده از روش های مختلف یا ابزارهای اندازه گیری اندازه گیری کرد M 1،..., ام جی،و در هر مورد به طور سیستماتیک. خطا b ijممکن است، به طور کلی، هر دو به روش انتخاب شده بستگی داشته باشد mj،و از یک مقدار اندازه گیری شده ناشناخته یک من، سپس نتایج چنین اندازه گیری ها مجموع فرم است

که در آن K تعداد اندازه گیری های مستقل یک کمیت مجهول است یک منروش ام جی،آ در ijk- خطای تصادفی k-thاندازه گیری های قدر یک منروش Mj(با فرض همه ییک- متغیرهای تصادفی مستقل با توزیع یکسان با صفر ریاضی. انتظار: E در ijk=0). چنین خطی طرح دو عاملی D. و. اولی مقدار واقعی مقدار اندازه گیری شده است، دومی روش اندازه گیری است، و در این حالت، برای هر ترکیب ممکن از مقادیر فاکتور اول و دوم، به همان تعداد اندازه گیری مستقل انجام می شود. این فرض برای اهداف D. a قابل توجه نیست و فقط برای سادگی ارائه در اینجا معرفی شده است).

نمونه ای از چنین شرایطی می تواند مسابقات ورزشی ورزشکاران I باشد که مهارت آن ارزیابی می شود جیداوران، و هر شرکت کننده در مسابقه کراز است (K "تلاش" دارد). در این مورد یک من- مقدار واقعی نشانگر مهارت ورزشکار با عدد من، بیج- نظام خطای علامت مهارت من-امین ورزشکار به عنوان داور با شماره j، xijk- امتیاز داده شده j-امین داور به -امین ورزشکار بعد از آخرین k-thتلاش ها، و ییک- تصادفی مربوطه این معمولی برای به اصطلاح است. بررسی ذهنی کیفیت چندین شی که توسط گروهی از کارشناسان مستقل انجام شده است. مثال دیگر آمار است. بررسی عملکرد یک محصول کشاورزی بسته به یکی از واریته های خاک J و روش های J فرآوری آن و برای هر رقم g خاک و هر روش فرآوری با عدد J، k آزمایش های مستقل انجام می شود (در این مثال b ij- مقدار واقعی عملکرد برای رقم i-امین خاک در راه jدر حال پردازش، xijkبازده مشاهده شده تجربی مربوطه در است k-thتجربه، و ییک- خطای تصادفی آن ناشی از دلایل تصادفی خاص؛ در مورد بزرگی ها یک من، سپس در زراعی آزمایشات، منطقی است که آنها را برابر با صفر در نظر بگیریم).

بگذاریم c ij =a i +b ij ,رهایش کن با من*، با *j و با ** - نتایج میانگین گیری با ijبا توجه به شاخص های مربوطه، یعنی.

اجازه دهید، علاوه بر این، الف =c**،ب من=با من*-با **، g j = با *j-c ** و d ij=با ij-با من*-با *j+ ج ** . ایده D. a. بر اساس هویت آشکار

اگر نماد ( ج ij) ابعاد را مشخص کنید آی جی، به دست آمده از ماتریس ||ج ij|| ترتیب IXJ را با استفاده از ترتیب از پیش ثابت عناصر آن، سپس (1) را می توان به عنوان یک برابری نوشت که در آن همه بردارها دارای آی جی، و الف ij=a،b ijمن، g ij=g j. از آنجایی که چهار بردار سمت راست (2) متعامد هستند، a ij=a - بهترین تقریب تابع ج ijاز آرگومان های i و jمقدار ثابت [به معنای حداقل مجموع مجذور انحرافات ]. به همین معنا الف ij+b ij=a+b من- بهترین ج ijتابع فقط به i، a ij+g ij=a+g j- بهترین تقریب ج ijتابع فقط به j، a a بستگی دارد ij+b ij+g ij=a+b من+g j- بهترین تقریب ج ijمجموع توابع، که یکی از آنها (مثلاً a+b من) فقط به r بستگی دارد و دیگری فقط به j بستگی دارد. این واقعیت، تاسیس شده توسط R. فیشر (نگاه کنید به) در سال 1918، بعدها به عنوان مبنایی برای نظریه تقریب درجه دوم توابع خدمت کرده است.

در مثال مسابقه ورزشی، د ij"تعامل" ورزشکار i و داور j را بیان می کند (مقدار مثبت استفاده شده به معنای "قضاوت کردن" است، به عنوان مثال، ارزیابی بیش از حد سیستماتیک مهارت ورزشکار یکم توسط داور j، و یک مقدار منفی استفاده شده به معنای "زاوگیوانیه" یعنی کاهش سیستماتیک امتیاز است). تساوی همه دست دوم تا صفر یک الزام ضروری است که باید به کار گروهی از متخصصان ارائه شود. در مورد زراعی در آزمایش‌ها، چنین برابری به عنوان فرضیه‌ای در نظر گرفته می‌شود که بر اساس نتایج آزمایش‌ها تأیید می‌شود، زیرا هدف اصلی در اینجا یافتن چنین مقادیری است. منو j که تابع (1) به حداکثر مقدار خود می رسد. اگر این فرضیه درست باشد، پس

و این بدان معنی است که شناسایی بهترین "خاک" و "خاک ورزی" را می توان به طور جداگانه انجام داد، که منجر به کاهش قابل توجهی در تعداد آزمایش ها می شود (به عنوان مثال، می توان همه انواع I "خاک" را با هر یک از روش های پردازش و تعیین بهترین تنوع، و سپس در این تنوع همه چیز را امتحان کنید جیراه هایی برای «پردازش» و یافتن بهترین راه; تعداد کل آزمایشات با تکرار برابر با (I + J) K خواهد بود. . اگر فرضیه (همه d ij=0) نادرست است، سپس حداکثر c را تعیین کنید ij"طرح کامل" شرح داده شده در بالا مورد نیاز است، که نیاز به تکرار K دارد، IJKآزمایش.

در وضعیت مسابقات ورزشی تابع g ij=g jرا می توان به عنوان یک سیستماتیک تعبیر کرد اشتباهی که داور j در رابطه با همه ورزشکاران مرتکب شد. در نهایت g j- توصیف "سخت" یا "لیبرالیسم" قاضی j. در حالت ایده آل، ما می خواهیم همه g jصفر بودند، اما در شرایط واقعی باید وجود مقادیر غیر صفر g را تحمل کرد jو این شرایط را هنگام جمع بندی نتایج معاینه در نظر بگیرید (به عنوان مثال، می توان غیر توالی مقادیر واقعی a + b را به عنوان پایه ای برای مقایسه مهارت های ورزشکاران در نظر گرفت. 1 +g j، ...، a+b من+g jو فقط نتایج ترتیب دادن این اعداد بر اساس مقدارشان است، زیرا برای همه j=1، . . . ، جیچنین دستوراتی یکسان خواهد بود). در نهایت، مجموع دو تابع باقی مانده a ij+b ij=a+b منفقط به i بستگی دارد و بنابراین می توان از آن برای مشخص کردن مهارت ورزشکار i استفاده کرد. با این حال، در اینجا باید به خاطر داشت که، بنابراین، ترتیب همه ورزشکاران بر اساس مقادیر a+b من(یا توسط a+ + b من+g jبرای هر j ثابت) ممکن است با ترتیب مقادیر مطابقت نداشته باشد یک من. در پردازش عملی ارزیابی های کارشناسی، این شرایط باید نادیده گرفته شود، زیرا طرح کامل آزمایشات ذکر شده اجازه ارزیابی جداگانه را نمی دهد. یک منو b i*. بنابراین a+b من=یک من + b i*نه تنها مهارت را مشخص می کند منورزشکار، بلکه به هر نحوی در این مهارت متخصص هستند. بنابراین، به عنوان مثال، نتایج ارزیابی های کارشناسی ذهنی انجام شده در زمان های مختلف (به ویژه در چندین مورد بازی های المپیک، به سختی قابل مقایسه هستند. در مورد زراعی آزمایشات، چنین مشکلاتی بوجود نمی آیند، زیرا همه یک من=0 و از این رو a+b من=b i*.

مقادیر واقعی توابع a، b من، g منو د ijمجهول هستند و بر حسب توابع مجهول بیان می شوند c ij .بنابراین مرحله اول د.الف. یافتن آمار است. برآورد برای ج ijبر اساس مشاهدات xijk.بی طرفانه و دارای حداقل واریانس برای c ijبا فرمول بیان می شود

از آنجایی که a، b من، g jو د ijتوابع خطی عناصر ماتریس هستند ||c ij||، سپس تخمین های خطی بی طرفانه برای این توابع که دارای حداقل واریانس هستند، با جایگزینی آرگومان های c به دست می آیند. ijبرآوردهای مربوطه، ج ijبه عنوان مثال، علاوه بر این، بردارهای تصادفی و به همان روشی که در بالا معرفی شد تعریف شده است (الف ij), ij)، (گرم ij). و (د ij) دارای خاصیت متعامد هستند، به این معنی که آنها بردارهای تصادفی ناهمبسته هستند (به عبارت دیگر، هر دو جزء متعلق به بردارهای مختلف همبستگی صفر دارند). علاوه بر این، هر نوع

با هیچ یک از اجزاء ارتباطی ندارد اینهاچهار بردار پنج مجموعه از متغیرهای تصادفی را در نظر بگیرید (x ijk )، (x ijk-xij*)زیرا

سپس واریانس ها تجربی هستند. توزیع های مربوط به جمعیت های مشخص شده توسط فرمول ها بیان می شوند

این تجربی واریانس ها مجموع مربع های متغیرهای تصادفی هستند که هر دوتای آنها تا زمانی که به مجموع متفاوتی تعلق داشته باشند، همبستگی ندارند. در حالی که با احترام به همه ییکهویت

توضیح منشأ اصطلاح «د. الف.» «بگذار و بگذار

در این مورد

که در آن s 2 واریانس خطاهای تصادفی است ییک.

بر اساس این فرمول ها، مرحله دوم D.a ساخته شده است که به آشکار کردن تأثیر عوامل اول و دوم بر نتایج آزمایش اختصاص دارد (در آزمایش های زراعی، اولین عامل نوع "خاک" است. ، دوم روش «تزکیه» است). به عنوان مثال، اگر لازم باشد فرضیه عدم وجود "تعامل" عوامل را که با برابری بیان می شود آزمایش شود، منطقی است که نسبت پراکندگی را محاسبه کنیم. s 2 3 /s 2 0 = F 3 .اگر این نسبت تفاوت معنی داری با واحد داشته باشد، فرضیه آزمایش شده رد می شود. به همین ترتیب، رابطه s 2 2 / s 2 0 \u003d F 2،که آن را نیز باید با وحدت مقایسه کرد; اگر در عین حال معلوم شود که به جای F2بهتر است با نسبت واحد مقایسه شود

به طور مشابه، می توانید آماری بسازید که به شما امکان می دهد درباره اعتبار یا نادرستی فرضیه نتیجه گیری کنید.

معنی دقیق مفهوم تفاوت معنی دار بین این نسبت ها از وحدت را تنها با در نظر گرفتن قانون توزیع خطاهای تصادفی می توان تعیین کرد. y ijk .در D. a. کامل ترین وضعیت مطالعه شده، که در آن همه ییکبه صورت عادی توزیع می شود. در این مورد، بردارهای تصادفی مستقل هستند و متغیرهای تصادفی مستقل هستند و

نسبت ها از توزیع کای دو غیر مرکزی با fmدرجات آزادی و پارامترهای غیر مرکزیت l t، m=0، 1، 2، 3، که در آن

اگر پارامتر غیرمرکزی صفر باشد، آنگاه کای اسکوئر غیر مرکزی همان توزیع کای دو نرمال است. بنابراین، اگر فرضیه l 3 =0 این نسبت از توزیع F (توزیع نسبت پراکندگی) با پارامترهای f 3 و f 0 پیروی می کند. فرض کنید x عدد کدام رویداد باشد (F 3 >x)برابر با مقدار معین e است که سطح معنی داری نامیده می شود (جدول تابع x= x(e; f 3 , f 0) در اکثر کتاب های درسی ریاضی موجود است. آمار). ملاک آزمون فرضیه l 3 = 0 قاعده ای است که بر اساس آن در صورت مقدار مشاهده شده این فرضیه رد می شود. F3بیش از x باشد، در غیر این صورت، فرضیه با نتایج مشاهدات مطابقت دارد. به طور مشابه، معیارها بر اساس آمار ساخته می شوند F2و F*2.

مراحل بعدی D. و. اساساً نه تنها به محتوای واقعی یک مسئله خاص، بلکه به نتایج تجزیه و تحلیل آماری نیز بستگی دارد. آزمون فرضیه در مرحله دوم مثلا در شرایط زراعی. آزمایش‌ها، اعتبار فرضیه l 3 \u003d 0، همانطور که در بالا ذکر شد، به شما امکان می‌دهد تا آزمایش‌های مشابه بعدی را از نظر اقتصادی برنامه‌ریزی کنید (اگر علاوه بر فرضیه l 3 \u003d 0، فرضیه l 2 \u003d 0 نیز صادق باشد. ، این بدان معنی است که عملکرد فقط به تنوع "خاک" بستگی دارد، و بنابراین، در آزمایشات بعدی، می توانید از طرح تک عاملی D. a. استفاده کنید). اگر فرضیه l 3 = 0 رد شود، منطقی است که بررسی کنیم که آیا عامل سوم نامشخصی در این مشکل وجود دارد؟ در صورتی که انواع "خاک" و روش های "فرآوری" آن نه در یک مکان، بلکه در مناطق مختلف جغرافیایی متفاوت بود. مناطق، پس چنین عاملی می تواند آب و هوایی باشد. یا جغرافیایی شرایط، و "پردازش" مشاهدات مستلزم استفاده از سه عامل D. a.

در مورد ارزیابی های متخصص، اعتبار تایید شده از نظر آماری فرضیه l 3 = 0 مبنایی برای مرتب کردن اشیاء مقایسه شده (به عنوان مثال، ورزشکاران) بر اساس مقادیر مقادیر فراهم می کند. i=l، . .. ، من.

اگر فرضیه l 3 =0 رد می شود (در مسئله مسابقات ورزشی، این به معنای کشف آماری "تعامل" برخی از ورزشکاران و داوران است)، پس طبیعی است که سعی شود دوباره همه نتایج را دوباره محاسبه کنیم، قبلاً از بررسی خارج شده است. xijkبا چنین جفت شاخص ( من، ج) که برای آن مقادیر مطلق آماری است. رتبه بندی د ijفراتر از حد مجاز از پیش تعیین شده این به این معنی است که از ماتریس ||xij* ||عناصر خاصی خط خورده اند، به این معنی که پلان D. a. ناقص می شود

مدل های مدرن دی و. طیف وسیعی از طرح‌های آزمایشی واقعی را پوشش می‌دهد (مانند طرح‌های طراحی ناقص، با عناصر انتخابی تصادفی یا غیرتصادفی xij*). داده های آماری مربوط به این طرح ها نتیجه گیری در بسیاری از موارد در دست توسعه است. به ویژه، در اوایل (تا سال 1978) آن مشکلاتی که در آن نتایج مشاهدات xijk=cij +yijkمتغیرهای تصادفی به طور مساوی توزیع نشده اند. مشکل حتی دشوارتر در مورد وابستگی مقادیر به وجود می آید x ijk .مشکلات انتخاب عامل ناشناخته (حتی در حالت خطی). ماهیت این مشکل به شرح زیر است: اجازه دهید s=s(و، v)- رهایش کن u=u(z، w) و u=u(z، w) - هر تابع خطی از متغیرهای r و wرفع مقادیر z 1 , . ..، z Iو w 1 ، . . .، و جی،این امکان برای هر انتخاب داده شده از توابع خطی u u وجود دارد . تعریف کردن ج ijفرمول و ساخت D. a. این مقادیر با توجه به نتایج مشاهدات مربوطه xijk. مشکل پیدا کردن چنین توابع خطی u و u است , که با حداقل مقدار مجموع مربع ها مطابقت دارد

جایی که (فرض می شود که تابع c( و، v) ناشناخته است). از نظر D. و. این مشکل به آمار برمی گردد. یافتن چنین عواملی z=z(u، v) و w-w(u، v), به کریمه مربوط به "کمترین تعامل" است.

روشن شد: فیشر R. A.، روش های آماری برای کارگران پژوهشی، ادینبورگ، 1925; Scheffe G.، تجزیه و تحلیل پراکندگی، ترجمه. از انگلیسی، M., 1963; خلد ع.، ریاضی با کاربردهای فنی، ترجمه. از انگلیسی، M., 1956; اسندکور جی. U.، روش های آماری در کاربرد در تحقیقات کشاورزی و زیست شناسی، ترجمه. از انگلیسی، M.، 1961.

L. N. بیشتر.


دایره المعارف ریاضی. - م.: دایره المعارف شوروی. I. M. Vinogradov. 1977-1985.

ببینید «تحلیل واریان» در فرهنگ‌های دیگر چیست:

    روشی در آمار ریاضی با هدف یافتن وابستگی ها در داده های تجربی با بررسی اهمیت تفاوت در مقادیر میانگین. نام ANOVA نیز در ادبیات یافت می شود (از انگلیسی ANAlysis Of ... ... ویکی پدیا

    - (تحلیل واریانس) یک روش آماری مبتنی بر تجزیه کل واریانس (واریانس) هر مشخصه جامعه به مؤلفه هایی که با سایر ویژگی ها همبستگی دارند و تغییرات باقیمانده (تغییر باقیمانده). در…… فرهنگ لغت اقتصادی

    یکی از روش ها آمار ریاضی، برای تجزیه و تحلیل نتایج مشاهداتی استفاده می شود که به عوامل مختلفی که به طور همزمان عمل می کنند بستگی دارد، که، به عنوان یک قاعده، خود را به کمیت نمی دهند. شرح. اجازه دهید ساده ترین مسائل D.a را در نظر بگیریم. اجازه دهید … دایره المعارف فیزیکی

    تحلیل واریانس- بخشی از آمار ریاضی که به روش هایی برای شناسایی تأثیر عوامل فردی بر نتیجه آزمایش (آزمایش فیزیکی، صنعتی، اقتصادی) اختصاص دارد. آره. به عنوان وسیله ای برای پردازش نتایج به وجود آمد ... ... فرهنگ لغت اقتصادی و ریاضی

    تحلیل واریانس- - تجزیه و تحلیل واریانس بخشی از آمار ریاضی اختصاص یافته به روش هایی برای شناسایی تأثیر عوامل فردی بر نتیجه آزمایش (فیزیکی، صنعتی، ... ... کتابچه راهنمای مترجم فنی

ANOVA مجموعه‌ای از روش‌های آماری است که برای آزمون فرضیه‌هایی درباره رابطه بین ویژگی‌های خاص و عوامل مورد مطالعه که توصیف کمی ندارند و همچنین تعیین میزان تأثیر عوامل و تأثیر متقابل آنها طراحی شده است. در ادبیات تخصصی، اغلب ANOVA (از نام انگلیسی Analysis of Variations) نامیده می شود. این روش برای اولین بار توسط R. Fischer در سال 1925 توسعه یافت.

انواع و معیارهای تحلیل واریانس

این روش برای بررسی رابطه بین ویژگی های کیفی (اسمی) و یک متغیر کمی (مستمر) استفاده می شود. در واقع فرضیه برابری میانگین های حسابی چند نمونه را آزمایش می کند. بنابراین می توان آن را به عنوان یک معیار پارامتریک برای مقایسه مرکز چند نمونه به طور همزمان در نظر گرفت. اگر از این روش برای دو نمونه استفاده کنید، نتایج آنالیز واریانس با نتایج آزمون t دانشجوی یکسان خواهد بود. با این حال، بر خلاف معیارهای دیگر، این مطالعه به شما امکان می دهد تا مشکل را با جزئیات بیشتری مطالعه کنید.

تجزیه و تحلیل واریانس در آمار بر اساس قانون است: مجموع مجذور انحرافات نمونه ترکیبی برابر است با مجموع مجذورات انحرافات درون گروهی و مجموع مربعات انحرافات بین گروهی. برای مطالعه، از آزمون فیشر برای تعیین اهمیت تفاوت بین واریانس‌های بین گروهی و درون گروهی استفاده می‌شود. با این حال، برای این، پیش نیازهای لازم نرمال بودن توزیع و هموسکداستی (برابری واریانس ها) نمونه ها است. بین تحلیل واریانس تک بعدی (تک عاملی) و چند متغیری (چند عاملی) تمایز قائل شوید. اولی وابستگی مقدار مورد مطالعه را به یک ویژگی در نظر می گیرد، دومی - به طور همزمان به بسیاری از آنها، و همچنین به شما امکان می دهد رابطه بین آنها را شناسایی کنید.

عوامل

عواملی را شرایط کنترل شده می گویند که بر نتیجه نهایی تأثیر می گذارد. سطح یا روش پردازش آن مقداری نامیده می شود که تظاهرات خاص این شرایط را مشخص می کند. این ارقام معمولاً در مقیاس اسمی یا ترتیبی اندازه گیری داده می شوند. اغلب مقادیر خروجی در مقیاس های کمی یا ترتیبی اندازه گیری می شوند. سپس مشکل گروه بندی داده های خروجی در یک سری مشاهدات که تقریباً با مقادیر عددی مشابهی مطابقت دارند وجود دارد. اگر تعداد گروه ها خیلی زیاد باشد، ممکن است تعداد مشاهدات در آنها برای به دست آوردن نتایج قابل اعتماد کافی نباشد. اگر تعداد خیلی کم باشد، این می تواند منجر به ضرر شود ویژگی های ضروریتاثیر بر سیستم روش خاص گروه بندی داده ها به حجم و ماهیت تغییرات در مقادیر بستگی دارد. تعداد و اندازه بازه ها در تحلیل تک متغیره اغلب با اصل فواصل مساوی یا با اصل فرکانس های برابر تعیین می شود.

وظایف تجزیه و تحلیل پراکندگی

بنابراین، مواردی وجود دارد که شما نیاز به مقایسه دو یا چند نمونه دارید. پس از آن است که توصیه می شود از تجزیه و تحلیل واریانس استفاده کنید. نام روش نشان می دهد که نتیجه گیری بر اساس مطالعه مولفه های واریانس انجام شده است. ماهیت مطالعه این است که تغییر کلی در شاخص به مؤلفه هایی تقسیم می شود که با عملکرد هر عامل جداگانه مطابقت دارد. تعدادی از مسائل را در نظر بگیرید که یک تحلیل واریانس معمولی آنها را حل می کند.

مثال 1

این کارگاه دارای تعدادی ماشین ابزار - ماشین های اتوماتیک است که قطعه خاصی را تولید می کند. اندازه هر قسمت یک مقدار تصادفی است که به تنظیمات هر دستگاه و انحرافات تصادفیناشی از فرآیند ساخت قطعات لازم است از اندازه گیری ابعاد قطعات مشخص شود که آیا ماشین آلات به همین ترتیب تنظیم شده اند یا خیر.

مثال 2

در طول ساخت یک دستگاه الکتریکی از انواع کاغذ عایق استفاده می شود: خازن، الکتریکی و غیره. دستگاه را می توان با مواد مختلفی آغشته کرد: رزین اپوکسی، لاک، رزین ML-2 و غیره. فشار بالا، هنگام گرم شدن. می توان آن را با غوطه ور شدن در لاک، زیر یک جریان مداوم لاک و غیره آغشته کرد. دستگاه الکتریکی به طور کلی با یک ترکیب خاص ریخته می شود که گزینه های مختلفی وجود دارد. شاخص های کیفیت عبارتند از قدرت دی الکتریک عایق، دمای بیش از حد گرم شدن سیم پیچ در حالت کار، و تعدادی دیگر. در طول توسعه فرآیند فناوری ساخت دستگاه ها، لازم است مشخص شود که هر یک از عوامل ذکر شده چگونه بر عملکرد دستگاه تأثیر می گذارد.

مثال 3

دپوی ترولی‌بوس چندین مسیر ترولی‌بوس را ارائه می‌کند. آنها انواع مختلف واگن برقی را اداره می کنند و 125 بازرس کرایه ها را جمع آوری می کنند. مدیریت انبار به این سوال علاقه مند است: چگونه می توان عملکرد اقتصادی هر کنترل کننده (درآمد) را با توجه به مسیرهای مختلف، انواع مختلف ترولی بوس مقایسه کرد؟ چگونه می توان امکان اقتصادی راه اندازی ترولی بوس های یک نوع خاص در یک مسیر خاص را تعیین کرد؟ چگونه می توان الزامات معقولی را برای میزان درآمدی که هادی در هر مسیر در انواع مختلف ترولی بوس به ارمغان می آورد ایجاد کرد؟

وظیفه انتخاب یک روش این است که چگونه می توان حداکثر اطلاعات را در رابطه با تأثیر بر نتیجه نهایی هر عامل، تعیین کرد ویژگی های عددیچنین تاثیری، قابلیت اطمینان آنها با حداقل هزینه و در کمترین زمان ممکن است. روش های تجزیه و تحلیل پراکندگی امکان حل چنین مشکلاتی را فراهم می کند.

تحلیل تک متغیره

هدف این مطالعه ارزیابی میزان تأثیر یک مورد خاص بر بررسی مورد تجزیه و تحلیل است. چالش دیگر تحلیل تک متغیرهممکن است دو یا چند وضعیت با یکدیگر مقایسه شوند تا تفاوت تأثیر آنها در فراخوان مشخص شود. اگر فرضیه صفر رد شود، مرحله بعدی کمی کردن و ایجاد فواصل اطمینان برای ویژگی های به دست آمده است. در مواردی که فرضیه صفر قابل رد نباشد، معمولاً پذیرفته می شود و در مورد ماهیت تأثیر نتیجه گیری می شود.

تجزیه و تحلیل واریانس یک طرفه می تواند به یک آنالوگ ناپارامتریک از روش رتبه بندی کروسکال-والیس تبدیل شود. این آزمون توسط ریاضیدان آمریکایی ویلیام کروسکال و اقتصاددان ویلسون والیس در سال 1952 ایجاد شد. این آزمون برای آزمایش این فرضیه صفر است که اثرات تأثیر بر نمونه های مورد مطالعه برابر با مقادیر میانگین ناشناخته اما برابر است. در این حالت تعداد نمونه ها باید بیشتر از دو باشد.

معیار Jonkhier (Jonkhier-Terpstra) به طور مستقل توسط ریاضیدان هلندی T. J. Terpstrom در سال 1952 و روانشناس بریتانیایی E. R. Jonkhier در سال 1954 پیشنهاد شد. این معیار زمانی استفاده می شود که از قبل مشخص شود که گروه های نتایج موجود با افزایش در مرتبه بندی شده اند. تأثیر عامل مورد مطالعه که در مقیاس ترتیبی اندازه گیری می شود.

M - معیار بارتلت که توسط آماردان بریتانیایی موریس استیونسون بارتلت در سال 1937 پیشنهاد شد، برای آزمون فرضیه صفر در مورد برابری واریانس چند جمعیت عمومی عادی که نمونه‌های مورد مطالعه از آنها گرفته شده است استفاده می‌شود که در حالت کلی دارای اندازه‌های مختلف هستند. (تعداد هر نمونه باید حداقل چهار عدد باشد).

ز - آزمون کوکران که توسط ویلیام جمل کوکران آمریکایی در سال 1941 کشف شد. برای آزمون فرضیه صفر در مورد برابری واریانس های جمعیت های عادی برای نمونه های مستقل با اندازه مساوی استفاده می شود.

تست ناپارامتری لوین که توسط ریاضیدان آمریکایی هاوارد لوین در سال 1960 پیشنهاد شد، جایگزینی برای آزمون بارتلت در شرایطی است که هیچ اطمینانی وجود ندارد که نمونه‌های مورد مطالعه اطاعت می‌کنند. توزیع نرمال.

در سال 1974، آماردانان آمریکایی مورتون بی براون و آلن بی. فورسایت آزمونی (آزمون براون-فورسایث) را پیشنهاد کردند که تا حدودی با آزمون لوین متفاوت است.

تحلیل دو طرفه

آنالیز واریانس دو طرفه برای نمونه‌های توزیع شده نرمال استفاده می‌شود. در عمل، جداول پیچیده این روش نیز اغلب استفاده می شود، به ویژه آنهایی که در آن هر سلول حاوی مجموعه ای از داده ها (اندازه گیری های مکرر) مربوط به مقادیر سطح ثابت است. اگر مفروضات لازم برای اعمال تحلیل واریانس دو طرفه برآورده نشد، از آزمون رتبه ناپارامتریک فریدمن (فریدمن، کندال و اسمیت) که توسط اقتصاددان آمریکایی میلتون فریدمن در پایان سال 1930 تهیه شد، استفاده می شود. این معیار به نوع توزیع بستگی ندارد.

فقط فرض بر این است که توزیع کمیت ها یکسان و پیوسته است و خود آنها مستقل از یکدیگر هستند. هنگام آزمایش فرضیه صفر، داده های خروجی به شکل یک ماتریس مستطیلی ارائه می شود که در آن ردیف ها با سطوح عامل B و ستون ها مربوط به سطوح A هستند. هر خانه از جدول (بلوک) می تواند نتیجه اندازه گیری پارامترها روی یک شی یا روی گروهی از اشیاء باشد مقادیر ثابتسطوح هر دو عامل در این مورد، داده های مربوطه به عنوان مقادیر متوسط ​​یک پارامتر خاص برای تمام اندازه گیری ها یا اشیاء نمونه مورد مطالعه ارائه می شود. برای اعمال معیار خروجی باید از نتایج مستقیم اندازه گیری ها به رتبه آنها حرکت کرد. رتبه بندی برای هر ردیف به طور جداگانه انجام می شود، یعنی مقادیر برای هر مقدار ثابت مرتب می شوند.

آزمون Page (آزمون L) که توسط آماردان آمریکایی E. B. Page در سال 1963 ارائه شد، برای آزمون فرضیه صفر طراحی شده است. برای نمونه های بزرگ، از تقریب Page استفاده می شود. آنها با توجه به واقعیت فرضیه های صفر مربوطه، از توزیع نرمال استاندارد تبعیت می کنند. در مواردی که سطرهای جدول منبع دارای مقادیر یکسانی هستند، لازم است از میانگین رتبه‌ها استفاده شود. در این صورت، دقت نتیجه‌گیری‌ها هر چه بدتر باشد، تعداد چنین تصادفی‌ها بیشتر می‌شود.

س - معیار کوکران، پیشنهاد شده توسط وی. . فرضیه صفر شامل برابری اثرات تأثیر است. تجزیه و تحلیل واریانس دو طرفه تعیین وجود اثرات پردازش را ممکن می کند، اما تعیین اینکه این اثر برای کدام ستون ها وجود دارد را ممکن نمی سازد. برای حل این مشکل، روش معادلات چندگانه Scheffe برای نمونه های مرتبط.

تحلیل چند متغیره

مشکل تحلیل واریانس چند متغیره زمانی مطرح می شود که تعیین تأثیر دو یا چند شرط بر روی یک متغیر تصادفی خاص ضروری باشد. این مطالعه وجود یک متغیر تصادفی وابسته را که در مقیاس تفاوت یا نسبت اندازه‌گیری می‌شود، و چندین متغیر مستقل، که هر یک در مقیاس نام‌ها یا در مقیاس رتبه‌ای بیان می‌شوند، فراهم می‌کند. تجزیه و تحلیل پراکندگی داده ها شاخه ای نسبتاً توسعه یافته از آمار ریاضی است که گزینه های زیادی دارد. مفهوم مطالعه برای مطالعات تک متغیره و چند متغیره مشترک است. ماهیت آن در این واقعیت نهفته است که واریانس کل به اجزایی تقسیم می شود که با گروه بندی خاصی از داده ها مطابقت دارد. هر گروه بندی داده مدل خاص خود را دارد. در اینجا ما فقط مفاد اصلی لازم برای درک و استفاده عملی از پرکاربردترین انواع آن را در نظر خواهیم گرفت.

تحلیل واریانس عاملی مستلزم توجه دقیق به جمع آوری و ارائه داده های ورودی و به ویژه تفسیر نتایج است. در مقابل تک عاملی که نتایج آن را می توان به صورت مشروط در یک توالی مشخص قرار داد، نتایج دو عاملی نیاز به ارائه پیچیده تری دارد. وقتی سه، چهار یا بیشتر شرایط وجود داشته باشد، وضعیت حتی دشوارتر به وجود می آید. به همین دلیل، مدل به ندرت بیش از سه (چهار) شرایط را شامل می شود. یک مثال می تواند وقوع رزونانس در مقدار مشخصی از ظرفیت و القایی دایره الکتریکی باشد. تجلی یک واکنش شیمیایی با مجموعه خاصی از عناصر که سیستم از آن ساخته شده است. وقوع اثرات غیرعادی در سیستم های پیچیده تحت یک تصادف خاص از شرایط. وجود تعامل می تواند مدل سیستم را به طور اساسی تغییر دهد و گاهی منجر به تجدید نظر در ماهیت پدیده هایی شود که آزمایشگر با آنها سر و کار دارد.

تجزیه و تحلیل واریانس چند متغیره با آزمایش های مکرر

داده‌های اندازه‌گیری را اغلب می‌توان نه بر اساس دو، بلکه بر اساس عوامل بیشتری گروه‌بندی کرد. بنابراین، اگر با در نظر گرفتن شرایط (تولید کننده و مسیری که لاستیک ها در آن استفاده می شود)، تجزیه و تحلیل پراکندگی عمر لاستیک چرخ های ترولیباس را در نظر بگیریم، می توانیم فصلی را که طی آن لاستیک ها در آن استفاده می شود، به عنوان یک شرایط جداگانه تشخیص دهیم. استفاده می شود (یعنی: عملیات زمستانی و تابستانی). در نتیجه مشکل روش سه عاملی را خواهیم داشت.

در صورت وجود شرایط بیشتر، رویکرد همانند تحلیل دو طرفه است. در تمام موارد، مدل سعی در ساده سازی دارد. پدیده تأثیر متقابل دو عامل چندان ظاهر نمی شود و تعامل سه گانه فقط در موارد استثنایی رخ می دهد. آن تعاملاتی را که اطلاعات قبلی و دلایل خوبی برای در نظر گرفتن آن در مدل وجود دارد، بگنجانید. فرآیند جداسازی عوامل فردی و در نظر گرفتن آنها نسبتاً ساده است. بنابراین، اغلب تمایل به برجسته کردن شرایط بیشتر وجود دارد. شما نباید از این موضوع غافل شوید. هر چه شرایط بیشتر باشد، مدل قابل اعتماد کمتری می شود و احتمال خطا بیشتر می شود. خود مدل، که شامل تعداد زیادی متغیر مستقل است، تفسیر بسیار دشوار و برای استفاده عملی ناخوشایند می شود.

ایده کلی تحلیل واریانس

تجزیه و تحلیل واریانس در آمار روشی برای به دست آوردن نتایج مشاهداتی است که به شرایط مختلف همزمان و ارزیابی تأثیر آنها بستگی دارد. متغیر کنترل شده ای که با روش تأثیرگذاری بر موضوع مطالعه مطابقت دارد و در یک دوره زمانی معین مقدار مشخصی به دست می آورد، عامل نامیده می شود. آنها می توانند کیفی و کمی باشند. سطوح شرایط کمی مقدار معینی را در مقیاس عددی به دست می آورند. به عنوان مثال دما، فشار فشار، مقدار ماده است. عوامل کیفی مواد مختلف، روش های مختلف تکنولوژیکی، دستگاه ها، پرکننده ها هستند. سطوح آنها با مقیاس اسامی مطابقت دارد.

کیفیت نیز شامل نوع مواد بسته بندی، شرایط نگهداری فرم دوز می باشد. همچنین منطقی است که در صورت استفاده از مقیاس کمی، درجه سنگ زنی مواد خام، ترکیب کسری گرانول ها را که ارزش کمی دارند، اما تنظیم آن دشوار است، لحاظ شود. تعداد فاکتورهای کیفی به نوع شکل دارویی و همچنین خواص فیزیکی و تکنولوژیکی مواد دارویی بستگی دارد. به عنوان مثال، قرص ها را می توان از مواد کریستالی با فشرده سازی مستقیم به دست آورد. در این مورد، انتخاب مواد لغزنده و روان کننده کافی است.

نمونه هایی از فاکتورهای کیفیت برای انواع مختلف اشکال دارویی

  • تنتور.ترکیب عصاره گیری، نوع استخراج کننده، روش تهیه مواد اولیه، روش تولید، روش فیلتراسیون.
  • عصاره ها (مایع، غلیظ، خشک).ترکیب استخراج کننده، روش استخراج، نوع نصب، روش حذف مواد استخراج کننده و بالاست.
  • قرص.ترکیب مواد کمکی، پرکننده ها، مواد تجزیه کننده، چسباننده ها، روان کننده ها و روان کننده ها. روش تهیه تبلت، نوع تجهیزات فناورانه. نوع پوسته و اجزای آن، فیلم سازها، رنگدانه ها، رنگ ها، نرم کننده ها، حلال ها.
  • محلول های تزریقینوع حلال، روش فیلتراسیون، ماهیت تثبیت کننده ها و نگهدارنده ها، شرایط استریلیزاسیون، روش پرکردن آمپول.
  • شیاف.ترکیب پایه شیاف، روش به دست آوردن شیاف، پرکننده، بسته بندی.
  • پمادها.ترکیب پایه، اجزای ساختاری، روش تهیه پماد، نوع تجهیزات، بسته بندی.
  • کپسول.نوع مواد پوسته، روش تهیه کپسول، نوع نرم کننده، نگهدارنده، رنگ.
  • لمینت هاروش تولید، ترکیب، نوع تجهیزات، نوع امولسیفایر.
  • سیستم های تعلیق.نوع حلال، نوع تثبیت کننده، روش پراکندگی.

نمونه هایی از فاکتورهای کیفیت و سطوح آنها در فرآیند تولید تبلت مورد مطالعه قرار گرفته است

  • پودر خمیرمایه.نشاسته سیب زمینی، خاک رس سفید، مخلوطی از بی کربنات سدیم با اسید سیتریک، کربنات منیزیم بازی.
  • محلول اتصالآب، خمیر نشاسته، شربت قند، محلول متیل سلولز، محلول هیدروکسی پروپیل متیل سلولز، محلول پلی وینیل پیرولیدون، محلول پلی وینیل الکل.
  • ماده کشوییآئروسیل، نشاسته، تالک.
  • پرکننده.قند، گلوکز، لاکتوز، کلرید سدیم، فسفات کلسیم.
  • روان کننده.اسید استئاریک، پلی اتیلن گلیکول، پارافین.

مدل های تجزیه و تحلیل پراکندگی در مطالعه سطح رقابت پذیری دولت

یکی از مهمترین معیارهای ارزیابی وضعیت دولت که برای ارزیابی سطح رفاه و توسعه اجتماعی-اقتصادی آن به کار می رود، رقابت پذیری است، یعنی مجموعه ای از ویژگی های ذاتی اقتصاد ملی که تعیین کننده توانایی دولت است. دولت برای رقابت با سایر کشورها با تعیین مکان و نقش دولت در بازار جهانی، می توان یک استراتژی روشن برای تضمین امنیت اقتصادی در مقیاس بین المللی ایجاد کرد، زیرا این کلید روابط مثبت بین روسیه و همه بازیگران در بازار جهانی است: سرمایه گذاران. ، طلبکاران، دولت های ایالتی.

برای مقایسه سطح رقابت پذیری کشورها، کشورها با استفاده از شاخص های پیچیده که شامل شاخص های وزنی مختلف است، رتبه بندی می شوند. این شاخص ها بر اساس عوامل کلیدی موثر بر وضعیت اقتصادی، سیاسی و ... است. مجموعه ای از مدل ها برای مطالعه رقابت پذیری دولت استفاده از روش های تجزیه و تحلیل آماری چند بعدی را فراهم می کند (به ویژه، این تجزیه و تحلیل واریانس (آمار)، مدل سازی اقتصادسنجی، تصمیم گیری است) و شامل مراحل اصلی زیر است:

  1. تشکیل یک سیستم شاخص - شاخص.
  2. ارزیابی و پیش بینی شاخص های رقابت پذیری دولت.
  3. مقایسه شاخص ها-شاخص های رقابت پذیری دولت ها.

و حال بیایید محتوای مدل های هر یک از مراحل این مجموعه را در نظر بگیریم.

در مرحله اولبا کمک روش های مطالعه کارشناسی، مجموعه معقولی از شاخص های اقتصادی برای ارزیابی رقابت پذیری دولت با در نظر گرفتن ویژگی های توسعه آن بر اساس رتبه بندی های بین المللی و داده های بخش های آماری شکل می گیرد که منعکس کننده وضعیت کشور است. سیستم به عنوان یک کل و فرآیندهای آن. انتخاب این شاخص ها با نیاز به انتخاب مواردی توجیه می شود که به طور کامل، از نقطه نظر عمل، امکان تعیین سطح ایالت، جذابیت سرمایه گذاری آن و امکان بومی سازی نسبی تهدیدات بالقوه و واقعی موجود را فراهم می کند.

شاخص ها-شاخص های اصلی سیستم های رتبه بندی بین المللی شاخص ها هستند:

  1. رقابت جهانی (GCC).
  2. آزادی اقتصادی (IES).
  3. توسعه انسانی (HDI).
  4. تصورات فساد (CPI).
  5. تهدیدات داخلی و خارجی (IVZZ).
  6. پتانسیل برای نفوذ بین المللی (IPIP).

فاز دومارزیابی و پیش بینی شاخص های رقابت پذیری دولت را بر اساس رتبه بندی های بین المللی برای 139 کشور مورد مطالعه جهان فراهم می کند.

مرحله سوممقایسه شرایط رقابت پذیری کشورها را با استفاده از روش های همبستگی و تحلیل رگرسیون فراهم می کند.

با استفاده از نتایج مطالعه، می توان ماهیت فرآیندها را به طور کلی و برای اجزای فردی رقابت پذیری دولت تعیین کرد. فرضیه تأثیر عوامل و رابطه آنها را در سطح مناسبی از اهمیت آزمایش کنید.

اجرای مجموعه مدل های پیشنهادی نه تنها امکان ارزیابی وضعیت فعلی سطح رقابت و جذابیت سرمایه گذاری کشورها را فراهم می کند، بلکه به تجزیه و تحلیل کاستی های مدیریتی، جلوگیری از اشتباهات تصمیمات اشتباه و جلوگیری از توسعه بحران می پردازد. در ایالت

تحلیل واریانس

درس در رشته: "تحلیل سیستم"

هنرجوی مجری گر. 99 ISE-2 Zhbanov V.V.

دانشگاه ایالتی اورنبورگ

دانشکده فناوری اطلاعات

گروه انفورماتیک کاربردی

اورنبورگ-2003

مقدمه

هدف کار: آشنایی با روش آماری مانند تحلیل واریانس.

تجزیه و تحلیل واریانس (از لاتین Dispersio - پراکندگی) یک روش آماری است که به شما امکان می دهد تأثیر عوامل مختلف را بر متغیر مورد مطالعه تجزیه و تحلیل کنید. این روش توسط بیولوژیست R. Fisher در سال 1925 توسعه یافت و در ابتدا برای ارزیابی آزمایشات در تولید محصول استفاده شد. بعدها، اهمیت علمی کلی تجزیه و تحلیل پراکندگی برای آزمایشات در روانشناسی، آموزش، پزشکی و غیره مشخص شد.

هدف از تجزیه و تحلیل واریانس، آزمایش اهمیت تفاوت بین میانگین ها با مقایسه واریانس ها است. واریانس ویژگی اندازه گیری شده به عبارات مستقلی تجزیه می شود که هر یک از آنها تأثیر یک عامل خاص یا تعامل آنها را مشخص می کند. مقایسه بعدی چنین عباراتی به ما امکان می دهد تا اهمیت هر یک از عوامل مورد مطالعه و همچنین ترکیب آنها /1/ را ارزیابی کنیم.

اگر فرضیه صفر درست باشد (در مورد برابری میانگین ها در چندین گروه از مشاهدات انتخاب شده از جمعیت عمومی)، تخمین واریانس مرتبط با تنوع درون گروهی باید نزدیک به برآورد واریانس بین گروهی باشد.

هنگام انجام تحقیقات بازار، اغلب سؤال مقایسه نتایج مطرح می شود. به عنوان مثال، هنگام انجام نظرسنجی در مورد مصرف یک محصول خاص در مناطق مختلف کشور، باید در مورد اینکه چگونه داده های نظرسنجی با یکدیگر متفاوت هستند یا تفاوتی ندارند، نتیجه گیری کرد. مقایسه شاخص های فردی معنی ندارد و بنابراین روش مقایسه و ارزیابی بعدی با توجه به برخی از مقادیر متوسط ​​و انحرافات از این ارزیابی میانگین انجام می شود. تنوع این صفت در حال مطالعه است. واریانس را می توان به عنوان معیاری برای تغییر در نظر گرفت. پراکندگی σ 2 اندازه گیری تغییرات است که به عنوان میانگین انحرافات یک مشخصه مجذور تعریف می شود.

در عمل، اغلب مشکلات ایجاد می شود عمومی- وظایف بررسی اهمیت تفاوت ها در میانگین نمونه های نمونه چند جمعیت. به عنوان مثال، بررسی تأثیر مواد اولیه مختلف بر کیفیت محصولات، برای حل مشکل تأثیر مقدار کود بر عملکرد محصولات کشاورزی ضروری است.

گاهی اوقات از تحلیل واریانس برای تعیین همگنی چند جمعیت استفاده می شود (واریانس این جمعیت ها بر اساس فرض یکسان است؛ اگر تجزیه و تحلیل واریانس نشان دهد که انتظارات ریاضی یکسان است، جمعیت ها از این نظر همگن هستند). جمعیت های همگن را می توان در یک ترکیب کرد و در نتیجه اطلاعات کامل تری در مورد آن به دست آورد و در نتیجه نتیجه گیری های قابل اعتماد تری به دست آورد /2/.

1 تجزیه و تحلیل واریانس

1.1 مفاهیم اساسی تحلیل واریانس

در فرآیند مشاهده شی مورد مطالعه، عوامل کیفی خودسرانه یا به صورت از پیش تعیین شده تغییر می کنند. اجرای خاص یک عامل (به عنوان مثال، یک رژیم دمایی خاص، تجهیزات یا مواد انتخاب شده) سطح فاکتور یا روش پردازش نامیده می شود. مدل ANOVA با سطوح ثابت عوامل مدل I و مدل با عوامل تصادفی مدل II نامیده می شود. با تغییر عامل، می توان تأثیر آن را بر میزان پاسخ بررسی کرد. در حال حاضر، تئوری کلی تحلیل واریانس برای مدل های I توسعه یافته است.

بسته به تعداد عواملی که تغییر ویژگی حاصل را تعیین می کنند، تجزیه و تحلیل واریانس به تک عاملی و چند عاملی تقسیم می شود.

طرح های اصلی برای سازماندهی داده های اولیه با دو یا چند عامل عبارتند از:

طبقه بندی متقابل، مشخصه مدل های I، که در آن هر سطح از یک عامل با هر درجه بندی عامل دیگر هنگام برنامه ریزی آزمایش ترکیب می شود.

طبقه بندی سلسله مراتبی (تودرتو)، مشخصه مدل II، که در آن هر مقدار به طور تصادفی انتخاب شده از یک عامل با زیر مجموعه مقادیر خود عامل دوم مطابقت دارد.

اگر وابستگی پاسخ به عوامل کمی و کیفی به طور همزمان بررسی شود، یعنی. عوامل مختلط، سپس از تحلیل کوواریانس استفاده شد /3/.

بنابراین، این مدل ها در نحوه انتخاب سطوح عامل با یکدیگر تفاوت دارند که بدیهی است که در درجه اول امکان تعمیم نتایج به دست آمده را تحت تأثیر قرار می دهد. نتایج تجربی. برای تحلیل واریانس آزمایش‌های تک عاملی، تفاوت این دو مدل چندان معنادار نیست، اما در تحلیل واریانس چند متغیره می‌تواند بسیار مهم باشد.

هنگام انجام تجزیه و تحلیل واریانس، فرضیات آماری زیر باید رعایت شود: صرف نظر از سطح عامل، مقادیر پاسخ دارای یک قانون توزیع نرمال (گاوسی) و واریانس یکسان هستند. به این برابری پراکندگی ها همگنی می گویند. بنابراین، تغییر روش پردازش تنها بر موقعیت متغیر تصادفی پاسخ، که با مقدار متوسط ​​یا میانه مشخص می شود، تأثیر می گذارد. بنابراین، تمام مشاهدات پاسخ متعلق به خانواده تغییر توزیع های نرمال است.

گفته می شود تکنیک ANOVA "محکم" است. این اصطلاح که توسط آماردانان استفاده می شود به این معنی است که این مفروضات را می توان تا حدی نقض کرد، اما با وجود این، می توان از این تکنیک استفاده کرد.

هنگامی که قانون توزیع مقادیر پاسخ ناشناخته است، از روش های تحلیل ناپارامتریک (اغلب رتبه ای) استفاده می شود.

تجزیه و تحلیل واریانس بر اساس تقسیم واریانس به قطعات یا اجزا است. تغییرات ناشی از تأثیر عامل زیربنایی گروه بندی با پراکندگی بین گروهی σ 2 مشخص می شود. این معیاری است برای تغییر میانگین جزئی برای گروه ها حول میانگین مشترک و با فرمول تعیین می شود:

,

که در آن k تعداد گروه ها است.

n j تعداد واحدهای گروه j است.

میانگین خصوصی برای گروه j;

میانگین کلی جمعیت واحدها.

تغییرات ناشی از تأثیر عوامل دیگر در هر گروه با پراکندگی درون گروهی σj2 مشخص می شود.

.

بین واریانس کل σ 0 2 ، واریانس درون گروهی σ 2 و واریانس بین گروهی رابطه وجود دارد:

σ 0 2 = + σ 2 .

واریانس درون گروهی تأثیر عواملی را که هنگام گروه بندی در نظر گرفته نشده اند توضیح می دهد و واریانس بین گروهی تأثیر عوامل گروه بندی را بر میانگین گروه /2/ توضیح می دهد.

1.2 تجزیه و تحلیل واریانس یک طرفه

مدل پراکندگی یک عاملی به شکل زیر است:

x ij = μ + F j + ε ij , (1)

که در آن х ij مقدار متغیر مورد مطالعه به دست آمده در سطح i ضریب (i=1,2,...,т) c j-ام ترتیبیعدد (j=1,2,...,n);

F i اثر ناشی از تأثیر سطح i-ام عامل است.

ε ij یک جزء تصادفی یا اختلال ناشی از تأثیر عوامل غیرقابل کنترل است. تنوع در یک سطح

پیش نیازهای اساسی برای تحلیل واریانس:

انتظار ریاضی اغتشاش ε ij برابر با صفر برای هر i است، یعنی.

M(ε ij) = 0; (2)

آشفتگی ε ij متقابلا مستقل هستند.

واریانس متغیر x ij (یا اغتشاش ε ij) برای آن ثابت است

هر i، j، i.e.

D(ε ij) = σ 2 ; (3)

متغیر x ij (یا اغتشاش ε ij) دارد قانون عادی

توزیع N(0؛ σ2).

تأثیر سطوح عامل می تواند ثابت یا سیستماتیک (مدل I) یا تصادفی (مدل II) باشد.

به عنوان مثال، لازم است بفهمیم که آیا تفاوت های قابل توجهی بین دسته های محصولات از نظر برخی از شاخص های کیفیت وجود دارد، یعنی. بررسی تاثیر بر کیفیت یک عامل - دسته ای از محصولات. اگر تمام دسته‌های مواد خام در مطالعه گنجانده شوند، تأثیر سطح چنین عاملی سیستماتیک است (مدل I) و یافته‌ها فقط برای آن دسته از دسته‌های فردی که در مطالعه شرکت داشتند قابل اعمال است. اگر فقط بخشی از احزاب را به طور تصادفی انتخاب کنیم، تأثیر عامل تصادفی است (مدل II). در مجتمع های چند عاملی، یک مدل مخلوط III امکان پذیر است که در آن برخی از عوامل دارای سطوح تصادفی هستند، در حالی که برخی دیگر ثابت هستند.

اجازه دهید تعداد دسته ای از محصولات وجود داشته باشد. از هر دسته، به ترتیب، n 1، n 2، ...، nm محصول انتخاب شد (برای سادگی، فرض می شود که n 1 =n 2 =...=n m =n). مقادیر شاخص کیفیت این محصولات در ماتریس مشاهده ارائه شده است:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

………………… = (x ij)، (i = 1.2، …، m؛ j = 1.2، …، n).

x m 1 x m 2 … x mn

بررسی اهمیت تأثیر دسته های محصولات بر کیفیت آنها ضروری است.

اگر فرض کنیم که عناصر ردیف های ماتریس مشاهده مقادیر عددی متغیرهای تصادفی X 1 , X 2 ,..., X m هستند که بیانگر کیفیت محصولات و داشتن قانون توزیع نرمال با انتظارات ریاضی هستند. به ترتیب 1، a 2،...، a m و واریانس های یکسان σ 2، سپس این کار به آزمایش فرضیه صفر کاهش می یابد H 0: a 1 =a 2 =...= a m، در تجزیه و تحلیل واریانس

میانگین گیری بیش از برخی از شاخص ها به جای شاخص با یک ستاره (یا یک نقطه) نشان داده می شود، سپس شاخص کیفیت متوسط ​​محصولات دسته i یا میانگین گروه برای سطح i ضریب، برابر خواهد بود. فرم:

جایی که i * مقدار متوسط ​​روی ستون ها است.

Ij عنصری از ماتریس مشاهده است.

n حجم نمونه است.

و میانگین کلی:

. (5)

مجموع مجذور انحراف مشاهدات x ij از میانگین کل ** به صورت زیر است:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

جمله آخر صفر است

از آنجایی که مجموع انحرافات مقادیر متغیر از میانگین آن برابر با صفر است، یعنی.

2 =0.

عبارت اول را می توان به صورت زیر نوشت:

نتیجه یک هویت است:

Q = Q 1 + Q 2 ، (8)

جایی که - مجموع مجذور انحرافات کل یا کل.

- مجموع مجذور انحرافات گروه به معنای از میانگین کل یا مجموع مجذور انحرافات بین گروهی (عاملی).

- مجموع انحرافات مجذور مشاهدات از میانگین گروهی، یا مجموع مجذور انحرافات درون گروهی (باقیمانده).

بسط (8) حاوی ایده اصلی تحلیل واریانس است. در رابطه با مسئله مورد بررسی، برابری (8) نشان می دهد که تغییرات کلی شاخص کیفیت، اندازه گیری شده با مجموع Q، از دو جزء - Q 1 و Q 2 تشکیل شده است که متغیر بودن این شاخص را بین دسته ها مشخص می کند (Q 1 ) و تغییرپذیری در دسته ها (Q2)، که تغییرات یکسانی را برای همه دسته ها تحت تأثیر عوامل نامشخص مشخص می کند.

در تحلیل واریانس، خود مجموع انحرافات مجذور آنالیز نمی شود، بلکه به اصطلاح مجذورات میانگین که تخمین های بی طرفانه از واریانس های مربوطه هستند، که از تقسیم مجموع انحرافات مجذور بر تعداد درجات مربوطه به دست می آیند، تحلیل می شوند. آزادی

تعداد درجات آزادی به عنوان تعداد کل مشاهدات منهای تعداد معادلات مربوط به آنها تعریف می شود. بنابراین، برای میانگین مربع s 1 2، که یک تخمین بی طرفانه از واریانس بین گروهی است، از تعداد درجات آزادی k 1 = m-1، زیرا گروه m به معنای به هم پیوسته با یک معادله (5) در محاسبه آن استفاده می شود. و برای میانگین مربع s22، که یک تخمین بی طرفانه از واریانس درون گروهی است، تعداد درجات آزادی k2=mn-m است، زیرا آن را با استفاده از تمام مشاهدات mn که با معادلات m (4) به هم مرتبط هستند محاسبه می شود.

به این ترتیب:

اگر انتظارات ریاضی مجذورهای میانگین را پیدا کنیم و عبارت xij (1) را در فرمول های آنها از طریق پارامترهای مدل جایگزین کنیم، به دست می آوریم:

(9)

زیرا با در نظر گرفتن ویژگی های انتظار ریاضی

آ

(10)

برای مدل I با سطوح ثابت ضریب F i (i=1,2,...,m) مقادیر غیر تصادفی هستند، بنابراین

M(S) = 2 /(m-1) +σ2.

فرضیه H 0 به شکل F i = F * (i = 1,2,...,m) است، یعنی. تأثیر همه سطوح عامل یکسان است. اگر این فرضیه درست باشد

M(S)= M(S)= σ 2 .

برای مدل تصادفی II، عبارت F i در عبارت (1) یک مقدار تصادفی است. نشان دادن آن با واریانس

ما از (9) دریافت می کنیم

(11)

و مانند مدل I

جدول 1.1 یک نمای کلی از محاسبه مقادیر با استفاده از تحلیل واریانس ارائه می دهد.

جدول 1.1 - جدول پایه تحلیل واریانس

اجزای واریانس

مجموع مربعات

تعداد درجات آزادی

مربع متوسط

میانگین انتظار مربع

بین گروهی

درون گروهی

فرضیه H 0 به شکل σ F 2 = 0 خواهد بود. اگر این فرضیه درست باشد

M(S)= M(S)= σ 2 .

در مورد یک کمپلکس تک عاملی برای هر دو مدل I و مدل II، میانگین مربعات S 2 و S 2 بی طرف هستند و ارزیابی های مستقلهمان پراکندگی σ 2 .

در نتیجه، آزمایش فرضیه صفر H 0 به آزمایش اهمیت تفاوت بین تخمین‌های نمونه بی‌طرف S و S از واریانس σ 2 کاهش یافت.

فرضیه H 0 رد می شود اگر مقدار واقعی محاسبه شده آمار F = S/S از مقدار بحرانی F α بیشتر باشد: K 1: K 2 که در سطح معنی داری α با تعداد درجات آزادی k 1 = m تعریف شده است. -1 و k2 =mn-m، و اگر F پذیرفته شود< F α: K 1: K 2 .

توزیع فیشر F (برای x > 0) تابع چگالی زیر را دارد (برای = 1، 2، ...؛ = 1، 2، ...):

جایی که - درجات آزادی؛

G - تابع گاما.

در رابطه با این مشکل، رد فرضیه H 0 به معنای وجود تفاوت های قابل توجه در کیفیت محصولات دسته های مختلف در سطح اهمیت مورد بررسی است.

برای محاسبه مجموع مربع های Q 1 ، Q 2 ، Q اغلب استفاده از فرمول های زیر راحت است:

(12)

(13)

(14)

آن ها به طور کلی نیازی به یافتن خود میانگین ها نیست.

بنابراین، روش تجزیه و تحلیل واریانس یک طرفه آزمایش فرضیه H 0 است که یک گروه از داده های تجربی همگن وجود دارد در مقابل گزینه ای که بیش از یک گروه از این قبیل وجود دارد. همگنی به یکسانی میانگین ها و واریانس ها در هر زیر مجموعه ای از داده ها اشاره دارد. در این مورد، واریانس ها می توانند از قبل هم شناخته شده و هم ناشناخته باشند. اگر دلیلی وجود داشته باشد که واریانس شناخته شده یا ناشناخته اندازه گیری ها در کل مجموعه داده یکسان است، وظیفه تحلیل واریانس یک طرفه به مطالعه اهمیت تفاوت میانگین ها در گروه های داده کاهش می یابد / 1/.

1.3 پراکندگی چند متغیره تحلیل و بررسی

فوراً باید توجه داشت که هیچ تفاوت اساسی بین تحلیل واریانس چند متغیره و تک عاملی وجود ندارد. تجزیه و تحلیل چند متغیره منطق کلی تحلیل واریانس را تغییر نمی دهد، بلکه فقط تا حدودی آن را پیچیده می کند، زیرا علاوه بر در نظر گرفتن تأثیر هر یک از عوامل بر متغیر وابسته به طور جداگانه، اثر ترکیبی آنها نیز باید ارزیابی شود. بنابراین، چیز جدیدی که تحلیل واریانس چند متغیره برای تجزیه و تحلیل داده ها به ارمغان می آورد، عمدتاً به توانایی ارزیابی تعامل بین عاملی مربوط می شود. با این حال، هنوز هم می توان تأثیر هر یک از عوامل را به طور جداگانه ارزیابی کرد. از این نظر، روش تحلیل واریانس چند متغیره (در نوع استفاده از رایانه آن) بدون شک مقرون به صرفه تر است، زیرا تنها در یک اجرا دو مشکل را همزمان حل می کند: تأثیر هر یک از عوامل و تعامل آنها تخمین زده می شود / 3/.

طرح کلی یک آزمایش دو عاملی که داده های آن با تحلیل واریانس پردازش می شود به شرح زیر است:



شکل 1.1 - طرح یک آزمایش دو عاملی

داده هایی که تحت تحلیل واریانس چند متغیره قرار می گیرند اغلب بر اساس تعداد عوامل و سطوح آنها برچسب گذاری می شوند.

با فرض اینکه در مشکل در نظر گرفته شده کیفیت m batch های مختلف، محصولات بر روی ماشین های t مختلف تولید شده اند و باید مشخص شود که آیا تفاوت های قابل توجهی در کیفیت محصولات برای هر عامل وجود دارد یا خیر:

الف - دسته ای از محصولات؛

ب - ماشین.

نتیجه انتقال به مسئله تحلیل واریانس دو عاملی است.

تمام داده ها در جدول 1.2 ارائه شده است که در آن ردیف ها - سطوح A i عامل A، ستون ها - سطوح B j از فاکتور B، و در سلول های مربوطه جدول مقادیر شاخص کیفیت محصول x ijk هستند. (i = 1.2، ...،m؛ j=1،2،...،l؛ k=1،2،...،n).

جدول 1.2 - شاخص های کیفیت محصول

x 11 لیتر، …، x 11k

x 12 لیتر، …، x 12k

x 1jl،…،x 1jk

x 1ll،…،x 1lk

x 2 1l ,…,x 2 1k

x 22 لیتر،…، x 22k

x 2jl،…،x 2jk

x 2ll،…،x 2lk

x i1l،…،x i1k

x i2l،…،x i2k

xijl,…,xijk

xjll،…،xjlk

x m1l،…،x m1k

x m2l،…،x m2k

xmjl،…، xmjk

x ml,…,x mlk

مدل پراکندگی دو عاملی به شکل زیر است:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

که در آن x ijk مقدار مشاهده در سلول ij با عدد k است.

μ - میانگین کلی؛

F i - اثر ناشی از تأثیر سطح i-ام عامل A.

G j - اثر ناشی از تأثیر سطح j-ام عامل B.

I ij - اثر ناشی از تعامل دو عامل، i.e. انحراف از میانگین برای مشاهدات در سلول ij از مجموع سه جمله اول در مدل (15).

ε ijk - آشفتگی ناشی از تغییر متغیر در یک سلول واحد.

فرض بر این است که ε ijk دارای توزیع نرمال N(0؛ с 2) است و تمام انتظارات ریاضی F * , G * , I i * , I * j برابر با صفر هستند.

میانگین گروه ها با فرمول های زیر بدست می آید:

در سلول:

توسط خط:

بر اساس ستون:

میانگین کلی:

جدول 1.3 یک نمای کلی از محاسبه مقادیر با استفاده از تحلیل واریانس ارائه می دهد.

جدول 1.3 - جدول پایه تحلیل واریانس

اجزای واریانس

مجموع مربعات

تعداد درجات آزادی

مربع های میانی

بین گروهی (عامل A)

بین گروهی (عامل B)

اثر متقابل

باقیمانده

بررسی فرضیه های صفر HA، HB، HAB در مورد عدم تأثیر بر متغیر در نظر گرفته شده عوامل A، B و برهمکنش آنها AB با مقایسه نسبت ها، (برای مدل I با سطوح ثابت عوامل) یا نسبت ها انجام می شود. ، (برای مدل تصادفی II) با مقادیر جدولی مربوطه F - معیار Fisher-Snedecor. برای مدل آمیخته III، آزمون فرضیه‌های مربوط به عوامل با سطوح ثابت به همان روشی که در مدل II و برای عوامل با سطوح تصادفی مانند مدل I انجام می‌شود.

اگر n=1 باشد، یعنی با یک مشاهده در سلول، نمی توان همه فرضیه های صفر را آزمایش کرد، زیرا مولفه Q3 از مجموع مجذور مجذور انحرافات و با آن مجذور میانگین خارج می شود، زیرا در این مورد نمی توان بحثی در مورد تعامل عوامل.

از نقطه نظر تکنیک محاسباتی، برای یافتن مجموع مربع های Q 1، Q 2، Q 3، Q 4، Q بهتر است از فرمول های زیر استفاده شود:

Q 3 \u003d Q - Q 1 - Q 2 - Q 4.

انحراف از پیش نیازهای اساسی تحلیل واریانس - نرمال بودن توزیع متغیر مورد مطالعه و برابری واریانس ها در سلول ها (اگر بیش از حد نباشد) - تأثیر قابل توجهی بر نتایج تجزیه و تحلیل واریانس با یک تعداد مشاهدات در سلول ها برابر است، اما اگر تعداد آنها نابرابر باشد، می تواند بسیار حساس باشد. علاوه بر این، با تعداد نابرابر مشاهدات در سلول ها، پیچیدگی دستگاه برای تجزیه و تحلیل واریانس به شدت افزایش می یابد. بنابراین، توصیه می شود طرحی با تعداد مساوی مشاهدات در سلول ها طراحی شود و در صورت وجود داده های گم شده، آنها را با مقادیر متوسط ​​سایر مشاهدات در سلول ها جبران کنید. با این حال، در این مورد، داده های گمشده به طور مصنوعی معرفی شده نباید هنگام محاسبه تعداد درجات آزادی /1/ در نظر گرفته شوند.

2 کاربرد ANOVA در فرآیندها و مطالعات مختلف

2.1 استفاده از تحلیل واریانس در مطالعه فرآیندهای مهاجرت

مهاجرت یک پدیده اجتماعی پیچیده است که تا حد زیادی جنبه های اقتصادی و سیاسی جامعه را تعیین می کند. مطالعه فرآیندهای مهاجرت با شناسایی عوامل مورد علاقه، رضایت از شرایط کاری و ارزیابی تأثیر عوامل به دست آمده بر حرکت بین گروهی جمعیت همراه است.

λ ij = c i q ij a j ,

که در آن λ ij شدت انتقال از گروه اصلی i (خروجی) به گروه جدید j (ورودی) است.

c i - امکان و توانایی ترک گروه i (c i ≥0)؛

q ij – جذابیت گروه جدیددر مقایسه با اصلی (0≤q ij ≤1)؛

a j – در دسترس بودن گروه j (a j ≥0).

ν ij ≈ n i λ ij =n i c i q ij a j . (16)

در عمل، برای یک فرد، احتمال p برای رفتن به گروه دیگر کم است و اندازه گروه n مورد بررسی زیاد است. در این مورد، قانون رویدادهای نادر اعمال می شود، یعنی حد ν ij توزیع پواسون با پارامتر μ=np است:

.

با افزایش μ، توزیع به نرمال نزدیک می شود. مقدار تبدیل شده √ν ij را می توان به طور معمول توزیع شده در نظر گرفت.

اگر لگاریتم بیان (16) را بگیریم و تغییرات لازم را در متغیرها ایجاد کنیم، می‌توانیم مدل تحلیل واریانس را بدست آوریم:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij ,

X i,j =2ln√ν ij -lnn i -lnq ij ,

Xi,j =Ci +Aj +ε.

مقادیر C i و A j به دست آوردن یک مدل ANOVA دو طرفه با یک مشاهده در هر سلول امکان پذیر است. تبدیل معکوس از C i و A j ضرایب c i و a j را محاسبه می کند.

هنگام انجام تحلیل واریانس، مقادیر زیر باید به عنوان مقادیر مشخصه مؤثر Y در نظر گرفته شوند:

X \u003d (X 1.1 + X 1.2 +: + X mi، mj) / mimj،

که در آن mimj تخمین انتظار ریاضی X i,j است.

X mi و X mj - به ترتیب تعداد گروه های خروجی و ورودی.

سطوح فاکتور I، گروه های خروجی mi، سطوح فاکتور J، گروه های ورودی mj خواهند بود. Mi=mj=m فرض شده است. مشکل از آزمون فرضیه‌های H I و H J در مورد برابری انتظارات ریاضی مقدار Y در سطوح I i و در سطوح Jj, i,j=1,…,m به وجود می‌آید. آزمایش فرضیه H I مبتنی بر مقایسه مقادیر تخمین های بی طرفانه واریانس sI 2 و s o 2 است. اگر فرضیه H I صحیح باشد، مقدار F (I) = s I 2 /s o 2 دارای توزیع فیشر با تعداد درجه آزادی k 1 =m-1 و k 2 =(m-1)(m- است. 1). برای سطح معناداری معین α، سمت راست نقطه بحرانی x pr,α cr. اگر مقدار عددی F (I) کمیت در بازه (x pr، α kr، +∞) قرار گیرد، فرضیه H I رد می شود و اعتقاد بر این است که عامل I بر ویژگی مؤثر تأثیر می گذارد. درجه این تأثیر، بر اساس نتایج مشاهدات، با ضریب تعیین نمونه‌گیری اندازه‌گیری می‌شود، که نشان می‌دهد چه نسبتی از واریانس ویژگی حاصل در نمونه به دلیل تأثیر عامل I بر آن است. من)

2.2 اصول تجزیه و تحلیل ریاضی و آماری داده های تحقیقات زیست پزشکی

بسته به وظیفه، حجم و ماهیت مواد، نوع داده ها و روابط آنها، انتخاب روش های پردازش ریاضی در مراحل مقدماتی (برای ارزیابی ماهیت توزیع در نمونه مورد مطالعه) و نیز وجود دارد. تجزیه و تحلیل نهایی مطابق با اهداف مطالعه. یک جنبه بسیار مهم، تأیید همگنی گروه‌های مشاهده انتخابی، از جمله گروه‌های کنترل است که می‌تواند توسط یک متخصص یا با روش‌های آمار چند متغیره (به عنوان مثال، با استفاده از تجزیه و تحلیل خوشه‌ای) انجام شود. اما اولین قدم، گردآوری پرسشنامه ای است که توصیف استانداردی از ویژگی ها را ارائه می دهد. مخصوصاً هنگام انجام مطالعات اپیدمیولوژیک، که در آن به وحدت در درک و توصیف علائم مشابه توسط پزشکان مختلف، از جمله در نظر گرفتن دامنه تغییرات (شدت) آنها نیاز است. اگر تفاوت های قابل توجهی در ثبت داده های اولیه (ارزیابی ذهنی ماهیت تظاهرات پاتولوژیک توسط متخصصان مختلف) و عدم امکان آوردن آنها به یک فرم واحد در مرحله جمع آوری اطلاعات وجود داشته باشد، به اصطلاح تصحیح کوواریانس می تواند انجام شود، که شامل نرمال سازی متغیرها است، یعنی. حذف ناهنجاری های شاخص ها در ماتریس داده ها. "هماهنگی نظرات" با در نظر گرفتن تخصص و تجربه پزشکان انجام می شود که سپس امکان مقایسه نتایج معاینه به دست آمده توسط آنها را با یکدیگر فراهم می کند. برای این منظور می توان از تحلیل واریانس چند متغیره و تحلیل رگرسیون استفاده کرد.

علائم می تواند از یک نوع باشد که نادر است و یا از انواع مختلف. این اصطلاح به ارزیابی متفاوت اندازه‌شناختی آنها اشاره دارد. علائم کمی یا عددی آنهایی هستند که در یک مقیاس معین و در مقیاس فواصل و نسبت (گروه I از علائم) اندازه گیری می شوند. کیفی، رتبه‌بندی یا امتیازدهی برای بیان اصطلاحات و مفاهیم پزشکی استفاده می‌شود که دارای مقادیر عددی نیستند (مثلاً شدت بیماری) و در مقیاس ترتیبی (گروه دوم علائم) اندازه‌گیری می‌شوند. طبقه بندی یا اسمی (به عنوان مثال، حرفه، گروه خون) - اینها در مقیاس نام ها (گروه III علائم) اندازه گیری می شوند.

در بسیاری از موارد، تلاش می شود تا تعداد بسیار زیادی از ویژگی ها مورد تجزیه و تحلیل قرار گیرد که باید به افزایش محتوای اطلاعاتی نمونه ارائه شده کمک کند. با این حال، انتخاب اطلاعات مفید، یعنی انتخاب ویژگی‌ها، یک عملیات کاملاً ضروری است، زیرا برای حل هر مشکل طبقه‌بندی، باید اطلاعاتی انتخاب شوند که حاوی اطلاعات مفید برای این کار باشند. اگر به دلایلی این کار توسط محقق به تنهایی انجام نشود یا معیارهای اثبات شده کافی برای کاهش ابعاد فضای ویژگی به دلایل معنی دار وجود نداشته باشد، مبارزه با افزونگی اطلاعات از قبل با روش های رسمی با ارزیابی اطلاعات انجام می شود. محتوا.

تجزیه و تحلیل واریانس به شما امکان می دهد تأثیر عوامل (شرایط) مختلف را بر روی صفت (پدیده) مورد مطالعه تعیین کنید که با تجزیه تنوع کل (پراکندگی بیان شده به عنوان مجموع انحرافات مجذور از میانگین عمومی) به اجزای منفرد ایجاد شده به دست می آید. تحت تأثیر منابع مختلف تنوع.

با کمک آنالیز واریانس، تهدیدات بیماری در حضور عوامل خطر بررسی می شود. مفهوم ریسک نسبی ارتباط بین بیماران مبتلا به یک بیماری خاص و افراد بدون آن را در نظر می گیرد. مقدار ریسک نسبی این امکان را فراهم می کند که تعیین کنیم احتمال بیماری در حضور آن چند برابر افزایش می یابد که می توان با استفاده از فرمول ساده شده زیر تخمین زد:

که در آن a وجود یک صفت در گروه مورد مطالعه است.

ب - عدم وجود یک صفت در گروه مورد مطالعه.

ج - وجود علامت در گروه مقایسه (کنترل)؛

د - عدم وجود علامت در گروه مقایسه (شاهد).

امتیاز خطر ویژگی (rA) برای ارزیابی نسبت عوارض مرتبط با یک عامل خطر معین استفاده می شود:

,

که در آن Q فراوانی صفت علامت گذاری ریسک در جمعیت است.

r" - خطر نسبی.

شناسایی عوامل مؤثر در بروز (تظاهر) بیماری، به عنوان مثال. عوامل خطر را می توان به روش های مختلفی انجام داد، به عنوان مثال، با ارزیابی محتوای اطلاعات با رتبه بندی بعدی علائم، که با این حال، بر خلاف استفاده از رگرسیون، تحلیل عاملی، اثر تجمعی پارامترهای انتخاب شده را نشان نمی دهد. روش های تئوری تشخیص الگو، که به دست آوردن "کمپلکس های علامتی" عوامل خطر را ممکن می سازد. علاوه بر این، روش های پیچیده تر امکان تجزیه و تحلیل روابط غیرمستقیم بین عوامل خطر و بیماری ها را فراهم می کند /5/.

2.3 سنجش زیستی خاک

آلاینده های متنوعی که وارد آگروسنوز می شوند، می توانند در آن دگرگونی های مختلفی داشته باشند و در عین حال اثر سمی خود را افزایش دهند. به همین دلیل، روش‌هایی برای ارزیابی یکپارچه کیفیت اجزای آگروسنوز ضروری بود. مطالعات بر اساس تجزیه و تحلیل واریانس چند متغیره در یک تناوب زراعی 11 مزرعه دانه-علف-ردیف انجام شد. در این آزمایش، تأثیر عوامل زیر مورد بررسی قرار گرفت: حاصلخیزی خاک (A)، سیستم کود (B)، سیستم حفاظت از گیاه (C). حاصلخیزی خاک، سیستم کود و سیستم حفاظت از گیاه در دوزهای 0، 1، 2 و 3 مورد مطالعه قرار گرفت. گزینه‌های اساسی با ترکیب‌های زیر نشان داده شدند:

000 - سطح اولیه باروری، بدون استفاده از کودها و محصولات محافظت از گیاهان از آفات، بیماری ها و علف های هرز.

111 - میانگین سطح حاصلخیزی خاک، حداقل دوز کود، حفاظت بیولوژیکی گیاهان از آفات و بیماری ها.

222 - سطح اولیه حاصلخیزی خاک، میانگین دوز کود، حفاظت شیمیایی گیاهان از علف های هرز.

333 - سطح بالای حاصلخیزی خاک، دوز بالای کود، حفاظت شیمیایی گیاهان از آفات و بیماری ها.

ما گزینه هایی را مطالعه کردیم که در آن تنها یک عامل وجود دارد:

200 - باروری:

020 - کودها؛

002 - محصولات حفاظت از گیاهان.

و همچنین گزینه هایی با ترکیبی متفاوت از عوامل - 111، 131، 133، 022، 220، 202، 331، 313، 311.

هدف از این مطالعه بررسی بازدارندگی کلروپلاست ها و ضریب رشد آنی، به عنوان شاخص های آلودگی خاک، در انواع مختلف یک آزمایش چند عاملی بود.

مهار فوتوتاکسی کلروپلاست های علف اردک در افق های مختلف خاک مورد مطالعه قرار گرفت: 0-20، 20-40 سانتی متر. سهم در پراکندگی کل حاصلخیزی خاک 39.7٪، سیستم های کود - 30.7٪، سیستم های حفاظت از گیاهان - 30.7٪ بود.

برای مطالعه اثر ترکیبی عوامل بر مهار فوتوتاکسی کلروپلاست، از ترکیبات مختلف انواع تجربی استفاده شد: در مورد اول - 000، 002، 022، 222، 220، 200، 202، 020، در مورد دوم - 111، 333، 331، 313، 133، 311، 131.

نتایج یک تجزیه و تحلیل واریانس دو طرفه نشان دهنده تأثیر معنی‌دار سیستم‌های برهمکنش کود و حفاظت گیاه بر تفاوت‌های فوتوتاکسی برای مورد اول است (سهم در واریانس کل 10.3٪ بود). برای مورد دوم، تأثیر قابل توجهی از برهمکنش حاصلخیزی خاک و سیستم کود (53.2٪) پیدا شد.

آنالیز واریانس سه طرفه در مورد اول تأثیر معنی داری بر اثر متقابل هر سه عامل را نشان داد. سهم در پراکندگی کل 47.9 درصد بود.

ضریب رشد آنی در انواع مختلف آزمایش 000، 111، 222، 333، 002، 200، 220 مورد بررسی قرار گرفت. استفاده از علف کش ها (اردیبهشت) و آخرین مورد در زمان برداشت (تیر) بود. پیشرو - آفتابگردان و ذرت برای غلات.

ظهور برگ های جدید پس از یک فاز تاخیر کوتاه با یک دوره دو برابر شدن کل وزن تر 2-4 روز مشاهده شد.

در شاهد و در هر واریته بر اساس نتایج به‌دست‌آمده، ضریب رشد آنی جمعیت r محاسبه و سپس زمان دو برابر شدن تعداد برگ‌ها (t دو برابر شدن) محاسبه شد.

t دو برابر می شود \u003d ln2 / r.

محاسبه این شاخص ها به صورت دینامیک با تجزیه و تحلیل نمونه های خاک انجام شد. تجزیه و تحلیل داده ها نشان داد که زمان دوبرابر شدن جمعیت اردک قبل از خاک ورزی در مقایسه با داده های پس از خاک ورزی و در زمان برداشت کوتاه ترین زمان بود. در دینامیک مشاهدات، پاسخ خاک پس از کاربرد علف کش و در زمان برداشت مورد توجه بیشتری است. اول از همه، تعامل با کودها و میزان باروری.

گاهی اوقات دریافت پاسخ مستقیم به استفاده از فرآورده‌های شیمیایی می‌تواند با برهمکنش این آماده‌سازی با کودهای آلی و معدنی پیچیده شود. داده‌های به‌دست‌آمده امکان ردیابی پویایی پاسخ آماده‌سازی‌های اعمال‌شده را در همه انواع با وسایل حفاظت شیمیایی، جایی که رشد نشانگر متوقف شد، می‌دهد.

داده های آنالیز واریانس یک طرفه تأثیر معنی داری هر شاخص را بر سرعت رشد علف اردک در مرحله اول نشان داد. در مرحله دوم، اثر تفاوت در حاصلخیزی خاک 65.0٪، در سیستم کود و سیستم حفاظت گیاه - 65.0٪ هر یک بود. فاکتورها تفاوت معنی داری را بین میانگین از نظر ضریب رشد لحظه ای گزینه 222 و گزینه 000، 111، 333 نشان دادند. در مرحله سوم، سهم در پراکندگی کل حاصلخیزی خاک 42.9 درصد، سیستم های کودی و حفاظت گیاه بود. سیستم ها - هر کدام 42.9٪. تفاوت معنی داری در مقادیر میانگین گزینه های 000 و 111، گزینه های 333 و 222 مشاهده شد.

نمونه‌های خاک مورد مطالعه از گزینه‌های پایش میدانی از نظر مهار فوتوتاکسی با یکدیگر متفاوت هستند. تأثیر عوامل باروری مورد اشاره قرار گرفت، سیستم کود و محصولات حفاظتی گیاهی با سهم 30.7 و 39.7 درصد در تجزیه و تحلیل تک عاملی، در تجزیه و تحلیل دو عاملی و سه عاملی، تأثیر مشترک عوامل ثبت شد.

تجزیه و تحلیل نتایج تجربی تفاوت های ناچیز بین افق های خاک از نظر شاخص مهار فوتوتاکسی را نشان داد. تفاوت ها با مقادیر متوسط ​​مشخص می شوند.

در تمام انواعی که محصولات حفاظتی گیاهی وجود دارد، تغییر در موقعیت کلروپلاست و توقف رشد اردک کمتر مشاهده می شود /6/.

2.4 آنفولانزا باعث افزایش تولید هیستامین می شود

محققان بیمارستان کودکان در پیتسبورگ (ایالات متحده آمریکا) اولین شواهدی را دریافت کردند که نشان می‌دهد سطح هیستامین با عفونت‌های ویروسی حاد تنفسی افزایش می‌یابد. علیرغم این واقعیت که قبلاً پیشنهاد شده بود که هیستامین در بروز علائم عفونت های حاد تنفسی دستگاه تنفسی فوقانی نقش داشته باشد.

دانشمندان علاقه مند بودند که چرا بسیاری از مردم از آنتی هیستامین ها، که در بسیاری از کشورها در رده OTC قرار می گیرند، برای خوددرمانی "سرماخوردگی" و سرماخوردگی استفاده می کنند. بدون نسخه پزشک در دسترس است.

هدف از این مطالعه تعیین اینکه آیا تولید هیستامین در طی عفونت تجربی ویروس آنفولانزای A افزایش می یابد یا خیر بود.

به 15 داوطلب سالم ویروس آنفولانزای A تزریق شد و سپس برای ایجاد عفونت مشاهده شد. روزانه در طول دوره بیماری، قسمت صبحگاهی ادرار از داوطلبان جمع‌آوری شد و سپس هیستامین و متابولیت‌های آن تعیین شد و میزان کل هیستامین و متابولیت‌های دفع شده در روز محاسبه شد.

این بیماری در همه 15 داوطلب ایجاد شد. تجزیه و تحلیل واریانس سطح بالاتری از هیستامین در ادرار در روزهای 2-5 عفونت ویروسی را تایید کرد (05/0 p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

نتایج این مطالعه به عنوان اولین شواهد مستقیم نشان می دهد که سطح هیستامین در عفونت های حاد تنفسی افزایش می یابد /7/.

تجزیه و تحلیل واریانس در شیمی

تجزیه و تحلیل پراکندگی مجموعه ای از روش ها برای تعیین پراکندگی، به عنوان مثال، ویژگی های اندازه ذرات در سیستم های پراکنده است. تجزیه و تحلیل پراکندگی شامل روش های مختلفی برای تعیین اندازه ذرات آزاد در محیط های مایع و گاز، اندازه کانال های منفذی در اجسام ریز متخلخل (در این مورد به جای مفهوم پراکندگی از مفهوم معادل تخلخل استفاده می شود) و همچنین مساحت سطح خاص برخی از روش های تجزیه و تحلیل پراکندگی به دست آوردن یک تصویر کامل از توزیع ذرات بر اساس اندازه (حجم) امکان پذیر است، در حالی که برخی دیگر فقط یک مشخصه متوسط ​​پراکندگی (تخلخل) را ارائه می دهند.

گروه اول شامل روش‌هایی برای تعیین اندازه ذرات جداگانه با اندازه‌گیری مستقیم (تحلیل غربال، میکروسکوپ نوری و الکترونی) یا با داده‌های غیرمستقیم است: میزان ته‌نشینی ذرات در یک محیط چسبناک (تحلیل رسوب در یک میدان گرانشی و در سانتریفیوژها)، بزرگی پالس های جریان الکتریکی، ناشی از عبور ذرات از سوراخی در یک پارتیشن غیر رسانا (روش رسانایی).

گروه دوم از روش ها ترکیبی از تخمین اندازه متوسط ​​ذرات آزاد و تعیین سطح ویژه پودرها و اجسام متخلخل است. اندازه متوسط ​​ذرات با شدت نور پراکنده (نفلومتری)، با استفاده از اولترامیکروسکوپ، روش های انتشار و غیره، سطح ویژه با جذب گازها (بخارها) یا مواد محلول، با نفوذپذیری گاز، سرعت انحلال، یافت می شود. و روش های دیگر در زیر محدودیت های کاربرد روش های مختلف آنالیز واریانس (اندازه ذرات بر حسب متر) آمده است:

آنالیز غربال - 10 -2 -10 -4

تجزیه و تحلیل رسوب در یک میدان گرانشی - 10 -4 -10 -6

روش هدایت سنجی - 10 -4 -10 -6

میکروسکوپ - 10 -4 -10 -7

روش فیلتراسیون - 10 -5 -10 -7

سانتریفیوژ - 10 -6 -10 -8

اولتراسانتریفیوژ - 10 -7 -10 -9

اولترامیکروسکوپی - 10 -7 -10 -9

نفرومتری - 10 -7 -10 -9

میکروسکوپ الکترونی - 10 -7 -10 -9

روش انتشار - 10 -7 -10 -10

تجزیه و تحلیل پراکندگی به طور گسترده ای در زمینه های مختلف علم و تولید صنعتی برای ارزیابی پراکندگی سیستم ها (سوسپانسیون ها، امولسیون ها، سل ها، پودرها، جاذب ها و غیره) با اندازه ذرات از چند میلی متر (10-3 متر) تا چندین نانومتر (10) استفاده می شود. -9 متر) /8/.

2.6 استفاده از تلقین عمدی مستقیم در حالت بیداری در روش تربیت کیفیات جسمانی

تمرین بدنی جنبه اساسی تمرینات ورزشی است، زیرا بیشتر از سایر جنبه های تمرین، با بارهای فیزیکی مشخص می شود که بر ویژگی های مورفولوژیکی و عملکردی بدن تأثیر می گذارد. موفقیت آموزش فنی، محتوای تاکتیک های یک ورزشکار، تحقق ویژگی های شخصی در روند تمرین و رقابت به سطح آمادگی جسمانی بستگی دارد.

یکی از وظایف اصلی تربیت بدنی، آموزش کیفیات بدنی است. در این راستا، نیاز به توسعه ابزارها و روش های آموزشی وجود دارد که امکان در نظر گرفتن ویژگی های سنی ورزشکاران جوان را فراهم می کند که سلامت آنها را حفظ کند، به زمان اضافی نیاز نداشته باشد و در عین حال رشد کیفیت های بدنی را تحریک کند و به عنوان یک نتیجه، اخلاق ورزشی استفاده از نفوذ ناهمگون کلامی در فرآیند آموزش در گروه های آموزشی ابتدایی یکی از زمینه های امیدوارکننده پژوهش در این زمینه است.

تجزیه و تحلیل تئوری و عمل اجرای نفوذ ناهمگن کلامی الهام بخش، تضادهای اصلی را آشکار کرد:

شواهدی دال بر استفاده مؤثر از روش‌های خاص نفوذ ناهمگون کلامی در فرآیند آموزش و عدم امکان عملی استفاده از آنها توسط مربی.

به رسمیت شناختن پیشنهاد مستقیم عمدی (از این پس DSP نامیده می شود) در حالت بیداری به عنوان یکی از روش های اصلی نفوذ ناهمگون کلامی در فعالیت آموزشی مربی و عدم وجود توجیه نظری برای ویژگی های روش شناختی استفاده از آن در ورزش. آموزش، و به ویژه در فرآیند آموزش کیفیات بدنی.

در ارتباط با تضادهای شناسایی شده و توسعه ناکافی، مشکل استفاده از سیستم روش‌های نفوذ ناهمگون کلامی در فرآیند آموزش کیفیت فیزیکی ورزشکاران، هدف مطالعه را از پیش تعیین کرد - توسعه روش‌های هدفمند منطقی PPV در حالت بیداری، کمک به بهبود روند آموزش کیفیات بدنی بر اساس ارزیابی وضعیت روانی، تجلی و پویایی کیفیات بدنی جودوکاران گروه های آموزشی ابتدایی.

به منظور آزمایش و تعیین اثربخشی روش‌های آزمایشی PPV در رشد کیفیت‌های فیزیکی کشتی‌گیران جودو، یک آزمایش آموزشی مقایسه‌ای انجام شد که در آن چهار گروه شرکت کردند - سه آزمایشی و یک کنترل. در گروه آزمایشی اول (EG) از تکنیک PPV M1، در گروه دوم - تکنیک PPV M2، در گروه سوم - تکنیک PPV M3 استفاده شد. در گروه کنترل (CG) از روش های PPV استفاده نشد.

برای تعیین اثربخشی تأثیر آموزشی روش‌های PPV در فرآیند آموزش کیفیت‌های فیزیکی در جودوکاران، تجزیه و تحلیل واریانس تک عاملی انجام شد.

میزان تأثیر روش PPV M1 در فرآیند آموزش:

تحمل:

الف) پس از ماه سوم 11.1٪ بود.

توانایی های سرعت:

الف) پس از ماه اول - 16.4٪؛

ب) بعد از دوم - 26.5٪؛

ج) بعد از سوم - 34.8٪؛

الف) پس از ماه دوم - 26.7٪؛

ب) بعد از سوم - 35.3٪؛

انعطاف پذیری:

الف) پس از ماه سوم - 20.8٪؛

الف) پس از ماه دوم آزمایش اصلی آموزشی، میزان تأثیر روش 6.4٪ بود.

ب) بعد از سوم - 10.2٪.

در نتیجه، تغییرات قابل توجهی در شاخص های سطح توسعه کیفیت های فیزیکی با استفاده از روش PPV M1 در توانایی های سرعت و قدرت یافت شد، میزان تأثیر روش در این مورد بیشترین است. کمترین میزان تأثیر روش‌شناسی در فرآیند پرورش توانایی‌های استقامت، انعطاف‌پذیری و هماهنگی یافت شد که زمینه را برای صحبت در مورد اثربخشی ناکافی استفاده از تکنیک PPV M1 در پرورش این ویژگی‌ها فراهم می‌کند.

میزان تأثیر روش PPV M2 در فرآیند آموزش:

تحمل

الف) پس از ماه اول آزمایش - 12.6٪؛

ب) بعد از دوم - 17.8٪؛

ج) بعد از سوم - 20.3٪.

توانایی های سرعت:

الف) پس از ماه سوم جلسات آموزشی - 28٪.

الف) پس از ماه دوم - 27.9٪؛

ب) بعد از سوم - 35.9٪.

انعطاف پذیری:

الف) پس از ماه سوم جلسات آموزشی - 14.9٪؛

توانایی های هماهنگی - 13.1٪.

نتیجه به دست آمده از تجزیه و تحلیل واریانس تک عاملی این EG به ما امکان می دهد نتیجه بگیریم که روش PPV M2 موثرترین روش در توسعه استقامت و قدرت است. در فرآیند توسعه انعطاف پذیری، سرعت و توانایی های هماهنگی کمتر موثر است.

میزان تأثیر روش PPV M3 در فرآیند آموزش:

تحمل:

الف) پس از ماه اول آزمایش 16.8٪؛

ب) بعد از دوم - 29.5٪؛

ج) بعد از سوم - 37.6٪.

توانایی های سرعت:

الف) پس از ماه اول - 26.3٪؛

ب) بعد از دوم - 31.3٪؛

ج) بعد از سوم - 40.9٪.

الف) پس از ماه اول - 18.7٪؛

ب) بعد از دوم - 26.7٪؛

ج) بعد از سوم - 32.3٪.

انعطاف پذیری:

الف) پس از اولین - هیچ تغییری وجود ندارد.

ب) بعد از دوم - 16.9٪؛

ج) بعد از سوم - 23.5٪.

توانایی های هماهنگی:

الف) هیچ تغییری پس از ماه اول وجود ندارد.

ب) بعد از دوم - 23.8٪؛

ج) بعد از سوم - 91٪.

بنابراین، تجزیه و تحلیل واریانس یک طرفه نشان داد که استفاده از تکنیک PPV M3 در دوره آماده سازی در فرآیند آموزش کیفیت های بدنی مؤثرتر است، زیرا بعد از هر ماه از آزمایش آموزشی، میزان تأثیر آن افزایش می یابد. /9/.

2.7 تسکین علائم روان پریشی حاد در بیماران مبتلا به اسکیزوفرنی با یک آنتی سایکوتیک غیر معمول

هدف از این مطالعه بررسی امکان استفاده از ریسپولپت برای تسکین روان پریشی حاد در بیماران مبتلا به اسکیزوفرنی (نوع پارانوئید مطابق با ICD-10) و اختلال اسکیزوافکتیو بود. در عین حال، شاخص طول مدت تداوم علائم روان پریشی تحت درمان دارویی با ریسپولپت (گروه اصلی) و آنتی سایکوتیک های کلاسیک به عنوان معیار اصلی مورد مطالعه قرار گرفت.

اهداف اصلی این مطالعه تعیین شاخص طول مدت روان پریشی (به اصطلاح روان پریشی خالص) بود که به عنوان حفظ علائم روان پریشی مولد از شروع استفاده از داروهای ضد روان پریشی، بیان شده در روز درک می شد. این شاخص به طور جداگانه برای گروه ریسپریدون و به طور جداگانه برای گروه آنتی سایکوتیک کلاسیک محاسبه شد.

در کنار این، وظیفه تعیین نسبت کاهش علائم تولیدی تحت تأثیر ریسپریدون در مقایسه با آنتی‌سایکوتیک‌های کلاسیک در دوره‌های مختلف درمان تعیین شد.

در مجموع 89 بیمار (42 مرد و 47 زن) با علائم روان پریشی حاد در فرم پارانوئید اسکیزوفرنی (49 بیمار) و اختلال اسکیزوافکتیو (40 بیمار) مورد بررسی قرار گرفتند.

اولین دوره و مدت بیماری تا 1 سال در 43 بیمار ثبت شد، در حالی که در سایر موارد در زمان مطالعه، دوره های بعدی اسکیزوفرنی با طول مدت بیماری بیش از 1 سال مشاهده شد.

درمان ریسپولپتوم توسط 29 نفر دریافت شد که در میان آنها 15 بیمار به اصطلاح اولین قسمت بودند. درمان با داروهای اعصاب کلاسیک توسط 60 نفر دریافت شد که در بین آنها 28 نفر با قسمت اول بودند. دوز rispolept در محدوده 1 تا 6 میلی گرم در روز و به طور متوسط ​​4±0.4 میلی گرم در روز متغیر بود. ریسپریدون منحصراً به صورت خوراکی بعد از غذا یک بار در روز در شب مصرف می شد.

درمان با آنتی سایکوتیک های کلاسیک شامل استفاده از تری فلوپرازین (تریفتازین) با دوز روزانه تا 30 میلی گرم عضلانی، هالوپریدول با دوز روزانه حداکثر 20 میلی گرم به صورت عضلانی، تری پریدول با دوز روزانه تا 10 میلی گرم خوراکی بود. اکثریت قریب به اتفاق بیماران در طی دو هفته اول از آنتی‌سایکوتیک‌های کلاسیک به‌عنوان مونوتراپی استفاده کردند، پس از آن، در صورت لزوم (با حفظ علائم هذیانی، توهم یا سایر علائم تولیدی) به ترکیبی از چندین آنتی‌سایکوتیک کلاسیک روی آوردند. در همان زمان، یک داروی اعصاب با اثر ضد هذیانی و ضد توهم انتخابی مشخص (به عنوان مثال، هالوپریدول یا تریفتازین) به عنوان داروی اصلی باقی ماند، دارویی با اثر خواب آور مشخص (کلرپرومازین، تیزرسین، کلرپروتیکسن در دوزهای تا حداکثر). 50-100 میلی گرم در روز) در شب به آن اضافه شد.

در گروهی که داروهای ضد روان پریشی کلاسیک مصرف می کردند، برنامه ریزی شد که اصلاح کننده های آنتی کولینرژیک (پارکوپان، سیکلودول) در دوزهای 10-12 میلی گرم در روز مصرف شود. اصلاح کننده ها در صورت بروز عوارض جانبی اکستراپیرامیدال مشخص به شکل دیستونی حاد، پارکینسونیسم ناشی از دارو و آکاتیزیا تجویز شدند.

جدول 2.1 داده هایی را در مورد مدت زمان روان پریشی در درمان rispolept و آنتی سایکوتیک های کلاسیک ارائه می دهد.

جدول 2.1 - مدت زمان روان پریشی ("روان پریشی خالص") در درمان ریسپولپت و آنتی سایکوتیک های کلاسیک

همانطور که از داده های جدول آمده است، هنگام مقایسه مدت زمان روان پریشی در طول درمان با داروهای ضد روان پریشی کلاسیک و ریسپریدون، کاهش تقریباً دو برابری در طول مدت علائم روان پریشی تحت تأثیر ریسپولپت وجود دارد. قابل توجه است که نه عوامل شماره سریال تشنج و نه ماهیت تصویر سندرم پیشرو بر این مقدار طول مدت روانپریشی تأثیری نداشتند. به عبارت دیگر، مدت روان پریشی صرفاً توسط عامل درمانی تعیین می شد، یعنی. بسته به نوع داروی مورد استفاده، صرف نظر از شماره سریال حمله، مدت زمان بیماری و ماهیت سندرم آسیب روانی پیشرو.

به منظور تایید نظم های به دست آمده، تحلیل واریانس دو عاملی انجام شد. در همان زمان، تعامل فاکتور درمانی و شماره سریال حمله (مرحله 1) و تعامل فاکتور درمانی و ماهیت سندرم پیشرو (مرحله 2) به نوبه خود در نظر گرفته شد. نتایج تحلیل واریانس تأثیر فاکتور درمانی را بر طول مدت روان پریشی (8/18=F) در غیاب تأثیر عامل تعداد حمله (5/2F=) و عامل نوع سندرم آسیب روانی (7/1=F) تأیید کرد. ). مهم است که تأثیر مشترک عامل درمانی و تعداد حمله در طول مدت روان پریشی و همچنین تأثیر مشترک عامل درمانی و عامل سندرم آسیب روانی وجود نداشت.

بنابراین، نتایج تجزیه و تحلیل واریانس تأثیر تنها عامل آنتی سایکوتیک اعمال شده را تأیید کرد. Rispolept به طور واضح منجر به کاهش طول مدت علائم روان پریشی در مقایسه با داروهای ضد روان پریشی سنتی حدود 2 برابر شد. مهم است که این اثر علیرغم تجویز خوراکی ریسپولپت به دست آمد، در حالی که در اکثر بیماران از آنتی سایکوتیک های کلاسیک به صورت تزریقی استفاده شد /10/.

2.8 تاب برداشتن نخ های فانتزی با جلوه چرخشی

دانشگاه فناوری دولتی کوستروما یک ساختار نخی شکل جدید با پارامترهای هندسی متغیر ایجاد کرده است. در این راستا مشکل فرآوری نخ فانتزی در تولید مقدماتی وجود دارد. این مطالعه به روند تاب برداشتن در مورد موضوعات اختصاص داده شده است: انتخاب نوع کشش، که حداقل گسترش کشش و تراز کشش را می دهد، رزوه هایی با چگالی خطی مختلف در امتداد عرض محور تاب.

موضوع تحقیق یک نخ کتانی شکل از چهار نوع چگالی خطی از 140 تا 205 tex است. کار دستگاه های کششی از سه نوع واشر چینی، دو ناحیه ای NS-1P و تک منطقه ای NS-1P مورد مطالعه قرار گرفت. یک مطالعه تجربی از کشش نخ های تاب بر روی دستگاه تاب SP-140-3L انجام شد. سرعت تاب خوردگی، وزن دیسک های ترمز با پارامترهای تکنولوژیکی تاب برداشتن نخ مطابقت دارد.

برای مطالعه وابستگی کشش نخ شکل به پارامترهای هندسی در حین تاب برداشتن، تجزیه و تحلیل برای دو عامل انجام شد: X 1 - قطر اثر، X 2 - طول اثر. پارامترهای خروجی کشش Y 1 و نوسان کشش Y 2 هستند.

معادلات رگرسیون به دست آمده برای داده های تجربی در سطح معنی داری 0.95 کافی است، زیرا معیار فیشر محاسبه شده برای همه معادلات کمتر از جدولی است.

برای تعیین میزان تأثیر عوامل X 1 و X 2 بر پارامترهای Y 1 و Y 2، تجزیه و تحلیل واریانس انجام شد که نشان داد قطر اثر تأثیر بیشتری بر سطح و نوسان کشش دارد. .

تجزیه و تحلیل مقایسه ای تنسوگرام های به دست آمده نشان داد که حداقل گسترش کشش در حین تاب برداشتن این نخ توسط دستگاه کشش دو ناحیه ای NS-1P ارائه می شود.

مشخص شده است که با افزایش چگالی خطی از 105 به 205 tex، دستگاه NS-1P تنها 23٪ سطح کشش را افزایش می دهد در حالی که واشر چینی - 37٪، تک منطقه ای NS-1P - 53 درصد

هنگام تشکیل شفت های تابدار، از جمله رزوه های شکل دار و "صاف"، لازم است که کشنده را به صورت جداگانه به روش سنتی /11/ تنظیم کنید.

2.9 آسیب شناسی همزمان با از دست دادن کامل دندان در افراد مسن و سالخورده

از دست دادن کامل دندان ها از نظر اپیدمیولوژیک و آسیب شناسی همزمان جمعیت سالمندان ساکن در خانه های سالمندان در قلمرو چوواشیا مورد مطالعه قرار گرفته است. این معاینه با معاینه دندانپزشکی و پر کردن کارت های آماری 784 نفر انجام شد. نتایج تجزیه و تحلیل درصد بالایی از از دست دادن کامل دندان ها را نشان داد که توسط آسیب شناسی عمومی بدن تشدید می شود. این طبقه بندی جمعیت مورد بررسی را به عنوان گروهی با خطرات دندانی افزایش یافته مشخص می کند و نیاز به بازنگری در کل سیستم مراقبت های دندانی آنها دارد.

در افراد مسن، میزان بروز دو برابر و در سنین بالا شش برابر بیشتر از میزان بروز در افراد جوان است.

بیماری های اصلی افراد مسن و سالخورده بیماری های دستگاه گردش خون، سیستم عصبی و اندام های حسی، اندام های تنفسی، اندام های گوارشی، استخوان ها و اندام های حرکتی، نئوپلاسم ها و جراحات است.

هدف از این مطالعه توسعه و کسب اطلاعات در مورد بیماری های همراه، اثربخشی پروتز و نیاز به درمان ارتوپدی در افراد مسن و سالخورده با از دست دادن کامل دندان می باشد.

در مجموع 784 نفر در سنین 45 تا 90 سال مورد بررسی قرار گرفتند. نسبت زنان و مردان 2.8:1 است.

ارزیابی رابطه آماری با استفاده از ضریب همبستگی رتبه‌های پیرسون امکان تعیین تأثیر متقابل دندان‌های از دست رفته بر عوارض همراه با سطح پایایی 0005/0=p را فراهم کرد. بیماران مسن با از دست دادن کامل دندان از بیماری های مشخصه دوران سالمندی، یعنی تصلب شرایین مغزی و فشار خون بالا رنج می برند.

تجزیه و تحلیل واریانس نشان داد که ویژگی بیماری در شرایط مورد مطالعه نقش تعیین کننده ای دارد. نقش اشکال نوزولوژیک در دوره های سنی مختلف از 52 تا 60 درصد متغیر است. بیشترین تأثیر آماری معنادار بر عدم وجود دندان ها ناشی از بیماری های دستگاه گوارش و دیابت است.

به طور کلی، گروه بیماران 75-89 ساله با تعداد زیادی بیماری پاتولوژیک مشخص می شود.

در این مطالعه، یک مطالعه مقایسه ای میزان بروز همبودی در بیماران با از دست دادن کامل دندان در سنین سالمندی و سالمندی ساکن خانه های سالمندان انجام شد. درصد بالایی از از دست دادن دندان در بین افراد این گروه سنی مشخص شد. در بیماران مبتلا به آدنسی کامل، بیماری های همراه مشخصه این سن مشاهده می شود. آترواسکلروز و فشار خون بالا در بین افراد مورد بررسی شایع ترین بودند. تأثیر بیماری هایی مانند بیماری های دستگاه گوارش و دیابت بر وضعیت حفره دهان از نظر آماری معنی دار است، سهم سایر اشکال نوزوولوژیکی در محدوده 52-60٪ بود. استفاده از تحلیل واریانس نقش معنادار جنسیت و محل سکونت بر شاخص های وضعیت حفره دهان را تایید نکرد.

بنابراین، در پایان، باید توجه داشت که تجزیه و تحلیل توزیع بیماری‌های همراه در افراد با فقدان کامل دندان در سالمندان و سالمندان نشان داد که این دسته از شهروندان به گروه خاصی از جمعیت تعلق دارند که باید از دندانپزشکی کافی برخوردار شوند. مراقبت در چارچوب سیستم های دندانپزشکی موجود /12/ .

3 تحلیل واریانس در زمینه روش های آماری

روش های آماری تجزیه و تحلیل روشی برای اندازه گیری نتایج فعالیت های انسانی است، یعنی تبدیل ویژگی های کیفی به کمی.

مراحل اصلی در تجزیه و تحلیل آماری:

ترسیم طرحی برای جمع آوری داده های اولیه - مقادیر متغیرهای ورودی (X 1 ,..., X p) ، تعداد مشاهدات n. این مرحله زمانی انجام می شود که آزمایش به طور فعال برنامه ریزی شده باشد.

به دست آوردن داده های اولیه و وارد کردن آنها به کامپیوتر. در این مرحله آرایه هایی از اعداد تشکیل می شود (x 1i ,..., x pi ; y 1i ,..., y qi) i=1,..., n که n حجم نمونه است.

پردازش داده های آماری اولیه در این مرحله، یک توصیف آماری از پارامترهای در نظر گرفته شده تشکیل می شود:

الف) ساخت و تجزیه و تحلیل وابستگی های آماری؛

ب) تجزیه و تحلیل همبستگی برای ارزیابی اهمیت تأثیر عوامل (X1،...،X p) بر پاسخ Y طراحی شده است.

ج) از آنالیز واریانس برای ارزیابی تأثیر عوامل غیر کمی (X 1،...،X p) بر پاسخ Y استفاده می شود تا مهمترین آنها از بین آنها انتخاب شود.

د) تحلیل رگرسیون برای تعیین وابستگی تحلیلی پاسخ Y به عوامل کمی X طراحی شده است.

تفسیر نتایج بر حسب مجموعه وظایف /13/.

جدول 3.1 روش های آماری را نشان می دهد که به وسیله آنها مسائل تحلیلی حل می شوند. سلول های مربوط به جدول حاوی فرکانس های اعمال روش های آماری است:

برچسب "-" - روش اعمال نمی شود.

برچسب "+" - روش اعمال می شود.

برچسب "++" - این روش به طور گسترده استفاده می شود.

برچسب "+++" - کاربرد روش مورد توجه خاص است /14/.

تجزیه و تحلیل واریانس، مانند آزمون تی دانشجویی، به شما امکان می دهد تفاوت بین میانگین های نمونه را ارزیابی کنید. با این حال، بر خلاف آزمون t، محدودیتی در تعداد میانگین های مقایسه شده ندارد. بنابراین، به جای پرسیدن اینکه آیا دو میانگین نمونه متفاوت است، می توان ارزیابی کرد که آیا میانگین های دو، سه، چهار، پنج یا k متفاوت است.

ANOVA به شما این امکان را می دهد که همزمان با دو یا چند متغیر مستقل (ویژگی ها، عوامل) برخورد کنید و نه تنها تأثیر هر یک از آنها را به طور جداگانه ارزیابی کنید، بلکه تأثیرات تعامل بین آنها را نیز ارزیابی کنید /15/.


جدول 3.1 - کاربرد روش های آماری در حل مسائل تحلیلی

وظایف تحلیلی که در زمینه تجارت، مالی و مدیریت ایجاد می شود

روش های آمار توصیفی

روش های تایید فرضیه های آماری

روش های تحلیل رگرسیون

روشهای تجزیه و تحلیل پراکندگی

روشهای تحلیل چند متغیره

روشهای تجزیه و تحلیل متمایز

cluster-nogo

روشهای تحلیل

بقا

روشهای تحلیل

و پیش بینی

سری زمانی

وظایف تحلیل افقی (زمانی).

وظایف تحلیل عمودی (ساختاری).

وظایف تجزیه و تحلیل روند و پیش بینی

وظایف تجزیه و تحلیل شاخص های نسبی

وظایف تحلیل مقایسه ای (فضایی).

وظایف تحلیل عاملی

برای اکثر سیستم های پیچیده، اصل پارتو اعمال می شود که بر اساس آن 20٪ از عوامل ویژگی های سیستم را 80٪ تعیین می کنند. بنابراین، وظیفه اصلی محقق مدل شبیه‌سازی حذف عوامل بی‌اهمیت است که امکان کاهش ابعاد مسئله بهینه‌سازی مدل را فراهم می‌کند.

تجزیه و تحلیل واریانس انحراف مشاهدات از میانگین کلی را ارزیابی می کند. سپس این تنوع به بخش هایی تقسیم می شود که هر کدام علت خاص خود را دارند. قسمت باقیمانده تغییرات که نمی تواند با شرایط آزمایش مرتبط باشد، خطای تصادفی آن در نظر گرفته می شود. برای تأیید معنی داری، از آزمون ویژه ای استفاده می شود - آماره F.

تجزیه و تحلیل واریانس تعیین می کند که آیا یک اثر وجود دارد. تحلیل رگرسیون به شما امکان می دهد پاسخ (مقدار تابع هدف) را در نقطه ای از فضای پارامتر پیش بینی کنید. وظیفه فوری تحلیل رگرسیون برآورد ضرایب رگرسیون /16/ است.

حجم نمونه خیلی بزرگ، تجزیه و تحلیل آماری را دشوار می کند، بنابراین کاهش حجم نمونه منطقی است.

با به کارگیری تحلیل واریانس می توان اهمیت تأثیر عوامل مختلف بر متغیر مورد مطالعه را شناسایی کرد. اگر تأثیر یک عامل ناچیز باشد، می توان این عامل را از پردازش بیشتر حذف کرد.

اقتصاددانان کلان باید قادر به حل چهار مشکل منطقی متمایز باشند:

شرح داده ها؛

پیش بینی کلان اقتصادی؛

استنتاج ساختاری؛

تجزیه و تحلیل سیاست.

توصیف داده ها به معنای توصیف ویژگی های یک یا چند سری زمانی و انتقال این ویژگی ها به طیف وسیعی از اقتصاددانان است. پیش‌بینی اقتصاد کلان به معنای پیش‌بینی روند اقتصاد است، معمولاً دو تا سه سال یا کمتر (عمدتاً به این دلیل که پیش‌بینی در افق‌های طولانی‌تر بسیار دشوار است). استنتاج ساختاری به معنای بررسی اینکه آیا داده های کلان اقتصادی با یک نظریه اقتصادی خاص سازگار است یا خیر. تحلیل سیاست اقتصاد کلان در چندین جهت پیش می رود: از یک سو، تأثیر یک تغییر فرضی در ابزارهای سیاست (به عنوان مثال، نرخ مالیات یا نرخ بهره کوتاه مدت) بر اقتصاد ارزیابی می شود، از سوی دیگر، تأثیر تغییر در قوانین سیاست (به عنوان مثال، گذار به یک رژیم سیاست پولی جدید) ارزیابی می شود. یک پروژه تحقیقاتی تجربی اقتصاد کلان ممکن است شامل یک یا چند مورد از این چهار وظیفه باشد. هر مسئله باید به گونه ای حل شود که همبستگی بین سری های زمانی در نظر گرفته شود.

در دهه 1970، این مشکلات با استفاده از روش‌های مختلفی حل شد، که اگر از موقعیت‌های مدرن ارزیابی شوند، به دلایل متعددی ناکافی بودند. برای تشریح دینامیک یک سری مجزا، استفاده از مدل‌های تک بعدی سری‌های زمانی و برای توصیف دینامیک مشترک دو سری، استفاده از تحلیل طیفی کافی بود. با این حال، هیچ زبان مشترکی مناسب برای توصیف سیستماتیک خواص دینامیکی مشترک چندین سری زمانی وجود نداشت. پیش‌بینی‌های اقتصادی یا با استفاده از مدل‌های میانگین متحرک خودبازگشتی ساده شده (ARMA) یا با استفاده از مدل‌های بزرگ اقتصادسنجی ساختاری رایج در آن زمان انجام شد. استنتاج ساختاری بر اساس مدل‌های تک معادله‌ای کوچک یا مدل‌های بزرگ است که شناسایی آن‌ها از طریق محدودیت‌های انحرافی نابجا به دست آمده و معمولاً شامل انتظارات نمی‌شوند. تحلیل خط مشی مدل ساختاری به این مفروضات شناسایی بستگی داشت.

در نهایت، افزایش قیمت ها در دهه 1970 توسط بسیاری به عنوان یک شکست بزرگ برای مدل های بزرگی که در آن زمان برای ارائه توصیه های سیاستی مورد استفاده قرار می گرفتند، تلقی می شد. یعنی زمان مناسبی برای ظهور یک ساختار اقتصاد کلان جدید بود که می توانست این بسیاری از مشکلات را حل کند.

در سال 1980، چنین ساختاری ایجاد شد - رگرسیون خودکار برداری (VAR). در نگاه اول، VAR چیزی بیش از تعمیم رگرسیون خودکار تک متغیره به حالت چند متغیره نیست، و هر معادله در VAR چیزی بیش از یک رگرسیون ساده حداقل مربعات یک متغیر بر روی مقادیر تاخیری خود و سایر متغیرها در VAR نیست. اما این ابزار به ظاهر ساده این امکان را فراهم کرد که به طور سیستماتیک و درونی دینامیک غنی سری های زمانی چند متغیره را به تصویر بکشیم و ابزار آماری همراه با VAR ثابت شد که راحت و مهمتر از آن تفسیر آسان است.

سه مدل مختلف VAR وجود دارد:

فرم VAR کاهش یافته؛

VAR بازگشتی؛

VAR ساختاری

هر سه مدل های خطی پویا هستند که مقادیر فعلی و گذشته بردار Y t یک سری زمانی n بعدی را به هم مرتبط می کنند. فرم کاهش یافته و VAR های بازگشتی مدل های آماری هستند که از هیچ ملاحظات اقتصادی دیگری به جز انتخاب متغیرها استفاده نمی کنند. این VAR ها برای توصیف داده ها و پیش بینی ها استفاده می شوند. VAR ساختاری شامل محدودیت‌هایی است که از نظریه اقتصاد کلان به دست می‌آید و این VAR برای استنتاج ساختاری و تحلیل سیاست استفاده می‌شود.

شکل فوق از VAR Y t را به عنوان یک تاخیر گذشته توزیع شده به اضافه یک خطای نامرتبط سریالی بیان می کند، یعنی، خودرگرسیون تک متغیره را به مورد بردارها تعمیم می دهد. شکل ریاضی کاهش یافته مدل VAR سیستمی از n معادله است که می توان آن را به صورت ماتریسی به صورت زیر نوشت:

که در آن  n l بردار ثابت است.

A 1 , A 2 , ..., A p n n ماتریس ضریب هستند.

 t یک بردار nl از خطاهای زنجیره ای نامرتبط است که میانگین صفر و ماتریس کوواریانس در نظر گرفته می شود.

خطاهای  t در (17) دینامیک غیرمنتظره در Y t هستند که پس از در نظر گرفتن تاخیر توزیع شده خطی مقادیر گذشته باقی می مانند.

تخمین پارامترهای فرم کاهش یافته VAR آسان است. هر یک از معادلات حاوی رگرسیورهای یکسانی است (Y t–1,...,Y t–p) و هیچ محدودیت متقابلی بین معادلات وجود ندارد. بنابراین، برآورد موثر (روش حداکثر احتمال با اطلاعات کامل) به حداقل مربعات معمول اعمال شده برای هر یک از معادلات ساده شده است. ماتریس کوواریانس خطا را می توان به طور قابل اعتماد با ماتریس کوواریانس نمونه به دست آمده از باقیمانده های LSM تخمین زد.

تنها نکته ظریف تعیین طول تاخیر p است، اما این کار را می توان با استفاده از یک معیار اطلاعاتی مانند AIC یا BIC انجام داد.

در سطح معادلات ماتریسی، VAR بازگشتی و ساختاری یکسان به نظر می رسند. این دو مدل VAR به صراحت برهمکنش‌های همزمان بین عناصر Yt را در نظر می‌گیرند که به معنای افزودن یک عبارت همزمان به سمت راست معادله است (17). بر این اساس، VAR بازگشتی و ساختاری هر دو به شکل کلی زیر نمایش داده می شوند:

جایی که  - بردار ثابت ها.

B 0،...، B p - ماتریس ها.

 t - خطاها.

وجود ماتریس B 0 در معادله به معنای امکان تعامل همزمان بین n متغیر است. یعنی B 0 به شما این امکان را می دهد که این متغیرهای مربوط به یک نقطه زمانی را با هم تعریف کنید.

VAR بازگشتی را می توان به دو روش تخمین زد. ساختار بازگشتی مجموعه ای از معادلات بازگشتی را به دست می دهد که می توان آنها را با استفاده از روش حداقل مربعات تخمین زد. یک روش تخمین معادل این است که معادلات شکل کاهش یافته (17) که به عنوان یک سیستم در نظر گرفته می شود، از سمت چپ در ماتریس مثلثی پایین ضرب می شوند.

روش تخمین VAR ساختاری بستگی به چگونگی شناسایی دقیق B 0 دارد. رویکرد اطلاعات جزئی مستلزم استفاده از روش‌های تخمین معادله منفرد مانند حداقل مربعات دو مرحله‌ای است. رویکرد اطلاعات کامل مستلزم استفاده از روش‌های تخمین چند معادله‌ای مانند حداقل مربعات سه مرحله‌ای است.

از انواع مختلف VAR ها آگاه باشید. شکل کاهش یافته VAR منحصر به فرد است. این ترتیب متغیرها در Y t مربوط به یک VAR بازگشتی است، اما n وجود دارد! چنین دستوراتی، یعنی n! VAR های بازگشتی مختلف تعداد VARهای ساختاری - یعنی مجموعه‌ای از مفروضات که روابط هم‌زمان بین متغیرها را مشخص می‌کنند - فقط با نبوغ محقق محدود می‌شود.

از آنجایی که تفسیر مستقیم ماتریس‌های ضرایب VAR برآورد شده دشوار است، نتایج تخمین VAR معمولاً با برخی از تابع‌های این ماتریس‌ها نشان داده می‌شوند. به چنین آماری تجزیه خطاهای پیش بینی.

بسط واریانس خطای پیش‌بینی عمدتاً برای سیستم‌های بازگشتی یا ساختاری محاسبه می‌شود. این تجزیه واریانس نشان می‌دهد که خطای معادله j چقدر برای توضیح تغییرات غیرمنتظره در متغیر i مهم است. هنگامی که خطاهای VAR از نظر معادله همبستگی ندارند، واریانس خطای پیش‌بینی برای h دوره‌های آینده را می‌توان به صورت مجموع مؤلفه‌های حاصل از هر یک از این خطاها /17/ نوشت.

3.2 تحلیل عاملی

در آمار مدرن، تحلیل عاملی به عنوان مجموعه ای از روش ها درک می شود که بر اساس روابط واقعی ویژگی ها (یا اشیاء)، شناسایی ویژگی های تعمیم پنهان ساختار سازمانی و مکانیسم توسعه پدیده ها و پدیده ها را ممکن می سازد. فرآیندهای تحت مطالعه

مفهوم تأخیر در تعریف کلیدی است. این به معنای ضمنی بودن ویژگی های افشا شده با استفاده از روش های تحلیل عاملی است. اول، ما با مجموعه ای از ویژگی های اولیه X j سروکار داریم، تعامل آنها وجود علل خاص، شرایط خاص، یعنی. وجود برخی عوامل پنهان دومی ها در نتیجه تعمیم ویژگی های ابتدایی ایجاد می شوند و به عنوان ویژگی ها یا ویژگی های یکپارچه، اما در سطح بالاتر عمل می کنند. به طور طبیعی، نه تنها ویژگی‌های بی‌اهمیت X j می‌توانند همبستگی داشته باشند، بلکه خود اشیاء مشاهده‌شده N i نیز می‌توانند همبستگی داشته باشند، بنابراین جستجوی عوامل پنهان از نظر تئوری هم از طریق داده‌های ویژگی و هم با داده‌های شی امکان‌پذیر است.

اگر اشیا با تعداد کافی از ویژگی های ابتدایی مشخص شوند (m> 3)، فرض دیگری نیز منطقی است - در مورد وجود خوشه های متراکم از نقاط (ویژگی ها) در فضای n شی. در عین حال، محورهای جدید به ترتیب ویژگی های Xj را تعمیم نمی دهند، بلکه اشیاء n i را تعمیم می دهند و عوامل پنهان Fr با ترکیب اشیاء مشاهده شده شناسایی می شوند:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N ,

که در آن c i وزن جسم n i در ضریب F r است.

بسته به اینکه کدام یک از انواع همبستگی در نظر گرفته شده در بالا - ویژگی های اولیه یا اشیاء مشاهده شده - در تحلیل عاملی مورد مطالعه قرار می گیرد، R و Q متمایز می شوند - روش های فنی پردازش داده ها.

نام تکنیک R تجزیه و تحلیل داده های حجمی توسط m ویژگی است که در نتیجه r ترکیب خطی (گروه) ویژگی ها به دست می آید: F r =f(X j)، (r=1..m). تجزیه و تحلیل با توجه به نزدیکی (اتصال) n شی مشاهده شده Q-technique نامیده می شود و به شما امکان می دهد r ترکیب خطی (گروه) اشیاء را تعیین کنید: F=f(n i)، (i = l .. N).

در حال حاضر، در عمل، بیش از 90 درصد از مسائل با استفاده از تکنیک های R حل می شود.

مجموعه ای از روش های تحلیل عاملی در حال حاضر بسیار بزرگ است، شامل ده ها رویکرد مختلف و تکنیک های پردازش داده است. برای تمرکز بر انتخاب صحیح روش ها در تحقیق، ارائه ویژگی های آنها ضروری است. ما تمام روش های تحلیل عاملی را به چند گروه طبقه بندی تقسیم می کنیم:

روش جزء اصلی به بیان دقیق، آن را به عنوان تحلیل عاملی طبقه بندی نمی کنند، اگرچه اشتراکات زیادی با آن دارد. مشخصاً این است که اولاً در طی فرآیندهای محاسباتی همه مؤلفه های اصلی به طور همزمان به دست می آیند و تعداد آنها در ابتدا با تعداد ویژگی های اولیه برابر است. ثانیاً، امکان تجزیه کامل پراکندگی ویژگی های ابتدایی، به عبارت دیگر، توضیح کامل آن از طریق عوامل نهفته (ویژگی های تعمیم یافته) فرض می شود.

روش های تحلیل عاملی واریانس ویژگی های ابتدایی در اینجا به طور کامل توضیح داده نشده است، مشخص شده است که بخشی از واریانس به عنوان یک مشخصه ناشناخته باقی می ماند. معمولاً عوامل به‌طور متوالی مشخص می‌شوند: اولی، توضیح دهنده بیشترین سهم تنوع در ویژگی‌های ابتدایی، سپس دوم، توضیح بخش کوچک‌تر واریانس، دومی پس از اولین عامل پنهان، سوم و غیره. فرآیند استخراج عوامل را می توان در هر مرحله ای قطع کرد، اگر تصمیمی در مورد کفایت نسبت واریانس توضیح داده شده ویژگی های ابتدایی یا در نظر گرفتن قابلیت تفسیر عوامل پنهان گرفته شود.

بهتر است روش های تحلیل عاملی را به دو دسته تقسیم کنیم: روش های تقریبی ساده و مدرن.

روش های ساده تحلیل عاملی عمدتاً با تحولات نظری اولیه همراه است. آنها توانایی های محدودی در شناسایی عوامل پنهان و تقریب راه حل های فاکتوریل دارند. این شامل:

مدل یک عاملی این به شما امکان می دهد فقط یک عامل پنهان عمومی و یک عامل مشخصه را انتخاب کنید. برای سایر عوامل پنهان احتمالاً موجود، فرضی در مورد بی اهمیت بودن آنها وجود دارد.

مدل دو عاملی اجازه می دهد تا بر تنوع ویژگی های اولیه نه یک، بلکه چندین عامل پنهان (معمولاً دو) و یک عامل مشخصه تأثیر بگذارد.

روش مرکز در آن، همبستگی بین متغیرها به عنوان دسته ای از بردارها در نظر گرفته می شود و عامل نهفته از نظر هندسی به عنوان بردار متعادل کننده ای که از مرکز این دسته عبور می کند، نشان داده می شود. : این روش به شما امکان می دهد چندین عامل پنهان و مشخصه را شناسایی کنید، برای اولین بار امکان همبستگی راه حل فاکتوریل با داده های اصلی وجود دارد، یعنی. حل مسئله تقریب به ساده ترین شکل

روش های تقریب مدرن اغلب فرض می کنند که اولین راه حل تقریبی قبلاً توسط برخی از روش ها پیدا شده است و این راه حل با مراحل بعدی بهینه می شود. روش ها در پیچیدگی محاسبات متفاوت است. این روش ها عبارتند از:

روش گروهی راه حل مبتنی بر گروه هایی از ویژگی های ابتدایی است که به نوعی از قبل انتخاب شده اند.

روش عوامل اصلی. این به روش اجزای اصلی نزدیک است، تفاوت در فرض وجود ویژگی ها نهفته است.

حداکثر احتمال، حداقل باقیمانده، تحلیل عاملی، تحلیل عاملی متعارف، همه بهینه‌سازی می‌شوند.

این روش‌ها بهبود مداوم راه‌حل‌های پیدا شده قبلی را بر اساس استفاده از تکنیک‌های آماری برای تخمین یک متغیر تصادفی یا معیارهای آماری امکان‌پذیر می‌سازند و به مقدار زیادی محاسبات زمان‌بر نیاز دارند. امیدوارکننده ترین و راحت ترین روش برای کار در این گروه، روش حداکثر احتمال است.

وظیفه اصلی که با روش های مختلف تحلیل عاملی از جمله روش اجزای اصلی حل می شود، فشرده سازی اطلاعات، انتقال از مجموعه مقادیر با توجه به ویژگی های اولیه با مقدار اطلاعات n x m به مقدار محدود است. مجموعه ای از عناصر ماتریس نگاشت عامل (m x r) یا ماتریس فاکتورهای مقادیر پنهان برای هر شی مشاهده شده با ابعاد n x r و معمولاً r< m.

روش های تحلیل عاملی همچنین امکان تجسم ساختار پدیده ها و فرآیندهای مورد مطالعه را فراهم می کند که به معنای تعیین وضعیت آنها و پیش بینی توسعه آنها است. در نهایت، داده های تحلیل عاملی زمینه ای را برای شناسایی شی فراهم می کند، یعنی. حل مشکل تشخیص تصویر

روش‌های تحلیل عاملی دارای ویژگی‌هایی هستند که برای استفاده از آن‌ها به عنوان بخشی از سایر روش‌های آماری، اغلب در تحلیل همبستگی-رگرسیون، تحلیل خوشه‌ای، مقیاس‌بندی چند متغیره و غیره بسیار جذاب است. /18/.

3.3 رگرسیون زوجی. ماهیت احتمالی مدل های رگرسیون.

اگر مشکل تجزیه و تحلیل هزینه های غذا را در گروه هایی با درآمد یکسان، به عنوان مثال 10000 دلار (x) در نظر بگیریم، این یک مقدار قطعی است. اما Y - سهم این پول خرج شده برای غذا - تصادفی است و می تواند سال به سال تغییر کند. بنابراین، برای هر i ام فرد:

جایی که ε i - خطای تصادفی؛

α و β ثابت هستند (از لحاظ نظری)، اگرچه ممکن است از مدلی به مدل دیگر متفاوت باشند.

پیش نیازهای رگرسیون زوجی:

X و Y به صورت خطی مرتبط هستند.

X یک متغیر غیر تصادفی با مقادیر ثابت است.

- ε - خطاها به طور معمول N(0,σ2) توزیع می شوند.

- .

شکل 3.1 یک مدل رگرسیون زوجی را نشان می دهد.

شکل 3.1 - مدل رگرسیون زوجی

این مفروضات مدل رگرسیون خطی کلاسیک را توصیف می کنند.

اگر خطا دارای میانگین غیر صفر باشد، مدل اصلی معادل مدل جدید و دیگر رهگیری خواهد بود، اما با میانگین صفر برای خطا.

اگر پیش نیازها برآورده شوند، برآوردگرهای حداقل مربعات و برآوردگرهای بی طرفانه خطی کارآمد هستند.

اگر تعیین کنیم:

این واقعیت که انتظار ریاضی و پراکندگی ضرایب به صورت زیر خواهد بود:

کوواریانس ضرایب:

اگر یک سپس آنها نیز به طور معمول توزیع می شوند:

از این مطلب چنین بر می آید که:

تغییر β به طور کامل توسط تغییر ε تعیین می شود.

هرچه واریانس X بیشتر باشد، تخمین β بهتر است.

پراکندگی کل با فرمول تعیین می شود:

واریانس انحرافات در این شکل یک تخمین بی طرفانه است و خطای استاندارد رگرسیون نامیده می شود. N-2 - می تواند به عنوان تعداد درجات آزادی تفسیر شود.

تجزیه و تحلیل انحرافات از خط رگرسیون می تواند معیار مفیدی از میزان انعکاس رگرسیون تخمینی داده های واقعی را ارائه دهد. رگرسیون خوب رگرسیونی است که بخش قابل توجهی از واریانس در Y را توضیح می دهد و بالعکس، رگرسیون بد بیشتر نوسانات داده های اصلی را ردیابی نمی کند. به طور شهودی واضح است که هر گونه اطلاعات اضافی مدل را بهبود می بخشد، یعنی سهم غیرقابل توضیح تغییر Y را کاهش می دهد. برای تجزیه و تحلیل مدل رگرسیونی، واریانس به اجزاء تجزیه می شود و ضریب تعیین R2 تعیین می شود.

نسبت دو واریانس بر اساس توزیع F توزیع می‌شود، یعنی اگر اهمیت آماری تفاوت بین واریانس مدل و واریانس باقیمانده‌ها را بررسی کنیم، می‌توان نتیجه گرفت که R2 معنادار است.

آزمون فرضیه برابری واریانس این دو نمونه:

اگر فرضیه H 0 (برابری واریانس چند نمونه) درست باشد، t دارای یک توزیع F با (m 1 ,m 2)=(n 1 -1, n 2 -1) درجه آزادی است.

با محاسبه نسبت F به عنوان نسبت دو پراکندگی و مقایسه آن با مقدار جدول، می‌توان نتیجه گرفت که R2 /2/، /19/ از نظر آماری معنی‌دار است.

نتیجه

کاربردهای مدرن تحلیل واریانس طیف وسیعی از مشکلات در اقتصاد، زیست‌شناسی و فناوری را پوشش می‌دهد و معمولاً بر اساس نظریه آماری آشکار کردن تفاوت‌های سیستماتیک بین نتایج اندازه‌گیری‌های مستقیم انجام شده تحت شرایط متغیر خاص تفسیر می‌شود.

به لطف اتوماسیون تحلیل واریانس، یک محقق می تواند مطالعات آماری مختلفی را با استفاده از رایانه انجام دهد، در حالی که زمان و تلاش کمتری را برای محاسبات داده ها صرف می کند. در حال حاضر بسته های نرم افزاری زیادی وجود دارد که دستگاه تجزیه و تحلیل پراکندگی را پیاده سازی می کند. رایج ترین محصولات نرم افزاری مانند:

اکثر روش های آماری در محصولات نرم افزاری آماری مدرن پیاده سازی می شوند. با توسعه زبان های برنامه نویسی الگوریتمی، ایجاد بلوک های اضافی برای پردازش داده های آماری امکان پذیر شد.

ANOVA یک روش آماری مدرن قدرتمند برای پردازش و تجزیه و تحلیل داده های تجربی در روانشناسی، زیست شناسی، پزشکی و سایر علوم است. ارتباط بسیار نزدیکی با روش شناسی خاص برای برنامه ریزی و انجام مطالعات تجربی دارد.

تجزیه و تحلیل واریانس در تمام زمینه های تحقیقات علمی مورد استفاده قرار می گیرد، جایی که لازم است تأثیر عوامل مختلف بر متغیر مورد مطالعه مورد بررسی قرار گیرد.

کتابشناسی - فهرست کتب

1 کرمر ن.ش. نظریه احتمالات و آمار ریاضی. م.: وحدت - دانا، 2002.-343s.

2 Gmurman V.E. نظریه احتمالات و آمار ریاضی. - M .: مدرسه عالی، 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infections.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 گوسف A.N. تحلیل پراکندگی در روانشناسی تجربی. - M.: مجموعه آموزشی و روش شناختی "روانشناسی"، 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru

5.1. تحلیل واریانس چیست؟

آنالیز واریانس در دهه 1920 توسط رونالد فیشر ریاضیدان و ژنتیک شناس انگلیسی توسعه یافت. طبق یک نظرسنجی در بین دانشمندان، که مشخص شد چه کسی بیشترین تأثیر را بر زیست شناسی قرن بیستم داشته است، این سر فیشر بود که برنده عنوان قهرمانی شد (به دلیل خدماتش به او نشان شوالیه - یکی از بالاترین ممتازها در بریتانیای کبیر) اهدا شد. از این نظر، فیشر با چارلز داروین قابل مقایسه است که در قرن نوزدهم بیشترین تأثیر را بر زیست شناسی داشت.

تجزیه و تحلیل پراکندگی (Analis of variance) اکنون شاخه ای جداگانه از آمار است. بر اساس این واقعیت کشف شده توسط فیشر است که اندازه گیری تغییرپذیری کمیت مورد مطالعه را می توان به بخش های مربوط به عوامل مؤثر بر این کمیت و انحرافات تصادفی تجزیه کرد.

برای درک ماهیت تحلیل واریانس، ما یک نوع محاسبات را دو بار انجام خواهیم داد: "دستی" (با ماشین حساب) و با استفاده از برنامه Statistica. برای ساده‌تر کردن کارمان، با نتایج توصیف واقعی تنوع قورباغه‌های سبز کار نمی‌کنیم، بلکه با یک مثال تخیلی که مربوط به مقایسه زن و مرد در انسان است، کار خواهیم کرد.تنوع قد 12 بزرگسال را در نظر بگیرید: 7 زن و 5 مرد.

جدول 5.1.1. مثال ANOVA یک طرفه: داده های جنسیت و قد برای 12 نفر

بیایید یک آنالیز واریانس یک طرفه انجام دهیم: بیایید مقایسه کنیم که آیا مردان و زنان از نظر قد در گروه مشخص شده از نظر آماری تفاوت معنی‌داری دارند یا نه.

5.2. تست توزیع نرمال

استدلال بیشتر بر این واقعیت استوار است که توزیع در نمونه در نظر گرفته شده نرمال یا نزدیک به نرمال است. اگر توزیع از نرمال دور باشد، واریانس (واریانس) معیار مناسبی برای تغییرپذیری آن نیست. با این حال، تجزیه و تحلیل واریانس نسبتاً مقاوم به انحراف توزیع از نرمال است.

تست نرمال بودن این داده ها به دو روش مختلف انجام می شود. اول: آمار / آمار پایه / جداول / آمار توصیفی / برگه نرمال. در برگهعادی بودن شما می توانید انتخاب کنید که از کدام تست های توزیع نرمال استفاده کنید. هنگامی که روی دکمه جداول فرکانس کلیک می کنید، جدول فرکانس ظاهر می شود و دکمه های Histograms - یک هیستوگرام. جدول و نمودار میله ای نتایج تست های مختلف را نشان می دهد.

روش دوم با استفاده از امکانات مناسب در هنگام ساخت هیستوگرام مرتبط است. در گفتگوی ساخت هیستوگرام (Grafs / Histograms...)، تب Advanced را انتخاب کنید. در قسمت پایین آن یک بلوک Statistics وجود دارد. توجه داشته باشید Shapiro-Wilkتی est و آزمون Kolmogorov-Smirnov، همانطور که در شکل نشان داده شده است.

برنج. 5.2.1. تست های آماری برای توزیع نرمال در گفتگوی ساخت هیستوگرام

همانطور که از هیستوگرام مشاهده می شود، توزیع رشد در نمونه ما با طبیعی متفاوت است (در وسط - "شکست").


برنج. 5.2.2. هیستوگرام با پارامترهای مشخص شده در شکل قبل ترسیم شده است

خط سوم در عنوان نمودار، پارامترهای توزیع نرمال را نشان می دهد که نزدیک ترین به توزیع مشاهده شده است. میانگین کلی 173، انحراف استاندارد کلی 10.4 است. درج شده در پایین نمودار، نتایج آزمایش‌های نرمال بودن را نشان می‌دهد. D آزمون کولموگروف-اسمیرنوف و SW-W تست شاپیرو-ویلک است. همانطور که مشاهده می شود، برای تمام آزمون های مورد استفاده، تفاوت در توزیع رشد از توزیع نرمال از نظر آماری ناچیز بود. پ در همه موارد بیشتر از 0.05).

بنابراین، به طور رسمی، آزمایش‌های مربوط به انطباق توزیع با نرمال ما را از استفاده از روش پارامتریک بر اساس فرض توزیع نرمال منع نمی‌کند. همانطور که قبلا ذکر شد، تجزیه و تحلیل واریانس نسبتاً در برابر انحراف از نرمال مقاوم است، بنابراین ما هنوز از آن استفاده می کنیم.

5.3. ANOVA یک طرفه: محاسبات دستی

برای مشخص کردن تغییر قد افراد در مثال بالا، مجموع انحرافات مجذور را محاسبه می کنیم (در انگلیسی به این صورت نشان داده می شود. اس اس ، مجموع مربع ها یا ) مقادیر فردی از میانگین: . میانگین مقدار قد در مثال بالا 173 سانتی متر است. بر این اساس،

اس اس = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

اس اس = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

اس اس = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

مقدار حاصل (1192) معیاری برای تغییرپذیری کل مجموعه داده است. با این حال، آنها از دو گروه تشکیل شده اند که برای هر یک می توان میانگین خود را اختصاص داد. در داده های داده شده، میانگین قد زنان 168 سانتی متر و مردان - 180 سانتی متر است.

مجموع مجذور انحرافات زنان را محاسبه کنید:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

ما همچنین مجموع انحرافات مجذور مردان را محاسبه می کنیم:

اس اس ام = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

اس اس ام = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

مقدار مورد مطالعه مطابق با منطق تحلیل واریانس به چه چیزی بستگی دارد؟

دو مقدار محاسبه شده، SS f و اس اس ام ، واریانس درون گروهی را مشخص می کند که در تحلیل واریانس معمولاً به آن "خطا" می گویند. ریشه این نام با منطق زیر مرتبط است.

چه چیزی قد یک فرد را در این مثال تعیین می کند؟ اول از همه، از میانگین قد افراد به طور کلی، صرف نظر از جنسیت آنها. ثانیا - از کف. اگر افراد یک جنس (مذکر) از جنس دیگر (مونث) بلندتر باشند، این می تواند به عنوان افزودنی بر میانگین «جهانی» مقداری، یعنی تأثیر جنسیت نشان داده شود. در نهایت، افراد همجنس به دلیل تفاوت های فردی از نظر قد با هم تفاوت دارند. در مدلی که قد را به عنوان مجموع میانگین انسان به اضافه یک تنظیم جنسی توصیف می کند، تفاوت های فردی غیرقابل توضیح است و می تواند به عنوان یک "اشتباه" دیده شود.

بنابراین، مطابق با منطق تحلیل واریانس، مقدار مورد مطالعه به صورت زیر تعیین می شود: ، جایی که xij - مقدار i-امین کمیت مورد مطالعه در مقدار j-امین عامل مورد مطالعه. - میانگین عمومی؛ Fj - تأثیر مقدار j-ام عامل مورد مطالعه؛ - "خطا"، سهم فردیت شیئی که ارزش به آن اشاره داردxij .

مجموع مربع های بین گروهی

بنابراین، اس اس اشتباهات = SS f + SS m = 212 + 560 = 772. با این مقدار، تنوع درون گروهی (هنگام جداسازی گروه ها بر اساس جنسیت) را توضیح دادیم. اما بخش دوم تغییرپذیری نیز وجود دارد - بین گروهی که ما آن را فراخوانی خواهیم کردافکت SS (زیرا ما در مورد تأثیر تقسیم مجموعه اشیاء مورد نظر به زن و مرد صحبت می کنیم).

میانگین هر گروه با میانگین کلی متفاوت است. هنگام محاسبه سهم این تفاوت در اندازه گیری کلی تنوع، باید تفاوت بین گروه و میانگین کل را در تعداد اشیاء در هر گروه ضرب کنیم.

افکت SS = = 7x(168-173) 2 + 5x (180-173) 2 = 7x52 + 5x72 = 7x25 + 5x49 = 175 + 245 = 420.

در اینجا اصل ثبات مجموع مربع ها که توسط فیشر کشف شد، خود را نشان داد: SS = اثر SS + خطاهای SS ، یعنی برای این مثال، 1192 = 440 + 722.

مربع های میانی

با مقایسه در مثال ما مجموع مربع های بین گروهی و درون گروهی، می بینیم که اولی با تغییرات دو گروه مرتبط است و دومی - 12 مقدار در 2 گروه. تعداد درجات آزادی ( df ) برای برخی از پارامترها را می توان به عنوان تفاوت بین تعداد اشیاء در گروه و تعداد وابستگی ها (معادلات) که این مقادیر را به هم متصل می کند تعریف کرد.

در مثال ما اثر df = 2–1 = 1، آ خطاهای df = 12–2 = 10.

ما می توانیم مجموع مربع ها را بر تعداد درجات آزادی آنها تقسیم کنیم تا مجذورهای میانگین ( ام‌اس ، به معنای مربع). با انجام این کار، می توانیم آن را ثابت کنیم ام‌اس - چیزی بیش از واریانس ("پراکندگی"، نتیجه تقسیم مجموع مربع ها بر تعداد درجات آزادی). پس از این کشف، می توانیم ساختار جدول ANOVA را درک کنیم. برای مثال ما به این شکل خواهد بود.

اثر

خطا

اثر ام اس و خطاهای ام اس تخمینی از واریانس های بین گروهی و درون گروهی هستند و بنابراین می توان آنها را بر اساس معیار مقایسه کرد.اف (معیار Snedecor، به نام فیشر)، طراحی شده برای مقایسه انواع. این معیار صرفاً ضریب تقسیم واریانس بزرگتر بر واریانس کوچکتر است. در مورد ما، این 420 / 77.2 = 5.440 است.

تعیین اهمیت آماری آزمون فیشر طبق جداول

اگر بخواهیم اهمیت آماری اثر را به صورت دستی و با استفاده از جداول تعیین کنیم، باید مقدار معیار بدست آمده را با هم مقایسه کنیم. اف با بحرانی، مربوط به سطح معینی از اهمیت آماری برای درجات آزادی معین.


برنج. 5.3.1. قطعه جدول با مقادیر بحرانی معیار اف

همانطور که مشاهده می کنید، برای سطح معنی داری آماری 05/0=p، مقدار بحرانی معیاراف 4.96 است. این بدان معناست که در مثال ما تأثیر جنسیت مورد مطالعه با سطح معناداری آماری 05/0 ثبت شده است.

نتیجه به دست آمده را می توان به صورت زیر تفسیر کرد. احتمال فرض صفر که بر اساس آن میانگین قد زنان و مردان یکسان است و تفاوت ثبت شده قد آنها به دلیل تصادفی بودن در تشکیل نمونه ها کمتر از 5 درصد است. این بدان معناست که باید فرضیه جایگزین را انتخاب کنیم که میانگین قد زنان و مردان متفاوت است.

5.4. تحلیل واریانس یک طرفه ( ANOVA) در بسته Statistica

در مواردی که محاسبات به صورت دستی انجام نمی شود، بلکه با کمک برنامه های مناسب (مثلاً بسته Statistica)، مقدار پ به صورت خودکار تعیین می شود. مشاهده می شود که مقداری بالاتر از مقدار بحرانی است.

برای تجزیه و تحلیل مثال مورد بحث با استفاده از ساده ترین نسخه تحلیل واریانس، باید رویه آماری / ANOVA را برای فایل با داده های مربوطه اجرا کنید و گزینه ANOVA یک طرفه (یک طرفه ANOVA) را در نوع انتخاب کنید. پنجره تجزیه و تحلیل، و گزینه گفتگوی مشخصات سریع در پنجره روش مشخصات.


برنج. 5.4.1. دیالوگ کلی ANOVA/MANOVA (ANOVA)

در پنجره گفتگوی سریعی که باز می شود، در قسمت Variables، باید ستون هایی را مشخص کنید که حاوی داده هایی هستند که ما در حال مطالعه تنوع آنها هستیم (لیست متغیر وابسته؛ در مورد ما، ستون رشد)، و همچنین ستونی حاوی مقادیر. که مقدار مورد مطالعه را به گروه‌هایی تقسیم می‌کنند (پیش‌بینی‌کننده طبقه‌ای (عامل)؛ در مورد ما، ستون جنسیت). در این نسخه از تحلیل، بر خلاف تحلیل چند متغیره، تنها یک عامل را می توان در نظر گرفت.


برنج. 5.4.2. گفتگوی ANOVA یک طرفه (تحلیل واریانس یک طرفه)

در پنجره Factor codes، باید مقادیر فاکتور مورد نظر را که باید در طول این تحلیل پردازش شوند، مشخص کنید. تمام مقادیر موجود را می توان با استفاده از دکمه بزرگنمایی مشاهده کرد. اگر، مانند مثال ما، باید تمام مقادیر فاکتور را در نظر بگیرید (و برای جنسیت در مثال ما فقط دو عدد وجود دارد)، می توانید روی دکمه همه کلیک کنید. هنگامی که ستون های پردازش و کدهای فاکتور تنظیم شدند، می توانید روی دکمه OK کلیک کنید و برای نتایج به پنجره تجزیه و تحلیل سریع بروید: نتایج ANOVA 1، در زبانه Quick.

برنج. 5.4.3. برگه سریع پنجره نتایج ANOVA

دکمه All Effects/Graphs به شما این امکان را می دهد که ببینید میانگین دو گروه چگونه با هم مقایسه می شوند. در بالای نمودار، تعداد درجات آزادی و همچنین مقادیر F و p برای فاکتور مورد نظر نشان داده شده است.


برنج. 5.4.4. نمایش گرافیکی نتایج تحلیل واریانس

دکمه همه جلوه ها به شما امکان می دهد یک جدول ANOVA مشابه آنچه در بالا توضیح داده شد (با برخی تفاوت های قابل توجه) دریافت کنید.


برنج. 5.4.5. جدول با نتایج تحلیل واریانس (مقایسه با جدول مشابه به دست آمده به صورت دستی)

خط پایین جدول مجموع مربع ها، تعداد درجات آزادی و میانگین مربعات خطا (تغییرپذیری درون گروهی) را نشان می دهد. در خط بالا - شاخص های مشابه برای عامل مورد مطالعه (در این مورد، علامت جنسیت)، و همچنین معیار اف (نسبت مجذورات میانگین اثر به میانگین مربعات خطا)، و سطح معنی داری آماری آن. این واقعیت که اثر عامل مورد بررسی از نظر آماری معنی‌دار است با برجسته کردن قرمز نشان داده می‌شود.

و خط اول داده های مربوط به نشانگر "Intercept" را نشان می دهد. این ردیف جدول برای کاربرانی که به بسته Statistica در نسخه ششم یا جدیدتر آن می‌پیوندند، یک رمز و راز است. مقدار Intercept احتمالاً مربوط به بسط مجموع مربعات همه مقادیر داده است (یعنی 1862 + 1692 ... = 360340). مقدار معیار F نشان داده شده برای آن با تقسیم به دست می آید MS Intercept / خطای MS = 353220 / 77.2 = 4575.389 و طبیعتاً مقدار بسیار کمی می دهد پ . جالب اینجاست که در Statistica-5 این مقدار به هیچ وجه محاسبه نشده است و راهنمای استفاده از نسخه های بعدی بسته به هیچ وجه در مورد معرفی آن اظهار نظر نمی کند. احتمالاً بهترین کاری که یک زیست شناس Statistica-6 و بعد از آن می تواند انجام دهد این است که به سادگی ردیف Intercept را در جدول ANOVA نادیده بگیرد.

5.5. ANOVA و معیارهای دانشجویی و فیشر: کدام بهتر است؟

همانطور که می بینید، داده هایی را که با استفاده از تحلیل واریانس یک طرفه مقایسه کردیم، می توانیم با استفاده از آزمون های Student's و Fisher نیز بررسی کنیم. بیایید این دو روش را با هم مقایسه کنیم. برای این کار تفاوت قد مردان و زنان را با استفاده از این معیارها محاسبه می کنیم. برای این کار باید مسیر Statistics / Basic Statistics / t-test مستقل را به تفکیک گروه ها دنبال کنیم. به طور طبیعی، متغیرهای وابسته، متغیر رشد و متغیر گروه بندی، متغیر جنسیت هستند.


برنج. 5.5.1. مقایسه داده های پردازش شده با استفاده از ANOVA بر اساس معیارهای دانشجویی و فیشر

همانطور که می بینید، نتیجه مشابه با استفاده از ANOVA است. پ 0.041874 = در هر دو مورد، همانطور که در شکل نشان داده شده است. 5.4.5 و در شکل نشان داده شده است. 5.5.2 (خودتان ببینید!).


برنج. 5.5.2. نتایج تجزیه و تحلیل (تفسیر تفصیلی جدول نتایج - در پاراگراف معیار دانشجو)

تاکید بر این نکته حائز اهمیت است که اگرچه معیار F از نظر ریاضی در تحلیل مورد بررسی بر اساس معیارهای دانشجویی و فیشر همانند ANOVA است (و نسبت واریانس را بیان می‌کند)، اما معنای آن در نتایج تجزیه و تحلیل ارائه شده توسط جدول نهایی کاملا متفاوت است. هنگام مقایسه با معیارهای دانشجویی و فیشر، مقایسه میانگین مقادیر نمونه ها با معیار دانشجویی و مقایسه تنوع آنها با معیار فیشر انجام می شود. در نتایج تجزیه و تحلیل، این خود واریانس نیست که نمایش داده می شود، بلکه ریشه دوم آن است - انحراف استاندارد.

در مقابل، در ANOVA، از آزمون فیشر برای مقایسه میانگین نمونه‌های مختلف استفاده می‌شود (همانطور که بحث کردیم، این کار با تقسیم مجموع مربع‌ها به قطعات و مقایسه میانگین مجموع مربع‌های متناظر با متغیرهای درون گروهی و درون گروهی انجام می‌شود). .

با این حال، تفاوت فوق بیشتر به ارائه نتایج یک مطالعه آماری مربوط می شود تا ماهیت آن. همانطور که به عنوان مثال توسط گلانتز (1999، ص 99) اشاره شد، مقایسه گروه ها با آزمون استیودنت می تواند به عنوان یک مورد خاص از تحلیل واریانس برای دو نمونه در نظر گرفته شود.

بنابراین مقایسه نمونه‌ها بر اساس آزمون‌های استودنت و فیشر یک مزیت مهم نسبت به تحلیل واریانس دارد: می‌تواند نمونه‌ها را از نظر تغییرپذیری با هم مقایسه کند. اما مزایای ANOVA هنوز قابل توجه است. از جمله، به عنوان مثال، امکان مقایسه همزمان چند نمونه است.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...